游客發(fā)表
發(fā)帖時(shí)間:2025-11-21 10:11:52
11月16日消息,破譯據(jù)媒體報(bào)道,水平谷歌旗下AI Studio平臺(tái)正在測(cè)試一款未命名的接近解讀AI模型,在破譯難辨認(rèn)歷史手稿方面取得重要進(jìn)展。谷歌古籍該模型在核心字符識(shí)別上的核心錯(cuò)誤率僅為0.56%,準(zhǔn)確率已接近該領(lǐng)域的錯(cuò)誤專業(yè)研究人員水平。
歷史學(xué)家Mark Humphries利用專門構(gòu)建的率僅基準(zhǔn)數(shù)據(jù)集對(duì)模型進(jìn)行了系統(tǒng)評(píng)估。在測(cè)試涵蓋的破譯五份18至19世紀(jì)高難度手稿中,模型整體字符錯(cuò)誤率約為1.7%,水平其中大部分錯(cuò)誤出現(xiàn)在標(biāo)點(diǎn)符號(hào)和大小寫規(guī)范等非核心問題上,接近解讀并未影響單詞本身的谷歌古籍正確識(shí)別。
若排除這些非關(guān)鍵性錯(cuò)誤,核心模型的錯(cuò)誤字符錯(cuò)誤率可進(jìn)一步降至0.56%,相當(dāng)于每轉(zhuǎn)寫200個(gè)字符僅出現(xiàn)一處實(shí)質(zhì)性錯(cuò)誤,率僅其表現(xiàn)已與專注于文獻(xiàn)轉(zhuǎn)寫的破譯專業(yè)工作者相當(dāng)。
測(cè)試手稿涵蓋了多樣化的書寫風(fēng)格,包括字跡潦草、拼寫非標(biāo)準(zhǔn)和語(yǔ)法不一致等復(fù)雜情況,充分驗(yàn)證了模型的強(qiáng)適應(yīng)能力。更值得注意的是,該模型不僅能完成文字轉(zhuǎn)寫,還展現(xiàn)出一定的上下文推理能力。
例如,在處理一份18世紀(jì)商人日記時(shí),模型遇到一條未標(biāo)注單位的購(gòu)糖記錄“145”。它通過反向核對(duì)賬目總額,結(jié)合當(dāng)時(shí)英國(guó)的貨幣與重量單位體系,成功推斷出該數(shù)字代表“14磅5盎司”。
Humphries也指出當(dāng)前評(píng)估仍存在一定局限。由于該模型僅以A/B測(cè)試形式零星出現(xiàn),難以進(jìn)行大規(guī)模系統(tǒng)性驗(yàn)證,目前僅完成基準(zhǔn)數(shù)據(jù)集中約10%樣本的評(píng)估工作。
相關(guān)內(nèi)容
隨機(jī)閱讀
熱門排行
友情鏈接