簧片在线观看,heyzo无码中文字幕人妻,天天想你在线播放免费观看,JAPAN4KTEEN体内射精

正在閱讀:

AI讀懂兩千年前文字,登上Nature封面,驚艷歷史學家

掃一掃下載界面新聞APP

AI讀懂兩千年前文字,登上Nature封面,驚艷歷史學家

DeepMind研究再登Nature封面,用AI解開古代文明謎題。

文|智東西

編譯|ZeR0

智東西3月10日消息,今日,DeepMind的“AI+科學”研究,再登國際學術頂刊Nature的封面!

DeepMind的深度神經網絡Ithaca,能從受損文物中破譯古希臘文字,準確率達到62%,在識別其原始位置方面的準確率達到71%,還能將古文字年代鎖定在其真實日期范圍的30年內。

據悉,這是第一個能夠恢復受損銘文的缺失文字、識別其原始位置并幫助確定其書寫日期的深度神經網絡。

研究結果表明,AI能幫助歷史學家更好地解讀銘文,以助力對古代歷史的論證與理解。當前,歷史學家已經使用這個工具,來重新評估希臘歷史上的重要時期。

為了讓研究人員、教育工作者、博物館工作人員和其他人能夠廣泛使用其研究,DeepMind與谷歌云和谷歌Arts &Culture合作,推出了Ithaca的免費互動版本,并開放了其代碼、預訓練的模型和一個交互式的協作實驗室筆記本。

01.古文字遭破壞?AI能修復這個bug

文字的誕生標志著歷史的開端,對人類理解過去的文明和今天生活的世界至關重要。

例如,2500多年前,希臘人開始在石頭、陶器和金屬上書寫,記錄從租約、法律到日歷和預言的一切,讓人們對地中海地區有了詳細的了解。不幸的是,這是一個不完整的記錄。

許多幸存下來的銘文在幾個世紀的時間里遭到了破壞,或者從原來的位置被移走了。此外,現代年代測定技術,如放射性碳年代測定法,無法在這些材料上使用,這使得解讀銘文既困難又費時。

為此,DeepMind與威尼斯Ca’Foscari大學人文系、牛津大學古典系、雅典經濟與商業大學信息學系合作,一起探索如何用AI幫助歷史學家更好地解讀這些銘文。

深度神經網絡Ithaca即是他們的最新成果,它以荷馬史詩《奧德賽》中的希臘島嶼命名,在DeepMind此前專注于文本修復的系統Pythia基礎上擴展而成。

從實驗結果來看,這個新算法展示了AI方法能克服現有恢復銘文方法的約束,輔助古語言研究,并幫助對古代歷史有更豐富的理解。

02.大幅提升修復受損古文字的準確率

Ithaca采用了古希臘語言和整個古代地中海世界的銘文進行訓練,訓練數據來自帕卡德人文學院提供的最大的希臘銘文數字數據集。

這一選擇有兩個主要原因。首先,希臘銘文記錄的內容和背景的變異性使其成為語言處理的巨大挑戰;其次是因為古希臘語數字化語料庫的可用性,這是訓練機器學習模型的基本資源。

自然語言處理(NLP)模型通常用單詞(word)進行訓練,因為它們在句子中出現的順序和它們之間的關系提供了額外的上下文和含義。然而,許多歷史學家有興趣讓Ithaca進行分析的銘文都已損壞,而且經常缺失文本塊。

DeepMind使用單詞和單個字符作為輸入來訓練模型,以確保Ithaca用這類文本時能正常工作。模型核心的稀疏自我注意機制并行地評估這兩個輸入,允許Ithaca根據需要評估銘文。

▲Ithaca的架構(文本的損壞部分用“-”表示)

實驗結果表明,Ithaca的設計決策和可視化輔助使研究人員更容易解釋結果。

單獨工作時,Ithaca在修復受損文字方面達到了62%的準確率;與DeepMind合作的歷史學家在單獨修復古代文獻時,準確率為25%;而當歷史學家與Ithaca合作時,修復受損文字的準確率提高至72%。

▲Ithaca的實驗結果(CER和年份,數值越低↓越好)

Ithaca還可以確定銘文書寫的原始地理位置,準確率達到71%,并能將銘文的書寫年代縮小至與歷史學家提出的日期相差30年以內。

研究人員認為,AI和歷史學家之間的這種合作,可能有助于改變對古代世界的研究,比如幫助推進歷史解釋,建立歷史事件的相對日期,乃至為當前的方法論爭鳴做貢獻。

例如,目前歷史學家對雅典頒布的一系列重要法令的日期存在分歧,這些法令是在蘇格拉底和伯里克利等著名人物在世的時期頒布的。

這些法令一直被認為是在公元前446/445年之前寫的,盡管有新的證據表明日期是公元前420年。雖然看起來差別不大,但這些法令對于理解古典雅典的政治史至關重要。

DeepMind采用的訓練數據集包含公元前446/445年的早期圖像。為了測試Ithaca的預測,研究人員在一個不包含日期銘文的數據集上對它進行了重新訓練,然后提交這些沒被包含在數據集中的文字進行分析。結果,Ithaca對這些法令的平均預測日期是公元前421年,這與新證據推測的日期一致。

由此可見,機器學習能幫助圍繞希臘歷史上最重要時刻之一的辯論提供支撐。

03.提供可視化輔助工具直觀呈現AI分析的結果

為了將Ithaca作為研究工具的價值最大化,研究團隊還創造了一些可視化輔助工具,來確保歷史學家能夠輕松地解釋Ithaca輸出的結果。

▲Ithaca的輸出

(1)修復假設:Ithaca為文本修復任務生成了幾個預測假設,供歷史學家利用專業知識進行選擇。

(2)地理屬性:Ithaca向歷史學家展示了它的不確定性,它給出了所有可能預測的概率分布,而不是單一的輸出。它提供了84個不同古代地區的概率,代表其確定性水平,并將這些結果可視化顯示在地圖上,以闡明古代世界潛在的地理聯系。

(3)時間歸屬:當確定文本的創作日期時,Ithaca會產生一個從公元前800年到公元800年所有幾十年的預測日期分布。歷史學家能看到模型對特定日期范圍的可信度,這可能提供有價值的歷史見解。

(4)顯著性圖:為了將結果傳達給歷史學家,Ithaca使用了計算機視覺中常用的一種技術,它可以識別哪些輸入序列對預測的貢獻最大。該輸出對影響Ithaca關于缺失文本、位置和日期預測的單詞用不同的顏色加以突出。

▲由顏色標注突出顯示了Ithaca聚焦的詞

04.結語:AI與人文學科的合作正釋放出更大潛力

DeepMind研究團隊相信,這只是像Ithaca這樣的AI工具的開始。

古希臘只是全球文明圖景的一部分,DeepMind還在研究由其他古代語言訓練的Ithaca版本,歷史學家已經可以在當前的建筑中使用他們的數據集來研究阿卡德語、希伯來語、瑪雅語等古代文字體系。

我國的研究團隊也早已開展了用AI識別古文字的研究。在2021年世界人工智能大會上,國內智能文字識別領域頭部企業合合信息就曾展示一種將古代象形文字甲骨文識別并翻譯成現代漢字的AI技術,這不僅有助于實現甲骨文研究資料電子化、數據化,也為破解甲骨文謎題提供了新的數字化手段。

我們期待看到更多諸如此類的研究,可以釋放AI和人文學科之間的合作潛力,改變歷史學家研究和確定人類歷史重要時期的方式,幫助我們獲得對古代文明更豐富的認知。

來源:DeepMind,Nature

本文為轉載內容,授權事宜請聯系原著作權人。

評論

暫無評論哦,快來評價一下吧!

下載界面新聞

微信公眾號

微博

AI讀懂兩千年前文字,登上Nature封面,驚艷歷史學家

DeepMind研究再登Nature封面,用AI解開古代文明謎題。

文|智東西

編譯|ZeR0

智東西3月10日消息,今日,DeepMind的“AI+科學”研究,再登國際學術頂刊Nature的封面!

DeepMind的深度神經網絡Ithaca,能從受損文物中破譯古希臘文字,準確率達到62%,在識別其原始位置方面的準確率達到71%,還能將古文字年代鎖定在其真實日期范圍的30年內。

據悉,這是第一個能夠恢復受損銘文的缺失文字、識別其原始位置并幫助確定其書寫日期的深度神經網絡。

研究結果表明,AI能幫助歷史學家更好地解讀銘文,以助力對古代歷史的論證與理解。當前,歷史學家已經使用這個工具,來重新評估希臘歷史上的重要時期。

為了讓研究人員、教育工作者、博物館工作人員和其他人能夠廣泛使用其研究,DeepMind與谷歌云和谷歌Arts &Culture合作,推出了Ithaca的免費互動版本,并開放了其代碼、預訓練的模型和一個交互式的協作實驗室筆記本。

01.古文字遭破壞?AI能修復這個bug

文字的誕生標志著歷史的開端,對人類理解過去的文明和今天生活的世界至關重要。

例如,2500多年前,希臘人開始在石頭、陶器和金屬上書寫,記錄從租約、法律到日歷和預言的一切,讓人們對地中海地區有了詳細的了解。不幸的是,這是一個不完整的記錄。

許多幸存下來的銘文在幾個世紀的時間里遭到了破壞,或者從原來的位置被移走了。此外,現代年代測定技術,如放射性碳年代測定法,無法在這些材料上使用,這使得解讀銘文既困難又費時。

為此,DeepMind與威尼斯Ca’Foscari大學人文系、牛津大學古典系、雅典經濟與商業大學信息學系合作,一起探索如何用AI幫助歷史學家更好地解讀這些銘文。

深度神經網絡Ithaca即是他們的最新成果,它以荷馬史詩《奧德賽》中的希臘島嶼命名,在DeepMind此前專注于文本修復的系統Pythia基礎上擴展而成。

從實驗結果來看,這個新算法展示了AI方法能克服現有恢復銘文方法的約束,輔助古語言研究,并幫助對古代歷史有更豐富的理解。

02.大幅提升修復受損古文字的準確率

Ithaca采用了古希臘語言和整個古代地中海世界的銘文進行訓練,訓練數據來自帕卡德人文學院提供的最大的希臘銘文數字數據集。

這一選擇有兩個主要原因。首先,希臘銘文記錄的內容和背景的變異性使其成為語言處理的巨大挑戰;其次是因為古希臘語數字化語料庫的可用性,這是訓練機器學習模型的基本資源。

自然語言處理(NLP)模型通常用單詞(word)進行訓練,因為它們在句子中出現的順序和它們之間的關系提供了額外的上下文和含義。然而,許多歷史學家有興趣讓Ithaca進行分析的銘文都已損壞,而且經常缺失文本塊。

DeepMind使用單詞和單個字符作為輸入來訓練模型,以確保Ithaca用這類文本時能正常工作。模型核心的稀疏自我注意機制并行地評估這兩個輸入,允許Ithaca根據需要評估銘文。

▲Ithaca的架構(文本的損壞部分用“-”表示)

實驗結果表明,Ithaca的設計決策和可視化輔助使研究人員更容易解釋結果。

單獨工作時,Ithaca在修復受損文字方面達到了62%的準確率;與DeepMind合作的歷史學家在單獨修復古代文獻時,準確率為25%;而當歷史學家與Ithaca合作時,修復受損文字的準確率提高至72%。

▲Ithaca的實驗結果(CER和年份,數值越低↓越好)

Ithaca還可以確定銘文書寫的原始地理位置,準確率達到71%,并能將銘文的書寫年代縮小至與歷史學家提出的日期相差30年以內。

研究人員認為,AI和歷史學家之間的這種合作,可能有助于改變對古代世界的研究,比如幫助推進歷史解釋,建立歷史事件的相對日期,乃至為當前的方法論爭鳴做貢獻。

例如,目前歷史學家對雅典頒布的一系列重要法令的日期存在分歧,這些法令是在蘇格拉底和伯里克利等著名人物在世的時期頒布的。

這些法令一直被認為是在公元前446/445年之前寫的,盡管有新的證據表明日期是公元前420年。雖然看起來差別不大,但這些法令對于理解古典雅典的政治史至關重要。

DeepMind采用的訓練數據集包含公元前446/445年的早期圖像。為了測試Ithaca的預測,研究人員在一個不包含日期銘文的數據集上對它進行了重新訓練,然后提交這些沒被包含在數據集中的文字進行分析。結果,Ithaca對這些法令的平均預測日期是公元前421年,這與新證據推測的日期一致。

由此可見,機器學習能幫助圍繞希臘歷史上最重要時刻之一的辯論提供支撐。

03.提供可視化輔助工具直觀呈現AI分析的結果

為了將Ithaca作為研究工具的價值最大化,研究團隊還創造了一些可視化輔助工具,來確保歷史學家能夠輕松地解釋Ithaca輸出的結果。

▲Ithaca的輸出

(1)修復假設:Ithaca為文本修復任務生成了幾個預測假設,供歷史學家利用專業知識進行選擇。

(2)地理屬性:Ithaca向歷史學家展示了它的不確定性,它給出了所有可能預測的概率分布,而不是單一的輸出。它提供了84個不同古代地區的概率,代表其確定性水平,并將這些結果可視化顯示在地圖上,以闡明古代世界潛在的地理聯系。

(3)時間歸屬:當確定文本的創作日期時,Ithaca會產生一個從公元前800年到公元800年所有幾十年的預測日期分布。歷史學家能看到模型對特定日期范圍的可信度,這可能提供有價值的歷史見解。

(4)顯著性圖:為了將結果傳達給歷史學家,Ithaca使用了計算機視覺中常用的一種技術,它可以識別哪些輸入序列對預測的貢獻最大。該輸出對影響Ithaca關于缺失文本、位置和日期預測的單詞用不同的顏色加以突出。

▲由顏色標注突出顯示了Ithaca聚焦的詞

04.結語:AI與人文學科的合作正釋放出更大潛力

DeepMind研究團隊相信,這只是像Ithaca這樣的AI工具的開始。

古希臘只是全球文明圖景的一部分,DeepMind還在研究由其他古代語言訓練的Ithaca版本,歷史學家已經可以在當前的建筑中使用他們的數據集來研究阿卡德語、希伯來語、瑪雅語等古代文字體系。

我國的研究團隊也早已開展了用AI識別古文字的研究。在2021年世界人工智能大會上,國內智能文字識別領域頭部企業合合信息就曾展示一種將古代象形文字甲骨文識別并翻譯成現代漢字的AI技術,這不僅有助于實現甲骨文研究資料電子化、數據化,也為破解甲骨文謎題提供了新的數字化手段。

我們期待看到更多諸如此類的研究,可以釋放AI和人文學科之間的合作潛力,改變歷史學家研究和確定人類歷史重要時期的方式,幫助我們獲得對古代文明更豐富的認知。

來源:DeepMind,Nature

本文為轉載內容,授權事宜請聯系原著作權人。
主站蜘蛛池模板: 天门市| 庆城县| 潢川县| 峡江县| 石棉县| 辽源市| 陆丰市| 方山县| 丹巴县| 横山县| 玉山县| 昭平县| 广河县| 中卫市| 乌鲁木齐县| 神池县| 兴城市| 五大连池市| 全州县| 阿坝县| 胶南市| 荥阳市| 濮阳市| 平阴县| 行唐县| 宁武县| 洪雅县| 兴国县| 汾阳市| 云安县| 宿州市| 崇文区| 唐河县| 大厂| 通渭县| 衡南县| 咸丰县| 灌南县| 加查县| 巴林右旗| 张家界市|