支持甲骨單字識別、字形檢索、釋讀查詢、摹本生成與拓片重見檢索等核心功能。
多知10月30日消息,日前,在“2025 AI+甲骨文成果展示暨協(xié)同創(chuàng)新交流會”上,安陽師范學院甲骨文信息處理教育部重點實驗室與騰訊SSV數(shù)字文化實驗室、騰訊優(yōu)圖實驗室、廈門大學人工智能研究院聯(lián)合發(fā)布了全球首個面向古文字研究的甲骨文智能體“殷契行止”。
該智能體主要聚焦甲骨文研究與文化普及中的高頻場景,支持甲骨單字識別、字形檢索、釋讀查詢、摹本生成與拓片重見檢索等核心功能。用戶只需上傳一張甲骨圖片,AI 即可完成文字識別、釋義查詢、文獻溯源和數(shù)字摹本生成,實現(xiàn)從學術研究到文化體驗的完整閉環(huán)。對于研究者而言,它顯著縮短了資料收集與比對時間;對于公眾而言,可以通過小程序“了不起的甲骨文”體驗甲骨識讀的樂趣。


據(jù)介紹,這款智能體由廈門大學人工智能研究院團隊支撐,基于騰訊云智能體開發(fā)平臺構建的 AI 研究工具,面向古文字專家與公眾免費開放。
多年來,甲骨文的研究一直面臨“識別難、比對難、共享難”的挑戰(zhàn)。由于拓片噪聲復雜、字形異構多變,通用大模型難以理解甲骨文的特征規(guī)律。
騰訊云副總裁、騰訊云智能負責人、騰訊優(yōu)圖實驗室負責人吳運聲介紹,“殷契行止”在字符分類、字形匹配等關鍵任務上顯著優(yōu)于通用大模型,其核心優(yōu)勢來自三方面的技術創(chuàng)新:針對甲骨文特征定制的算法算子、基于學術知識庫的閉環(huán)推理機制,以及高質量的多模態(tài)語料支撐。
廈門大學人工智能研究院團隊支撐,騰訊優(yōu)圖實驗室聯(lián)合甲骨文信息處理實驗室,以 AI + 多模態(tài)語料融合為基礎,研發(fā)出多項關鍵技術,包括字形檢測與分類算法、AI 摹本生成與字形匹配技術、甲骨校重與結構化比對算法,以及融合圖像、文字與語義的多模態(tài)推理能力。這些針對性算法的引入,使得 AI 首次具備了“理解古文字”的能力,有效解決了通用模型在專業(yè)領域中的適配難題。
在算法突破之外,“殷契行止”還建立了基于知識庫驗證的閉環(huán)推理機制,確保 AI 釋讀結果的專業(yè)性與準確性。其背后依托的是全球規(guī)模最大的甲骨文 AI 研究語料體系,由安陽師范學院甲骨文信息處理教育部重點實驗室提供學術支撐,涵蓋 4184 個字頭釋義與字形信息、1.5 萬片甲骨多模態(tài)數(shù)據(jù)(包括拓片、摹本與 3D 模型)、143 萬字形數(shù)據(jù)庫與 7 萬拓片樣本,以及超過 3000 篇研究論文與 8 萬篇釋文資料。這一龐大的語料體系為智能體提供了堅實的數(shù)據(jù)與知識基礎,也成為全球古文字 AI 研究的重要開放資源。

據(jù)介紹,“殷契行止”的推出,是騰訊及廈門大學人工智能研究院及眾多伙伴三年技術攻堅的成果結晶。過去三年間,廈門大學人工智能研究院團隊支撐騰訊 SSV 數(shù)字文化實驗室聯(lián)合騰訊優(yōu)圖實驗室、騰訊云智能以及安陽師范學院等科研機構,持續(xù)探索“AI 助力甲骨文破譯與數(shù)字回歸”的新路徑,發(fā)布了全球首個甲骨文多模態(tài)數(shù)據(jù)集和最大單字數(shù)據(jù)庫,構建全球首個甲骨文 AI 協(xié)同平臺,并推出甲骨文專家智能體,提升了查找文字、實物和文獻的效率——原本需要五天的資料檢索,如今五分鐘即可完成。