今年以來,浙江省檔案館以檔案數(shù)字化深度轉(zhuǎn)型為抓手,利用大模型技術(shù)對館藏良渚遺址考古檔案進行知識化梳理,形成了良渚遺址考古檔案專題知識庫,全方位展示黨和政府以及社會各界發(fā)掘、保護良渚文化遺址的歷程全貌。這一創(chuàng)新舉措標(biāo)志著我國檔案管理工作在人工智能技術(shù)應(yīng)用方面邁出了重要一步。
良渚古城遺址自2019年列入世界遺產(chǎn)名錄后,愈發(fā)成為文明對話與文化研究的焦點。以其對實證中華五千年的文明史特殊的圣地地位和所蘊涵豐富的考古檔案價值而言,良渚遺址對我們了解新石器時代中原地區(qū)的社會政治、經(jīng)濟、文化等各個方面都具有極高的歷史價值和極大的學(xué)術(shù)意義。然而,這些檔案體量龐大、類型復(fù)雜、資源分散,僅憑人工整理難以充分釋放其價值。浙江省檔案館通過引入大模型技術(shù),成功解決了這一難題,為文化遺產(chǎn)保護提供了新的技術(shù)路徑。
專題知識庫基于檔案多模態(tài)數(shù)字資源治理平臺,利用大模型強大的語義分析理解能力,對800余份與良渚遺址考古有關(guān)的館藏檔案進行要素智能識別與知識關(guān)聯(lián)重構(gòu)。具體技術(shù)實現(xiàn)包括:
要素抽取與知識關(guān)聯(lián)?:系統(tǒng)自動抽取檔案中的人物、機構(gòu)、主題、事件、時間等要素及相互聯(lián)系,建立"實體—關(guān)系—實體"的語義三元組關(guān)聯(lián)關(guān)系,實現(xiàn)檔案資源從"文本存儲"到"數(shù)據(jù)可用"的轉(zhuǎn)變。
多維標(biāo)簽體系?:按照"時間+事件、規(guī)范+技術(shù)"的雙軸整理邏輯,對檔案進行分類標(biāo)注,建立主題、類型和實體的多維標(biāo)簽體系,構(gòu)建了知識分類庫。
可視化展示形式?:
以知識圖譜形式直觀呈現(xiàn)考古發(fā)掘、保護和開發(fā)的關(guān)聯(lián)網(wǎng)絡(luò)
以知識百科形式系統(tǒng)展現(xiàn)考古發(fā)掘的各類知識要點
以知識年表形式清晰再現(xiàn)考古發(fā)掘的歷史過程
浙江省檔案館還部署了檔案數(shù)字資源大模型底座,建成館藏檔案數(shù)據(jù)倉,采用檢索增強生成(RAG)技術(shù),支持自然語言交互,實現(xiàn)文本、圖像等多模態(tài)智能檢索,大幅提升檔案檢索查全率和查準(zhǔn)率。
良渚遺址考古檔案知識庫的建成具有多重價值:
學(xué)術(shù)研究?:為考古學(xué)家和歷史研究者提供了系統(tǒng)化的知識資源,能夠快速獲取良渚文化相關(guān)考古發(fā)現(xiàn)、研究成果和歷史脈絡(luò),提高研究效率。
文化傳播?:通過可視化展示和智能問答功能,向公眾普及良渚文化知識,增強文化自信,促進中華優(yōu)秀傳統(tǒng)文化的傳承與傳播。
檔案管理創(chuàng)新?:為全國檔案行業(yè)提供了大模型技術(shù)應(yīng)用的典型案例,推動了檔案工作從數(shù)字化管理向知識化服務(wù)的轉(zhuǎn)型。
國際交流?:作為世界文化遺產(chǎn),良渚遺址的國際關(guān)注度不斷提升,該知識庫為國際學(xué)術(shù)界提供了研究中國早期文明的重要數(shù)字資源。
浙江省檔案館表示,將繼續(xù)深化大模型技術(shù)在檔案管理中的應(yīng)用,計劃將這一模式推廣到其他重要歷史檔案的整理工作中。不斷的對知識更新和完善使得我們的知識庫始終能保持著對最新的考古發(fā)現(xiàn)和研究進展的把握,從而始終保持其較高的學(xué)術(shù)前沿性。
依托于這一的創(chuàng)新實踐,不僅為我們對文化遺產(chǎn)的保護提供了更為先進的技術(shù)手段,也為人工智能的深入人文社科的應(yīng)用開辟了廣闊的新天地,充分體現(xiàn)了“科技+文化”的高水平的融合發(fā)展典范。