由中央研究院歷史語言研究所、數位文化中心,與奈良文化財研究所、東京大學史料編纂所、國文學研究資料館、國立國語研究所、京都大學人文科學研究所等日本5大機構合作建置的「歷史文字資料庫統合檢索系統」於2020年10月13日正式啟用。
該系統整合了前述機構所藏源自中國與日本,橫跨紀元前至19世紀,涵蓋簡牘與紙本、文書與典籍、抄本與刻本等不同性質的文字圖像數位資源。使用者透過單一入口網就能即時跨國、跨機構查詢5個資料庫,約150萬件的高解析度文字圖像,且所有圖像均以創用CC條款釋出,開放免費下載,以進行加值利用。
近年來,開放資料(Open Data)概念的標準化,觸發了數位典藏的整體質變。為了探究以簡牘為主題的開放性資料庫架構,2019年起史語所與本中心共同合作,導入國際圖像互通架構(International Image Interoperability Framework, IIIF)規範,結合鏈結開放資料(Linked Open Data, LOD)等技術,開發「簡牘字典—史語所藏居延漢簡資料庫」。簡牘字典不僅發展出強大的圖像縮放瀏覽、提取單字字形、圖像比較、標註功能,改善簡牘研究的工具,也建構史語所藏漢簡圖像、後設資料的開放共享環境,成為發展跨國合作「歷史文字資料庫統合檢索系統」的立基。
本中心、史語所與奈文研等機構共同確立了文字圖像數位資源共享與流通的體制,並議定一致的IIIF 共通性應用程式介面規範。當多方共同遵循相同語法規範時,即可從彼此的資料庫中檢索出指定的單字圖像並進行再利用。
「歷史文字資料庫統合檢索系統」是文字圖像典藏機構間首次創新合作模式,這次系統的公開上線只是起點,未來將持續號召其他典藏機構加入,並嘗試深化技術發展的可能性。期待在文字圖像資源共享的理念下,突破時空的限制,再現東亞漢字文化圈的源流與歷史脈絡。
透過歷史文字資料庫統合檢索系統查詢,可即時呈現臺日5個典藏機構的單字圖像。
相關連結:
開放性資料庫—簡牘字典(2020年「數位典藏與數位人文學研究計畫」數位成果展)
媒體報導:
《中央社》:東亞最大文字圖像資料庫啟用 150萬件免費下載
《自由時報》:中研院與日本合作打造 東亞最大規模文字圖像資料庫上線
《工商時報》:中研院啟用東亞最大規模文字圖像資料庫
《青年日報》:150萬字形一次蒐齊 東亞最大規模文字圖像庫上線
《國語日報》:東亞最大文字圖象庫 中研院啟用
《人間福報》:東亞規模最大資料庫 150萬字形 免費跨國共享
《中央廣播電臺》:150萬字形一次蒐齊 東亞最大規模文字圖像資料庫上線啟用
《國立教育廣播電台》:東亞最大規模文字圖像資料庫上線 150萬字形免費下載使用
《中時新聞網》:東亞最大文字圖像資料庫上線 150萬字形可免費下載
《華視新聞網》:150萬字形免費下載!東亞最大規模圖庫上線
《三立新聞網》:150萬字形免費下載!東亞最大規模圖庫上線 連結看這裡
《ETtoday新聞雲》:150萬字形一次下載! 東亞最大規模文字資料庫免費下載
《台灣大紀元》:台中研院與日本合造:東亞最大文字圖像資料庫
臺日合造 東亞最大文字圖像資料庫
《科技新報》:150 萬字形一次蒐齊,東亞最大規模文字圖像資料庫上線啟用
《世界民報》:中研院與日本合作 東亞最大規模文字圖像資料庫上線