中文版 | English

「簡牘字典」開發計畫—開放性資料庫的結構及技術探索(第二年)

基本資料
計畫類別 數位文化中心計畫
計畫編號 AS-ASCDC-109-304
通過年度 109
執行單位 史語所(109)
主持人
簡介

中央研究院歷史語言研究所為國內收藏漢代簡牘數量最多的機構,歷年已累積豐盛的數位典藏成果。期在本所《居延漢簡》數位化內容及「漢代簡牘資料庫」的既有基礎上,探索資料庫開放性結構及技術,嘗試將傳統的數位典藏系統轉型為數位人文系統開放性平台,開發「簡牘字典」,以強化簡牘數位資源的互通性,成為開放性資料庫的先導典範。本計畫與日本木簡發掘與典藏的代表性機構─—奈良文化財研究所進行雙邊合作,及數位文化中心總計畫共同規劃與執行。

 

「簡牘字典」開發計畫總期程為三年,計畫目標包括:(一)探索簡牘字典相關國際標準規範。(二)採用鏈結開放資料(Linked Open Data,簡稱 LOD)技術及國際圖像互通架構(International Image Interoperability Framework,簡稱 IIIF)規範,提昇簡牘研究便利性。(三)開發簡牘影像文字自動定位與標註模型,進而建置以圖搜圖、影像文字辨識(Optical Character Recognition,簡稱OCR)、自動釋讀的功能。(四)以標註簡牘屬性為基礎,探究簡牘屬性自動辨識及標註的可行性。(五)跨機構間數位資源互通共享,深化國際交流與合作。

 

第一年已初步開發簡牘字典所需的核心技術,並著手設計展示介面。第二年將持續優化系統架構,並透過大量資料建立及人工校正回饋,以穩定字元自動定位與標註模型。此外,亦將導入資料共享機制,逐步達成國際合作單位間聯合檢索的階段目標。

回計畫列表

 

Facebook Newsletter RSS





 

訂閱電子報

 

訂閱RSS