中文版 | English

史語所學術創新數位深耕計畫

基本資料
計畫類別 數位文化中心計畫
計畫編號 ASCDC-105-02
通過年度 105
執行單位 史語所
主持人
簡介

史語所自民國73年(1984)推動「史籍自動化」以來即全力進行各項典藏的數位化工作,包括民國77年(1988)善本書、民國85年(1996)明清檔案的數位化工作,民國90年(2001)數位博物館計畫、數位典藏先導計畫。民國91-101年(2002-2012),分別以「珍藏歷史文物數位典藏計畫」、「史語所數位知識總體經營計畫」之名,參與數位典藏國家型科技一、二期計畫。前期將所內典藏分為考古、拓片、善本圖籍、少數民族、內閣大庫檔案等五類,進行數位典藏之基礎建設。後期則以擴展更多珍貴典藏的數位化、創造更多元的數位資源為目標,並結合內容與技術專家創新發展,將數位資源再造為數位知識,推展科普應用、教育應用與學術加值應用。為使本所多年來的數位成果,無論在學術、教育、科普或是產學發展上都能展現知識創新的效益,尤其在國際人文與社會科學學術發展的趨勢上展現影響力,於民國102年(2013)起規劃「史語所學術創新數位深耕計畫」,藉以實現數位典藏的永續經營與創新發展。

 

近年來數位人文學在國內外蔚為風氣,並獲得長足的發展,為因應此潮流與活用前期豐碩的數位成果,本期計畫一方面仍持續進行所內珍貴典藏數位化、資料庫內容與功能增建等工作,以豐富數位人文學的基礎建設。另一方面,也將致力於利用現有成果結合資訊科技,進行「一源多用,跨庫整合」的構想,讓資料庫由單一資料庫單方面供使用者提取資訊,進一步演化為具有標註、分析、探索功能,並成為能與各資料庫橫向連結的查詢系統,以發掘材料間的內部連結與脈絡,進而找出值得深入研究的主題。本計畫中的漢籍電子文獻資料庫權威資訊物件管理系統(人名、地名、職官)、地理資訊系統(GIS)即是各資料庫橋接的重要媒介與分析工具,藉由彼此的串連,當能使數位人文學演繹出更多的可能性,以深化此學科的研究與進展。

 

本計畫包含七個子計畫:

【子計畫一:數位資源維運與知識服務計畫】

以數位典藏成果的維運與推廣應用為目標,不僅統籌行政庶務與整體資訊環境的建構,更進行多元面向的刊佈與耕耘,使各項數位資源在學術界、教育界等皆能獲得有效的應用。

 

【子計畫二:數位內容學術加值計畫】

 「數位內容學術加值計畫」針對學術研究的需求,抽取人、事、時、地的核心脈絡,進行數位內容的知識加值,主要包含人名、地名、職官三個資料庫。本計畫一方面持續增建資料,以厚植數位人文學的基礎建設。另一方面也透過協助「漢籍電子文獻資料庫權威資訊物件管理系統」之建置,整合人名、地名、職官資料庫,讓其成果得到更進一步的加值運用,最終發展為文本分析的重要利器,以深化數位人文學之研究。

 

【子計畫三:考古資料數位典藏創新計畫】

  105年度考古資料數位典藏創新計畫,延續歷年來考古資料數位化的基礎工作,持續擴大數位典藏的內容。預定數位化的考古資料在台灣考古方面為花蓮地區花岡山遺址、南投縣頂崁子遺址及澎湖群島考古出土精品遺物;大陸考古方面將進行殷墟文字乙編甲骨及林西遺址細石器及昂昂溪骨器的考古資料。

 

  此外,本計畫同時亦延續104年數位人文計畫之甲骨拼合計畫,利用電腦高效能的運算能力取代以往耗時費力的人為綴合甲骨工作,使出土時即斷裂分散的甲骨文字句於拼合後得以更完整呈現,裨益研究者免於一再重複繁瑣的綴合比對工作,而能集中心力於後續的文字釋讀,並可避免甲骨實物因拼合受損的潛在風險。在104年下半年度測試訓練材料之後,新年度目標聚焦於YH127坑所出17,096片甲骨之正反面影像,作為拼合演算之訓練材料,以提昇甲骨自動拼合技術及效能。

 

【子計畫四:傅圖館藏數位典藏創新計畫】

 本所傅斯年圖書館之特色館藏,包含善本古籍、金石拓片、俗文學資料、少數民族文書、檔案文書、內閣大庫檔案等,均為國內外相關研究機構及學者專家之重要研究素材。為避免這些珍貴典藏因一再使用造成損傷,本所過去及近年參與國家型數位典藏計畫的豐碩成果,除提供讀者更方便、更迅速的檢索利用,並有利於國際相關研究計畫之合作與交流。本計畫的目標將延續歷年來之數位化成果,並力求充實與增補研究所需的材料。計畫預計於民國105年提出特色館藏中(1)善本古籍四部分類中的「集部」,(2)宋代拓片,(3)佛教石刻拓片等三種主題特色之館藏,以作為永續計畫經營之重點。

 

【子計畫五:漢籍全文資料庫】

 「漢籍全文資料庫計畫」的建置肇始於民國73年,為「史籍自動化」計畫的延伸,開發的目標是為了建置研究人員使用之全文資料庫,為學術研究的輔助工具,故收錄之典籍為對中國傳統人文研究具有重要價值的文獻。「漢籍全文資料庫」是目前最具規模、資料統整最為嚴謹的中文全文資料庫之一。三十多年來累計收錄歷代典籍已達925種,5億零65萬字,內容幾乎涵括了所有重要的典籍。

 

 至104上半年止,已有58萬張圖上線,「人名權威檔參見」提供《清實錄》、《清史稿》、《明實錄》等書14萬4千多次的「明清人名權威資料庫」參見。「免費使用」秒數已累積15億1,076萬秒,「授權使用」的秒數達10億3,685萬秒, 「登入人次」總計237萬人次。授權使用的團體:國外包括美國、加拿大、德國、荷蘭、比利時、法國、日本、韓國、澳大利亞、以色列等十國,以及國內團體共92個,國內個人使用總數六百多位。

 

 計畫往後將以原建置書目為中心,建置「專書資料庫」。並乘數位人文學研究之學術導向,擴充系統自動化比對、檢索歷史、圖文對照閱圖模式,與權威資訊參見統計等功能,並與GIS合作提供「由文到圖」之視學情報,為專家、學者以及愛好文化人士,提供品質更優良的電子文獻,以及更完備的檢索工具。

 

【子計畫六:新出青銅器銘文暨器影(2006-2013)匯入『殷周金文暨青銅器資料庫』計畫】

本計畫是承繼過去「語言典藏」計畫之分支計畫「先秦甲骨金文簡牘詞彙庫」而來。中央研究院語言學研究所「數位典藏與數位學習國家型科技計畫」執行「語言典藏」計畫已於101結束,102-103年持續永續經營計畫,「先秦甲骨金文簡牘詞彙庫」一直作為分支計畫包含在「語言典藏」計畫中。

 

「語言典藏」將於103年完全結束計畫,而「先秦甲骨金文簡牘詞彙庫」作為階段性的任務也隨之告一段落。這段期間我們建置了「先秦甲骨金文簡牘詞彙資料庫」、「殷周金文暨青銅器資料庫」、「金文關係文獻資料庫」、「青銅器愛玩網」、「殷周青銅器地理資訊系統」「先秦銅器紋飾資料庫」共六個資料庫,詳細情況請進入口網站。在橫向連結幾個資料庫之間,提供研究者及一般大眾便捷、學術性的數位應用環境,建立多重互動查詢,與大眾共享的先秦文字研究數位平台,這一點,我們也取得相當的成績(請參後附統計圖表數字)。目前我們持續維持運作,管理及修正資料庫、與使用者對話、以專業知識提供使用者諮詢服務等方面,都在積極進行中。

 

「殷周金文暨青銅器資料庫」原包含在「語言典藏」中。過去我們歷經10多年的努力,將《殷周金文集成》12,000餘件、《新收殷周青銅器銘文暨器影彙編》2005件銅器資料,都整合在「殷周金文暨青銅器資料庫」中,每件青銅器的銘文拓片、青銅器影像及基本資料、銅器出土地理資訊、考古器物出土平面圖等,都包含其中。內容截至2005年已發表有銘銅器資料。

 

持續進行中的工作,最迫切需要關注的是2006-2013新出土有銘青銅器。這一批新出青銅器資料,在近兩年之間(102-103),已完成基本資料收集,包括1,648件青銅器之器影1,631張、拓片1,507張、及線圖、紋飾等687張,出土平面圖334張等。未來我們所要努力的方向是對這1648件青銅器的內容撰寫釋文、新增參考資料、詞彙分析標記、器物所屬時間及空間定位、影像修治及強化等。在數位技術方面,將上述完成之資料增收整合進入原先的「殷周金文暨青銅器資料庫」中,同時橫向連結其他幾個資料庫:詞彙標記分析將增加資料進「先秦甲骨金文簡牘詞彙資料庫」、參考資料將增入「金文關係文獻資料庫」、空間定位分析將增入「殷周青銅器地理資訊系統」。

 

目前「殷周金文暨青銅器資料庫」已正式對外開放,是全世界唯一利用網路平台且免費使用的金文及青銅器研究資料庫,得到許多青銅器研究者、上古史學者、藝術史學者的好評。要保持長久以來建立的資訊信賴與學術地位,唯有不停前進更新。在新出銅器資料大量湧現之際,若未能隨時增補新資料,就將落後並被淘汰,前功盡棄。因此,2006-2013新出土有銘青銅器的增補並整合進「殷周金文暨青銅器資料庫」,實為刻不容緩之務。

 

【子計畫七:以漢籍電子文獻資料庫之加值應用為主軸的時空座標系統建置研究計畫】

史語所多年以來持續建置的漢籍電子文獻資料庫,透過網頁全文檢索即可篩選關鍵字所在的文本章節段落,再從中查閱所需內容,對於加速歷史研究已甚有助益。隨著新技術與應用理念的拓展,進一步對漢籍電子文獻資料庫進行加值應用之可能性增加。本研究在於嘗試運用地理資訊科學的概念與技術,探討由人、地、時等面向建立時空座標系統,將散見於漢籍電子文獻資料庫之歷史事件因果與歷程加以整合,並透過地圖作可視化的呈現,形成對漢籍電子文獻資料庫進行一加值應用模式的可能性。

 

欲透過時空座標系統來串連歷史事件,關鍵為具備完整的地名檢索基礎,亦即須賦予漢籍電子文獻資料庫空間屬性,因此,本研究之核心技術包括整合歷史地名資料庫,及運用文本標註技術、地名時空對位之網路地理資訊系統技術等,就漢籍電子文獻資料庫進行地名標註,再透過地名檢索機制及時空資訊系統之可視化設計,使漢籍電子文獻資料庫之文本資料與中華文明之時空基礎架構(CCTS)的地圖可相互串連,達到以圖形呈現歷史事件的效益。

 

本計畫透過擴充歷史地名資料庫與彙整歷史事件資料,以及建置完善的漢籍文獻地名標註系統,改善文本資料之地名標註、分析與檢索模式,藉以提升文本地名標註的精確度與歷史事件於地圖呈現之有效性,增加於文本資料解析歷史事件因果與歷程的能力;同時,對於四維時空資訊平台的開發與地圖資料擴充,將大幅提升圖面之可視化效果。本計畫建置成果,後續可結合院內其他具有空間屬性的數位典藏資料庫,以進行相關研究與加值應用。

相關連結

回計畫列表

 

Facebook RSS
加入粉絲團



 

訂閱RSS 訂閱RSS

RSS Feed