中文版 | English

史語所學術創新數位深耕計畫

基本資料
計畫類別 數位文化中心計畫
計畫編號 ASCDC-106-02
通過年度 106
執行單位 史語所
主持人
簡介

史語所自民國73年(1984)推動「史籍自動化」以來即全力進行各項典藏的數位化工作,包括民國77年(1988)善本書、民國85年(1996)明清檔案的數位化工作,民國90年(2001)數位博物館計畫、數位典藏先導計畫。民國91-101年(2002-2012),分別以「珍藏歷史文物數位典藏計畫」、「史語所數位知識總體經營計畫」之名,參與數位典藏國家型科技一、二期計畫。前期將所內典藏分為考古、拓片、善本圖籍、少數民族、內閣大庫檔案等五類,進行數位典藏之基礎建設。後期則以擴展更多珍貴典藏的數位化、創造更多元的數位資源為目標,並結合內容與技術專家創新發展,將數位資源再造為數位知識,推展科普應用、教育應用與學術加值應用。為使本所多年來的數位成果,無論在學術、教育、科普或是產學發展上都能展現知識創新的效益,尤其在國際人文與社會科學學術發展的趨勢上展現影響力,於民國102年(2013)起規劃「史語所學術創新數位深耕計畫」至今,藉以實現數位典藏的永續經營與創新發展。

 

近年來數位人文學在國內外蔚為風氣,並獲得長足的發展,為因應此潮流與活用前期豐碩的數位成果,本期計畫一方面仍持續進行所內珍貴典藏含考古大龍峒遺址、荖濃溪流域遺物、綠島史前文化遺物、殷墟文字乙編,以及佛教石刻拓片、五代及宋代拓片,還有善本史部政書類文物資料等數位化、資料庫內容與功能增建等工作,以豐富數位人文學的基礎建設。

 

另一方面,也將致力於利用現有成果結合資訊科技,進行「一源多用,跨庫整合」的構想,讓資料庫由單一資料庫單方面供使用者提取資訊,進一步演化為具有標註、分析、探索功能,並成為能與各資料庫橫向連結的查詢系統,以發掘材料間的內部連結與脈絡,進而找出值得深入研究的主題,另更藉由地理資訊系統(GIS)及相關分析與技術功能的串連,強化資料庫應用的功能,使數位人文學演繹出更多的可能性,深化此學科的研究與進展,提供更便捷、學術性的數位應用環境。

 

本計畫包含七個子計畫,分述如下:

【子計畫一:數位資源維運與知識服務計畫】

「數位資源維運與知識服務計畫」為總計畫,有效整合各項行政資源,包含人事、經費、計畫書、成果報告等統籌工作,另進行綜合業務協調,及協助數位化拍攝事宜,並提供技術、設備之支援,有助提升計畫執行之成效。

 

【子計畫二:數位內容學術加值計畫】

「數位內容學術加值計畫」針對學術研究的需求,抽取人、事、時、地的核心脈絡,進行數位內容的知識加值,主要包含人名、地名、職官三個資料庫。本計畫一方面持續增建資料,以厚植數位人文學的基礎建設。另一方面也透過協助「漢籍電子文獻資料庫權威資訊物件管理系統」之建置,整合人名、地名、職官資料庫,讓其成果得到更進一步的加值運用,最終發展為文本分析的重要利器,以深化數位人文學之研究。

 

【子計畫三:考古資料數位典藏創新計畫】

106年度考古資料數位典藏創新計畫,將延續歷年來考古資料數位化及考古學研究及知識的推廣工作,持續豐富深化考古資料數位典藏的內容,推廣臺灣考古學研究成果。預定數位化的考古資料為臺北市大龍峒遺址,以及荖濃溪流域玉山國家公園早期人類聚落史的考古學研究計畫調查發掘之遺物與東部海岸國家風景區綠島史前文化調查研究計畫調查發掘之遺物;此外,將持續進行殷墟文字乙編甲骨文字的數位化基礎工作。

 

數位人文運用方面,持續進行甲骨拼合計畫,利用電腦高效能的運算能力取代以往耗時費力的人為綴合甲骨工作。106年度的目標將聚焦於拼合演算法的實作修正,在利用合編資料庫中已知可綴合之殘片驗證拼合演算法的同時,不斷改進演算法內容,最後套用至未知碎片上,提供可能的拼合清單供拼合者實際驗證。

 

【子計畫四:傅圖館藏數位典藏創新計畫】

本所傅斯年圖書館之特色館藏,包含古籍善本、金石拓片、俗文學資料、少數民族文書、檔案文書、內閣大庫檔案等,均為國內外相關研究機構及學者專家之重要研究素材。為避免這些珍貴典藏因一再使用造成損傷,本所過去及近年參與國家型數位典藏計畫的豐碩成果除提供讀者更方便、更迅速的檢索利用,並有利於國際相關研究計畫之合作與交流。本計畫的目標將延續歷年來之數位化成果,並力求充實與增補研究所需的材料。106年預計提出特色館藏中(1)古籍善本史部政書類,(2)佛教石刻拓片,(3)五代及宋代拓片等三種主題特色之館藏,作為永續計畫經營之重點。

 

【子計畫五:漢籍全文資料庫】

「漢籍全文資料庫計畫」的建置肇始於民國73年,為「史籍自動化」計畫的延伸,開發的目標是為了收錄對中國傳統人文研究具有重要價值的文獻,並建立全文電子資料庫,以作為學術研究的輔助工具。「漢籍全文資料庫」是目前最具規模、資料統整最為嚴謹的中文全文資料庫之一。

 

資料庫內容包括經、史、子、集四部,其中以史部為主,經、子、集部為輔。若以類別相屬,又可略分為宗教文獻、醫藥文獻、文學與文集、政書、類書與史料彙編等,30餘年來累計收錄歷代典籍已達905種,6億3959萬字,內容幾乎涵括了所有重要的典籍。計畫往後將以原建置書目為中心,逐年增設主題,並擴增系統功能,尚期為專家、學者以及愛好文化人士,提供品質更優良的電子文獻,以及更完備的檢索工具。

 

【子計畫六:新出青銅器銘文暨器影(2006-2013)匯入『殷周金文暨青銅器資料庫』計畫】

本計畫是承繼過去「語言典藏」計畫之分支計畫「先秦甲骨金文簡牘詞彙庫」而來。由中央研究院語言學研究所「數位典藏與數位學習國家型科技計畫」執行之「語言典藏」計畫於101年結束,102-103年持續永續經營計畫,「先秦甲骨金文簡牘詞彙庫」一直作為分支計畫包含在「語言典藏」計畫中。

 

「語言典藏」於103年完全結束計畫,而「先秦甲骨金文簡牘詞彙庫」作為階段性的任務也隨之告一段落。這段期間我們建置了「先秦甲骨金文簡牘詞彙資料庫」、「殷周金文暨青銅器資料庫」、「金文關係文獻資料庫」、「青銅器愛玩網」、「殷周青銅器地理資訊系統」「先秦銅器紋飾資料庫」共六個資料庫。在橫向連結幾個資料庫之間,提供研究者及一般大眾便捷、學術性的數位應用環境,建立多重互動查詢,與大眾共享的先秦文字研究數位平台,這一點,我們也取得相當的成績。目前我們持續維持運作,管理及修正資料庫、與使用者對話、以專業知識提供使用者諮詢服務等方面,都在積極進行中。

 

「殷周金文暨青銅器資料庫」原包含在「語言典藏」中。過去我們歷經10多年的努力,將《殷周金文集成》12,000餘件、《新收殷周青銅器銘文暨器影彙編》2,005件銅器資料,都整合在「殷周金文暨青銅器資料庫」中,每件青銅器的銘文拓片、青銅器影像及基本資料、銅器出土地理資訊、考古器物出土平面圖等,都包含其中。至105年度為止,則又新增了2006-2013年新出土有銘青銅器1,705件。

 

本年度(106)將持續新增 2014-2016年新出有銘青銅器,納入原有「殷周金文暨青銅器資料庫」中,又補充過去遺漏的資料,及更新汰換原有不夠清晰之圖像,令資料庫隨時更新,資料更為完整。

 

目前「殷周金文暨青銅器資料庫」已正式對外開放,是全世界唯一利用網路平台且免費使用的金文及青銅器研究資料庫,得到許多青銅器研究者、上古史學者、藝術史學者的好評。要保持長久以來建立的資訊信賴與學術地位,唯有不停前進更新。在新出銅器資料大量湧現之際,若未能隨時增補新資料,就將落後並被淘汰,前功盡棄。因此,持續地將新出土有銘青銅器新增至「殷周金文暨青銅器資料庫」,實為刻不容緩之務。

 

【子計畫七:以漢籍電子文獻資料庫之加值應用為主軸的時空座標系統建置研究計畫】

本計畫基於「以漢籍電子文獻資料庫之加值應用為主軸的時空座標系統建置研究計畫」所研發之漢籍電子文獻標註系統架構,進一步推展整合資訊技術與人文研究之數位人文研究方法,提出一個利用自然語言處理技術之漢籍全文巨量文本分析方法,將巨量之漢籍全文文獻中的重要詞彙自動擷取出來,並分析擷取之人物與地名等相關資訊,有系統地呈現其時空特性,供文史學者參考,以輔助文史相關研究課題的推展。

 

同時,本計畫亦將開發線上歷史文獻標註系統,供專家學者檢視系統自動擷取之詞彙與其相關資訊,並修正更新相關標註內容;本線上系統亦具有針對歷史事件與地名等文字進行手動標註的功能,以提供本計畫開發之文本分析系統再次訓練之用,藉此提升系統標註之準確性,並且將彙整標註結果,用於產生適合數位人文相關研究運用之知識庫。

 

本計畫研發之方法預期將可廣泛應用於不同的歷史文本上,且能有效分析其詞彙分佈與標註其所記載事件。透過本研究方法所發展完善化的漢籍文本標註功能,不僅可提升對於文本中所記載人、事、時、地、物等訊息擷取之能力,輔助解析歷史事件因果,改善歷史事件於地圖呈現之有效性,並且將可進一步強化時空座標架構之資訊整合與知識庫應用功能,拓展時空整合資訊系統於數位人文之研究範疇。

相關連結

回計畫列表