中文版 | English

史語所學術創新數位深耕計畫

基本資料
計畫類別 數位文化中心計畫
計畫編號 ASDC-104-02
通過年度 104
執行單位 史語所
主持人
簡介

史語所自民國73年(1984)推動「史籍自動化」以來即全力進行各項典藏的數位化工作,包括民國77年(1988)善本書、民國85年(1996)明清檔案的數位化工作,民國90年(2001)數位博物館計畫、數位典藏先導計畫。民國91-101年(2002-2012),分別以「珍藏歷史文物數位典藏計畫」、「史語所數位知識總體經營計畫」之名,參與數位典藏國家型科技一、二期計畫。前期將所內典藏分為考古、拓片、善本圖籍、少數民族、內閣大庫檔案等五類,進行數位典藏之基礎建設。後期則以擴展更多珍貴典藏的數位化、創造更多元的數位資源為目標,並結合內容與技術專家創新發展,將數位資源再造為數位知識,推展科普應用、教育應用與學術加值應用。為使本所多年來的數位成果,無論在學術、教育、科普或是產學發展上都能展現知識創新的效益,尤其在國際人文與社會科學學術發展的趨勢上展現影響力,於民國102年(2013)起規劃「史語所學術創新數位深耕計畫」,藉以實現數位典藏的永續經營與創新發展。

 

近年來數位人文學在國內外蔚為風氣,並獲得長足的發展,為因應此潮流與活用前期豐碩的數位成果,本期計畫一方面仍持續進行所內珍貴典藏數位化、資料庫內容與功能增建等工作,以豐富數位人文學的基礎建設。另一方面,也將致力於利用現有成果結合資訊科技,進行「一源多用,跨庫整合」的構想,讓資料庫由單一資料庫單方面供使用者提取資訊,進一步演化為具有標註、分析、探索功能,並成為能與各資料庫橫向連結的查詢系統,以發掘材料間的內部連結與脈絡,進而找出值得深入研究的主題。本計畫中的漢籍電子文獻資料庫權威資訊物件管理系統(人名、地名、職官)、古籍目錄典籍導航系統、地理資訊系統(GIS)即是各資料庫橋接的重要媒介與分析工具,藉由彼此的串連,當能使數位人文學演繹出更多的可能性,以深化此學科的研究與進展。本計畫包含八個子計畫:

子計畫一:數位資源維運與知識服務計畫

 

以數位典藏成果的維運與推廣應用為目標,不僅負責行政庶務與整體資訊環境的建構,更進行多元面向的刊佈與耕耘,使各項數位資源在學術界、教育界等皆能獲得有效的應用。

 

子計畫二:數位內容學術加值計畫

 

針對學術研究的需求,抽取人、事、時、地的核心脈絡,進行數位內容的知識加值,主要包含人名、地名、職官三個資料庫。本計畫一方面持續增建資料,以厚植數位人文學的基礎建設。另一方面,也透過協助「漢籍電子文獻資料庫權威資訊物件管理系統」之建置,整合人名、地名、職官資料庫,讓其成果得到更進一步的加值運用,最終發展為文本分析的重要利器,以深化數位人文學之研究。

 

子計畫三:考古資料數位典藏創新計畫

 

104年度「考古資料數位典藏創新計畫」,致力於營造支援學術研究、教學及學習考古知識的專業網站,不僅持續維護更新「考古資料數位典藏資料庫」、「漢簡資料庫」等系統,102-103年計畫期間增加殷墟文字甲骨1,000件,以及殷墟出土的動物獸骨遺留計800件;台灣考古資料方面增加了1994年「臺閩地區考古遺址普查研究計畫第二年及第三年」工作成果,包括遺址189處及考古遺物732件,以及1993年第二高速公路後續計畫規劃路線沿線文化遺址調查工作成果,其中包括38處遺址及302件考古遺物。在數位化這些考古資料的基本內容後,同時開展相對應的專題的考古學相關的推廣網頁,如「動物考古學」、「我家後院有遺址」,以深入淺出的文字,兼顧視覺及互動性的方式,迎合時下青年學子熟悉的網路學習平台,透過本計畫,持續更新的考古資料數位化的內容,並轉成提供學術研究、教學及學習考古的知識。

 

本計畫將持續扮演考古知識的推廣中心,在過去數位化及教育推廣成果的基礎上,收錄的考古資料力求涵蓋台灣史前文化各個代表性文化的考古遺址,民國104年(2015)計畫將持續增加考古資料的數位化內容,包括屏東地區的北葉遺址標本300件以及花蓮地區花岡山遺址500件,此外,延續本1930-1940年代於大陸考古的工作成果,持續數位化殷墟文字乙編甲骨500件,以及小屯遺址上層隋唐墓的考古資料。

 

典藏成果推廣與應用方面將擴及二個方向:台灣考古遺址實境導覽APP及甲骨自動拼合數位人文學運用。台灣考古遺址實境導覽APP將與相關技術廠商合作,設計開發考古遺址導覽APP及網頁版,攝製實景的虛擬實境,結合google map與google街景功能,使用者可根據導覽系統所提供之導航資料,實際造訪各個考古遺址,為結合考古學研究於城市文化觀光的運用。

 

此外,本計畫於104年度將開展數位人文的方向,在過去殷墟甲骨考古資料數位化的基礎之上,結合資訊科學運用於甲骨拼合研究的初步成果,進一步將甲骨拓片資料庫中的相關甲骨研究資料,運用及深化這「考古資料數位典藏資料庫」及「甲骨拓片資料庫」等二個資料庫中甲骨的後設資料,提供影像自動拼合的自動分類依據,運用拓片及彩色數位檔案提供新的拼合演算比對程式修正及自動學習的來源,提昇甲骨自動拼合技術及運用。

 

子計畫四:傅圖館藏數位典藏創新計畫

 

本所傅斯年圖書館之特色館藏,包含善本古籍、金石拓片、俗文學資料、少數民族文書、檔案文書等,均為國內外相關研究機構及學者專家之重要研究素材。為避免這些珍貴典藏因一再使用造成損傷,本所過去及近年參與國家型數位典藏計畫的豐碩成果除提供讀者更方便、更迅速的檢索利用,並有利於國際相關研究計畫之合作與交流。本計畫的目標將延續歷年來之數位化成果,並力求充實與增補研究所需的材料。計畫預計於民國104年提出特色館藏中(1)善本古籍四部分類中的「集部」,(2)唐代與北朝有紀年之佛教石刻拓片,(3)宋代拓片等三種主題特色之館藏,以作為永續計畫經營之重點。此外,為倡導數位人文學之研究,提出古典目錄典籍導航系統之建置計畫,將中文古典書目加以數位化,以提供人文學者功能多元的線上研究利器。

 

子計畫五:漢籍全文資料庫

 

漢籍全文資料庫計畫」的建置肇始於民國73年,為「史籍自動化」計畫的延伸,開發的目標是為了建置研究人員使用之全文資料庫,為學術研究的輔助工具,故收錄之典籍為對中國傳統人文研究具有重要價值的文獻。「漢籍全文資料庫」是目前最具規模、資料統整最為嚴謹的中文全文資料庫之一。三十年來累計收錄歷代典籍已達814種,4億7,796萬字,內容幾乎涵括了所有重要的典籍。

 

至103上半年止,已有51萬張圖上線;「人名權威檔參見」提供《清實錄》、《清史稿》、《明實錄》等書14萬4千多次的「明清人名權威資料庫」參見。「免費使用」秒數已累積11億7,219萬秒,「授權使用」的秒數達8億5,372萬秒,「登入人次」計187萬人次。授權使用的團體:國外包括美、加、德、日、澳、法、比、荷、以色列等九國與國內團體共101個,國內個人使用總數八百多位。

 

104、105年計畫每年建置漢籍全文3000萬字與全文影像圖檔15萬至20萬頁,104年另建《正統道藏》內文圖檔9萬頁。同時,以數位人文學研究為導向,擴充系統自動化比對、檢索歷史、圖文對照閱圖模式,與權威資訊物件管理等功能,並與GIS合作,提供「由文到圖」之視學情報,為研究者提供品質更優良的電子文獻、功能更完備的檢索工具,以及適當文獻內容分析工具。

 

子計畫六:新出青銅器銘文暨器影(2006-2013)匯入「殷周金文暨青銅器資料庫」計畫

 

本計畫是承繼過去「語言典藏」計劃之分支計畫「先秦甲骨金文簡牘詞彙庫」而來。中央研究院語言學研究所「數位典藏與數位學習國家型科技計畫」執行「語言典藏」計畫已於101結束,102-103年持續永續經營計畫,「先秦甲骨金文簡牘詞彙庫」一直作為分支計畫包含在「語言典藏」計劃中。

 

「語言典藏」將於103年完全結束計畫,而「先秦甲骨金文簡牘詞彙庫」作為階段性的任務也隨之告一段落。這段期間我們建置了「先秦甲骨金文簡牘詞彙資料庫」、「殷周金文暨青銅器資料庫」、「金文關係文獻資料庫」、「青銅器愛玩網」、「殷周青銅器地理資訊系統」「先秦銅器紋飾資料庫」共六個資料庫,詳細情況請進入口網站。在橫向連結幾個資料庫之間,提供研究者及一般大眾便捷、學術性的數位應用環境,建立多重互動查詢,與眾共享的先秦文字研究數位平台,這一點,我們也取得相當的成績。目前我們持續維持運作,管理及修正資料庫、與使用者對話、以專業知識提供使用者諮詢服務等方面,都在積極進行中。

 

「殷周金文暨青銅器資料庫」原包含在「語言典藏」中。過去我們歷經10多年的努力,將《殷周金文集成》12000餘件、《新收殷周青銅器銘文暨器影彙編》2005件銅器資料,都整合在「殷周金文暨青銅器資料庫」中,每件青銅器的銘文拓片、青銅器影像及基本資料、銅器出土地理資訊、考古器物出土平面圖等,都包含其中。內容截至2005年已發表有銘銅器資料。

持續進行中的工作,最迫切需要關注的是2006-2013新出土有銘青銅器。這一批新出青銅器資料,在近兩年之間(102-103),已完成基本資料收集,包括1648件青銅器之器影1631張、拓片1507張、及線圖、紋飾等687張,出土平面圖334張等。未來我們所要努力的方向是對這1648件青銅器的內容撰寫釋文、新增參考資料、詞彙分析標記、器物所屬時間及空間定位、影像修治及強化等。在數位技術方面,將上述完成之資料增收整合進入原先的「殷周金文暨青銅器資料庫」中,同時橫向連結其他幾個資料庫:詞彙標記分析將增加資料進「先秦甲骨金文簡牘詞彙資料庫」、參考資料將增入「金文關係文獻資料庫」、空間定位分析將增入「殷周青銅器地理資訊系統」。

 

目前「殷周金文暨青銅器資料庫」已正式對外開放,是全世界唯一利用網路平台且免費使用的金文及青銅器研究資料庫,得到許多青銅器研究者、上古史學者、藝術史學者的好評。要保持長久以來建立的資訊信賴與學術地位,唯有不停前進更新。在新出銅器資料大量湧現之際,若未能隨時增補新資料,就將落後並被淘汰,前功盡棄。因此,2006-2013新出土有銘青銅器的增補並整合進「殷周金文暨青銅器資料庫」,實為刻不容緩之務。

 

子計畫七:歷史事件巨量資料的收集與研究:新媒體與歷史學研究

 

318公民運動創造了一個機會,讓我們有一個完整的面對數位時代新媒體史料如何生產、收集、整理與研究的學習機會,本計劃是更完整的思考新媒體與歷史學的第一步。

 

子計畫八:以漢籍電子文獻資料庫之加值應用為主軸的時空座標系統建置研究計畫

 

史語所多年以來持續建置的漢籍電子文獻資料庫,上線後透過網頁全文檢索即可篩選關鍵字所在的文本章節段落,再從中查閱所需內容,對於加速歷史研究已甚有助益。隨著新技術與應用理念的拓展,進一步對漢籍電子文獻資料庫進行加值應用之可能性增加。本研究在於嘗試運用地理資訊科學的概念與技術,探討由人、地、時等面向建立時空座標系統,將散見於漢籍電子文獻資料庫之歷史事件因果與歷程加以整合,並透過地圖作可視化的呈現,形成對漢籍電子文獻資料庫進行一加值應用模式的可能性。

 

欲透過時空座標系統來串連歷史事件,關鍵為具備完整的地名檢索基礎,亦即須賦予漢籍電子文獻資料庫空間屬性,因此,本研究之核心技術包括整合地名資料庫,及運用文本標註技術、地名時空對位之網路地理資訊系統技術等,就漢籍電子文獻資料庫進行地名標註,再透過地名檢索機制及時空資訊系統之可視化設計,使漢籍電子文獻資料庫之文本資料與中華文明之時空基礎架構(CCTS)的地圖可相互串連,達到以圖形呈現歷史事件的效益。

 

本計畫透過擴充歷史地名資料庫與事件地圖,建置完善的漢籍文獻地名標註系統,改善文本資料之地名標註、分析與檢索模式,以提升文本地名標註的精確度與歷史事件於地圖呈現之有效性,增加於文本資料解析歷史事件因果與歷程的能力,同時,三維時空資訊系統的開發,亦將大幅提升地圖之可視化效果。本計畫建置成果,後續可移轉至院內其他具有空間屬性的數位典藏資料庫,以進行各項研究加值應用。

相關連結

回計畫列表

 

Facebook RSS
加入粉絲團
中央研究院數位文化中心粉絲團
中研院-數位人文學研究室粉絲團
臺灣生命大百科粉絲團
中央研究院 Academia Sinica 粉絲團

 

訂閱RSS 訂閱RSS

RSS Feed