當數位科技逐漸成為學術日常,臺灣人文學未來可以是怎樣的一幅景象?
巨量資料分析新利器「中央研究院數位人文研究平台」,重磅登場!一站式服務讓研究者一舉兼得文獻資料、數位工具與合作夥伴,盼能集結數位人文研究社群,吹響共創臺灣人文研究新典範的號角!
運用數位科技豐富研究材料、改善研究環境、促進人文研究,是本中心一貫的努力方向。歷時近2年研發的「中研院數位人文研究平台」,於今日正式上線,開放全球近用。
近年來,「研究平台」已成為數位人文領域的網絡基礎設施發展主流,本中心亦不自外於此國際潮流。「數位人文研究平台」乃根據人文研究的需求而打造,只要建立了數位文本,即可進行巨量資料分析。本中心希望藉由此一研究新工具,促使臺灣人文研究者使用新的研究方法及研究途徑,進而探索新課題。
有鑑於此,此平台力求功能完整,讓研究者得以在其上同時取得研究所需之資料、工具與夥伴。兼具資料開放存取與多人協同研究機制,是「數位人文研究平台」的特色。研究者不僅能上傳文本與權威詞,更可自由加入不同主題的研究群組,結合平台內部的既有豐富史料與其他研究者匯入的開放資料,運用文本自動標記、詞頻統計、相似內容比對、關聯分析、時空整合呈現、資料視覺化等工具,進行文本資料探勘,以期梳理或發現新的知識脈絡。
目前「數位人文研究平台」已彙整與介接中研院史語所的漢籍開放文本、日本京都大學的漢籍文本Kanripo、美國哈佛大學的中國哲學書電子化計劃Ctext,共約80億字,以及中國歷史地理信息系統項目(CHGIS)的地名、中國歷代人物傳記資料庫(CBDB)的人名等開放權威檔,作為基礎的研究素材。值得一提的是,平台內的文本可使用冊、卷、章、節、段的結構呈現,權威詞亦可具多層分類架構。
在傳統人文研究之外另闢蹊徑,建立不一樣的、更具新意的研究範式,可為此領域注入新活水。「中研院數位人文研究平台」將在其中扮演集結社群、與研究者共創另一種研究可能的角色!
未來,「數位人文研究平台」將持續介接更多史料內容,並發展鏈結開放資料(Linked Open Data, LOD)、國際圖像互操作架構(International Image Interoperability Framework, IIIF)、中文古籍圖像文字辨識技術(Optical Character Recognition, OCR)、命名實體識別技術(Named Entity Recognition)等,提供更多元、具智慧分析能力的輔助研究功能。
延伸閱讀:
盼共創臺灣人文研究新典範 中研院數位人文研究平台10月吹響集結號!
跑吧!權威詞 廖宜方團隊的《太平廣記》研究靈感催生札記