「史語所學術創新數位深耕計畫」之子計畫「建置研究導向知識庫所需之巨量歷史文本資訊擷取技術」主持人蔡宗翰,將於7月9日至12日遠赴荷蘭,參與全球性數位人文頂尖會議「2019年數位人文研討會」(Digital Humanities Conference 2019),並發表論文。
論文題目為〈中國古代歷史文獻的事件擷取—以《明實錄》貢賞事件的擷取為例〉(Event Extraction on Classical Chinese Historical Texts: A Case Study of Extracting Tributary Events from the Ming Shilu)。蔡宗翰及其團隊藉由運用「語義角色標註」(Semantic Role Labeling,簡稱SRL)技術,進行《明實錄》貢賞事件的自動識別與擷取。這亦是機器學習方法於歷史事件擷取技術的一項嘗試。
本中心每年公開徵選本院「數位典藏與數位人文學研究計畫」,可分為三大類計畫,即「擴增數位典藏內容,建置以數位人文研究為導向的知識庫之計畫」、「數位人文研究計畫」,以及「數位內容徵集及數位技術研發計畫」。「史語所學術創新數位深耕計畫」為第一類計畫,其子計畫「建置研究導向知識庫所需之巨量歷史文本資訊擷取技術」今年的目標,是利用自然語言處理技術的漢籍全文巨量文本擷取方法,從巨量的漢籍全文文獻中自動擷取重要詞彙,並分析所擷取之人物與地名的相關資訊。此外,亦結合近年致力研發的非監督式文本事件分析技術,以《明實錄》為分析標的,進行人物、地名、時間和事件的擷取,逐步整合相關內容資料,建置知識庫。
〈中國古代歷史文獻的事件擷取—以《明實錄》貢賞事件的擷取為例〉即為相關實作。「2019年數位人文研討會」的主題為「複雜」(Complexities),蔡宗翰將於7月12日的「史學與史學史」(History and Historiographies)場次發表此論文。
「數位人文研討會」創辦於1989年,為國際數位人文學界的年度重要頂尖會議,每年皆吸引逾千名全球各地的專家學者赴會。
2019年數位人文研討會(Digital Humanities Conference 2019)
時 間:2019年7月9日-12日
地 點:荷蘭烏特勒支市TivoliVredenburg音樂中心
主辦單位:荷蘭烏特勒支大學
相關連結:
「史語所學術創新數位深耕計畫」簡介
「史語所學術創新數位深耕計畫」網站