採訪/房翠瑩
報導/劉詩媛
攝影/林郁靜、侯名晏
「108年度數位典藏與數位人文學研究計畫成果發表會暨數位文化工作坊」。成果發表會吸引不少院內研究人員與民眾前來觀摩與交流。本中心副召集人陳熙遠致詞。擔任「數位典藏與數位人文學研究計畫」審查委員的法鼓文理學院校長釋惠敏(中),與本中心「中央研究院數位人文研究平台」團隊交流。史語所研究員劉錚雲操作本中心所開發的「開放博物館」平台。本中心數位博物館團隊對院內人士說明「開放博物館」的功能與特色。本中心召集人林富士於現場閱覽「數位典藏與數位人文學研究計畫」各子計畫的執行成果。陳熙遠與本中心執行秘書陳淑君聚精會神聆聽子計畫研究團隊的說明,並提出意見。「史語所學術創新數位深耕計畫」團隊向史語所研究員兼文物館主任黃銘崇展示執行成果。「地理資訊數位典藏與空間人文學發展計畫」研究助理向民眾說明,如何促進數位地理圖像的加值應用。「戰後農村復員與資源重整」計畫團隊展示「農業復員委員會資源地圖」。透過「臺灣檔案文獻數位典藏與加值應用計畫—以日治時期旅券為核心」,可迅速掌握日治時期臺灣出國的人數、地點及目的。「病苦與死懼:歷代僧傳疾病敘述的數位人文研究」計畫運用「中研院數位人文研究平台」,建立模型以擷取歷代僧傳的疾病敘述文本,解讀其中的人際互動與情感結構。「『簡牘字典』開發計畫—開放性資料庫的結構及技術探索」,使用鏈結開放資料、國際圖像互通架構與影像文字辨識技術,將傳統的數位典藏系統,轉型為數位人文系統開放性平台,是展場裡最亮眼的成果之一。「漢籍自動化資訊擷取研究與系統開發(第三年)」計畫自動辨識及擷取漢籍的人名、地名、組織名、職官名等,建構人物知識圖譜。圖為計畫主持人馬偉雲與劉錚雲進行討論。「數位博物館人物誌:彭鏡毅博士的學術生涯」計畫運用「開放博物館」,策劃彭博士相關數位特展,彰顯其對生物多樣性研究之貢獻。圖為陳熙遠、陳淑君與計畫團隊進行交流。「人名權威暨清代職官鏈結開放資料建置計畫」團隊向民眾說明鏈結人名權威檔與清代職業官檔的LOD資料集轉置。民眾翻閱「臺灣民間信仰影音數位平臺計畫(第三年)」出版的專書《西港玉勅慶安宮:王府行儀》。在今年增辦的「數位文化工作坊」中,本中心數位博物館專案經理許正欣發表專題演講,說明開放授權觀念與行為對推動開放博物館的重要性。本中心資訊總監王祥安以中國傳統藥物研究為案例,說明及演示如何運用「中研院數位人文研究平台」進行研究。
「在眾多研究計畫中,中央研究院臺灣史研究所的『臺灣檔案文獻數位典藏與加值應用計畫—以日治時期旅券為核心』,讓我印象深刻。日治時期的臺灣,人民皆須申請『旅券』才能出境,透過此計畫,可迅速掌握臺灣當時出國的人數、地點及目的等,作為大數據的應用概念來說,是滿新鮮的!」
如同現場參觀民眾對於研究成果感到新奇,中研院歷史語言研究所陳姓研究員分享在展位上的驚喜發現——該計畫蒐集的20萬筆旅券,透過數位工具分析、比對、呈現巨量資料,再現了當時臺灣人的海外足跡;若再與私人日記、商號文書等相互映證,可勾勒出宏觀人流面貌,也發掘出微觀行旅故事,可說「是知識上的新獲得」!
這是本中心於10月1日假中研院史語所文物陳列館地下一樓,所舉辦的「108年度數位典藏與數位人文學研究計畫成果發表會暨數位文化工作坊」。雖然原定兩日行程受颱風影響,濃縮為一日活動,依然吸引不少人前來,觀摩與交流數位科技與人文研究結合的各種可能性。
本中心於2013年成立,自此擔負起執行與管理本院「數位典藏與數位人文學研究計畫」之重任。除執行「數位文化中心總計畫」,致力於運用數位科技促進人文研究、推動鏈結開放資料(Linked Open Data, LOD)之研究與實作、數位資料與學術成果之創新應用、數位內容維運與拓展等,每年亦徵選與管理「數位典藏與數位人文學研究計畫」子計畫。
「數位文化中心是一個溝通與統籌的平台,這是『數位典藏與數位人文學研究計畫』第四次舉辦成果發表會,邀集關心數位人文發展的各界人士參加,對外展示教學,對內觀摩交流」,本中心副召集人陳熙遠致詞時如是說。
資訊科技的發展,正在改變人文研究的方法。數位技術的運用,能更有效率地蒐集與整合大量研究材料,用新的方法切入既有的研究問題、發現新的現象、開展新的研究方向,提昇人文研究的質與量。隨著數位人文學(Digital Humanities)的興起,數位典藏也不再只是資料數位化、建置資料庫,而是走向知識庫途徑。
「從資料庫到知識庫,數位文化中心雖然還有一段路要走,但像是鏈結開放資料的SPARQL平台,提醒了人文學者其實可以問很多問題。這些問題在傳統研究方法來說,可能要花很多時間處理。」長期觀察數位人文學發展的法鼓文理學院校長釋惠敏說道。鏈結開放資料,是將不同來源與主題的巨量資訊,轉化為可被機器讀取與處理的結構及語彙,因此能與全球相關資訊相互連結,促成新知識的產出。
工作坊開講 開放博物館「如何開放、何以博物」
本中心本著以數位科技促進人文研究的使命,開發「中央研究院數位人文研究平台」,協助人文研究進行,希望在傳統人文研究之外另闢蹊徑,建立不一樣的、更具新意的研究範式。另並推出「開放博物館」,以「打開」藏品的典藏權、詮釋權及創作權為核心精神,提供典藏、展示、線上策展等數位服務,促進藏品共享與應用,亦有助於研究成果的呈現與擴散。
現場除了由專人展示此二平台,今年亦增辦「數位文化工作坊」,進行2場相關專題演講。本中心數位博物館專案經理許正欣以「我們與開放的距離—從數位典藏到開放博物館服務」為題,說明開放授權觀念與行為對推動開放博物館的重要性。「開放博物館」目前有逾4萬件數位藏品,九成以上採創用CC授權,只要依循授權規則,典藏單位、民眾、研究者等皆可自由使用藏品,或自訂主題進行線上策展,不同領域的知識得以在此平台重組、加值及傳遞。
許正欣說明「開放博物館」所採用的創用CC授權條款。許正欣說明「開放博物館」的功能。曾任台灣微軟股份有限公司副總經理的林三元,建議「開放博物館」開發多語言介面,並推出手機版的使用者即時回饋機制。國立政治大學宗教研究所助理教授林敬智建議「開放博物館」提供3D模組的展示。
「現在的博物館,講求要更開放、讓更多人應用。」遠從臺南而來的奇美博物館館員葉書含受訪時指出,該館是實體博物館,早年雖進行館藏數位化,但僅是將圖檔上傳至資料庫,較無主題性和互動性。「『開放博物館』累積了大量資料,進行串連和應用,產生新的知識。我們可參考此做法,在網站上開放藏品圖檔的授權,讓民眾自行策劃主題數位展,並分享、擴散出去。」
工作坊現場交流熱烈。曾任台灣微軟股份有限公司副總經理的「草編CEO」林三元,建議「開放博物館」開發多語言介面,並推出手機版的使用者即時回饋機制,以促進庶民文化的採集。對此,許正欣透露,「開放博物館」目前正規劃群眾協作機制,希望能集結社會大眾,共同為平台內的大量老照片進行資料註記。國立政治大學宗教研究所助理教授林敬智則希望此平台能提供3D模組的展示。
數位人文研究平台演示 中國傳統藥物研究巨量資料分析
此外,本中心資訊總監王祥安在「中研院數位人文研究平台簡介」專題演講中,以中國傳統藥物研究為案例,說明及演示如何運用此平台進行研究,回應預先提出的7個研究問題。
首先是取得文本,自「中研院數位人文研究平台」中取得《本草綱目》、《傷寒論》、《醫方類聚》等36冊中國古籍醫書。接著建立權威檔,其功用類似字典,即將逾15,000個藥名、逾4,000個病徵名稱,有系統地分層建構。其後,便能運用「標記關係詞」、「搜尋與詞頻統計」、「共現詞統計」、「文本比對與差異分析」、「視覺化分析結果」等工具,了解書中哪些藥物出現次數最多、藥物與病徵之關係、在地圖上呈現詞頻統計(例如風寒病症出現於哪些地點)等。
「這就是此平台的『一站式』理念,所有資料和工具一應俱全,研究者只需進到平台裡,平台就能幫你找到你要的資料散落在哪些書籍裡,又怎麼跟你的問題產生關聯。」王祥安點出,「數位人文研究平台」在巨量資料提供與快速分析上,能更有效地協助研究進行,甚至在分析結果的呈現中,也可能發現新的研究主題。而開放性線上多人協同研究機制,亦能在平台上不斷累積個別研究者的研究結晶與智慧,作為後人研究的基石。
王祥安說明「中研院數位人文研究平台」的設計理念。陳淑君(右)主持「數位文化工作坊」。國立臺灣師範大學臺灣史研究所教授兼所長張素玢於交流時間提問。國立臺灣大學學生提問。
十五大子計畫各展所長 簡牘字典綻光彩
除了「數位文化中心總計畫」的成果展示,活動另一重頭戲——「數位典藏與數位人文學研究計畫」子計畫亦端出豐碩成果。今年度展出的子計畫共計15個,可分為三類,包括「擴增數位典藏內容,建置以數位人文研究為導向的知識庫之計畫」、「數位人文研究計畫」,以及「數位內容徵集及數位技術研發計畫」。在展覽現場,各計畫專人以海報展示圖文解說,搭配電腦螢幕所顯示的各網站平台頁面,如「農業復員委員會資源地圖」、「中國歷史氣候時空地圖」、「婦女期刊作者研究平台」等,以及民間信仰紀錄片,邊操作示範,邊向民眾解說計畫成果內容。人群流動於各展位前,不時拋出問題與之交流、互動。
第一類計畫的主要目標為建置知識庫,前述「臺灣檔案文獻數位典藏與加值應用計畫—以日治時期旅券為核心」即令參觀者印象深刻。中研院人文社會科學研究中心的「地理資訊數位典藏與空間人文學發展計畫」,持續擴充兩岸地圖與空照影像大數據,並進行地理坐標定位處理、開發專屬查詢與應用系統,整合分散資料成為學術研究型資料庫;「史語所學術創新數位深耕計畫」新開發「臺灣考古遺址地理資訊系統」及「漢籍電子文獻專題庫研究分析平台」,亦不時吸引參觀者駐足探詢。
第二類計畫不以開發資料庫為目的,主要是利用現有數位技術及內容解決學術課題。「日治時期臺灣菁英的社會網絡初探:以楊肇嘉(1892-1976)與中研院臺史所『日記知識庫』為例」欲重構臺灣近現代人物的社會網絡與文化政治動態,目前已運用「中研院數位人文研究平台」,進行初步分析與比較。「性別、媒體與戰爭:抗戰時期國民黨婦女的社會網路Ⅱ」計畫,則以替中國近代婦女期刊作者建立傳記的「婦女期刊作者研究平台」為根基,透過社會網絡分析線上工具,組構出女性的社會網絡,探尋她們如何集結,透過媒體爭取群體或個人的目標。該計畫已勾勒出戰時國民黨婦女期刊的投稿網絡,並從中找出明星作者,也發現中央與地方互通聲息的媒介作者,以及不同的編輯策略。
第三類計畫則著重內部合作,由中研院各所提供內容與技術,結合本中心所發展的技術或平台,擴大數位內容徵集及數位技術研發。「漢籍自動化資訊擷取研究與系統開發(第三年)」計畫即與史語所、語言學研究所合作,自動辨識及擷取漢籍的人名、地名、組織名、職官名等,建構人物知識圖譜,並以知識本體呈現詞彙語義,開放予人文學者使用。此外,「『簡牘字典』開發計畫—開放性資料庫的結構及技術探索」則無疑是展場裡最亮眼的成果之一。
此計畫以史語所「漢代簡牘資料庫」為基礎,使用鏈結開放資料、國際圖像互通架構(International Image Interoperability Framework, IIIF)與影像文字辨識(Optical Character Recognition , OCR)等技術,將傳統的數位典藏系統,轉型為數位人文系統開放性平台─—「簡牘字典」。同時亦與日本奈良文化財研究所、東京大學史料編纂所、國立國語研究所等合作,採用IIIF標準,共同建置跨機構的文字資訊聯合檢索系統,以達成雙邊簡牘文字圖像互通。
「『簡牘字典』的知識成分,比我們以前使用(漢代簡牘資料庫)只有查單字的功能,高出許多。因為它不僅讓我們看字,還讓我們看同一個字的不同字型,同時也有那個字在簡牘上面的狀況,整個簡牘圖像都能顯現出來。」史語所陳姓研究員以學術角度,道出數位技術的整合資料能力與呈現方式,協助人文研究擴及更多可能性,「我很期待,這不只是字,也是圖與字的結合。」
「現今歷史學者不只是注意文本,也很注重物質的東西,因為它們可協助我們斷代,了解是哪個時代。」他進一步指出「簡牘字典」的獨特性,「漢籍資料庫」仍以文字為主要訴求,「若未來查詢『李鴻章』或『曾國藩』,就可以顯示出相關典籍的扉頁或主要內容圖像,如果能發展至此,就太令人驚豔了!」
院內攜手合作 冀成臺灣數位文化領域領頭羊
至於「數位典藏與數位人文學研究計畫」目前所採用的院內各所或中心相互合作之模式,陳姓研究員也以第一線研究員身分,表示「方向是對的」。惟他亦點出,當新的閱讀和研究形式出現,院內研究單位有那麼多資料、那麼多研究需求,技術性人才卻似乎不足,故建議盡快網羅更多相關人才。
此外,他建議將此研究計畫下各所或中心所建置的資料庫,予以整合、匯流。雖然早期資料庫的開發語言可能各不相同,但應可想辦法相通。「大數據分析或數位知識最令人驚豔的是,原本覺得沒有相關的東西,其實是有關聯的。只要匯流的知識(量)夠大,就能發現新的問題、新的題目。」
他指出,數位資料是靜態、被動的,研究人員要主動動手,自己找到連結;未來數位資料的連結若做得夠好,將會展示更多可能。舉例而言,若使用者進入植物分類的網站,就能直接搜尋到相關植物與某部分的臺灣史有關,或至少能產生一種連結的關係,如此「原本只能等待被使用的資料,就能做到比較主動的提醒、邀約,使用效果即能事半功倍!」
「這些年來,『數位典藏與數位人文學研究計畫』的研究與實作是滿成功的,也讓研究者走出象牙塔,與民眾接觸。」計畫審查委員釋惠敏對於計畫執行成果,持正面態度。
他指出,以對內交流為例,藉由人文學者實際使用後的回饋意見,可使「中央研究院數位人文研究平台」更貼近使用需求,加上人名、地名、清代職官名權威檔建置,與鏈結開放資料的應用,讓人期待未來的發展。而對外交流方面,「開放博物館」可讓數位人文研究成果與民眾產生互動,也極具潛力。
對於計畫的未來目標,釋惠敏亦有深切觀察,「數位文化中心成立時,並未局限於人文學領域,下一步或可思考,擴大併納社會科學和自然科學,建構出數位文化的學術性意涵,成為臺灣數位文化領域的先鋒者和領頭羊!」