中文版 | English
https://ipicbox.tw/picfiles/image/00/0f/41/da_7PODAMJJ9N7X_source.jpg

【DADH 2020系列報導一】回首臺灣數位人文之路 展望未來新可能

發佈日期:2021/02/08
發佈者: 中央研究院數位文化中心
分享到 Facebook
分享到 LINE

 

 

報導/房翠瑩  

攝影/林郁靜、林慧菁

影片製作/葛玉倩 

 

 

為期4天的「第十一屆數位典藏與數位人文國際研討會」(11th International Conference of Digital Archives and Digital Humanities, DADH 2020)已於12月4日圓滿結束,但席間來自9個國家、逾150位專家學者對數位人文發展的探索仍持續發酵、沸騰,未曾劃下句點。會中那些因知識碰撞而火花激盪的珍貴時刻,留下熠熠光輝。

 

本中心推出DADH 2020會後系列報導,是為鈐記。報導一著重於本會議唯一公開直播的「十年回顧」圓桌論壇,從技術、內容、人文研究等面向,呈現臺灣數位人文發展的前世今生與未來展望。報導二以數位工具、智慧資料對人文研究的促進,乃至方法上的轉變為切入視角,探究人文學者如何與數位協作。報導三展現人文領域應用智慧資料的多元與彈性,呈現其對不同面向、不同議題之關照。報導四則從會議中較具生活化面向的研究議題切入,展現數位技術在數位人文研究不同層面的應用,看它如何與我們的生活擦出火花。

 

會議開幕式簡單隆重。在開幕短片的襯托下,會議主席、本中心召集人陳熙遠為大會掀開帷幕,並由本院院長廖俊智致歡迎詞。

 

本院院長廖俊智致歡迎詞。 會議主席、本中心召集人陳熙遠致詞。
本院院長廖俊智致歡迎詞。會議主席、本中心召集人陳熙遠致詞。

 

人文、資科學者齊聚 線上觀摩交流

他表示,過去20年來,臺灣在數位典藏與數位人文領域投入了龐大心力。尤其是中央研究院,聚集了一群來自人文領域、資訊科學領域的學者,共同朝此重要方向努力,鑽研、促進數位人文之研究。

 

「資訊科技在過去數十年間已取得長足進展,包括圖像處理、文本探勘、機器學習,當然還有人工智能。因此,IT(資訊科技)研究人員與人文研究人員合作的機會極大,而這正是舉辦本次會議的目的。」

 

雖然本會議因新冠肺炎疫情之故,首次以線上虛擬方式進行,惟廖俊智相信,此二領域的專家學者仍能透過此平台,針對數位典藏與數位人文相關重要議題,相互觀摩並深入交流。

 

「今年恰逢『數位典藏與數位人文國際研討會』第二個十年的開端,幸好我們還是能透過網路,連結海內外專家學者,一起對話數位人文研究的各種新可能。」對於疫情當前仍能排除萬難,如期舉辦會議,陳熙遠亦深感慶幸。

 

本屆會議主題為「智慧資料×數位人文」(Smart Data × Digital Humanities),期間共展開8場會前工作坊、1場專題討論、9場論文發表(總計31篇論文),以及25篇海報發表。專題演講方面,更邀請到德國馬克斯・普朗克科學史研究所(Max Planck Institute for the History of Science, MPIWG)第三部門主任薛鳳(Dagmar Schäfer)、美國肯特州立大學資訊學院教授曾蕾(Marcia Lei Zeng),以及本院資訊科學研究所特聘研究員兼所長廖弘源,講演「數位人文」當前重要的研究與發現。

 

有別於過往,本屆會議於12月3日特設「十年回顧」圓桌論壇,邀請臺灣數位人文領域的領航者,包括國立臺灣大學資訊工程學系暨研究所特聘教授兼數位人文研究中心主任項潔、臺灣數位人文學會理事長劉昭麟、本院歷史語言研究所兼任研究員劉錚雲、法鼓文理學院佛教學系副教授洪振洲、國立政治大學圖書資訊與檔案學研究所特聘教授陳志銘、國立師範大學臺灣史研究所教授兼所長張素玢,分享各自在專精領域深耕的經驗,並由陳熙遠、本中心執行秘書陳淑君擔任主持人。縱然論壇時間僅短短1小時,透過與會者提綱挈領的分析回顧,臺灣數位人文發展的重要軌跡於焉浮現。 

 

「十年回顧」圓桌論壇 主持人本中心召集人陳熙遠(左二)、本中心執行秘書陳淑君(左三)與與談人臺灣數位人文學會理事長劉昭麟(左起)、臺大資訊工程學系暨研究所特聘教授兼數位人文研究中心主任項潔、政大圖書資訊與檔案學研究所特聘教授陳志銘、本院史語所兼任研究員劉錚雲、師大臺灣史研究所教授兼所長張素玢、法鼓文理學院佛教學系副教授洪振洲侃侃而談。 主持人與與會者合影。
「十年回顧」圓桌論壇主持人本中心召集人陳熙遠(左二)、本中心執行秘書陳淑君(左三)與與談人臺灣數位人文學會理事長劉昭麟(左起)、臺大資訊工程學系暨研究所特聘教授兼數位人文研究中心主任項潔、政大圖書資訊與檔案學研究所特聘教授陳志銘、本院史語所兼任研究員劉錚雲、師大臺灣史研究所教授兼所長張素玢、法鼓文理學院佛教學系副教授洪振洲侃侃而談。主持人與與會者合影。

 

臺灣數位典藏獨特傳統 會議名稱見端倪

「臺灣的數位人文在數位典藏的傳統下發展,跟全世界都不一樣。」數位典藏與數位人文國際研討會創辦人項潔指出,此會議創設於2009年,為亞太地區最早創立之數位人文會議,甚至早於日本。而臺灣數位人文發展的獨特脈絡,也反映於會議名稱中。

 

他表示,全世界的數位人文會議中,只有臺灣以「數位典藏與數位人文」為名。這是因為臺灣具有「數位典藏」的獨特傳統,始於中研院1984年展開的「漢籍全文資料庫計畫」,邁入21世紀後,更傾國之力推動二期的數位典藏國家型科技計畫。期間,建置了許多高品質的人文素材資料庫。

 

「『數位典藏』這個名詞是謝清俊先生所創,當時的概念模糊,如今已變成一個家喻戶曉的名稱。」謝清俊為中文字形及資訊編碼的研究先驅者,1980年代任職於本院資訊所時,即與本院史語所研究員毛漢光攜手,以二十五史打先鋒,創設「漢籍全文資料庫」,後更積極推動數位典藏國家型科技計畫,可謂是臺灣將文化及科技結合的第一人。

 

項潔笑言,數位典藏本就是人文學者、資訊學者、圖資學者三方的整合,故從數位典藏發展為數位人文,屬理所當然。「你做了數位典藏,就會開始思考使用的問題;你既然開始思考學者如何使用數位典藏,工具的問題自然而然就出來了。」

 

數位人文有助開展跨時代、跨國研究

「數位典藏與數位人文國際研討會」前七屆由臺大主辦,2016年臺灣數位人文學會成立,次年起即由該學會承接,每年輪流與各大專院校聯合舉辦。

 

學會現任理事長、政大資訊科學系特聘教授兼系主任劉昭麟認為,數位人文的一大特色,即只要手握適當且足量的資料,在電腦、數位工具的輔助下,研究規模已從過去個人的單打獨鬥,起了莫大變化,時間與空間的維度皆得以擴展。以文學、史學領域而言,過去可望不可及的跨時代、跨國研究,有了展開的可能。

 

「過去我們可能研究特定詩人的作品,現在則可以研究全唐詩或全宋詩,甚至分析長達2,700年的漢詩,過去這幾乎是無人能做到的。」又如詩歌的跨國研究,如今更可比較「雪」、「風」等概念在唐代、當代臺灣的新詩如何運用。

 

他說,數位人文給予研究者許多機會,而臺灣數位人文學會的會員,仍在不同地方努力著。

 

出身純資訊背景、因緣際會下踏入數位人文領域的洪振洲即為其中一員。法鼓文理學院及前身體系發展數位典藏的歷程可追溯至1998年,以提供完整佛典資料著稱的CBETA中華電子佛典協會,即為其所推出。2007年進入該學院佛教學系任教時,他即被該學院所開發的「數位資源」所震懾,因其已超越單純數位化的層次,與強調要「保存得長長久久」的數位典藏「已是完全另一回事」,大多在探討如何支援使用者進行運用。

 

「一開始從全文的CBETA,到目錄,再到後來的字典、二手文獻資料,甚至GIS(Geographic Information System,地理資訊系統)的應用、Social Network(社會網路分析)等各種方式我們都試過,希望能帶給研究者一種全新的感覺。」洪振洲笑言,當人文知識結合科技技術,將呈現非常不同的變化,書裡頭的知識似乎「用另一種角度、另一種方式讓你看到」,他對此深深著迷。 

 

強調團隊合作 研究議題漸趨聚焦

當初法鼓文理學院以為自己是孤獨的,也不知如何稱呼這個獨特的領域,僅將其定位為「佛學資訊」。直至「第一屆數位典藏與數位人文國際研討會」徵稿,他才意識到原來有一個叫做「數位人文」的領域在慢慢演化、成型,原來在以為孤獨的路上,還有同道中人。

 

尤其近年來,數位人文領域的發展益加熱烈,發展模式也從過去的「大家各自努力」,慢慢趨向組織化、聚焦化。他分享自身的觀察,指出相較於傳統人文研究,數位人文研究更強調團隊合作。以佛學領域而言,期刊論文作者多為一位,但縱觀歷屆數位典藏與數位人文國際研討會的論文,作者人數約略在1.5至3位之間,2018年北京龍泉寺團隊所發表的論文〈自動標點的原理與實現〉,作者更高達9位,創下歷史新高。

 

國外的數位人文研究發表,漸有數個專家或群體同時從各面向探討同一議題之勢。「譬如,某個地方有很特別的數位資料,從拍照、數位化、網路建模到資料庫建置等,皆由不同專家進行,可說是各個專家的結合。」

 

臺灣的數位人文界也開始發展出此模式。他表示,縱觀近幾年會議的「專題討論」(Panel)主題,也從之前大而廣泛的題目,如歷史GIS、東亞文學概念與數位人文等,逐漸過渡至較為聚焦的題目,如人物資料庫的建置、臺南府城的數位人文創新探討等。

 

洪振洲對此發展抱持正面態度。他希望未來有更多人參與到數位人文領域,「或許有一天,我們真的就能定義出數位人文獨一無二的研究方法」。

 

著重人機合作 數位人文平台應具使用者導向

政大圖檔所特聘教授兼圖書館館長陳志銘一路伴隨著數位典藏國家型計畫走來,具有豐富的平台開發經驗,2018年更與國家圖書館合作,推出「通用型古籍數位人文研究平台」。他認為,好用,是數位人文平台的必備條件,惟近年來的觀察顯示,無論是文本閱讀、文本分析或其他涉及使用者使用的資訊系統功能,在技術層次上尚有極大的躍進空間。

 

他強調,建置任何系統,「使用者研究」至關重要,但也一直被忽略。系統的發展應是Design-based Research(設計本位研究),開發後應透過使用者研究進行多次、循環的改善,不斷去演化平台的功能,使之慢慢趨向人文學者的需求。

 

因此,在發展「通用型古籍數位人文研究平台」的過程中,除了進行使用者訪談,他們更透過後端平台的歷程記錄、數據分析,去了解人文學者解讀資料的脈絡。從使用者研究的角度出發,說服人文學者接受數位人文平台可慢慢符合其研究需求,甚至可對解讀資料有更高期許。

 

「電腦不見得完全正確,但做出來的東西,可以在細讀與遠讀之間鏈結。」系統可用遠讀快速抽取抽象概念,人文學者再以細讀,也就是自身知識進行判別、分析,此種人機合作的模式,能讓人文學者產生信賴感。

 

歷史GIS、社會網絡分析夯 研究要為人文而數位

數位工具、數位技術不斷推陳出新,臺灣人文學者如何以之走出另闢蹊徑的研究道路?曾多次開設「數位人文與專題實作」課程的張素玢,為以數位結合臺灣史料與地方志的先驅,在論壇中拋出如此省思――我們是為數位而數位,還是為人文而數位?

 

她表示,人文學者要從傳統人文領域跨足數位人文領域,需要莫大勇氣,而對於「數位」與「人文」之間的咬合,也需具備不斷探索的意願。

 

隨著時代的推進,查找、運用資料的方式已呈現大幅度變化。2000年前基本上是跑圖書館,查找資料的時間與人力成本高,但2000年後資料庫逐漸扮演重要角色,人文學者需充分掌握資料庫的發展動向。2010年前後,具有工具分析性的資料庫(今稱智慧庫)開始湧現,使用資料的效率、廣度大為擴展。

 

張素玢指出,臺灣人文領域以數位進行研究,較明顯的成果,一為歷史GIS,二為近5年興起的社會網絡分析。人文學者以往對空間的掌握度不足,但GIS快速降低使用門檻,極易入門,而「臺灣百年曆史地圖」亦已被國中生、國小老師廣泛使用。

 

「社會網絡分析本來是社會學的,可是今天歷史要處理人的問題、網絡的問題,視覺化分析其實帶起了一個很好的效果。」

 

她認為,數位工具的一大突破,即為視覺化分析。惟目前出版的呈現,無論是紙本或電子版,反而對數位人文是種束縛。她希望未來會議或期刊的發表,能突破現有出版框架,提供動態式的閱讀體驗。

 

數位內容建置耗時費力 善用工具解困境

除了數位工具,數位人文的發展,亦與數位內容息息相關。數位內容的建置,已從過去單純數位化的典藏型態,過渡至建構智慧資料。在此發展過程中,中研院皆參與其盛,而從1980年代的「漢籍全文資料庫」,直至近10年來史語所數位內容的建置,一路上都能見到劉錚雲的身影。

 

「我們當初建資料庫時,根本就還沒有數位人文研究的概念,資料庫主要是給人類使用;現在的資料庫,則必須讓機器讀得懂。」劉錚雲舉例,20年前建置「人名權威─人物傳記資料庫」,主要是為了讓研究者能快速查找官員的仕宦經歷,入錄資料時一律按原始資料所載,壓根兒就沒考慮到名詞與格式上的統一。

 

然而,若要將這些資料得以讓機器進行資料探勘或資料分析,並應用於數位人文研究,則需再進行資料清理或標註等前置作業。他透露,就如「戶科給事中掌印」,後來就全修訂為「戶科掌印給事中」,如此才能利用數位工具進行統計分析。「再如提到東安縣,亦必須讓機器知道,這究竟是湖南省、廣東省還是直隸省的東安縣,因此需透過標註,將其清楚定義。」

 

智慧資料的建置知易行難,上述標註及資料清理工作,尤其是人工校核,非常耗費人力。他不禁藉此場合,詢問是否能藉由資訊技術的介入,降低此方面的人力成本?

 

對此,項潔回應道,人、時、地、物的標註,最大的問題是標準化。以歷史文獻而言,一來需處理「消歧」(如同一姓名,為不同之人),二來需處理「聚合」(如人名、地名、官名等若有別名,需歸為同一對象),只要有足夠好的參考工具,就能提升標註效率。

 

「以CBDB(中國歷代人物傳記資料庫)為例,可以有5個人起同樣的名字,你用一些標記工具如MARKUS,會詢問你此名字有5個人,所指到底是哪一個?這是一個互動的過程,不是整批標好了再人工檢驗。」他提醒,此類工具勢必將日益精進、好用,惟人文學者亦需知道,期待全自動化在短期內是不可能的,尚有長遠的路要走。

 

「十年回顧」圓桌論壇破例於本中心臉書粉絲專頁進行直播,更於觀眾的熱烈提問中結束。

 

「其實我們無所逃離數位天地之間」,作為一位人文學者,陳熙遠於圓桌論壇尾聲如此感慨道。借助資料庫進行搜尋,過去的「他人瓦上霜」,與「我的門前雪」極可能有所關係;透過細讀與遠讀,不同的觀點豁然誕生。

 

以前我們覺得今日格一物,明日格一件,終有一天會豁然貫通。「如今透過數位人文的方式,不再需要這樣遙遙無期、皓首窮經才能有朝一日成為一個通經知識之人。」 

 

延伸閱讀:

【DADH 2020系列報導二】智慧資料×數位工具 擴大知識邊界

【DADH 2020系列報導三】掌握研究問題意識 釋放資料潛力

【DADH 2020系列報導四】學術可以很生活 數位人文研究繽紛多元

 

 

分享到 Facebook
分享到 LINE

回近期消息