中文版 | English
https://ipicbox.tw/picfiles/image/00/0f/42/01_7PY2SWYK9NGM_source.jpg

【DADH 2020系列報導三】掌握研究問題意識 釋放資料潛力

發佈日期:2021/02/09
發佈者: 中央研究院數位文化中心

 

 

報導/田伊婷

攝影/林郁靜、林慧菁 

 

馬克斯・普朗克科學史研究所第三部門主任薛鳳(Dagmar Schäfer)在專題演講中,分享運用智慧資料的3個研究案例。圖為薛鳳與聽眾進行線上Q&A。中國北京大學助理教授楊浩的研究以論語中「仁」、「禮」的關係為核心。「數位人文中的台灣關注」場次視訊直播現場一景。台師大柯皓仁團隊成員陳佳君發表論文,探討台灣公民參與文化資產的議題與面向。

 

近10年間,數位人文領域持續致力於活用數位典藏時代的巨量資料,成果頗豐。如今在大數據潮流逐步轉向智慧資料的當兒,數位人文學者亦開始融會更新穎的技術,朝更多方向開展研究論題。「第十一屆數位典藏與數位人文國際研討會」(11th International Conference of Digital Archives and Digital Humanities, DADH 2020)所發表的研究成果,顯示了人文領域應用智慧資料的多元與彈性,呈現對不同面向、不同議題之關照,其中亦不乏對數位人文概念的省思,以及對智慧資料的探討與活用。

 

智慧資料三重應用 科學史視野大不同

是什麼讓智慧資料與數位人文產生關聯?現任馬克斯・普朗克科學史研究所(Max Planck Institute for the History of Science, MPIWG)第三部門主任薛鳳(Dagmar Schäfer)在專題演講「從數位到人文―智慧數據與科學史在數位人文研究的定位」中指出,資料訊息如何構成人們對世界的理解,或世界如何轉化成人們所理解的資料,是科學史學者關注的重點。此種由資料驅動的研究,在研究取徑之間的互通交集,就是智慧資料與數位人文擦碰出的火花。

 

她以3個研究計畫為例,探討智慧資料之於數位人文的作用,並闡述科學史在其中扮演的重要角色。「天界的視覺與物質文化:歐亞和北非的圖像資料庫」(Visualization and Material Cultures of the Heavens: Image Database Eurasia and North Africa(4000 BCE-1700 CE))研究計畫,是由圖像資料庫發展而來,透過匯集天堂母題的視覺形象,進而設計出歐亞和北非地區知識形成和視覺文化的比較研究。薛鳳認為,當我們蒐集資料並將其作為知識源進行研究時,亦是「從數位想像中重新思索(知識)邊界的可能性」。

 

此計畫的目標是透過比較研究,重新思考星體科學的定位,以及星體科學在科學史中被研究、構建和解構的過程。例如,重新思索星體在東西文化中的定位、比較墓穴與廟宇中描繪天堂的圖像等,都有助於理解當前知識的不足並予以擴充,發展出更多研究方向。

 

薛鳳在演講中介紹LoGaRT的建置目的。(圖片提供/薛鳳) 

 

地方志研究」(Local Gazetteers)主要研究中國的地方志此一文體,當中記錄了中國的社會、建築、農產品、公共設施等在地知識,且因為持續更新、可供不同類別查詢,而與目前研究人員使用的資料庫有異曲同工之妙。在研究過程中,因為需要共同研究開放授權或受版權保護的文本,而開發了「東亞研究基礎設施」(Research Infrastructure for the Study of East Asia)。在這種大型協作中,資料集和資料庫往往產生非預期結果,如過去地圖中未標示的地點,或先前研究中未觀察到的資訊缺口。

 

薛鳳表示,這些缺失或意外結果值得深入考慮,若能以此改變研究方法,並藉此審視既有的假設是否合用,對數位人文研究助益甚大。「數位人文不是通往解答的鑰匙,而是朝向更多元研究的路徑。」

 

召喚科學史」(History of Science ON CALL: Listening, Attending, Acting)則為一國際合作計畫,整合與「危機」有關的研究和教育資訊,不僅統整各國學者提供的即時資訊與採訪影片,更譯為多國語言。由此,能使人們對危機時期的國際合作學術分工產生新的理解,並認知到數位方法的未來用途,在當前全球疫情危機下尤顯重要。

 

「數位人文的發展過程,從提供未經改動的原始資料,到現在由資料驅動科學家,促使科學家通過研究,通過資料的驗證,觀察研究資料的生成、重組,進而產生新見解。」薛鳳強調,資料需要經過研究者的清理和分析,才能釋放隱藏的實力,這也是數位化和數位物件的重點,更是學術界和非學術界於知識傳播層面,能夠透過科學和數位人文學緊密結合的可能性。 

 

研究視角彈性收放 中國古代文史資料任翱翔

結合智慧資料的數位人文研究,擁有無限可能。專題討論「數大便是美?──智慧數據在中國古代文史研究上的兩種途徑」以3個文史研究為例,展現數位人文收放自如的研究角度。

 

本院人文社會科學研究中心合聘副研究員蔡宗翰、合聘研究員范毅軍團隊所發表的的〈歷史氣候現象之史料擷取與科學解析──數位人文技術發展與時空整合研究〉,即以「雨土」此一現象,作為多標籤分類方法(Multi-label Classification)、地理資訊系統(Geographic Information System, GIS)分析和歷史文本比對的示範案例,再透過氣候科學研究目前所建立的長期(1650-1800年)氣候模擬資料,進行跨學科的比對和驗證。研究發現,運用歷史氣候科學模擬資料,可彌補中國北方乾旱地區歷史氣象文本缺乏造成研究困難的情況。此計畫預期持續運用長期氣候科學模擬資料,與氣候紀錄史料相互參照,未來可多面向發展相關主題研究。

 

本院中國文哲研究所研究員劉苑如團隊所發表的〈振錫征行:歷代僧傳僧人遊方事件擷取與時空資訊應用分析〉,則在六朝至明代的千年跨度中選取8套文本,探討在不同歷史階段中僧人的遊方是否具有個體差異性。由於遊方詞彙並無固定權威詞,該團隊另行開發「事件擷取技術」及結合現有資料庫,透過半自動擷取僧人遊方事件,分析歷代僧人遊方的動機和結果、僧人科別與籍貫,以呈現遊方點的空間分布,統計出各朝代的「遊方熱點」,並製作「遊方路徑圖」。此研究提供的模式,或能補足過往人文學者對實際地理空間分析的不足。

 

劉苑如團隊的技術開發人員林品傑介紹在〈振錫征行:歷代僧傳僧人遊方事件擷取與時空資訊應用分析〉中使用的「事件擷取技術」運作機制。(圖片提供/林品傑)  

 

劉苑如團隊的另一研究〈魏晉南北朝周邊意象之數位人文研究:以外族人名為中心〉,則運用本中心研發的「中央研究院數位人文研究平台」,匯入「漢籍電子文獻資料庫」之魏晉南北朝9部正史外國傳,進行文本標記、分析部族與地名共現情況,並建置人物資料庫。團隊分享目前的文本標記與資訊視覺化成果,用文字雲、部族與地名共現圖呈現魏晉南北朝正史外國傳中的部族數量與分布關係,如氐族與跟其他地名的共現成果。

 

劉苑如團隊成員邱琬淳分享「部族與地名共現圖(氐)」。(圖片提供/邱琬淳)

 

「智慧數據呈顯出一種詩化的精神,精巧且具有結構。」劉苑如期勉學者透過此種結構,將數據加以整理,並與研究進行連結。而從前述發表亦可見到,數位技術固然可透過文本字面上的辭彙或語法擷取資訊,惟最終仍需配合人文研究的問題意識,才能對這些資訊進行分類、標籤,從而形成有意義的智慧資料。

 

東亞文史扎根穩 傳統新解更繽紛

在本屆會議的「思想與概念研究」場次中,數篇以東亞古典文史為主題的論文,皆採用數位技術對資料進行研究分析,在傳統學術領域嘗試新的研究取徑。如中國北京大學信息管理系博士研究生王林旭與王軍教授,採取「社會網絡分析」方式,進行多部學案中人物關係圖之探索與構建,并利用桑基图和地图的方式對宋元明清儒學發展特徵進行分析,更進一步呈現視覺化脈絡。

 

中國北京大學《儒藏》編纂與研究中心助理教授楊浩則探討《論語》研究的核心問題──《論語》是以「禮」抑或「仁」為核心?研究過程經人工篩選概念集、編寫Python代碼建立概念集之共現矩陣,後使用Gephi軟體以概念爲結點、共現次數爲關係產出概念之間的分組的視覺化結果,呈現出「仁」、「禮」兩個核心概念在「民」、「義」、「國」、「恭」、「敬」等概念中的地位。楊浩坦言,此篇論文尚屬階段性的探索,是對《論語》研究的微觀嘗試,分析僅為《論語》中「仁」與「禮」的關係,要看出當中的具體變化,還需要孔子相關的文獻進行比較,並根據文本特點,進行一定程度的資料清理。

 

另有韓國翰林大學的宋寅在,分享韓國翰林科學院數位人文發展進程,並以韓國近代文藝雜誌的數位化資料作為實例,說明「韓國近代期刊語料庫」的資訊處理與分析過程。他表示,資訊處理的難處在於需進行近代韓語中韓文的轉換。他也實際操作語料庫進行關鍵詞分析,發現期刊《白潮》較多與「女性」、「情感」相關的詞彙,如母親、愛情、眼淚等;《少年》則具有較多與「西方國家」、「新知識」相關的詞彙,如法國、英國、地理學等。可據此進一步進行期刊間的比較分析,未來更期望能以數據,觀察近代韓國的語言、社會、文化變化趨勢。

 

韓國翰林大學宋寅在分享韓國近代雜誌語料庫的數據處理、分析過程。(圖片提供/宋寅在)

 

本土議題待解答 數位人文提方法

在「數位人文中的台灣關注」場次中,也不乏智慧資料應用於實務層面的分享。多組研究團隊充分發揮學術回饋社會的精神,對當前臺灣文史領域所遇困境,提出可行解法。

 

中研院人社中心的彭逸帆與國立政治大學文學院薛化元及資訊科學系劉昭麟團隊發表〈數位化人物傳記分析之研究方法論—以雷震日記為例〉時透露,鑑於目前日記文本研究門檻較高、研究過程耗時耗力,故開發「日記文本分析系統」以輔助研究,期能藉由資訊技術的前期分析與處理,產生日記資料的地理資訊和量化結果,降低研究門檻。

 

國立臺灣大學圖書資訊學系教授陳光華團隊為改善使用者難以全面掌握國內現有資料庫的窘境,經前期研究全面盤點國內資料庫後,將盤點所得資料庫及其詮釋資料建置成「人文社會資料庫名錄檢索系統」(Humanities & Social Science databases Catalog, HUSSCat)。

 

「人文社會資料庫名錄檢索系統」(HUSSCat)首頁 

 

國立臺灣師範大學圖書資訊學研究所優聘教授柯皓仁團隊所發表的〈公民參與下的文化資產議題:質性內容分析研究〉,則以紮根理論(Grounded Theory)整理分析全國文化資產會議公民發言內容,以探討現階段台灣民眾對文化資產議題關注的面向與議題,並作為未來文化資產政策制定的參考。 

 

宗教研究也數位 知識應用更智慧

結合智慧資料的人文研究,範圍更擴及東西方宗教,可見人文領域使用智慧資料進行研究的多變彈性。在「數位人文與宗教語境」場次中,天主教輔仁大學宗教學系助理教授張名揚團隊在〈網路宗教語言分析的挑戰:以基督宗教在臺灣社會公共議題討論的線上參與為例〉中,探討台灣基督徒在網路平台上引用宗教經典的情況。

 

法鼓文理學院佛教學系副教授洪振洲發表的〈佛學期刊論文內大藏經引用資訊之擷取與分析〉,利用文字挖掘技術,擷取佛學期刊論文內對《大藏經》的引用資訊,概觀佛學研究行為的變化。其目標是將現行佛學資料庫如CBETA中華電子佛典、臺大佛學數位圖書館等進行深度整合,是一篇對佛學研究者相當實用且具前瞻性的研究。

 

法鼓文理學院佛教學系副教授洪振洲根據相關研究對於佛教論文關鍵字(1957-1986)的文字雲統計結果,與其研究成果進行匹配比較,提出早期佛學研究引用佛經的特徵。(圖片提供/洪振洲) 

 

法鼓文理學院佛教學系博士生黃淑齡的〈數位人文中的知識本體研究—以佛典科判的建構與應用為例〉,則用知識本體架構重新表述佛典內容,圍繞佛典主題和文脈進行主題式的人、事、時、地、物標記,建立該經典的知識本體。期望能藉由知識本體間的屬性關係,將完成標記的不同佛典相互進行內容對應,讓佛學研究者可查詢更為細緻的佛典內容,可說是一張「佛典知識表達藍圖」。

 

這些研究在在顯示數位人文工具可幫助學者重組、清理並產生智慧資料,增加研究資源、強化研究效率;不過於此同時,研究的核心依然是研究者的問題意識。一如薛鳳所強調,資料需經研究者的清理和分析才能釋放潛力,而只有掌握問題意識,經過分類、標籤產生的智慧資料才會有意義。以此期勉正在各研究議題深耕的數位人文學者,有效運用智慧資料進行研究,掌握古今、眺望未來。

 

延伸閱讀:

【DADH 2020系列報導一】回首臺灣數位人文之路 展望未來新可能

【DADH 2020系列報導二】智慧資料×數位工具 擴大知識邊界

【DADH 2020系列報導四】學術可以很生活 數位人文研究繽紛多元

 

 

回近期消息

 

Facebook RSS
加入粉絲團



 

訂閱RSS 訂閱RSS

RSS Feed