報導/盧履彥、房翠瑩
攝影/葉恩慈
美國蓋提研究中心資訊技術部主任Joan Cobb(左二起)、德國柏林國立博物館研究中心副總監Monika Hagedorn-Saupe及資深工程師Axel Ermert、本中心執行秘書陳淑君(左一)及LOD團隊同仁齊聚,探討國際間的數位人文領域LOD發展。Joan Cobb說明美國蓋提研究中心的LOD建置過程與未來展望。Monika Hagedorn-Saupe與Axel Ermert分享「藝術與建築索引典」德文版執行狀況,並說明如何將歐洲各國的數位資料,以統一標準整合於歐洲數位圖書館(Europeana)平台。三方積極進行討論、交流。本中心LOD團隊成員盧履彥說明本中心的LOD建置過程。本中心技術長王祥安回顧LOD技術之發展演進。本中心研究助理林玉雯分享中心數位典藏成果及「藝術與建築索引典」中文化工作成果。
「美國蓋提研究中心預計於2018年完成『文化物件名權威檔』(Cultural Objects Name Authority, CONA)及『圖像學名稱權威檔』(Iconography Authority, IA)鏈結開放資料(LOD)轉置工作,將所建置的五種權威檔案皆以鏈結開放方式發佈於眾。」
本中心於11月3日舉辦「Getty @ Taipei: LOD for Digital Humanities」工作坊,邀請美國蓋提研究中心(Getty Research Institute, GRI)資訊技術部主任Joan Cobb、德國柏林國立博物館研究中心(Institute for Museum Research, State Museums of Berlin)副總監Monika Hagedorn-Saupe及資深工程師Axel Ermert,進行數位人文研究技術與經驗交流。
Joan Cobb指出,此兩項新計畫延續美國蓋提研究中心的一貫做法,針對文本或後設資料,皆建立具規範人、事、時、地、物等資訊的權威檔,使之成為控制詞彙,以制定文化資產或博物館展品典藏的管理標準。
蓋提研究中心成立於1985年,屬美國蓋提基金會旗下組織,致力於保存和研究視覺藝術領域的文化遺產,為美國首屈一指的數位人文及數位科技應用、導入之研究機構。長期以來著力文化資產的知識組織系統建置,並倡導文化資產保存進入LOD時代,打造全球鏈結開放資料網絡。
LOD(Linked Open Data,鏈結開放資料),是以開放授權、機器語意讀取標準所發佈的資料集,能打破地域、典藏館際、語言等有形及無形疆界,提供全球使用者自由下載、重新利用及散佈。
自2014年起,美國蓋提研究中心逐步將其建構的「藝術與建築索引典」(Art & Architecture Thesaurus, AAT)、「蓋提地名索引典」(Getty Thesaurus of Geographic Names, TGN)及「藝術家人名權威檔」(Union List of Artist Names, ULAN),進行LOD格式轉置。Joan Cobb透露,迄今已完成逾280萬筆資料紀錄轉換,並開放民眾以JSON、JSONLD、RDF、N-Triples、N3/Turtle等檔案格式下載。
她表示,為強化資料再利用性,美國蓋提研究中心同步建立Sparql Endpoint語意查詢檢索系統,提供近百種檢索案例範本,促進資料使用者對LOD資料集建構邏輯的理解。此外,亦設立公共論壇(Public Discussion Forum),以線上討論方式,對外解說該機構的LOD資料使用及語意設計型知識本體(ontology)結構。
美國蓋提基金會下一階段更規劃將旗下不同部門運作的「蓋提出版資訊」(Getty Publication)、「蓋提文物保存中心科學資料」(Getty Conservation Institute Science Data)、「蓋提研究中心典藏來源資料庫」(Getty Research Institute Provenance Indexes)及「國際文物保存文獻摘要資料庫」(AATA Online)等資料庫,轉置為LOD格式。全球文化資產保存邁入LOD趨勢,可謂幾不可逆。
本中心前身「數位典藏與數位學習國家型科技計畫」早在2008年,即與美國蓋提研究中心遞約合作,並實質展開「藝術與建築索引典」中文化工作。迄今已完成「藝術與建築索引典」中文版檢索平台(AAT-TAIWAN)建置、逾34,000筆詞彙中譯,並貢獻書法字體及中國節慶等在地化詞彙,豐富索引典內容。
自2010年起,本中心每年受邀參與「國際術語工作小組」會議(International Terminology Working Group, ITWG),與美國、荷蘭、德國、智利等「藝術與建築索引典」國際成員分享工作成果,並對全球LOD資料庫之發展進行交流討論。
「藝術與建築索引典」是一套具有等同、層級和聯想等三種語義關係的多語資料庫,涵蓋藝術、建築、裝置藝術、物質文化和素材等專業詞彙,主要被用作博物館編目和文獻工作的依據,協助資料檢索,更成為數位典藏資料庫的控制詞彙,滿足人文學科應用上最主要且基礎的功能。
鼓勵文化資產的流通與創新應用,向來是蓋提研究中心的核心精神。除了著力於LOD發展,該機構今年起開始釋放大圖檔,逐步將美術館典藏的3萬件作品,於Getty Collection中提供高解析度圖像(容量平均為30-50MB,最高逾100MB;約9,600*7,413像素)免費下載。
Joan Cobb說,「我們想讓這些圖像及索引典資料,成為資料科學家及社會大眾進行創意發想、實現計畫的來源。」
對此,本中心執行秘書兼LOD團隊領導人陳淑君表示,典藏單位釋放大圖檔以達致最大利用,在國際間似乎隱然成風。「然而,典藏機構目前無法對圖檔被應用狀況展開追蹤,這是我們可以思考要如何解決的問題。」
同時受邀來訪的德國博物館研究中心副總監Monika Hagedorn-Saupe及資深工程師Axel Ermert除分享「藝術與建築索引典」德文版執行狀況,更進一步說明該機構如何將歐洲各國不同語言、不同典藏機構來源的數位資料,利用統一性標準,整合於歐洲數位圖書館(Europeana)平台。
「現階段採取的方式是,先將資源轉換為符合LIDO(Light Information Describing Objects)語意標準規範,上傳至整合性平台(aggregator),再貢獻至Europeana資料庫中。」
另一方面,本中心LOD團隊並以研究實作的經驗,示範及解說如何利用OpenRefine等免費開源軟體進行LOD資料轉置,尤其是資料清理、調和等工作。此解析軟體目前在LOD資料清理上應用甚為普遍,Joan Cobb強調,未來若在運用實作上有所阻滯,可積極進行雙邊交流。