本中心去年於「中國古籍文字自動識別挑戰 2021」國際競賽中,以近91%之高準確率奪冠。今年進一步與香港中文大學圖書館攜手,共同舉辦「2022中國古籍文字自動識別挑戰」競賽,以推廣中文古籍文字自動識別技術的發展及交流,為數位人文研究開創新里程。
本屆賽事分為學生組及公開組,不限地區,歡迎各界以團隊或個人名義參加。即日起開放報名至4月14日止。
「2022中國古籍文字自動識別挑戰」賽程長達10日,參賽隊伍需自行提供線上平台,大會每日將上傳一批中文古籍文字圖像檔,參賽者需於限時內進行自動文字識別,並回傳識別結果。評分標準包含文字識別準確度與輸出文字順序。每日競賽成績將以代號即日公布。
囿於技術所限,過去難以運用文本圖像進行數位人文研究。結合人工智慧的光學字元識別(Optical Character Recognition, OCR)技術近年已取得巨大進展,自2021年起,學界更持續發起針對中文古籍之文字自動識別競賽,勢必將推動各界對中文資料的發掘,從而為文本圖像數位人文研究取得突破性進展。
參賽資格
學生組:需為現正就讀於任何院校之學生,團體組別最多只容許一位教研人員加入
公開組:沒有限制
參賽時程
2022年2月14日:開放報名
2022年4月14日:報名截止
2022年4月7日:線上簡介會
2022年5月3 日-17日:線上競賽(每日一挑戰,為期10天;逢假日休賽)
2022年5月底:線上頒獎禮、得獎隊伍技術簡報
本中心近年來著重發展中文古籍OCR技術,亦積極協助本院與國際多家學術機構進行古籍文字辨識。歡迎各界共襄盛舉,踴躍參與本屆賽事,共同精進中文古籍文字自動識別技術。
「2022中國古籍文字自動識別挑戰」
報名期限:2022年2月14日-4月14日
競賽時段:2022年5月3 日-5月17日
主辦單位:中央研究院數位文化中心、香港中文大學圖書館
活動網址:https://dsprojects.lib.cuhk.edu.hk/zh-hant/2022-chinese-ocr-challenge
報名網址:https://bit.ly/3rp1ULH