小學堂文字學資料庫的研發與應用
國內最大的文字學資料庫「小學堂」,24年研發經驗集結成冊!
「小學堂文字學資料庫」起源於1990年代建置的「漢字構形資料庫」、「漢字古今音資料庫」,經24年擴充、改版與整合,目前收錄甲骨文、金文、戰國文字、小篆、楷書等字形逾22萬個,聲韻資料逾134萬筆,以及字書索引逾36萬筆。
做為形、音、義綜合的資料庫,「小學堂」提供使用者根據文字的形音等屬性,先檢索出字頭,再透過字頭連接到個別的形音義資料庫或字書索引。目前連結5部外部線上字典,包括「異體字字典」、「CNS11643中文標準交換瑪全字庫」、「國際電腦漢字與異體字知識庫」等。
「小學堂」最為人所稱道的,是一目了然的古今漢字形體演變。以資料量而言,國內同類資料庫皆難以望其項背。自2013年開放以來,「小學堂」的網頁瀏覽量已近1,000萬,對漢字教學的推動成效顯著,亦成為國內文字學研究的重要參考來源。
此技術報告文字清晰、結構井然,詳盡描述了「小學堂」的發展歷程、系統架構、操作界面,以及內部資料庫設計與網站實作。24年研發經驗不藏私大公開,讓您一次看透「小學堂」的資料庫銜接機制、文字銜接機制、檢字機制、缺字處理機制等!
本著作是極佳的「科普」文獻,敘述了人文與資訊跨域合作之典範打造歷程。
欲購此書,請洽中研院四分溪書坊(02-2652-1876)與三民書局(02-2500-6600);或至國立公共資訊圖書館(免費加入會員瀏覽全文)、凌網科技HyRead eBook(免費加入會員瀏覽全文)、華藝數位iRead eBook(點選試閱瀏覽全文)免費瀏覽電子書。
作者簡介:
莊德明,中央研究院歷史語言研究所研究助技師。投身「小學堂文字學資料庫」建置24年,為文字學知識庫專家。