中文版 | English

大語言模型與知識庫的結合 - 以自然語言進行知識庫的問答與導覽

基本資料
計畫類別 數位文化中心計畫
計畫編號 AS-ASCDC-113-202
通過年度 113
執行單位 資訊所
主持人
簡介

2022年11月,OpenAI在AI界投下一個重磅炸彈 - ChatGPT ,能理解大多數的人類語言,可以用任何語言包含中文回答任何問題,可以聊天,寫小說,甚至寫code。這樣的應用帶給吾人一個大膽的想像:既然ChatGPT可以幫公司就其產品跟使用者進行自然的互動,那麼ChatGPT不就也可能為數位人文平台或是博物館之類的機構,就其典藏資料或典藏品來跟使用者進行自然的互動嗎? 這樣使用自然語言做自然的互動,就類似一個典藏機構的導覽員隨時隨地在旁,可以跟參觀者隨時地解說,解答,互動,聊天,甚至反問,例如數位觀賞者在觀賞翠玉白菜的圖片或3D影像時,以ChatGPT技術扮演的 “數位導覽員”就可以跟觀賞者進行實時的對話,或是人文學者在研究李衛這個清代人物的生平時,以ChatGPT技術扮演的 “顧問”可以用自然語言進行任意的查詢,回饋,既能扮演搜尋資料角色,又具備消化資料與提出觀點的能力,而且是有所本,本於典藏資料或典藏品的資訊,而不是ChatGPT當初自己的記憶。這樣強大的工具有可能會帶給數位人文研究在方法上的莫大助益,也給一般使用者一個更容易親近接觸數位人文的媒介。

因此,本計畫擬跟中研院數位人文平台團隊密切合作,打造出能夠用自然語言為使用者查詢,互動,解說的虛擬導覽員。以兩年計畫執行,第一年將目標限縮在能夠用自然語言為使用者查詢進行事實類的QA,第二年聚焦用自然語言為使用者進行互動式導覽等等。 本計畫在策略上有兩大方向:1. 以OpenAI的ChatGPT或GPT4的API作為主體,吾人將之賦能,使其具有精準查詢典藏資料的能力,並能跟使用者進行事實類的QA。2. 有鑑於ChatGPT或GPT4的API仍須付費,還有日後維運的獨立性,以及典藏資料的隱私性等種種考量,自行開發並擁有7 billion參數以上的大語言模型仍有其必要,能夠基於典藏資料進行預訓練(pretraining)與任務微調(fine tuning),可以作為免費條件下的另一選擇。 

相關連結

跟歷史人物對話
知人善「認」數位博物館

回計畫列表

 

Facebook RSS
加入粉絲團



 

訂閱RSS 訂閱RSS

RSS Feed