2024-05-18

TAIDE一年有成 公私協力共同推進具臺灣特色之大型語言模型

港灣新聞網

國科會自去(2023)年初整合產學研力量,發展具臺灣特色與繁體中文的可信任生成式AI對話引擎(Trustworthy AI Dialogue Engine, TAIDE),歷經一年,開發出基於Llama2的TAIDE LX-7B (可商用版本)及TAIDE LX-13B (學研用版本)模型,其在寫文章、寫信、摘要、英翻中、中翻英等五大任務表現優異,並具備多輪對話及阻絕產生不恰當回應之能力,國科會昨(3)日舉行成果發表會,邀請合作夥伴一同展示各種應用成果。

國科會吳政忠主委致詞時表示,感謝團隊這一年的努力打造出最有臺灣味的生成式AI引擎,同時也感謝產學研界合作夥伴的參與,驗證了TAIDE模型的可用性與多樣性,對於有這樣的成果深感欣慰,未來國科會也將繼續努力,讓TAIDE模型與時俱進,成為臺灣指標性的基礎模型。

中央研究院孔祥重院士出席今日的活動,表示臺灣不能缺席在這各國AI競逐的世界,因此要掌握屬於臺灣的大型語言模型,TAIDE計畫集結了很多優秀的人力,在很短的時間就有很好的果實,值得慶賀。另外Google傑出科學家紀懷新博士也受邀於昨日活動上進行專題演講。

TAIDE模型在各領域開花結果
 

該團隊在這一年積極與產學研合作夥伴發展多元應用,產業夥伴也有超乎預期的進展,成功案例列舉如下:

(1)中興大學開發的農業知識檢索系統-「神農TAIDE」,團隊經轉換使用TAIDE模型,使用者不再需要付費查詢,費用大為降低,且經過TAIDE過濾和摘要的答案,準確且容易理解,減少查找資料的辛苦。不僅農業研究人員,青農也都是受惠者。

(2)臺南大學的「台英語」對話機器人則將TAIDE模型導入中小學生台語教學,結合本土語言教材適合全球中小學生多元化語言學習, 2024年已在日本、馬來西亞、香港及臺灣進行場域驗證。

(3)陽明交大的台客語TAIDE大語言模型+語音AI介面,讓電腦具華台客英語聽說讀寫,翻譯口譯(至多國語言,包括英語,日語,印尼語,越南語等)能力,也能進行即時任意對話。

(4)高雄大學Kuwa GenAI OS是本土開發且開放源碼的新一代生成式AI應用平臺,其預載TAIDE模型,讓個人及各行各業皆可輕鬆在地端使用TAIDE生成式AI服務或開發創新應用。

(5)群聯獨家專利研發的aiDAPTIV+平台已與TAIDE模型完美驗證整合,並攜手十家以上的國際電腦大廠聯手,共同推出平民化的生成式AI地端運算平台,大幅加速臺灣及全球的生成式AI應用普及。

(6)叡揚資訊在不同產品整合TAIDE模型,讓使用者可以用直白語句查詢知識庫;此外,公文系統提供自動例稿生成,提高公文撰寫效率。

(7)教育部推出基於TAIDE的AI CUP競賽報告檢查系統,此系統將自動審查參賽報告,確保符合學術標準。以往僅前25%的報告進行實質審查,現透過TAIDE技術,所有報告均獲全面審查,提升報告品質,加強競賽的公平性與專業性。此系統未來亦可供其他教育競賽使用,作為文件檢核的參考模型。

以上的案例都證明了TAIDE模型可應用在各個領域,對於後續推動百工百業使用AI展現出無限的可能性。

為讓外界自由運用TAIDE打造符合自身需求的系統,團隊於今(113)年4月15日公開釋出TAIDE LX-7B模型,不到半個月的時間,已有超過6,000人次下載,顯示各界對於可信任、具有臺灣特色的繁體中文基礎模型之強烈需求。

而在4月19日Meta 公開釋出Llama 3,為回應各界對於基於Llama 3繁中模型之期待,TAIDE團隊僅以4天時間旋即完成Llama 3-TAIDE-LX-8B-Chat-Alpha1模型,於4月29日公開釋出。

持續精進並推動服務應用
TAIDE計畫的成功得益於國內學研力量的整合,包括國內相關領域最頂尖的教授團隊,及國科會轄下國研院科政中心與國網中心,科政中心主要負責訓練資料的收集及篩選,國網中心負責運算環境建置、運算效能優化以及雲端應用服務平台提供。

此外,業界夥伴也扮演重要角色,透過業界夥伴積極參與,可以預見各行各業的應用將如雨後春筍般地推出。展望未來,除了持續維護、精進現有TAIDE模型,確保本地化模型能與時俱進之外,並將推動協助TAIDE模型導入公、私領域相關應用,建構出具有本地特色的生態系,使臺灣在生成式AI領域持續保有競爭力。