子計畫二 /
原住民族語言人工智慧科技平台研發與教育應用
112 年 11 月份報導
打造全新太魯閣族語數位語料庫:遠端錄音與多設備協作平台
本計畫目標為建置臺灣第一套具數位典藏價值之族語語料庫,除了族語文字外,也包含族語語音,本年度以太魯閣族語為主。因大多數太魯閣族人居住在花蓮縣市,為了提供分佈在各地熟悉太魯閣族語的人士方便協助進行族語語音錄製,本團隊開發一套協作平台,提供線上多人錄製與驗證族語語音,平台以網頁方式呈現,使用者透過裝置登入帳號後,即可在遠端進行族語語音錄製。本協作平台的設計重視直覺友善的操作,使用者只需選擇想要錄製的族語句子,點選錄音按鈕後進行錄音,錄音完成後點選結束按鈕,使用者再聽一次自己錄製的語音內容是否正確,即可確認並將錄製完音檔即時傳送儲存系統,相關資訊也會同步寫入資料庫中,這樣即完成一筆族語語音之錄製,使用者可再挑選其他族語句子進行錄音。此系統目前已邀請十多位不同年齡層、不同姓別的族語人士進行錄音,後續將持續邀請更多熟族語人士加入,以期收錄到更多、更完整的族語語音資料。
本團隊亦在國網中心建置一套可移動式之族語語音錄製系統,該系統提供6種不同錄音設備的輸入(L/R麥克風、麥克風、領夾式麥克風、Android手機、iPhone手機),以達到一次可同時錄製6個音軌之語音檔案,有利於後續進行族語語音辨識AI模組之開發,此系統目前邀請新竹清華大學太魯閣族語教學老師,定期到國網中心進行族語語音錄製。