族語語音合成結合族語文字辨識—讓太魯閣族語圖書快速轉換成數位有聲書

隨著時代的進步,AI科技不僅改變了我們的生活,也為傳統文化的保存帶來新的可能性。臺灣原住民由於人口較為稀少、族語使用率較低且大多數族語內容為紙本圖書,族語保存正面臨嚴峻挑戰。本計畫結合太魯閣族語語音合成和文字辨識的創新技術,期許能快速、輕鬆的將太魯閣族語圖書內容轉換成數位有聲書,讓族語保存朝數位化邁進,加速族語保存的效率。

將太魯閣族語圖書快速轉換成數位有聲書的技術核心在於結合「語音合成」和「文字辨識」2種AI模型。「語音合成」模型利用專業太魯閣族語專家在錄音室錄製的10小時語料進行訓練,成功開發出臺灣首個太魯閣語的語音合成模型,這個模型可將任何輸入的太魯閣語文字,快速轉換成自然流暢的語音,宛如真人說話。「文字辨識」模型則針對印刷族語書籍進行開發,模型能快速辨識出紙本書籍中的族語文字並轉換成數位內容。透過這兩項技術結合後,只需將族語圖書進行掃描或拍照後上傳,AI模型就能將傳統族語圖書轉換為數位有聲書。這套系統不僅是技術上的突破,更為族語保存與推廣提供了全新的方法。以往,族語圖書需要透過人工逐字逐句轉錄與錄音,耗時耗力。而現在,這些書籍可以在短時間內數位化並生成有聲書,讓族語數位化與保存更加便利,也讓更多人能夠透過數位方式方便地學習和接觸太魯閣族語,讓臺灣原住民族語得以延續並活化。

太魯閣族語圖書轉換成數位有聲書展示系統