全文檢索關鍵字
查詢
平台訊息
最新消息
AAC影音
平台簡介
成立平台宗旨
平台功能
成員及分工
聯絡我們
AAC科普
AAC迷思
AAC一般知識
輔具產品
輔具介紹
輔具類型
低科技輔具
有聲溝通器
溝通軟體
溝通App
輸入方式
溝通輔具相關周邊產品
輔具廠商
元鼎國際
格羅斯
朋笛
博陽科技
吉喬
Sense森思
語悅科技
庭田
App Store
Google Play
AAC百寶箱
溝通符號
溝通輔具
溝通技術
溝通策略
整合式方案
資源連結
政策法規
相關書籍
相關文獻
AAC新趨勢
提供AAC服務單位
網站導覽
第一社會福利基金會官網
Facebook粉絲頁
Youtube官方影片
回饋與建議
前往主要內容
您的瀏覽器不支援JavaScript功能,若網頁功能無法正常使用時,請開啟瀏覽器JavaScript狀態
:::
網站導覽
第一社會福利基金會官網
Facebook粉絲頁
Youtube官方影片
關鍵字
查詢
平台訊息
最新消息
AAC影音
平台簡介
成立平台宗旨
平台功能
成員及分工
聯絡我們
AAC科普
AAC迷思
AAC一般知識
輔具產品
輔具介紹
輔具類型
輔具廠商
AAC百寶箱
溝通符號
溝通輔具
溝通技術
溝通策略
整合式方案
資源連結
政策法規
相關書籍
相關文獻
AAC新趨勢
提供AAC服務單位
資源連結
:::
首頁
>
資源連結
>
相關文獻
>
【學位論文】建立強健性台語聲調音素資料庫以發展文字轉語音系統
政策法規
相關書籍
相關文獻
AAC新趨勢
2009-01-01
【學位論文】建立強健性台語聲調音素資料庫以發展文字轉語音系統
指導教授:鍾高基
研究生:許銘峻
出版年:2009
校院與系所名稱:國立成功大學 醫學工程研究所碩博士班
台語為台灣人民常用的主要語言,特別是中、高齡人口與中南部人民普遍以台語進行溝通。但現今台灣的醫療服務、臨床教育訓練、醫療多媒體應用主要以中文語音為主,受醫者與醫療人員在溝通上往往有極大的困難,造成就醫問題。另一方面,台灣的聽語障者與銀髮族人口逐年增加中,老年人隨年齡的增長亦常造成聽語障異常,因此突顯了聽語障者與銀髮族的照顧服務需求問題。聽語溝通輔具扮演了聽語障者與人群接觸的重要角色,利用輔助溝通系統中的文字轉語音系統,代替人發出自然流暢的語音,便是一種聽語障者與外界溝通的方法。但聽語輔具資源集中於中文和歐美句調語言系統的開發,無法充分滿足台灣本土音調語言系統之需求。近十幾年來台灣的語音科技研究,對於台語進行探討的研究較少,無法滿足台語在語音科技研發上的需求,因此發展台語的語音科技有其必要性。
本研究的目的在於建立一套強健性的台語聲調音素資料庫,並應用隱藏式馬可夫模型發展建立台語文字轉語音系統。研究之特定目標包括:(1)設計一套台語平衡句的訓練演算法,並建立台羅現代文平衡句語音資料庫;(2)以統計學方法分析理念性聲調音素單元之強健性,以驗證並建立強健性的台語聲調音素資料庫;(3)應用隱藏式馬可夫模型之語音合成系統與台語聲調音素資料庫以發展台語文字轉語音系統。
本研究基於台語語音學、音韻學、統計學方法和數位訊號處理科技的進步,實際應用台羅現代文系統作為建立相關資料庫之基礎。而整體的研究架構主要分為四個階段:第一階段首先將台羅現代文的次音節單元結構作更深入的探討分析,並配合台語聲調變化完成建立台語理念性聲調音素模型。第二階段發展設計台語平衡句的訓練演算法,用以訓練台語文句語料,再透過語音錄製完成平衡句語音資料庫。第三階段應用HTK辨識器辨識語音資料庫之聲調音素序列,並應用統計學中靈敏性與特異性的ROC曲線分析其辨識結果以驗證強健性聲調音素單元集。第四階段應用本研究發展的強健性聲調音素模型與HMM-based語音合成系統發展台語文字轉語音系統。
本研究收集完成台羅現代文連續文句語料,約十萬個音節,共8,905句。以視窗程式設計發展平衡句訓練暨分析系統,經訓練連續文句語料後,獲得869句平衡句與罕見單元載字句218句,實際錄音後成為可供本土臨床語音科技使用的台語平衡句語音資料庫。應用語音辨識器HTK得到的辨識結果,以統計學方法驗證完成聲調音素單元集之強健性分析,獲得156個(不含靜音段)強健性台語聲調音素單元集。最後在Linux和Windows作業系統上均成功地建構出HMM-based台語文字轉語音系統,其合成語音的MOS分數為4分,已符合一般合成語音之要求,更提升了合成語音自然度之水準。綜合以上的研究成果,本研究之各項研發均可提供本土臨床語音科技和台語計算語言學研發之基礎,並達成本研究之預期目標。
本研究已獲得預期的研究成果,可提供台語資訊化及計算語言學相關研發之基礎,以期有效地廣泛應用於醫療服務、臨床教育訓練、醫療多媒體和語音溝通輔助復健科技方面。未來可繼續探討的部分,包括:(1)可利用台語平衡句語音資料庫,進行各聲調基頻趨勢之分析比較。(2)平衡句訓練演算法可參考貪婪演算法之概念作更有效的平衡句挑選。(3)平衡句語音資料庫可再錄製女性語音以進行更深入分析及更廣泛之應用。(4)可應用視窗程式設計建構語音辨識器一貫化的訓練與辨識流程。(5)可考慮增加台語文字轉語音系統之漢字輸入介面,以供社會大眾更廣泛之使用。(6)由建構更多的台語語句文法規則資料庫來判斷合成韻律,以得到更符合口語化之合成語音。
文獻連結