【2015年5月25日】隨著智能手機的快速普及,語音識別輸入作為一種便捷易行的文字輸入方式,一直是學術界和產業界關注的熱點。作為擁有三十余年研發經驗的行業先行者,東芝公司在語音識別領域一直進行著卓有成效的理論研究和產品開發,對中文語音識別系統的創新不斷取得實質性突破。近期,東芝公司設在中國的研究開發中心傳來最新消息:通過利用深度學習算法對模型進行最優化,東芝將為中文連續語音識別帶來更具應用價值的解決方案。
東芝語音識別技術支持不同層次的系統要求,高魯棒性嵌入式語音識別引擎和針對不同口音的技術優化使其可用于各類電子設備。在現有高效語音識別系統的基礎上,為進一步提升中文連續語音識別準確率,東芝語音研發團隊利用鑒別性基頻特征和帶調聲學建模,圓滿解決了中文所特有的同音異調詞語辨別的技術難題。同時,新系統增加了對英文縮略語的識別功能,在中英文互譯應用中更加得心應手。
面對中文語音識別實用化的兩大難點——新詞識別和口語識別,技術人員引入全新的詞捕捉算法和深度學習算法,大幅提升了識別準確率。據東芝語音研發團隊負責人丁沛博士透露,新系統可將中文新詞的識別率提高至98%以上,而對朗讀語音和會議口語的識別率分別超過了95%和92%,在各類場景下都能實現高精度識別,為高質量的人機交互打下基礎。
始于上世紀70年代的東芝語音識別技術現已形成以東京-劍橋-北京為中心的全球研發體系,開發出包括中、日、英、法、德等十四種以上的語言識別系統。目前,東芝在中文語音的識別、合成和自然語言處理技術的研發上成果卓著,廣泛應用于PC、車載、移動通信、互聯網等領域,并在多項國際評比中展現出行業領導力。東芝(中國)研究開發中心作為東芝全球四大研發基地之一,近年來在人機交互、軟件開發和高校合作方面都取得了積極進展,不斷將全球最尖端的技術方案引入中國,強化東芝各業務領域的市場競爭力。
此次對于中文語音識別系統的技術升級,顯示了東芝(中國)研究開發中心在該領域的持續專注和領先實力,是對中文語音識別應用的又一次技術突破。據悉,此次創新將加速東芝語音技術在中國的產品化和市場推廣,將更具實用價值的語音系統帶給中國用戶。