車音網推出基于自然語言技術的智能語音引擎
作為國內領先的中文語音識別技術提供商,車音網近年來在車載領域不斷取得突破性進展,通過特有的商用級非特定人語音識別技術,為駕駛者提供了更加安全和便捷的智能化汽車生活方式。日前,車音網宣布正式推出擁有自主知識產權的智能語音識別引擎--AIVO。作為以車音網特有的商用級非特定人語音識別技術為底層支撐的核心產品,AIVO將為企業和終端用戶帶來了全新的語音應用體驗,企業用戶可借助開放型平臺的AIVO語音引擎為產品快速添加基于自然語言識別技術的音視頻內容檢索、語言轉文本等功能,同時不久的將來通過技術升級,AIVO引擎還將實現聲紋識別、旋律搜索等更為強大的語音識別領域的技術突破,滿足更全面的用戶需求;而終端用戶使用嵌入AIVO引擎的產品則無需手動操作,通過語音就能實現收發短信、發送遠程指令和直接搜索并獲取音視頻內容等互聯網信息,從而極大提升互動體驗。
值得注意的是此次發布的AIVO語音引擎不僅可以應用車載領域,還適用于如移動互聯網、智能家居等行業,為不同領域的企業及用戶提供了更好的平臺技術支撐和人機交互體驗。

作為車音網的核心產品,AIVO語音引擎的最大亮點是其"自然語言識別"技術。相較上一代只能識別關鍵詞指令的語音識別技術,AIVO的"自然語言理解"依托網格計算技術和非結構化的語音數據庫,突破了用戶口音、關鍵詞準確性及普適性對識別率影響較大的局限,用戶可以用個人習慣性的語言方式,甚至模糊的語言需求指令,就能實現人與機器的交互溝通。
美國《心理科學》雜志刊登的一項研究報告顯示,如果聲音和圖像來自同一個方向(簡稱"耳目同向"),人們就更容易在聽清楚的同時看清楚。車音網十余年堅持投入大量資金用于垂直化語言模型訓練,語音識別率大幅度提升,高達90%以上。通過AIVO語音引擎的自然語言識別技術,駕駛者可以以安全易于操控的方式將語言快速轉換成文字,在遵守"手眼同向"法則下收聽、編寫郵件或短信。
AIVO語音引擎的另一大創新還在于行業領先的人工智能技術和海量知識庫導入,實現了雙向或多向的實時音視頻內容檢索服務。該檢索服務徹底重構了當下單向度的信息檢索方式,并將顛覆現有用戶搜索習慣,標志著語義搜索引擎的商業化進程取得了新的突破。AIVO引擎的音視頻檢索功能區別于當前按關鍵詞標注的單向文本檢索,可對海量音視頻庫中的音頻進行快速準確的基于語音內容的自動索引、關鍵音檢索及語音識別。使用AIVO引擎語音檢索音樂文件,結合特有的節拍或旋律識別,[FS:PAGE]不僅能幫助用戶輕松搜索到音樂文件,還能識別歌曲的名稱、制作者、演唱者、專輯等背景信息,甚至告訴用戶歌曲的風格是悲傷的還是歡快的。相信不久的將來,這一人工智能技術將廣泛應用于互聯網、電視媒體及智能電視領域,并讓我們的生活充滿更多樂趣。