系統特點:
1.同時支持windows&Linux;
2.識別率高:
語音識別率超97%<;
3.識別速度快:
較快的識別速度實時率可以達到0.2-0.3;
4.模型豐富:
數據、算法、模型積淀,聲學語音模型覆蓋各行各業;
5.多語種支持:
支持英語等外語種、維藏蒙彝朝等少數民族語、粵語四川話閩南話等方言的識別;
模型可定制,可根據客戶應用場景進行模型的定制訓練,迅速提高領域內識別率;
6.支持實時/離線識別:
在離線語音質檢轉寫場景中,能夠單通道錄音的語音識別進行話者分離,情緒檢測,語速檢測;
7.支持模型訓練:
針對特定的領域,可以針對性的訓練專門的語言模型和聲學模型這樣對于集中在這個領域的說話內容就會獲得更好的識別率。支持根據生產錄音,進行進一步訓練優化。包括語言模型訓練和聲學模型訓練,提升語音識別的準確率。訓練形式可支持本地化訓練或簽訂保密協議遠程訓練;
8.支持多模型:
全智能能力平臺支持掛載多個模型支持根據不同的場景啟用相應的模型;
9.高識別率:
高識別率:支持對大量的行業詞庫進行專業模型訓練,包括文本和語音文件訓練;
高處理性能: 語音識別具有高識別速度,實時率0.2-0.3,并且能夠穩定支持100路并發;
系統擴容:支持橫向擴容,滿足甲方業務增長的需求;
10.支持多接口調用:
支持開放友好的接入方式支持HTTP、TCP、MRCP、webservice、socket等接口支持使用異步通信庫獲取結;
支持自動加標點語音識別引警可以自動對識別結果加上標點符號,此過程主要利識別結果的語義進行處理的,也利用了聲學上的一些特性,例如停頓長度等;
11.支持流式/非流式識別:
非流式識別: 輸入一整段語音,引擎進行特征提取和解碼的識別工作,并返回這段語音的識別結果;
流式識別: 可以分段輸入語音,最后得到結果。引擎在獲得分段的輸入語音的同時,就可以同步地對這段數據進行特征提取和解碼工作,而不用等到所有數據都獲得后再開始工作。因此這樣就可以在最后一段語音結束后,僅延遲很短的時間即可返回最終識別結果。這種流式輸入方式能縮短整體上獲得最終結果的時間,極大地提升用戶體驗;
12.支持實時/離線識別:
實時識別: 語音識別引擎在每次獲得分段輸入的語音后,如果已經開始檢測到語音端點并加以識別,就會實時返回當前已識別出來的結果,而不是等到檢測到語音結束端點,再輸出本段語音的完整結果;
離線轉寫: 語音識別引擎支持提供離線轉寫服務,可以將呼叫中心產生的錄音轉寫成文本;