飛象網(wǎng)訊 近日,科大訊飛董事長劉慶峰在公司成立 25 周年司慶活動上透露,訊飛星火 V4.0 發(fā)布時將展示最新的端到端智能語音落地成果,同時公司的端到端的語音技術(shù)建模方案也排在計劃中,預(yù)計三季度推向市場。
除此之外,科大訊飛還將提供GPT-4o沒有的一句話復(fù)刻、高噪音場景語音識別、多方言多語種免切換功能。
在劉慶峰看來,OpeanAI 發(fā)布 GPT-4o 對萬物互聯(lián)時代語音浪潮的推動,類似于當(dāng)年 Siri 對語音應(yīng)用的推動。它備受關(guān)注的原因有幾個點:超擬人合成,使得說話不再是朗讀腔調(diào),而是真的像人一樣自由對話;全雙工交互,可以同時(瞬時)進行信號的雙向傳輸,人機對話可以隨時打斷和繼續(xù);通過語音到語音的端到端建模,實現(xiàn)快速反應(yīng)的極致交互體驗。
劉慶峰透露,下一步,科大訊飛將發(fā)力遠場高噪音多人說話場景、高表現(xiàn)力個性化場景、云邊端一體化、軟硬件一體化,從技術(shù)優(yōu)勢、市場先機、落地成效構(gòu)建全方位持續(xù)領(lǐng)先優(yōu)勢。據(jù)他介紹,在5月底上線的訊飛星火V3.5 Max版本,已在文本生成、知識問答、邏輯推理、數(shù)學(xué)能力上超越GPT-4 Turbo 0429的最新版本。