根據(jù)國(guó)家統(tǒng)計(jì)局的數(shù)據(jù)顯示,截至2023年,我國(guó)殘疾人人口達(dá)8591.4萬(wàn)。隨著科技助殘政策的進(jìn)一步推行,以及前沿科技的迅猛發(fā)展,利好殘障人士的高科技產(chǎn)品也不斷問(wèn)世。腦機(jī)接口技術(shù)、智能假肢、智能AR眼鏡、外骨骼機(jī)器人……,這些前沿產(chǎn)品正逐漸重塑著殘障人士的生活,為他們逐步打造出一個(gè)“有愛(ài)無(wú)礙”的世界。在今年的科技助殘平行論壇上,科大訊飛的智能語(yǔ)音交互技術(shù)也入選了科技助殘創(chuàng)新案例,為助殘事業(yè)注入了更新鮮的活力。那么科大訊飛智能語(yǔ)音交互技術(shù)具體是什么?一起跟著福祉君來(lái)看看吧!
此外,在今年的9月12日-14日,2025中國(guó)國(guó)際福祉博覽會(huì)暨中國(guó)國(guó)際康復(fù)博覽會(huì)(CR EXPO)將在北京國(guó)家會(huì)議中心舉行,科大訊飛愛(ài)博智能也將在本屆福祉博覽會(huì)上展示最新人工智能輔具產(chǎn)品,歡迎提前掃碼登記,體驗(yàn)更多前沿科技產(chǎn)品!
?限時(shí)福利,免費(fèi)領(lǐng)取早鳥(niǎo)票!
一、科大訊飛智能語(yǔ)音交互技術(shù)是什么?
科大訊飛智能語(yǔ)音交互技術(shù),主要是基于科大訊飛全自研國(guó)產(chǎn)語(yǔ)音大模型,集成語(yǔ)音轉(zhuǎn)寫(xiě)、合成等關(guān)鍵技術(shù),可廣泛應(yīng)用于聽(tīng)障群體的無(wú)障礙溝通與交流。
語(yǔ)音能力作為科大訊飛的領(lǐng)先優(yōu)勢(shì),去年年初科大訊飛便在星火大模型V3.5的更新中,首次對(duì)外發(fā)布了星火語(yǔ)音大模型,對(duì)于37種主流語(yǔ)種的語(yǔ)音識(shí)別效果已超過(guò)OpenAI Whisper V3。在后續(xù)的星火大模型V4.0發(fā)布會(huì)上。除了之前已有的37個(gè)主流語(yǔ)種,還新增了37種方言,這代表著使用者可以多語(yǔ)種和方言隨意切換。
同時(shí),在今年1月,在訊飛星火大模型升級(jí)發(fā)布會(huì)現(xiàn)場(chǎng),現(xiàn)場(chǎng)發(fā)布了目前全國(guó)產(chǎn)算力平臺(tái)上唯一的深度推理模型——訊飛星火X1。該模型的中文和數(shù)學(xué)能力都在國(guó)內(nèi)處于領(lǐng)先地位。此外,首個(gè)具備端到端語(yǔ)音到語(yǔ)音同傳能力的大模型——星火語(yǔ)音同傳大模型也在現(xiàn)場(chǎng)同期發(fā)布,據(jù)悉,該模型最快語(yǔ)音同傳時(shí)延小于5秒。
除了上述提到的星火語(yǔ)音大模型,科大訊飛的語(yǔ)音識(shí)別與合成技術(shù)也是其智能語(yǔ)音交互技術(shù)的重要支撐。
根據(jù)相關(guān)資料顯示,訊飛語(yǔ)音識(shí)別技術(shù)可將短音頻(≤60秒)精準(zhǔn)識(shí)別成文字,同時(shí)能支持多語(yǔ)種的自動(dòng)判別,其中包括語(yǔ)音轉(zhuǎn)寫(xiě)等功能,可滿足使用者不同時(shí)長(zhǎng)音頻的轉(zhuǎn)文字需求,識(shí)別率較高。以科大訊飛推出的智能語(yǔ)音識(shí)別與轉(zhuǎn)寫(xiě)軟件“訊飛聽(tīng)見(jiàn)”為例,其能將語(yǔ)音內(nèi)容實(shí)時(shí)轉(zhuǎn)為文字,同時(shí)支持多語(yǔ)言自動(dòng)識(shí)別,可廣泛應(yīng)用在會(huì)議、教學(xué)、面對(duì)面交流等場(chǎng)景,眾多聽(tīng)障人士也能利用該軟件進(jìn)行語(yǔ)音識(shí)別與轉(zhuǎn)寫(xiě),從而實(shí)現(xiàn)與健聽(tīng)人士的無(wú)障礙溝通。
圖源:信息化教學(xué)創(chuàng)新公眾號(hào)
同時(shí),訊飛語(yǔ)音合成技術(shù)(TTS)也是智能語(yǔ)音交互技術(shù)的重要基石。今年6月,科大訊飛宣布其語(yǔ)音合成技術(shù)實(shí)現(xiàn)了關(guān)鍵性的突破,“一句話聲音復(fù)刻”與“超擬人語(yǔ)音合成”兩項(xiàng)能力取得重大升級(jí)。此前,訊飛星火APP上線了“一句話聲音復(fù)刻”功能,并在業(yè)界和客戶中取得了較好的評(píng)價(jià),在今年升級(jí)完成后, AI可在僅一句語(yǔ)音錄音的基礎(chǔ)上,復(fù)刻用戶完整音色、語(yǔ)氣與情緒起伏,效果更逼近真人。
基于訊飛自研的星火語(yǔ)音大模型的迭代升級(jí)以及最新構(gòu)建的三階段層次化語(yǔ)音建??蚣?,訊飛語(yǔ)音合成技術(shù)在音色恢復(fù)方面,不僅通過(guò)融合幀級(jí)音色編碼與聲紋語(yǔ)義一致性損失函數(shù),進(jìn)一步提升了合成音頻的相似度與自然度,同時(shí)結(jié)合DPO強(qiáng)化學(xué)習(xí)策略,強(qiáng)化了所合成語(yǔ)音的流暢性。目前,蔚來(lái)汽車已在新車型中應(yīng)用了訊飛“超擬人情感語(yǔ)音系統(tǒng)”。
為了能在復(fù)雜環(huán)境下也能實(shí)現(xiàn)語(yǔ)音識(shí)別與轉(zhuǎn)寫(xiě),同時(shí)達(dá)到無(wú)障礙溝通的目的,訊飛抗干擾技術(shù)也已達(dá)到國(guó)際領(lǐng)先地位,可成功完成在極復(fù)雜場(chǎng)景的語(yǔ)音轉(zhuǎn)寫(xiě)。訊飛推出的麥克風(fēng)陣列技術(shù)和降噪算法以及噪音魯棒性技術(shù)都能顯著進(jìn)行抗干擾,從而實(shí)現(xiàn)多重疊復(fù)雜環(huán)境下的語(yǔ)音轉(zhuǎn)寫(xiě)。
在今年的2025中關(guān)村論壇年會(huì)科技助殘平行論壇上,科大訊飛的智能語(yǔ)音交互技術(shù)已入選2025科技助殘創(chuàng)新案例。同時(shí),科大訊飛也與中國(guó)殘聯(lián)簽署了合作協(xié)議,將共建通用人工智能助殘聯(lián)合實(shí)驗(yàn)室。目前,以“訊飛聽(tīng)見(jiàn)”APP為例,2019年,科大訊飛聯(lián)合中國(guó)聾人協(xié)會(huì)、中國(guó)殘疾人藝術(shù)團(tuán)發(fā)起“聽(tīng)見(jiàn)AI的聲音”關(guān)愛(ài)聽(tīng)障人士公益行動(dòng),使用“訊飛聽(tīng)見(jiàn)”APP,將實(shí)時(shí)語(yǔ)音轉(zhuǎn)化成文字,從而幫助聽(tīng)障人士更好地與他人交流。截至目前,“聽(tīng)見(jiàn)AI的聲音”公益行動(dòng)已累計(jì)為聽(tīng)障人士提供超2億分鐘的免費(fèi)轉(zhuǎn)寫(xiě)服務(wù)。
此外,科大訊飛子公司訊飛愛(ài)博智能推出的無(wú)障礙AI交流屏也是科技助殘的有力產(chǎn)品。該產(chǎn)品集成多語(yǔ)種識(shí)別翻譯、星火大模型和多模態(tài)降噪技術(shù),具備多語(yǔ)種識(shí)別翻譯、手寫(xiě)輸入等功能,能幫助聽(tīng)障人士實(shí)現(xiàn)面對(duì)面的與人交流。
目前,科大訊飛的智能語(yǔ)音交互技術(shù)也已應(yīng)用在公共服務(wù)領(lǐng)域,例如政府部門(mén)、機(jī)場(chǎng)、商業(yè)中心等??拼笥嶏w的智能語(yǔ)音客服系統(tǒng)在接入政務(wù)熱線后,可實(shí)現(xiàn)7×24小時(shí)在線值守,能夠迅速反饋并解決民眾咨詢的問(wèn)題,實(shí)現(xiàn)迅速響應(yīng)。
不僅如此??拼笥嶏w的無(wú)障礙AI交流屏也已在北京首都國(guó)際機(jī)場(chǎng)、大興機(jī)場(chǎng)、成都春熙路商圈IFS、曼谷高端購(gòu)物中心Siam Paragon和ICONSIAM等投入使用,可為不用國(guó)籍的旅客提供更為方便的服務(wù)。
此外,科大訊飛的智能語(yǔ)音交互技術(shù)也在特殊教育領(lǐng)域有較大應(yīng)用前景。此前,科大訊飛為全國(guó)80多所特殊教育學(xué)校提供了技術(shù)和產(chǎn)品,為特殊教育學(xué)校師生的課堂效率等提供了較大助力。
智能語(yǔ)音交互技術(shù)等更多助殘科技,正幫助許多殘疾人和老年人改善生活。目前程天、大艾、強(qiáng)腦、科大訊飛愛(ài)博智能等科技品牌企業(yè),已確認(rèn)參加2025中國(guó)國(guó)際福祉博覽會(huì)。作為助殘科技成果展示推廣與落地轉(zhuǎn)化的重要平臺(tái),中國(guó)國(guó)際福祉博覽會(huì)將于2025年9月12-14日在北京國(guó)家會(huì)議中心舉行。本屆展會(huì)將特設(shè)“創(chuàng)研匯”科技助殘專區(qū)及品牌展示區(qū),為企業(yè)、高校及科研院所提供科技創(chuàng)新產(chǎn)品的首發(fā)平臺(tái),并推動(dòng)科技成果轉(zhuǎn)化及落地應(yīng)用。
目前,組委會(huì)正在征集科技助殘創(chuàng)新成果、技術(shù)應(yīng)用、產(chǎn)品和服務(wù)案例展示及發(fā)布,我們誠(chéng)摯邀請(qǐng)人工智能、腦機(jī)接口、信息無(wú)障礙、智能假肢與康復(fù)機(jī)器人、感知輔助技術(shù)、VR/AR、仿生、神經(jīng)調(diào)控等領(lǐng)域助殘創(chuàng)新相關(guān)領(lǐng)域的高校、科研院所、企業(yè)、服務(wù)機(jī)構(gòu)及相關(guān)單位報(bào)名參與,共同推動(dòng)科技助殘及殘疾人事業(yè)的發(fā)展,讓科技的溫度惠及更多有需要的人群。歡迎感興趣的朋友掃碼報(bào)名參與此次征集活動(dòng)→征集通知 | 2025中國(guó)國(guó)際福祉博覽會(huì)科技助殘創(chuàng)新成果展示交流活動(dòng)
資料來(lái)源:中國(guó)殘聯(lián)公眾號(hào)、中國(guó)殘聯(lián)公眾號(hào)、機(jī)器之心公眾號(hào)、科大訊飛集團(tuán)公眾號(hào)、科大訊飛官網(wǎng)、信息化教學(xué)創(chuàng)新公眾號(hào)、訊飛產(chǎn)業(yè)加速中心公眾號(hào)、藍(lán)鯨新聞等