在國家智能語音創(chuàng)新中心看民企活力——“創(chuàng)新鏈產(chǎn)業(yè)鏈深度融合,,步伐更快”
制圖:沈亦伶
企業(yè)是科技創(chuàng)新的主體,。習(xí)近平總書記強(qiáng)調(diào):“有能力、有條件的民營企業(yè)要加強(qiáng)自主創(chuàng)新,,在推進(jìn)科技自立自強(qiáng)和科技成果轉(zhuǎn)化中發(fā)揮更大作用,。”
越來越多的民營企業(yè)創(chuàng)新步伐不斷加快,,成為推動(dòng)經(jīng)濟(jì)高質(zhì)量發(fā)展的重要力量。在安徽合肥,,記者走進(jìn)國家智能語音創(chuàng)新中心,。這是工業(yè)和信息化部2021年批復(fù)組建的4家國家制造業(yè)創(chuàng)新中心之一,由科大訊飛牽頭,,依托合肥智能語音創(chuàng)新發(fā)展有限公司,,國內(nèi)10多家智能語音企業(yè)和科研院所聯(lián)手組建而成。中心與企業(yè)聯(lián)動(dòng),,充分發(fā)揮科技創(chuàng)新驅(qū)動(dòng)作用,,不斷促進(jìn)創(chuàng)新鏈產(chǎn)業(yè)鏈深度融合,,為生產(chǎn)生活帶來更多想象空間。
助生產(chǎn)提質(zhì)增效——
“智能耳朵”將質(zhì)檢效率提高2/3
浙江捷昌線性驅(qū)動(dòng)科技股份有限公司主營電機(jī)生產(chǎn),。“在傳統(tǒng)工業(yè)場(chǎng)景中,電機(jī)設(shè)備一旦出現(xiàn)故障,,發(fā)出異常聲音,,通常都是經(jīng)驗(yàn)豐富的老師傅用耳朵聽,來判斷故障點(diǎn),。”公司新昌生產(chǎn)基地生產(chǎn)總監(jiān)張巍峰介紹:“我們實(shí)現(xiàn)了電機(jī)在流水線組裝完成后,,通過聲紋質(zhì)檢系統(tǒng)檢測(cè)采集產(chǎn)品運(yùn)轉(zhuǎn)數(shù)據(jù)。”
一款系統(tǒng),,如何通過聲音識(shí)別產(chǎn)品質(zhì)量,?
靜音房中,電機(jī)運(yùn)轉(zhuǎn),,嗡嗡聲響接連不斷,;顯示屏上,聲紋起伏,,數(shù)據(jù)被采集捕捉,;存在故障,通過數(shù)據(jù)分析,,維修點(diǎn)位隨即可以確定,。一直以來,張巍峰都在琢磨怎樣通過機(jī)器“聽音”提高質(zhì)檢效率,,“自個(gè)兒摸索兩三年,,沒有取得一點(diǎn)進(jìn)展”。
機(jī)緣巧合,,一次技術(shù)推介會(huì)上,,得知國家智能語音創(chuàng)新中心正在開展工業(yè)聲學(xué)方向的研究,張巍峰當(dāng)即尋求合作:“我們有需求,,他們懂技術(shù),,優(yōu)勢(shì)互補(bǔ),說不定能研發(fā)出來,。”
研發(fā)初期,,中心委派的聲紋分析工程師入廠調(diào)研,收集樣本,;質(zhì)檢工人現(xiàn)場(chǎng)聽音,,記錄特征。6個(gè)多月時(shí)間,,采集近5萬條數(shù)據(jù),,算法選型、深度學(xué)習(xí)、參數(shù)調(diào)節(jié),,經(jīng)過與人工聽音多輪比拼試驗(yàn),,工業(yè)聲紋質(zhì)檢系統(tǒng)初步建成。
國家智能語音創(chuàng)新中心總經(jīng)理吳江照介紹,,利用工業(yè)聲學(xué)技術(shù)開展設(shè)備質(zhì)檢,,除了民營企業(yè)自主創(chuàng)新,還離不開科研院所的大力支持,。“發(fā)聲位置,、距離遠(yuǎn)近都會(huì)對(duì)收音造成影響,為了解決工業(yè)領(lǐng)域的麥克風(fēng)陣列分布問題,,我們和西北工業(yè)大學(xué)科研團(tuán)隊(duì)開展交流,,共同探討技術(shù)方案。”吳江照說,。
如今,,這款“智能耳朵”已在產(chǎn)線投用,質(zhì)檢識(shí)別準(zhǔn)確率達(dá)到95%,。“一次聯(lián)合研發(fā),,僅一條產(chǎn)線每年就能為我們節(jié)省成本近15萬元!”張巍峰算了筆賬,,過去人工聽音,,易因疲勞而失準(zhǔn),現(xiàn)在使用工業(yè)聲紋質(zhì)檢系統(tǒng),,不僅效率提高2/3,,還增強(qiáng)了一致性。曾經(jīng)難以分辨的齒輪或換向器故障點(diǎn),,通過聲紋數(shù)據(jù)分析,,有了改進(jìn)方向。
讓生活智慧便捷——
“全屋智控”識(shí)別用戶指令更精準(zhǔn)精確
一進(jìn)門,,燈光自動(dòng)點(diǎn)亮,,空調(diào)自行開啟;一句語音指令,,舒緩的音樂在耳邊響起,,陽臺(tái)上的晾衣架開始升降;廚房里,,感應(yīng)裝置監(jiān)測(cè)到煤氣泄漏,,既能報(bào)警,還會(huì)開窗……走進(jìn)合肥榮事達(dá)電子電器集團(tuán)智能全屋體驗(yàn)生活館,,研發(fā)中心技術(shù)人員孫杰指向巴掌大小的控制面板:“能集中控制空調(diào),、音箱,、窗簾等,啟動(dòng)各種智能情景,。”
一塊屏幕,,如何實(shí)現(xiàn)“全屋智控”?
從傳統(tǒng)的按鍵控制到智能的語音交互,,為實(shí)現(xiàn)多款產(chǎn)品集成,,孫杰帶領(lǐng)團(tuán)隊(duì)與國家智能語音創(chuàng)新中心一道攻關(guān),花了約一年時(shí)間,。
首先要解決的,,是用戶反映最多的“免喚醒”功能,。孫杰介紹,,喚醒詞是為了激活設(shè)備進(jìn)入運(yùn)行狀態(tài),一般來說,,喚醒詞說出后,,若能立刻給出反應(yīng),有利于提升用戶體驗(yàn),??扇绻看问褂弥悄茉O(shè)備都需要喚醒詞,也會(huì)造成交互冗余,,增添麻煩,。
為此,企業(yè)結(jié)合市場(chǎng)調(diào)研,,分析常用指令,,中心則利用聲學(xué)技術(shù),提供算法支持,。通過具有AI(人工智能)交互能力的語音芯片加持,,這款控制面板可以實(shí)現(xiàn)一分鐘內(nèi)“一次喚醒,多輪交互”,。
“誤操作”是橫在面前的另一道難題,。“居家生活時(shí),經(jīng)常出現(xiàn)閑聊觸發(fā)關(guān)鍵詞,、設(shè)備作出響應(yīng)的情況,,尤其是在開發(fā)‘免喚醒’功能后。”中心AI語音芯片部研發(fā)總監(jiān)周正友介紹,。
是否可以通過識(shí)別聲音,、判斷方向,進(jìn)而給出正確回應(yīng),?為了解決這個(gè)難題,,周正友和同事們根據(jù)波速強(qiáng)度,,算法分析音頻,經(jīng)過多次試驗(yàn),,系統(tǒng)識(shí)別準(zhǔn)確度大幅提升,。
眼下,除了智能家居,,這款具有語音交互功能的面板產(chǎn)品還被應(yīng)用到其他領(lǐng)域,。“醫(yī)院、養(yǎng)老院,、辦公室等商用客戶也很感興趣,!”孫杰表示,企業(yè)與中心聯(lián)合攻關(guān),,既增強(qiáng)了創(chuàng)新能力,,還開拓了應(yīng)用市場(chǎng)。
為創(chuàng)新提供支撐——
AR字幕眼鏡帶來“看得見的聲音”
耳邊,,交流聲音不斷,,眼前,文字逐句呈現(xiàn),。這讓弱聽患者劉爍感覺不錯(cuò):“跟看劇一樣,!戴上眼鏡,聲音就能轉(zhuǎn)化成文字顯示在眼前,,還可以調(diào)節(jié)字體大小,、背景顏色,絲毫不影響視線,。”
這款A(yù)R(增強(qiáng)現(xiàn)實(shí))字幕眼鏡,,由北京亮亮視野科技有限公司與國家智能語音創(chuàng)新中心聯(lián)合研發(fā),具備實(shí)時(shí)轉(zhuǎn)寫,、語音翻譯等功能,,已為5000多名弱聽患者帶來“看得見的聲音”。
面向市場(chǎng)需求,,兼具技術(shù)基礎(chǔ),,新品研發(fā)按說應(yīng)該很順利。令亮亮視野系統(tǒng)研發(fā)部總監(jiān)趙偉沒想到的是,,技術(shù)遷移并不簡(jiǎn)單,。“我們想的是把眼鏡和聲學(xué)技術(shù)相結(jié)合,增強(qiáng)用戶體驗(yàn),,可眼鏡收集聲音后,,難以依托眼鏡本體算力進(jìn)行轉(zhuǎn)寫。”趙偉思來想去,,決定“上云”一試,。
這朵“云”,,是國家智能語音創(chuàng)新中心構(gòu)建的端云一體語音云平臺(tái),為金融,、醫(yī)療,、智能交通等領(lǐng)域企業(yè)提供技術(shù)服務(wù),助力企業(yè)高效穩(wěn)定運(yùn)營,,日交互量達(dá)20億次,。
近半年時(shí)間里,趙偉在合肥,、北京兩地奔走,,從拾音降噪到接入“云端”,企業(yè),、中心協(xié)同創(chuàng)新,。如何精準(zhǔn)識(shí)別人聲?科研人員調(diào)節(jié)上千次麥克風(fēng)陣列組合,,確定聲音增益最佳范圍,。怎樣確保轉(zhuǎn)寫迅速穩(wěn)定,?技術(shù)人員將數(shù)據(jù)接入云平臺(tái),,提供響應(yīng)及時(shí)的算力支撐。
“簡(jiǎn)化操作步驟,、調(diào)節(jié)字幕位置,,產(chǎn)品去年研發(fā)成功以來,軟件前后更新了三四個(gè)版本?,F(xiàn)在,,我們正在和中心討論,如何增加語音控制開關(guān)功能,,讓用戶操作更加便捷,。”趙偉說。
近年來,,為支持智能語音產(chǎn)業(yè)發(fā)展,,工信部批復(fù)組建國家智能語音創(chuàng)新中心,給予專項(xiàng)支持,;2021年,,安徽省印發(fā)《支持中國聲谷創(chuàng)新發(fā)展若干政策》,鼓勵(lì)人工智能及智能語音產(chǎn)業(yè)發(fā)展和推廣應(yīng)用,,引導(dǎo)企業(yè)協(xié)同創(chuàng)新發(fā)展,。“政府有政策,企業(yè)有場(chǎng)景,、有需求,,中心有技術(shù),、有實(shí)力。依托這樣的創(chuàng)新合作形式,,可以更有效實(shí)現(xiàn)資源聯(lián)動(dòng),。創(chuàng)新鏈產(chǎn)業(yè)鏈深度融合,步伐更快,。”吳江照說,。
(原標(biāo)題:在國家智能語音創(chuàng)新中心看民企活力——“創(chuàng)新鏈產(chǎn)業(yè)鏈深度融合,步伐更快”(經(jīng)濟(jì)新方位·支持民營經(jīng)濟(jì)發(fā)展))
【責(zé)任編輯:楊巧妮】
【內(nèi)容審核:黎曉帆】
24小時(shí)熱聞
相關(guān)閱讀/RELATED READING