我單位“遠(yuǎn)場聲學(xué)信息人機(jī)交互關(guān)鍵技術(shù)及其應(yīng)用”項(xiàng)目提名2020年度北京市科學(xué)技術(shù)獎(jiǎng),現(xiàn)進(jìn)行公示。公示期: 2020 年 11 月 4 日至 11 月 10日,公示期內(nèi)如有任何單位或個(gè)人對公示內(nèi)容有異議的,請您以書面方式向中國科學(xué)院聲學(xué)研究所科技發(fā)展部(公示單位科管部門名稱)反映,以單位名義提出的,需加蓋單位公章;以個(gè)人名義提出的,需要提供個(gè)人身份證明文件。
聯(lián)系人及聯(lián)系電話:金老師 010-82547935
中國科學(xué)院聲學(xué)研究所
2020年11月4日
公示內(nèi)容:
項(xiàng)目名稱:遠(yuǎn)場聲學(xué)信息人機(jī)交互關(guān)鍵技術(shù)及其應(yīng)用
候選單位(含排序):1.中國科學(xué)院聲學(xué)研究所; 2.北京聲智科技有限公司; 3.北京建筑大學(xué)
候選人(含排序):1.楊軍; 2.陳孝良; 3.楊飛然; 4.吳鳴; 5.馮大航; 6.程曉斌; 7.常樂; 8.余紫瑩; 9.周若華; 10.蘇少煒; 11.許勇; 12.李良斌; 13.武帥兵; 14.劉博; 15.欒天祥
提名意見:
本項(xiàng)目突破了遠(yuǎn)場復(fù)雜聲學(xué)場景下語音交互的聲學(xué)感知和語義理解關(guān)鍵技術(shù),融合了基于經(jīng)典陣列信號(hào)處理的模型驅(qū)動(dòng)算法和基于深度學(xué)習(xí)的數(shù)據(jù)驅(qū)動(dòng)算法,開發(fā)出具有自主知識(shí)產(chǎn)權(quán)的遠(yuǎn)場聲學(xué)信息人機(jī)交互系統(tǒng)和平臺(tái),提高了遠(yuǎn)場人機(jī)交互質(zhì)量和用戶體驗(yàn),促進(jìn)了人工智能技術(shù)在聲學(xué)信息交互領(lǐng)域的落地。本項(xiàng)目的推廣應(yīng)用產(chǎn)生了重大的經(jīng)濟(jì)效益和社會(huì)效益,技術(shù)成果在智能音箱、AI數(shù)字人紅外測溫與監(jiān)管系統(tǒng)、智慧電梯與安全監(jiān)管平臺(tái)等多個(gè)領(lǐng)域獲得成功應(yīng)用,服務(wù)海內(nèi)外包括中國移動(dòng)、華為、百度、小米、阿里、騰訊等120家企業(yè),擁有4000多萬用戶,產(chǎn)生直接經(jīng)濟(jì)效益超1.6億。本項(xiàng)目成果產(chǎn)品國內(nèi)首款智慧電梯與安全監(jiān)管平臺(tái)和AI數(shù)字人紅外測溫與監(jiān)管系統(tǒng)已迅速落地北京、武漢、上海、青島、深圳等地的新冠肺炎定點(diǎn)醫(yī)院,以及全國人大機(jī)關(guān)辦公樓、北京東城區(qū)政協(xié)、中國殘聯(lián)大廈等等海內(nèi)外近百個(gè)城市的辦事服務(wù)中心、機(jī)場、酒店、辦公樓宇、區(qū)民小區(qū)等公共場所,為抗擊新冠疫情作出了突出貢獻(xiàn),獲得工信部突出貢獻(xiàn)企業(yè)表彰,入選工信部AI助力疫情防控重點(diǎn)物資清單。
提名該項(xiàng)目為北京市科學(xué)技術(shù)獎(jiǎng)科學(xué)技術(shù)進(jìn)步獎(jiǎng)(類別:技術(shù)開發(fā)類)(一等獎(jiǎng)和二等獎(jiǎng))。
項(xiàng)目簡介:
聲學(xué)信息人機(jī)交互對人工智能產(chǎn)業(yè)發(fā)展具有重要戰(zhàn)略意義,遠(yuǎn)場交互是聲學(xué)信息人機(jī)交互產(chǎn)業(yè)的創(chuàng)新升級(jí)方向。從近場交互到遠(yuǎn)場交互,噪聲、混響、回聲等干擾帶來了語音識(shí)別、語義理解等難題,亟需攻克。本項(xiàng)目面向聲學(xué)信息人機(jī)交互產(chǎn)業(yè)落地的重大需求,突破了多項(xiàng)遠(yuǎn)場語音交互的聲學(xué)感知和語義理解關(guān)鍵技術(shù),構(gòu)建了陣列信號(hào)處理融合深度學(xué)習(xí)的先進(jìn)聲學(xué)模型和通用語義理解模型,形成了涵蓋麥克風(fēng)陣列、前端聲學(xué)處理、語音喚醒、語音識(shí)別、語義理解、語音合成等技術(shù)深度融合的端+云一體化系統(tǒng),大幅提高了系統(tǒng)泛化能力和識(shí)別精度,促使我國智能產(chǎn)品萬物互聯(lián)現(xiàn)象級(jí)產(chǎn)業(yè)直接對標(biāo)超越歐美標(biāo)桿企業(yè)。主要技術(shù)創(chuàng)新點(diǎn):
1. 提出了不同場景下低復(fù)雜度穩(wěn)健的時(shí)頻域自適應(yīng)濾波算法,解決了高度依賴雙端對講檢測、收斂速度慢等難題,實(shí)現(xiàn)了單通道和多通道回聲抵消系統(tǒng)應(yīng)用。
2. 提出了基于麥克風(fēng)陣列噪聲消除和盲源分離等方法,建立了帶噪語音的特征修復(fù)技術(shù),去除了人聲及背景噪聲干擾,大幅提升了系統(tǒng)的識(shí)別性能。
3. 提出了抗混響、抗干擾的低復(fù)雜度聲源定位方法,有效解決了復(fù)雜聲學(xué)環(huán)境特別是電梯、家居、會(huì)議室等場景的聲源定位問題。
4. 提出了加權(quán)有限狀態(tài)轉(zhuǎn)換機(jī)解碼圖喚醒算法,實(shí)現(xiàn)了多個(gè)聲學(xué)模型深度融合的在線語音識(shí)別引擎,提高了系統(tǒng)在各種環(huán)境下語音識(shí)別、喚醒的性能。
5. 提出了基于用戶對話交互歷史的詞匯-領(lǐng)域詞庫映射算法、領(lǐng)域感知的詞向量訓(xùn)練算法,提高了領(lǐng)域識(shí)別精度,提升了信息交互的流暢度與準(zhǔn)確性。
本項(xiàng)目在國家科技支撐計(jì)劃等課題支持下,開發(fā)出具有自主知識(shí)產(chǎn)權(quán)的全球領(lǐng)先的遠(yuǎn)場聲學(xué)信息人機(jī)交互系統(tǒng),技術(shù)成果形成了智能音箱、AI數(shù)字人紅外測溫與監(jiān)管系統(tǒng)、智慧電梯與安全監(jiān)管平臺(tái)等產(chǎn)品在多個(gè)領(lǐng)域落地應(yīng)用,占據(jù)了全球70%以上的中文遠(yuǎn)場智能語音市場。本項(xiàng)目獲授權(quán)發(fā)明專利44項(xiàng)、實(shí)用新型專利37項(xiàng)、軟件著作權(quán)61項(xiàng),發(fā)表論文135篇,參與制定國家標(biāo)準(zhǔn)15項(xiàng)、團(tuán)體標(biāo)準(zhǔn)15項(xiàng),產(chǎn)生直接經(jīng)濟(jì)效益超1.6億。本項(xiàng)目促進(jìn)了人工智能技術(shù)的推廣應(yīng)用,產(chǎn)品覆蓋家居、會(huì)議、軍工、醫(yī)療、交通等行業(yè),服務(wù)120多家企業(yè),擁有4000多萬用戶,數(shù)十億次人機(jī)交互真實(shí)場景的規(guī)模驗(yàn)證,服務(wù)海內(nèi)外客戶包括中國移動(dòng)、華為、百度、小米、阿里、騰訊等。實(shí)現(xiàn)了先進(jìn)的智能交互體驗(yàn),有力促進(jìn)了北京建設(shè)具有全球影響力的科技創(chuàng)新中心。本項(xiàng)目產(chǎn)品在抗擊新冠疫情期間作出了突出貢獻(xiàn),獲得工信部突出貢獻(xiàn)企業(yè)表彰,入選工信部AI助力疫情防控重點(diǎn)物資清單。
附件:主要支撐材料目錄

