新一輪疫情防控得到全面控制,多地社群也陸續“解封”,但解封不等於解防,在後疫情時代,人工智慧在科學防疫的應用場景中發揮著不可替代的關鍵作用,AI技術打造的多項無接觸應用正全面助力疫情防控常態化。
本期《e谷觀察》聚焦北京聲智科技有限公司(簡稱:聲智科技),一家融合聲學和人工智慧技術的平臺服務商,透過自有AI技術在疫情防控中做出傑出貢獻的公司,獲得工信部表彰和中央臺、人民日報等媒體報道。
加速科研成果轉化,創新惠及更多公眾
聲智科技創始人、董事長兼CEO陳孝良,2002年畢業於北京航空航天大學獲得管理學學士學位,之後到中國科學院大學讀書獲得工學博士學位,曾任中國科學院聲學研究所副研究員。科學家創業一般在探索科研成果轉化方面都要經歷很多艱辛,這是因為前沿技術類的創業專案與模式創新類創業專案不同,要求創始團隊擁有深厚的技術積累與前沿的商業嗅覺,80後的陳孝良就是其中非常敏銳的一位。
《e谷觀察》兩次到訪聲智科技並與之交談,發現他比一般科研工作者多了共情和同理心的氣質,又比大部分網際網路公司創業者多了些嚴謹求索的學術氣息。他專注人工智慧與物理聲學融合領域13年,對連線數字世界和物理世界的未來充滿了憧憬。就是因為這些夢想,2016年他帶領團隊創辦了聲智科技。
智慧生活
因為聲學研究所的背景和技術沉澱,最開始聲智科技專注於人機互動方式中語音互動技術的研究和在智慧生活方面的應用,賦能智慧產品聽見、聽準和聽懂的能力。
語音互動作為人機互動最重要的入口,包括近場語音互動與遠場語音互動。比如手機的語音開啟方式,當我們要向手機發出語音指令時,需要先按下手機的語音按鍵,才能讓智慧手機作出反應,這便是近場語音互動。但從使用者的角度來說,真正意義上的語音識別是可以解放雙手輸入的。遠場語音功能省略了“按下手機語音鍵”這一程式,比如智慧音箱,在適合人與人自然互動的距離之內,對機器說出指令,即可得到反饋。
從近場互動到遠場互動,聲智科技突破了多項遠場語音互動的聲學感知和語義理解關鍵技術,包括回聲抵消技術、噪聲消除技術、聲源定位技術、語音識別技術等。2017年,聲智科技聯合Xilinx和Cypress釋出FPGA遠場語音互動開發板,支援百度SoundPi開放平臺釋出,支援小米釋出小米AI智慧音箱,憑藉領先的智慧語音互動技術以及開放、靈活的合作模式,贏得了智慧裝置、智慧家居、智慧汽車、智慧安防、智慧金融、智慧教育和機器人等多個領域,包括小米、阿里、騰訊、百度、華為、360、亞馬遜等眾多行業頭部客戶的認可與青睞。
智慧健康
伴隨著人工智慧的快速發展,聲智科技關注並意識到人機互動、協同過程中,單一技術能做的事情非常少,商業價值不高,需要將很多的技術組合起來,即多技能多模態,這樣才能做出比較有影響力的成果。SoundAI Azero(壹元人工智慧開發框架)是聲智科技於2018年釋出並在2019年進一步升級的,基於聲智科技的遠場聲光融合、多模態識別(聲音、文字、影象、手勢等)、推理和翻譯、推薦搜尋等技術的AIoT基礎開發框架,這是聲智科技得以迅速發展的核心技術,也是聲智科技在智慧健康領域實現應用落地的重要原因。
2020年,突如其來的新冠疫情暴露出傳統醫療資訊化和公共衛生管理的短板,也加速了聲智科技在智慧健康方面的加速創新和落地應用步伐。這些服務和產品都快速滲透到後疫情時代的各個健康版塊。
北京核酸檢測資訊統一平臺,是聲智科技基於SoundAI Azero人工智慧開發框架開發的重要抗疫平臺之一,包含採集、識別、翻譯和外呼等眾多技能,使檢測效率提升5-10倍;一站式疫情防控健康管理平臺,居民可以使用小程式進行疫苗接種和核酸檢測預約;醫聯網翻譯裝置IDA,利用AI翻譯技術實現對衛生健康機構和防疫機構組織部門之間的資料互聯互通,降低防疫鏈條成本、提升資料安全保護的能力。AI虛擬數字人紅外測溫系統,具備人工智慧互動和預警能力,減少人工投入,降低一線安檢人員感染風險,提高安檢效率;AI電梯與安全監管平臺,不僅提供全程非接觸乘梯體驗,並且支援多種方言識別,還可以將人、裝置集中在“一個螢幕”進行呈現和管控,避免了疫情期間的交叉感染風險;此外,還包括AI醫療智慧屏、智慧流行病學調查系統等在內,累計用新產品智慧服務1億+人次。
聲智科技基於SoundAI Azero人工智慧開發框架的多項抗疫、防疫應用成果紛紛落地,為助力科技抗疫做出了突出貢獻。
智慧城市
新基建浪潮下,聲智科技也積極投身於智慧城市建設,提供覆蓋城市生活出行、居住、辦公等全方位的創新AI產品和方案。
北京智慧垃圾分類平臺是聲智科技在智慧城市領域的率先嚐試。它融合了AI數字人、人臉識別 、智慧語音互動、行為識別、影片監控等AI技術,實現全流程"AI數字人垃圾分類管家"引導與值守,使垃圾分類的管理快速見效、持續有效。智慧垃圾桶檢測到人路過時會語音提示,並且可以識別人員身份,支援多種智慧辨識方式。使用時可以在裝置端進行註冊,資訊會儲存在雲端,方便實時記錄垃圾投遞的個人積分、垃圾稱重等資料,為後續監測提供視覺化管理。
海淀區中關村壹號園區、海淀區萬壽路街道,以及房山區合景領峰社群匹配的聲智智慧垃圾桶都在智慧運營管理平臺的統一監管下,用一塊大屏就可以對輻射範圍內垃圾投遞進行統一監測。垃圾投遞站點是否已經溢滿,垃圾堆積導致的空氣質量狀態,垃圾投遞行為,各類垃圾的重量等資訊都可以一覽無遺。
此外,聲智科技在智慧文旅園區、城市大腦、平安社群等領域做出了創新應用,如位於通州智慧文旅園區的環球影城專案。
截止目前,聲智科技已獲得國家/北京市專精特新“小巨人”企業、北京市科學技術進步二等獎、北京市智慧財產權試點和示範單位、中關村前沿技術企業、中國經濟十大創新企業、十大AI產品創新獎等100餘項榮譽資質與1000餘項自主智慧財產權。
《e谷觀察》認為人機互動技術是人工智慧產業發展的核心驅動力,AI產業的發展將極大地加速人類的創新步伐和創造社會價值的效率。從世界上第一臺通用計算機“ENIAC”採用打孔小紙條來實現指令與結果的輸入輸出開始,是人機互動的最原始形式;之後鍵盤直接解決了計算機文字輸入難題,有了真正意義上的人機互動;滑鼠、觸控式螢幕、繪圖板、手寫筆等“指點裝置”的誕生,實現了圖形化視覺化的人機互動;蘋果公司將手機鍵盤改成螢幕手指互動從而徹底改變了人們的使用習慣;馬斯克宣佈的腦機介面技術的實現,開啟人類腦機互動的新革命;而人工智慧應用到軍事領域,比如戰鬥機中的視覺跟蹤,可以讓作戰飛行員能夠“瞄哪兒打哪兒”……未來的人機互動將呈現多元化的交錯式發展態勢,誰能將各種不同的技術融合在一個平臺上,誰就是贏家。
應用場景落地難是當前人工智慧產品普遍面臨的困難,不少人工智慧公司都在“持續技術投入”與“模式創新”中“夾縫求生”。聲智科技透過對技術的持續研發投入,目前已在多個場景下實現應用,尤其是透過不斷迭代的互動技術,讓場景的落地更為便捷。《e谷觀察》希望聲智科技可以透過對多模態互動技術的不斷投入與研發,持續提高行業技術壁壘,使SoundAI Azero最終成為“AI時代的行業底層作業系統”。
互動讓機器更智慧。
作者:李慧