sponsored links

自治區重點實驗室6篇論文被訊號處理領域頂級國際會議ICASSP錄用

自治區重點實驗室6篇論文被訊號處理領域頂級國際會議ICASSP錄用
自治區重點實驗室6篇論文被訊號處理領域頂級國際會議ICASSP錄用


近日,內蒙古自治區蒙古文資訊處理技術重點實驗室(內蒙古大學蒙古文智慧資訊處理技術國家地方聯合工程研究中心)有6篇論文被2022年IEEE音訊、語音與訊號處理國際會議(2022 IEEE International Conference on Acoustics, Speech, and Signal Processing, ICASSP 2022)接收錄用。此次被錄用的論文涉及智慧語音互動領域的語音增強、語音鑑偽、語音識別等研究領域。

ICASSP是由IEEE電氣電子工程師學會主辦的訊號處理領域的頂級國際會議,是IEEE下語音方向最具代表性、最高榮譽的會議,在國際上享有盛譽並具有廣泛的學術影響力。

內蒙古自治區蒙古文資訊處理技術重點實驗室(以下簡稱重點實驗室)高光來教授、張學良教授、飛龍教授帶領團隊多年來針對語音識別、語音合成、語音增強與分離等領域進行了深入的研究,提出了一系列創新性方法,在TASLP、ICASSP等語音訊號處理領域國際頂級期刊和會議發表論文二十多篇,並且研發的蒙古語語音識別、蒙古語語音合成和語音增強等智慧系統已實際落地應用,對國家和自治區智慧語音產業發展起到了積極推動作用。

近幾年,該重點實驗室不斷強化能力建設,在科技創新、產學研結合和人才培養方面取得了一系列可喜的成績,為我區乃至全國多語言智慧資訊處理、大資料雲計算服務提供了技術支撐。該科研團隊引進和培養了張懷文研究員(駿馬計劃B1崗)、劉瑞研究員(駿馬計劃B1崗)、張暉副教授等一批優秀的年輕教師,併成為了重點實驗室核心骨幹力量。目前,重點實驗室專業技術人員29人,其中教授10人、研究員2人,副教授7人、副研究員1人、博士生導師7人,27人具有博士學位,具有層次高、國際化和年輕化的特點。

論文名稱及摘要

01 《基於對齊學習單步解碼的非自迴歸準確快速語音識別方法》

本文提出一種基於對齊學習的非自迴歸Transformer(AL-NAT)語音識別方法。受端到端模型中編碼器CTC的輸出和目標序列具有單調相關性這一事實的啟發。我們將編碼器CTC的輸出作為解碼器的輸入,並定義了一種對齊損失函式用於最小化該輸入和目標序列之間的對齊成本矩陣。我們的方法不需要長度預測機制,在識別準確率和解碼速度方面相比已有的NAT模型取得了顯著提升。此外,為了學習上下文知識以提高識別準確率,我們進一步在編碼器和解碼器端分別增加了輕量級3-gram語言模型。實驗結果表明,分別在編碼器和解碼器端增加語言模型對識別效能有很大提升。

02 《 一種基於原地卷積神經網路的複數頻譜對映聲學回聲消除方法》

近年來,深度學習技術被引入到聲學回聲消除(AEC)中,並取得了顯著的效果。然而對於基於深度學習方法的AEC來說,最重要的問題是在多樣性場景下模型的泛化能力。與大多數處理整個頻段的方法不同,本文提出了用於端到端AEC的原地卷積遞迴神經網路(ICRN),它利用原地卷積和通道級的時間建模來確保近端訊號資訊得到保留。此外,本文采用複數頻譜對映與多工學習策略,獲得更好的泛化能力。在多個不匹配的場景下進行的實驗表明,所提出的方法優於以前的方法。

03 《DRC-NET:用於語音去混響的密集連線迴圈卷積神經網路》

基於作者之前在時頻域上使用Inplace CRN模型對每個頻率點進行單獨處理得到的顯著效能提升。在本文中,該方法將單頻點特徵作為基本的處理單元,這使得模型可以統一RNN在時頻域中對頻率維度和時間維度的處理方式。在此基礎上,該方法將卷積神經網路(CNN)和RNN緊密結合起來作為一種基本的時頻域處理單元,最終得到了密連迴圈卷積神經網路(DRC-NET)。DRC-NET有效融合了RNN的無限衝擊響應特性和CNN的有限衝擊響應特性,使得效能得到了顯著提升。實驗結果表明,無論是非因果版本的DRC-NET還是因果版本的DRC-NET,語音去混響的效能都優於SOTA基線模型。

04 《使用奇異點檢測特徵的深度音訊(拼接)偽造檢測》

本文針對偽造語音中的半真半假音訊鑑別提出了一種利用高頻奇異性檢測特徵和序列資訊進行音訊鑑偽的方法,以彌補對於半真半假音訊檢測方法的缺失。給定當前待檢測的音訊,該方法首先對音訊進行小波分解,並提取分解後的高頻分量進行重構,提取出音訊中的高頻奇異點以及突變特徵。然後利用長短時記憶模組(LSTM)進行序列建模,進行初步的奇異點上下文建模以及定位。為了消除音訊本身存在的固有奇異點干擾,該方法組合了線性頻率倒譜系數(LFCC)作為補充。該方法不僅實現了對於半真半假音訊資料的鑑別,同時也對偽造的音訊片段進行定位。所提方法為一種新型的攻擊方式——半真半假音訊提供了一種有效方法,且實驗結果表明,相對於已有鑑偽方法,該方法在精度和魯棒性方面都有了很大的提高。

05 《一種緩解有監督單通道語音增強系統中損失-度量不匹配問題的演算法》

在本文中,作者研究了有監督的單通道語音增強系統的損失-度量不匹配問題。大多數現有的語音增強系統的效能並不令人滿意,因為它們根據經驗選擇的損失函式與不可微的評估指標存在語義上的差距,又稱損失-度量不匹配問題。在這項工作中,作者提出了一種簡單而有效的方法,為真實的前端語音增強場景生成合適的損失函式,以緩解損失-度量不匹配的問題。具體來說,該方法採用了函式平滑技術,透過一組基函式及其線性組合來逼近不可微的評價指標。實驗結果表明,由該方法生成的損失函式能夠幫助語音增強系統在大多數評價指標上取得更顯著的效能。

06 《基於注意力融合的複數域骨傳導和空氣傳導語音增強方法》

骨傳導(BC)麥克風透過將人類頭骨的振動轉換為電訊號來捕獲語音訊號。BC感測器對噪聲不敏感,但頻寬有限。另一方面,傳統或空氣傳導 (AC)麥克風能夠捕獲全頻帶語音,但容易受到背景噪音。我們透過使用執行復雜頻譜對映的卷積迴圈網路結合AC和BC麥克風的優勢。為了更好地利用來自兩種麥克風的訊號,我們採用了基於注意力的融合以及早期融合和晚期融合策略。實驗證明了所提出的方法優於其他最近結合BC和AC訊號的語音增強方法。此外,我們的增強效能明顯優於傳統的語音增強對應物,尤其是在低信噪比場景中。

(來源:自治區科技廳基礎研究處)

分類: 健身
時間: 2022-02-06

相關文章

「共赴春城之約」科普 | 碳匯:用生態手段減少溫室氣體濃度

「共赴春城之約」科普 | 碳匯:用生態手段減少溫室氣體濃度
央視網訊息:要實現碳達峰.碳中和的"雙碳"目標,除了要減少二氧化碳的排放,還有一個重要抓手就是提升生態碳匯能力,增加對二氧化碳的吸收.那麼,什麼是碳匯,生態碳匯包括哪些內容? 碳匯 ...

“花裡大豐 為愛而來”旅遊季,邀您共赴一場金秋之約

“花裡大豐 為愛而來”旅遊季,邀您共赴一場金秋之約
來源:新華日報 離開了春暖萬物復甦時的喧鬧,告別了夏日驕陽似火時的浮躁,金秋九月.百合飄香,麋鹿歡騰.舉國同慶,"花裡大豐 為愛而來"旅遊季邀您共赴一場金秋之約,所有的美好都會在此 ...

出發,中建八局邀您共赴探月之旅

出發,中建八局邀您共赴探月之旅
八月中秋 寰宇中圓月高懸 很久以前 中國人抬頭望的時候 嫦娥.玉兔.廣寒宮-滿天神話 而今 "嫦娥"是中國探月工程之名 "玉兔"是我們對月球車的愛稱 " ...

《平原上的摩西》更名《平原上的火焰》周冬雨劉昊然共赴8年之約

《平原上的摩西》更名《平原上的火焰》周冬雨劉昊然共赴8年之約
9月20日,電影<平原上的摩西>劇組亮相第十一屆北京國際電影節開幕式,導演張驥.演員周冬雨.梅婷.袁弘.陳明昊集體現身紅毯.活動現場,<平原上的摩西>宣佈正式更名為<平原 ...

蟻起變裝蟻起FUN 奇瑞新能源小螞蟻邀您共赴潮改盛宴

蟻起變裝蟻起FUN 奇瑞新能源小螞蟻邀您共赴潮改盛宴
以個性駕馭生活,用改裝詮釋自我.在如今"萬物皆可DIY"的年代,汽車改裝已經成為當代年輕人追逐潮流.展現個性的一種方式.作為始終走在時尚前沿的明星車型,奇瑞新能源小螞蟻以更潮酷.更 ...

皓月當空!江小妹攜兩江網紅打卡地,邀您共赴月圓之夜

皓月當空!江小妹攜兩江網紅打卡地,邀您共赴月圓之夜
中秋佳節至,這是一年之中 最溫柔又最有詩意的節日. 在兩江新區,一半山水一半城, 夜幕降臨,華燈初上, 夢幻夜景在這裡交相輝映. 今年中秋"十五的月亮十五圓", 最圓時刻為9月21 ...

北影節紅毯星光熠熠,200多位電影人共赴光影盛典

北影節紅毯星光熠熠,200多位電影人共赴光影盛典
9月20日晚,第十一屆北京國際電影節開幕式紅毯在雁棲湖畔舉行,200多位電影人走上紅毯,在爛漫秋光中共赴光影盛典. 紅毯當天上午,北京的秋雨一直沒有停,但就在紅毯開始前幾小時,天空突然放晴,還出現了層 ...

戴安娜最後的愛人:為她擋風遮雨,比查爾斯溫柔,24年前共赴黃泉

戴安娜最後的愛人:為她擋風遮雨,比查爾斯溫柔,24年前共赴黃泉
我們都道查爾斯始亂終棄,辜負了一心愛他的戴安娜.可世界上的錯誤,向來都不是一方造就的. 查爾斯在婚內出軌卡米拉固然不對,可戴安娜在婚姻內就一定是潔白無瑕嗎? 戴安娜在與查爾斯婚姻關係存續期間就曾數次出 ...

一起向未來“洋網紅”妙語連珠共話冬奧之約

一起向未來“洋網紅”妙語連珠共話冬奧之約
國際線上訊息(記者 李勝蘭):9月17日,在北京冬奧會開幕倒計時140天之際,北京2022年冬奧會和冬殘奧會主題口號揭曉--"一起向未來".當天,由北京冬奧組委主辦,中央廣播電視總 ...

美女學霸趙煜寧:不上補習班,高考674分上北大,她是怎麼做到的

美女學霸趙煜寧:不上補習班,高考674分上北大,她是怎麼做到的
今年9月份國家對教育連環出手,控制了遊戲時長,出臺了"雙減"措施,減輕學生的作業負擔,不允許校外培訓機構進行學科類培訓. 雖然所有的舉措都是為了孩子,但是家長們在短時間內依然感到很 ...

共慶中秋 天壇公園推出5G雲賞月線上直播活動
新華網北京9月20日電(楊淑君 魏冠宇)今年中秋假期,天壇公園在開展多場次文化宣教活動的同時,將以線上直播的方式在天壇標誌性建築祈年殿前與廣大網友相約雲端,共慶中秋佳節. 記者從天壇公園瞭解到,21日 ...

萬物共榮 華夏之美

萬物共榮 華夏之美
10月11日下午,聯合國<生物多樣性公約>第十五次締約方大會(COP15)在雲南昆明拉開帷幕.主會場大門前,鮮花組成了一位敞開雙臂的少女,寓意為我們萬物共生的家園. 由於物種特別豐富,中國 ...

被劇名耽誤的《我的巴比倫戀人》爆笑,雞飛狗跳,共情代入

被劇名耽誤的《我的巴比倫戀人》爆笑,雞飛狗跳,共情代入
導讀:"今天,我親眼看見了古國璀璨的文明,像一幅壯美的畫卷,也像一個真實的夢境,那些寫在歷史和傳說中的浪漫奇遇,就這樣闖進了我的生活,我心生敬畏卻又忍不住偷偷幻想,說不定,我也可以成為這傳奇 ...

特工盧志英:曾救下8.6萬紅軍,解放後下落不明,開棺才知被活埋

特工盧志英:曾救下8.6萬紅軍,解放後下落不明,開棺才知被活埋
1935年,中央紅軍四渡赤水過後,地下黨員盧志英奉命掩護紅軍傷病員,並策應紅二.六軍團的活動.期間,盧志英帶領四名戰友前去接應一支紅軍隊伍,要將他們轉移至雲貴邊境,正巧路遇妻子張育民抱著2個多月大的小 ...

第十一屆北京國際電影節今晚開幕,線上線下暢享中外佳作

第十一屆北京國際電影節今晚開幕,線上線下暢享中外佳作
"北京展映"首次走出北京.電影嘉年華首次推出夜場."電影+"活動以跨界帶動產業新局--第十一屆北京國際電影節將於今晚正式拉開帷幕.多年來,北京國際電影節不僅是影 ...

到雲南昆明周邊旅遊必去的13大景點,你去過幾個?最愛哪個景點?

到雲南昆明周邊旅遊必去的13大景點,你去過幾個?最愛哪個景點?
昆明是著名的旅遊勝地,旅遊資源獨具魅力,景點很多,我之前已經出過一篇昆明的21個景點介紹了,今天我接著出一篇昆明周邊的有代表性的13個景點介紹.你去過幾個景點?最愛的又是哪個景點? 1.石林風景區 石 ...

博學一“夏”|“化石”裡的故事,聽我說給你來聽……

博學一“夏”|“化石”裡的故事,聽我說給你來聽……
炎炎夏日長 暑期裡,和小編一起走進博物館 來聽"化石"講述時間的故事 -- 中國地質博物館 創建於1916年的中國地質博物館 收藏了恐龍系列化石.史前生物化石.礦物標本等國家珍品2 ...

剛剛拉響的防空警報,提醒每一個廣西人:這是不能忘記的恥辱!

剛剛拉響的防空警報,提醒每一個廣西人:這是不能忘記的恥辱!
剛剛 你聽到防空警報聲了嗎 10時00分至10時15分 廣西拉響了防空警報 預先警報:鳴響36秒,停24秒,反覆3遍,時間3分鐘: 空襲警報:鳴響6秒,停6秒,反覆15遍,時間3分鐘: 解除警報:連續 ...

山東科技大學軍訓大片震撼出擊!超燃草地音樂節等你贊

山東科技大學軍訓大片震撼出擊!超燃草地音樂節等你贊
烈日當頭,秋風侵襲眼眶 迷彩斑斕,汗水浸透脊樑 金秋九月 來自五湖四海的新嵙er 共赴與嵙嵙的軍訓相聚之約 轉眼間,軍訓已接近尾聲,一起去看看吧! 操場上,草坪邊 眼神 從迷茫到堅毅 身姿 從柔弱到挺 ...

明湖中學:實施“四項工程”辦好優質教育
9月16日,明湖中學舉行2021-2022學年開學典禮,全校7000餘名師生共赴九月開學之約,汲取奮進力量,開啟新學年新徵程. 教師:"我是一名光榮的明湖中學教師,我莊嚴宣誓:忠誠黨的教育事 ...