原標題:雲南省人工智慧重點實驗室部分成果國內領先 自主研發系統可翻譯108種語言
隨著人工智慧技術的發展,語音實時翻譯轉寫已不再是難事。但目前市場上大多數裝置和軟體主要支援中文與英語、日語、韓語、法語等常用語言的翻譯,而支援越南語、緬甸語、寮國語等非通用語言的翻譯產品還較少,翻譯效果不理想。針對雲南的區位特點,昆明理工大學雲南省人工智慧重點實驗室從南亞東南亞語言資訊處理及機器翻譯、語音識別及合成等方向開展研究,形成一支面向“兩亞”語言資訊處理的高水平研究團隊。去年,該實驗室入駐昆明呈貢資訊產業園區,透過“語言技術+”應用和產業合作平臺建設,研發成果不斷轉化並加速推向市場。
“實驗室在語言技術方面的研究10多年前就開始了。”該實驗室負責人毛存禮說,2005年,團隊從資源建設等底層工作開始,研究起了語言轉化技術,包括自然語言處理及機器翻譯、資訊檢索與社會計算、語音識別與合成、影象識別與檢索、機器學習與智慧控制5個方向。
雲嶺機器翻譯平臺是實驗室的核心成果,結合越南語、泰語等南亞東南亞語言資源稀缺的特點,團隊提出一系列神經機器翻譯方法,實現了中文與越南語、緬甸語、泰語、寮國語、英語、日語等108個語種的雙向神經機器翻譯,覆蓋“一帶一路”沿線多個國家。日前,“雲嶺翻譯”服務板塊正式上線“一部手機辦事通”,成為平臺首家上線的南亞東南亞語言翻譯工具。
“今天的天氣真好”“準備開會了”“我們聊一聊”……11月11日,研究人員手拿一臺翻譯裝置持續輸入普通話,幾乎是同一時間,另一臺裝置上就出現了對應的越南語文字。這便是小語洞聽同聲翻譯軟體。基於先進的深度全序列卷積神經網路模型,該軟體構建了實時語音識別引擎,可以將採集到的音訊實時轉化成文字並進行翻譯,識別準確率高、速度快。
同時,基於文字翻譯技術,團隊向多個方向拓展,針對日常交流、會議、社交等場景,上線了小語洞聽、小語聊聊等系列產品。小語聊聊整合自主研發的東南亞語言翻譯、影象OCR識別、語音識別及合成等核心技術,不同國家的人能在平臺上跨語言暢通交流。小語譯製可實現中文到越南語、泰語、緬甸語等東南亞語言的字幕自動譯製,投入使用以來已譯製上百集電視劇。小語悅讀採用深度學習技術構建端到端語音合成引擎,輸入的文字可自動轉換為語音。“為了提高聲音輸出效果,不同地區、民族的語言均為當地標準口音,現場錄製後用機器訓練合成模型,準確率高且接近真實人聲。”毛存禮說。
除了文字、語音識別翻譯,影象識別也是實驗室研究的方向之一。結合輸電路巡維智慧化需求,實驗室研發的輸電線路缺陷智慧識別系統支援輸電線路影象質量判斷、低質量影象高畫質化、影象內容校驗,完成絕緣子自爆等20餘種缺陷的智慧標註和識別。毛存禮表示,和傳統人工巡檢相比,智慧識別系統只需根據圖片就能作出正確判斷,不僅確保了工人的安全,也提升了巡檢水平。
目前,雲南省人工智慧重點實驗室已獲國家新一代人工智慧專項、國家自然科學基金重點專案等國家和省部級專案60餘項,構建了面向南亞東南亞語言的大規模雙語詞典、平行語料等資源庫,以及面向南亞東南亞語言分詞、詞性標記等語言解析平臺。接下來,實驗室將主要開展翻譯機系列產品升級、定製化系統部署、翻譯介面服務等方面工作,力爭突破語言技術,推動面向“兩亞”的數字經濟先行示範區建設。(記者 張怡 實習生 張瑞東攝影報道)
來源:昆明日報