語音合成架構師：“看到”你的聲音

兩年前的經歷讓孫濤至今難以忘懷。“有一位抗美援朝的老戰士，很懷念已經過世的老排長。” 語音合成架構師孫濤就和同事錄製了一些老排長在世時的聲音，並透過語音合成技術把老排長留給老戰士的信讀給他聽，老人頓時淚流滿面。

語音合成廣泛應用於播報、客服、導航、虛擬主播、虛擬主持人等等。語音合成有三大關鍵因素：文字內容、發音人音色和說話的韻律節奏。發音人音色的不同在於喉嚨。每個人的喉嚨結構比較固定，如果把它比喻成一個樂器，文字內容和韻律節奏更像是樂譜。語音合成相當於只要掌握了樂器（喉嚨）的基本結構，想要合成什麼樣的語句，只要提供樂譜（文字內容和韻律節奏）就可以了。

“只要收集你說的9句話，就能復刻你的聲音”。語音合成架構師孫濤自信地對中工網記者說。每天，孫濤要處理大量採集來的聲音。看著高低不平的聲波，就像看著即將亮相的樂譜，人工智慧是“演奏家”，而他，就是那個“作曲家”。

語音合成需要很多環節，比如聲音的質量、錄製時的環境、資料規整等等，最關鍵的還是如何讓機器透過學習獲得聲音與文字的匹配關係，這是語音架構師花費時間最多的地方。並且，語音跟影象、文字不一樣，它具有時序性和互動性特點，要求系統具有快速響應使用者的能力，這樣，如何更好地完成時序模型系統的設計是考驗一名語音架構師是否合格的因素之一。

“以前客戶服務電話的拒接率很高，大家一聽就知道這不是真人，從情感上就不想交流。” 人工智慧的快速發展，語音合成也搭上了這趟順風車。“語音合成的效果提升以後，已經無法分辨接客服電話的是真人還是機器，與客戶溝通的效率也提升了。”孫濤對中工網記者說，語音合成發展到現在已經進步為個性化的合成，會帶上情感表現，甚至還有一些人文關懷的成分。“語音合成發展的大方向是互動，讓人與人工智慧自如地對話。不僅能傳遞資訊，也能傳遞情感。”孫濤滿懷憧憬地說。

來源：中工網

分類： 科技

時間： 2021-10-08

「一線：360行」系統架構師：當養豬遇到AI
來源:中工網假如四周無人,你偷偷踢豬一腳,app智慧監控平臺會立即發出預警. 當養豬遇到AI,人工智慧養豬變為現實. "從豬的生產到交易.金融,我們需要經過系統的統計分析,形成自己豬場的生 ...

A15擠牙膏的原因找到了！蘋果架構師跑路：晶片研發陷入瓶頸
近日,蘋果釋出了最新的iPhone 13系列,帶來了最新的A15仿生晶片.令人意外的是,官方沒有在釋出會上沒有圍繞A15的提升做太多介紹.目前,最新的一份報告表明,蘋果減少對A15晶片描述的篇幅,是有 ...

智慧新零售：盡顯聯想新IT架構背後的科技實力
談到零售企業所面臨最高的成本,人們想到的往往是實體門店的人工費用.而事實上,成本佔用最高的是能耗.一家60平米左右規模的門店,4名員工即可維持正常運轉,員工平均成本可能不到5000元,但每月能耗成本就 ...

高薪和失業，汽車行業裡的兩個世界
撰文/張霖鬱編輯/ 孟為設計/ 師瑜超 2016年,上汽通用年銷量接近190萬輛,淨利潤增幅高於銷量和收入的同比增幅.這一年,大部分的整車廠仍處在舒適區.整個汽車行業的銷量為2438萬輛,大盤同 ...

為什麼現在玩貼吧的人越來越少了？百度貼吧到底是如何沒落的？
前言在曾經的中國互聯網裡,有一個非常火熱的網際網路社群平臺,想必許多人的青春都留在了上面. 它,就是當年百度著名的王牌產品之一--百度貼吧. 毫不誇張地說,百度貼吧當年吊打所有網際網路社群類的產品, ...

語音合成架構師：“看到”你的聲音

相關文章

高薪和失業，汽車行業裡的兩個世界
撰文/張霖鬱編輯/ 孟為設計/ 師瑜超 2016年,上汽通用年銷量接近190萬輛,淨利潤增幅高於銷量和收入的同比增幅.這一年,大部分的整車廠仍處在舒適區.整個汽車行業的銷量為2438萬輛,大盤同 ...

A15後，蘋果晶片將跌落神壇？
多年來,Apple 一直因擁有適合消費者工作負載的最佳 CPU 核心而備受讚譽.在與 AMD 和英特爾目前最好的 CPU 相同級別的效能驅動下,它們具有迄今為止最高的每時鐘效能和效率.這是由十年來每年 ...

谷歌和IBM競相佈局的量子計算，靠譜嗎？
來源:計算機世界下一代技術最終有望帶來的商業價值已經激起了一些IT領導者的興趣,但也有很多人對伴隨高風險的回報持懷疑態度. 著名模仿音樂家David St. Hubbins曾說過:"愚蠢和 ...

TCP的FIN_WAIT1狀態理解｜深入理解TCP
相關影片推薦從websocket協議到tcp自定義協議,tcp分包與粘包,明文傳輸 TCP/IP協議棧深度解析丨實現單機百萬連線丨最佳化三次握手.四次揮手 C/C++Linux伺服器開發/後臺架構師 ...

超千人到場，世鏈Web3.0分散式儲存行業峰會完美收官
如何用一場峰會,展現一個牛市?9月17日,由上市公司信維股份主辦,世鏈財經承辦的"賦能·共贏--2021信維Web3.0分散式儲存行業峰會"便火爆到彷彿置身"牛市&quo ...

教培機構匆忙轉型程式設計存四大亂象
國家"雙減"政策出臺1個多月,眾多教培機構逐步轉型素質教育."以前是卓越.新東方等這些教培機構派傳單,現在變成了機器人培訓.少兒程式設計課的機構在派傳單",據瞭 ...

語音合成架構師：“看到”你的聲音

相關文章

A15後，蘋果晶片將跌落神壇？ 多年來,Apple 一直因擁有適合消費者工作負載的最佳 CPU 核心而備受讚譽.在與 AMD 和英特爾目前最好的 CPU 相同級別的效能驅動下,它們具有迄今為止最高的每時鐘效能和效率.這是由十年來每年 ...

谷歌和IBM競相佈局的量子計算，靠譜嗎？ 來源:計算機世界 下一代技術最終有望帶來的商業價值已經激起了一些IT領導者的興趣,但也有很多人對伴隨高風險的回報持懷疑態度. 著名模仿音樂家David St. Hubbins曾說過:"愚蠢和 ...

TCP的FIN_WAIT1狀態理解｜深入理解TCP 相關影片推薦 從websocket協議到tcp自定義協議,tcp分包與粘包,明文傳輸 TCP/IP協議棧深度解析丨實現單機百萬連線丨最佳化三次握手.四次揮手 C/C++Linux伺服器開發/後臺架構師 ...

超千人到場，世鏈Web3.0分散式儲存行業峰會完美收官 如何用一場峰會,展現一個牛市?9月17日,由上市公司信維股份主辦,世鏈財經承辦的"賦能·共贏--2021信維Web3.0分散式儲存行業峰會"便火爆到彷彿置身"牛市&quo ...

教培機構匆忙轉型程式設計存四大亂象 國家"雙減"政策出臺1個多月,眾多教培機構逐步轉型素質教育."以前是卓越.新東方等這些教培機構派傳單,現在變成了機器人培訓.少兒程式設計課的機構在派傳單",據瞭 ...

A15後，蘋果晶片將跌落神壇？
多年來,Apple 一直因擁有適合消費者工作負載的最佳 CPU 核心而備受讚譽.在與 AMD 和英特爾目前最好的 CPU 相同級別的效能驅動下,它們具有迄今為止最高的每時鐘效能和效率.這是由十年來每年 ...

谷歌和IBM競相佈局的量子計算，靠譜嗎？
來源:計算機世界下一代技術最終有望帶來的商業價值已經激起了一些IT領導者的興趣,但也有很多人對伴隨高風險的回報持懷疑態度. 著名模仿音樂家David St. Hubbins曾說過:"愚蠢和 ...

TCP的FIN_WAIT1狀態理解｜深入理解TCP
相關影片推薦從websocket協議到tcp自定義協議,tcp分包與粘包,明文傳輸 TCP/IP協議棧深度解析丨實現單機百萬連線丨最佳化三次握手.四次揮手 C/C++Linux伺服器開發/後臺架構師 ...

超千人到場，世鏈Web3.0分散式儲存行業峰會完美收官
如何用一場峰會,展現一個牛市?9月17日,由上市公司信維股份主辦,世鏈財經承辦的"賦能·共贏--2021信維Web3.0分散式儲存行業峰會"便火爆到彷彿置身"牛市&quo ...

教培機構匆忙轉型程式設計存四大亂象
國家"雙減"政策出臺1個多月,眾多教培機構逐步轉型素質教育."以前是卓越.新東方等這些教培機構派傳單,現在變成了機器人培訓.少兒程式設計課的機構在派傳單",據瞭 ...