sponsored links

從個性化推薦到語音識別,微軟亞洲研究院為Windows 11注入新智慧

編者按:問世30多年來,Windows 已經成為全球億萬人工作、生活、創作時不可或缺的絕佳夥伴。2021年10月5日,微軟產品大家庭正式迎來了最新成員 Windows 11。在如今混合辦公、遠端協作成為新常態的背景下,新一代 Windows 11 創新的功能設計、高效易用的體驗、豐富精彩的內容,將更好地幫助使用者提高生產力、發揮創造力。而在 Windows 11 個性化、智慧化功能的背後,既有微軟產品團隊努力的成果,也離不開微軟研究部門的技術支援。那麼,這些豐富實用的新功能是如何實現的?微軟亞洲研究的基礎研究創新成果又是如何轉化到一線產品中的?



2021年10月5日正式釋出的 Windows 11,小到“開始”選單、工作列的位置、圖示和字型的設計,大到自動化推薦、語音控制等功能,都讓使用者與之所愛更近一步。在更智慧化、人性化的 Windows 11 系統中,多個基於微軟亞洲研究院的技術創新實現的功能,為使用者帶來了全新的使用體驗。

在這些技術創新中,除了底層的技術支援之外,還有一些使用者熟悉的功能,比如從 Windows 7 開始,Windows 產品部門就基於微軟亞洲研究院提供的演算法,不斷提升中文、日文、韓文的手寫識別功能。而在最新版本 Windows 11 的“新聞與興趣(News and Interests)”和“語音訪問(Voice Access)”兩個功能上,研究院又進一步優化了底層模型,對演算法進行了創新,這背後是微軟亞洲研究院在推薦演算法、深度學習、自然語言處理等領域深耕多年的積累。

從個性化推薦到語音識別,微軟亞洲研究院為Windows 11注入新智慧

從個性化推薦到語音識別,微軟亞洲研究院為Windows 11注入新智慧

深度學習與 NLP 的融合,

讓 Windows 11“新聞與興趣”知你所需

新聞推薦屬於一種特殊的個性化推薦,相比於商品、電影等內容的推薦,新聞事件每時每刻都在更新,對於系統來說每條新聞都是全新的內容,這就使得系統無法獲得足夠的使用者互動資料來訓練推薦模型,因此,必須從新聞本身出發,加強對內容的理解。儘管之前也有針對新聞推薦的演算法模型,但那些模型給使用者推薦的往往是同質化的新聞,極易造成使用者反感,難以精準匹配使用者對新聞的實際需求。

微軟亞洲研究院首席研究員謝幸表示,“新聞內容本身和閱讀新聞的使用者其實都可以用文字表示,推薦的準確與否本質上都可以看作是對這些文字語義理解的深度。過去的推薦系統要麼沒有使用深度學習技術,無法學習樣本資料的內在規律,要麼基於深度學習卻沒有結合自然語言處理(NLP)技術,無法對語義進行更深的理解。”因此,微軟亞洲研究院將最新的深度學習與 NLP 技術整合到了對使用者和新聞的建模中,大幅提升了推薦模型的效能和準確率。基於此模型,Windows 11 “新聞與興趣”功能實現了多樣化、個性化和更精準的新聞推薦,現在使用者可以透過 Windows 11 中的小元件等多種方式隨時看到他們最感興趣的新聞內容。

從個性化推薦到語音識別,微軟亞洲研究院為Windows 11注入新智慧


個性化新聞推薦的技術流程

具體來看,可以將這一推薦演算法分成三層:

第一層是針對當前新聞內容本身文字的理解,實際上就是對自然語言的理解。這一層主要基於微軟圖靈通用語言表示模型,其核心模型和演算法採用了研究院最新的統一語言預訓練模型 UniLM 和多語言預訓練模型 InfoXLM,這兩項技術在語言理解、生成和翻譯任務上都取得了領先的結果。

第二層是對使用者的理解,也就是圍繞使用者所展開的一系列文字理解,但又不只是簡單的文字整合。雖然可以將使用者看成一個已經瀏覽或閱讀了新聞的文字集合,但不能將所有文字簡單地進行拼接,系統還需要了解使用者閱讀的先後順序,以及由此形成的使用者興趣群組、對興趣重要性進行區分等等,這些都是對使用者的建模過程。當考慮這些因素時,使用者就由原來一系列標籤化的表示,轉變為在深度學習中的向量表示,從而極大地提升準確率。

舉例來說,我們可以按照不同的屬性類別給某個使用者打上諸如男性、本科畢業、居住在北京等標籤,這樣當一條受北京男性喜愛的新聞出現時,系統就會將其推送給相關使用者。然而,這種推薦方法只做了簡單的匹配,因為這些標籤並不能準確地描述個人特徵,比如無法明確說明他真的是北京人,也不知道使用者真正的興趣愛好是什麼。但深度學習則可以拋開標籤,將每一個人變成數字,也就是向量,透過計算向量之間的相似性來推薦內容。

按照此方式,每個人都可以被看作是高維空間中的一個點。新聞則是同一空間中的另一個點,這樣就可以直接比較使用者和新聞間的距離。我們可以想象,在一個空間中同時包含了眾多的使用者和新聞,與其中一個使用者比較近的自然就是他喜歡的新聞。

最後一層是排序。理論上可以將新聞推薦看作是對高維空間中使用者與新聞內容距離的計算,但實踐中還有更多的因素需要考慮,例如新聞推薦的多樣性、公平性、可解釋性等等。

透過將深度學習與 NLP 整合到新聞推薦系統中,Windows 11 可以更好地滿足使用者對新聞的需求。資料顯示,在所推薦的新聞上,使用者的實時點選率得到了提升,瀏覽時長也有所增加。

該推薦演算法具有較高的通用性,涉及到個性化搜尋和推薦的領域,如微軟廣告、必應(Bing)搜尋等場景都能應用。另外,基於推薦演算法的研究,微軟亞洲研究院還與微軟新聞團隊聯合釋出了迄今世界上最大的英文個性化新聞推薦資料集 MIND,為新聞推薦的研究建立了相對權威的評測標準。而且在2021年的 ACL 大會上,雙方團隊還合作構建了第一個可以離線評測個性化新聞標題生成方法的基準資料集 PENS(PErsonalized News headlineS)。

從個性化推薦到語音識別,微軟亞洲研究院為Windows 11注入新智慧

用語音操作電腦,微軟無障礙功能不斷精進

歷代 Windows 版本都慮到了無障礙增強功能,為不同類別的殘障人士提供支援和便利。而 Windows 11 中新增的輔助功能Voice Access(語音訪問),則讓包括行動不便人士在內的所有人都可以透過語音控制他們的電腦,編輯文字內容,如操作 Windows 系統的應用程式、瀏覽網頁、編寫郵件等。

微軟亞洲研究院主管研究員吳俁說,“Voice Access 功能使用的是一種端到端的 ASR(Automatic Speech Recognition 自動語音識別)技術。它將聲音模型與語言模型融合成統一的模型,不僅可以更準確地識別出使用者的指令,快速完成相應的任務,更重要的是降低了對計算資源的需求,更適合在膝上型電腦等終端裝置上部署,即使在沒有網際網路的情況下,裝置也能支援快速語音識別。”

從個性化推薦到語音識別,微軟亞洲研究院為Windows 11注入新智慧

如上圖所示,Voice Access 首先會將桌面的專案進行編號,然後透過如下的語音指令進行控制。


操作


語音指令


顯示專案編號


“Show numbers” 或者 “Show numbers here”


點選某個編號對應的專案


“Click [number]”, 比如“Click 1”, “Double click 1”, “Right click 1”


隱藏某個編號對應的專案


“Hide Numbers,” “Cancel”

早在2019年,微軟亞洲研究院就已和微軟 Azure 團隊的語音組合作開展了相關的語音識別研究。最初的 ASR 模型是聲學模型和語言模型的混合體,先由聲學模型把輸入的語音轉換為發音的最小單母音素,再用音素結合語言模型產生語音識別結果。由於模型體量較大,當時相關技術主要以 SaaS 模式部署在微軟 Azure 雲平臺上供使用者使用。隨著研究員們對 ASR 技術的不斷探索、提升,微軟的產品部門希望升級後的 ASR 技術可以更多地應用在產品端,以支援弱勢群體更方便地使用相關產品。

然而,直接將大規模 ASR 模型部署在終端裝置上並不現實。除了要將模型本身輕量化、提升運算速度外,在與 Azure 團隊語音組合作的過程中,研究員們也意識到在將技術轉化為產品時,最佳化模型不僅要聚焦準確率,還要以使用者體驗為第一優先原則。正如微軟亞洲研究院高階研究員劉樹傑所說,“我們做基礎研究的時候往往會把一些問題抽象出來,思考如何在一個點上發力把技術做到更好、更優。而產品部門的同事更多的是站在使用者的角度思考問題,比如使用者在什麼情況下對產品的滿意度更高,使用感受更好。”

在對端到端的 ASR 模型測試時,研究團隊和產品團隊就遇到了不同思維的相互碰撞。劉樹傑介紹到,研究員們注重的是客觀指標,會在大資料集上做客觀指標的測試,而轉化為產品後,產品經理更加註重的是使用者的主觀感受。因此,當 Windows 11 在微軟 Surface 以及各 PC 廠商的電腦上執行時,ASR 模型也要做相應的最佳化和適配。

開發過程中,微軟亞洲研究院與 Azure 團隊語音組和 Windows 產品部門緊密合作,反覆溝通,透過不斷迭代,使得 ASR 模型在多裝置上的測試結果都達到了人類正常說話時的水平。儘管目前模型只支援美式英語的語音識別,但該模型具有跨語言通用性,後續只需利用不同語言的資料對模型展開訓練,就能夠實現跨語言的語音識別與操控。

得益於深度學習的發展和充足的語料支援,自動語音識別 ASR 在大語種上取得了非常優異的效能。然而,世界上還有很多語言缺少語料資料,這些小語種、地方方言的使用人數較少,收集相應的語言資料會耗費大量的人力和資源,給相應 ASR 的實現造成了一定困難。為了解決這一問題,微軟亞洲研究院提出了一種極低資源下語音識別的新方法 WavLM,尤其是針對 ASR 的預訓練模型,其各項指標一直在 SUPERB 評測資料集排行榜上位列第一(https://superbbenchmark.org/leaderboard)。

從個性化推薦到語音識別,微軟亞洲研究院為Windows 11注入新智慧


WavLM 在 SUPERB Leaderboard 上的表現

一直以來,微軟始終重視無障礙(Accessibility)方面的建設,目的是讓產品、裝置、服務和環境的設計更加方便地為殘障人士所使用。下一步,微軟亞洲研究院還將聯合微軟的產品團隊將類似的技術擴充套件到更多的產品和應用場景中,打破溝通與使用障礙,予力每一人。

煥然一新的桌面、簡潔的設計、舒適的佈局和靈活的體驗,無一不彰顯新一代作業系統 Windows 11 的高效與創新。無論是面向工作、學習、生活、遊戲,還是藝術創作、程式設計開發,Windows 11 都為使用者提供了一個更適合的模式。面對混合辦公新常態以及新的使用者需求,微軟亞洲研究院也會持續將最新的科研成果輸出到微軟的產品中,幫助更多使用者提高生產力,激發創作靈感!

分類: 農業
時間: 2022-01-11

相關文章

2021半年度十大熱梗回顧 王思聰、潘長江“傾情出演”

2021半年度十大熱梗回顧 王思聰、潘長江“傾情出演”
[CNMO]如今在網上"衝浪",玩梗已經成為日常,沒有幾個梗"防身"都會被叫做"山頂洞人".但網路訊息更迭飛快,不是人人都能實時" ...

中國古代十大手抄本之一《人間樂》第十五、十六 回

中國古代十大手抄本之一《人間樂》第十五、十六 回
第十五回 花下贈金勸勉成名歸急早 潛身逸去春風得意馬蹄香 詞曰: 寂靜無譁,天街明淨,暗想嗟呀.許結姻親,飄零書劍,無聘疑奢.今宵一見天涯,顧不得叮嚀眼色.手贈黃金,言入於耳,名就歸家. 調寄< ...

中國足壇十大留洋成功的球星
中國足壇十大留洋成功的球星 中國足球現在是一地雞毛,讓球迷傷透了心,我們這些老球迷,已懶得再對現在的中國足球說什麼了,沒事的時候,只有靠回憶來支撐對足球的喜愛了,今天沒事就整理一下記憶中的中國足壇幾位 ...

中國體壇十大統治力巨星:有人參賽必拿冠軍,有人難尋敵手而退役

中國體壇十大統治力巨星:有人參賽必拿冠軍,有人難尋敵手而退役
伴隨著20世紀80年代改革開放的春風,中國體育蓬勃發展,出現了很多家喻戶曉的體育明星,他們都在自己的領域裡取得了無與倫比的輝煌成就,下面我選出中國體壇十大統治力巨星. 第十位,姚明,作為一名中國人,姚 ...

中國足壇十大留洋失敗的球星
上次我發了之篇<中國足壇十大留洋成功的球星>,很多球迷不以為然,認為中國根本就沒有在海外成功的球員,當然,和近鄰的日本韓國相比,我們在海外留洋的球員確實沒有可比性,但從縱向相比,究竟還算是 ...

中國古代十大奸臣,都是誰榜上有名?

中國古代十大奸臣,都是誰榜上有名?
歷朝歷代有忠臣就有奸臣,有的明君親賢臣,有的昏君親小人,朝代的興衰除了統治者的作為之外,也離不開朝臣的影響.如果一代帝王眼光不行,一朝堂大半都是奸臣,那他的統治也距離終結不遠了. 在中國古代也有出現過 ...

中國的“十大”,快來看看...

中國的“十大”,快來看看...
▲ 點選上方關注本號,更多行業內容推送 01 中國城市十之最 01 雨天最多的城市:四川峨眉縣 02 人口最密的城市:上海市 03 離海最遠的城市:烏魯木齊 04 管轄面積最大的城市:赤峰市 05 霧 ...

中國前十大白酒企業(上)

中國前十大白酒企業(上)
近期白酒板塊龍頭貴州茅臺由(國有獨資)更改為(國有控股)這意味著什麼?一個人賺錢不好嗎?為什麼要和其他人一起賺.懂得人自然懂,外國股市大多是以科技為龍頭的,而中國的股市確實以白酒撐起"小半邊 ...

中國足壇十大惡性飛腳

中國足壇十大惡性飛腳
飛腳是足球場上的惡性犯規,不過有一些球員素質不高,出腳傷人.接下來小編為各位盤點一下中國足壇歷史上十大惡性飛腳. 2019年韋世豪飛腳 2019年3月25日,韋世豪在中國杯比賽中飛鏟烏茲別克球員,而後 ...

中國足壇十大外籍門將,其中三人已經去世了

中國足壇十大外籍門將,其中三人已經去世了
中國足球目前的實力已經早就不如當年的水平了,如果說哪個位置水平沒有明顯的下滑,恐怕只能說是在守門員這個位置還保持了亞洲一流的水平. 之所以門將還保留著這樣的高水平,與在聯賽中禁止使用外籍守門員有著莫大 ...

普及中華民族文化之中國古代十大思想家
老子 老子姓李名耳,字伯陽,楚國苦縣(今河南鹿邑東)人.老子是中國春秋末期的思想家,道家學派的創始人,也是全世界最早具有辯證思想的哲學家.<老子化胡經·序說第一>:"以為聖人有老 ...

CBA帥位,20-21賽季的十大重量級調整,效果排名

CBA帥位,20-21賽季的十大重量級調整,效果排名
NO.1.老郭辭別白鶴樓,煙花三月下廣州 郭士強到廣州,主要就是做了兩件事:一是給全隊鼓勁兒.他剛到廣州的時候接受採訪,重點強調:要培養球隊的頑強作風.從效果來看,相當不錯,廣州隊作為聯盟弱旅,上季差 ...

外媒測評2021年最佳十大手機,國產僅一個品牌上榜

外媒測評2021年最佳十大手機,國產僅一個品牌上榜
網際網路時代的到來如今誰也離不開手機,根據外媒報道的最新2021年最佳智慧手機排行榜中被譽為最佳智慧手機的就屬iPhone13pro max了,在使用者體驗上5g功能,相機功能,執行速度上,都是最優的 ...

新款旌航依維柯雙拓展房車,彰顯中國房車十大品牌品質

新款旌航依維柯雙拓展房車,彰顯中國房車十大品牌品質
hello,大家好,我是小峰哥.今天給大家介紹一款房車,這款車是來自旌航國產依維柯雙拓展房車.首先看看前臉,旌航房車是非常有特色的,車身的噴漆和彩貼極具辨識度,行在路上就是兩個字--拉風!傳承者家族臉 ...

慈溪升至第六,宜興首次入圍!中國十大強縣大洗牌

慈溪升至第六,宜興首次入圍!中國十大強縣大洗牌
縣域經濟的發展即將轉向高質量階段,特別是東部沿海地區,有著完善的發展基礎和管理制度.在東部地區中,江蘇.浙江.山東三大省份的縣域經濟,更是有著絕對的優勢. 不過廣東的縣域經濟,在百強縣的排名中,已經沒 ...

中國十大名山,八座都位於四川、西藏、新疆,只有二座位於中東部

中國十大名山,八座都位於四川、西藏、新疆,只有二座位於中東部
中國西部的青藏高原,是世界上海拔最高的高原,像珠穆朗瑪峰.岡仁波齊.喬戈裡峰等名山,它們不僅是中國的名山,同樣也是世界的名山. 中國的十大名山,實際上也堪比全球十大名山.但這十大名山,八座都位於中國的 ...

中國十大著名古鎮,你又去過幾處,僅僅只有一處古鎮免費

中國十大著名古鎮,你又去過幾處,僅僅只有一處古鎮免費
中國著名十大古鎮 中國,在這片遼闊的土地上,有著歷史悠久的古鎮,古樸的民族氣息,濃厚的歷史文化,造就了古鎮中優美的環境,之前,看到不少作者,把古城充當古鎮,所以說,我們一定要區分古鎮與古城兩個概念,古 ...

中國十大頂級姓氏

中國十大頂級姓氏
中國的姓氏數量特別多,據統計,記錄在文獻中的姓氏有5662個,其中單姓3484個,複姓2032個,三個字的146個. 如果你熟讀百家姓,自然知道有"趙錢孫李.周吳鄭王.馮陳褚衛.蔣沈韓楊&q ...

盤點十大國寶級動物
1.中華鱘所屬的鱘魚類都是在距今約1.4億年的中生代末期的上白堊紀出現的,中國曾在遼寧北票晚侏羅紀(距今1億4千萬年前)地層中發現過鱘類化石,名北票鱘.這種鱘只在兩體側有一行側線鱗,其它體表裸露,與中 ...

2021中國茶葉品牌十強公佈,湖北採花、漢家劉氏上榜

2021中國茶葉品牌十強公佈,湖北採花、漢家劉氏上榜
調研資料顯示,中國茶葉產量佔全球茶葉產量四成以上,國內茶葉市場規模超過2600億元. 近年,茶葉的品牌意識開始增強,市場上興起了一批茶葉品牌.2021年浙大CARD中國農業品牌研究中心釋出了" ...