愛數智慧創始人兼CEO 張晴晴
作者丨巴里
編輯丨子鉞
圖源丨受訪者
“能夠讓機器理解人的所思所想,並能夠將這些內容轉化成文字是一件很酷的事情。”
17年前,還在北郵讀通訊的本科生張晴晴偶然間接觸到了語音識別。她當時也許沒有料到,在接下來的17年,語音識別會與她的理想與事業結下不解之緣。
在人工智慧三駕馬車中,資料是演算法的基礎,就好比原油,只有經過清洗、分類、標註、質檢和篩選等結構化過程,才能用於AI模型訓練。
2015年,已經在中科院聲學所從事對話式AI研究的張晴晴意識到,如果不從根本上解決資料的問題,人工智慧在未來幾年仍然會面臨巨大的挑戰。
就這樣,肩負著這份理想與情懷,一位女科學家開啟了創業之旅,創立了愛數智慧。
據介紹,目前,愛數智慧已處於AI語音資料服務行業的第一梯隊,為超100家國內外頭部網際網路公司、行動通訊、知名演算法公司等提供專業的AI資料解決方案。2020年,愛數智慧的營業收入接近億元。
同時,近兩年來,畢馬威、華為、百度、亞馬遜、英特爾等大廠人才紛紛加入愛數智慧。尤其是今年6月,前華為資深銷售總監張濤也正式加盟愛數智慧任合夥人兼銷售副總裁。
正值愛數智慧成立5週年,創業邦獨家採訪了愛數智慧創始人兼CEO張晴晴、合夥人兼銷售副總裁張濤,深入解讀對話式AI如何賦能企業數字化轉型,以及女科學家又是如何蛻變成為一家AI資料服務公司的創始人。
女科學家曾為科研採集資料
立志為AI輸送“原油”
從事語音識別研究已經17年的張晴晴,在最初接觸到這個專業時可以說是興趣使然。“語音訊號數字處理”這門選修課,讓她第一次萌生了對語音的興趣。
後來在保研過程中,張晴晴看到中科院聲學所在招語音專業的研究生,毫不猶豫立馬報了名。最終,她在北郵通訊學院600多個報名的學生中脫穎而出,以第7名的成績保送到了中科院聲學研究所中科信利語音實驗室,師從中科院聲學所首席科學家顏永紅。
後來,張晴晴成為實驗室中最年輕的副高,並且獲得了2014年度中科院傑出科技成就獎,又在法國國家實驗室攻讀博士後,可謂一個妥妥的女學霸。
自此,如何構建更好的模型,讓機器更好地理解人說的語音成為了她的研究目標。
張晴晴的博士論文研究的是中國人說英語的問題。她需要用200箇中國人說英語的語音進行訓練模型,分析出中國人的發音特徵,從而讓機器用最適合的方式理解中國人說英語的特點。
為此,她收集了200個人的聲音,不僅包括親朋好友,甚至她碰見走在大街上的路人,也會習慣的問一句:“您能幫我來錄個音嗎?”經過300天的時間,張晴晴終於收集齊了這200個人的聲音,將所有語音進行清洗和分類,並把資料送到系統模型裡,僅花費了1天的時間系統就給出了第一個實驗結果。
301天的時間,300天都在收集和處理資料,張晴晴發現,像這樣的現象並不是只有她一個人遇到,這是很多AI科學家共同的難題。在人們普遍印象裡,AI科學家每天所做的工作應該都是在構建高大上的模型,但實際上絕大多數的時間都用在了與資料做掙扎上。
那麼,有沒有可能創造一個大型的訓練資料集,來讓所有科學家和企業都能夠使用呢?這一想法在張晴晴的腦海中油然而生。
直到2016年,整個市場的時機逐漸成熟。張晴晴觀察到BAT等網際網路巨頭對於資料的需求越來越多。實際上,在這幾年,人工智慧曾經出現過三起三落,張晴晴的大部分師兄師姐在畢業後也都轉型到了其他行業。
在人工智慧三駕馬車中,資料是演算法的基礎,就好比原油,只有經過清洗、分類、標註、質檢和篩選等結構化過程,才能用於AI模型訓練。如果不從根本上解決資料的問題,人工智慧在未來幾年仍然會面臨巨大的挑戰。
作為一個人工智慧從業者,她希望這一次的人工智慧可以一直向前,不再衰落。也正是肩負著這樣的情懷和理想,終於在同年11月,愛數智慧在北京正式成立。
經過五年的發展,公司已經從最開始10個人的小團隊發展到100多人規模。在這其中,有一件事始終讓張晴晴印象深刻,直至今日,她也認為是創業過程中最大的挑戰之一。
2017年,公司剛剛成立一年,為了節省成本,張晴晴只能租下在北京海淀區的一個商住兩用樓的房間裡辦公。那段時間,北京大興區的幾場大火讓存在消防隱患的辦公樓都受到了波及。
一個週日的下午,消防隊員走進大樓,公司被告知這個樓的消防不合規,需要當天晚上立刻撤走。當時,辦公室裡一共50個員工的辦公物品,張晴晴需要在3-4個小時的時間裡,把所有人的電腦、座椅、辦公用品全部搬走。面對突如其來的打擊,張晴晴彷彿無所適從。
“如果我是一個員工,聽著我的老闆打電話告訴我說我們要立刻搬家,員工會覺得這個公司很不靠譜吧,還要不要在這裡繼續工作?”這些話不由自主地浮現在了張晴晴的腦海裡,開始忐忑起來。但她很快晃過神來:不可能以一己之力完成,需要求助團隊的力量,馬上告訴大家。
聽到這個訊息之後,所有員工沒有一個人抱怨。50個員工僅用一晚上的時間就把所有東西搬到了新的辦公樓裡,第二天團隊還面臨著給客戶交付資料。
第二天10點,所有人準時打開了電腦開始辦公。而在那個時刻,公司還正在忙著A輪融資。投資人看到了整個過程以及所有人的凝聚力,毅然決然地投下了A輪。
“公司一路發展過來,幾乎碰到了所有創業者都會遇到的問題,早期甚至有可能明天就發不出工資了。但好在我們一直堅信公司的目標和戰略,如今終於迎來了人工智慧行業的爆發。”張晴晴說。
據艾瑞分析《2020年中國AI基礎資料服務行業發展報告》顯示,2019年中國AI基礎資料服務行業市場規模達到30.9億元,其中語音類資料需求規模佔比為39.1%,預計到2025年資料市場規模將突破100億元,年化增長率21.8%。
伴隨著資料市場的爆發,今年年初,愛數智慧也已完成B輪融資。目前,公司已經處於AI語音資料服務行業的第一梯隊,為全球超過100家頂級人工智慧企業提供相應的資料服務,而且規模也已經達到了上億的小目標。
愛數智慧-融資歷程
打造對話式AI三大基石
賦能企業數字化轉型
公司成立之初,張晴晴就把她一直在研究的對話式AI(Conversational AI)作為公司發展重點。在她看來,對話式一定是AI人機互動的終極形態,突破對話式形態代表著強人工智慧時代的到來。
張晴晴之所以創立愛數智慧很重要的一點就是要把公司定位於AI人機互動這一場景,讓人和機器可以以一種非常自然的方式進行交流。
從技術角度看,對話式AI涉及語音識別、自然語言理解和語音合成等技術,想要透過這些技術實現人和機器更自然的對話,面臨著更大的難題。對話式口語常常會有語序顛倒,猶豫、遲疑產生的停頓,多人同時交流甚至出現語句打斷、搶話、交疊音等複雜語音場景,這都為 AI建模帶來了很大困難。
目前,從資料行業看,行業提供的大部分人工智慧資料都以朗讀式訓練資料為主,而人與人自然的對話式資料對訓練對話式 AI 有更加關鍵的作用。“要想把機器訓練成人,使得機器可以像人一樣能夠理解語言,這就需要我們為機器注入知識圖譜、中文、方言、外語等等,這確實有很大的難度,但這正是我們意義所在。”張晴晴說道。
如今,AI訓練資料集、資料智慧化標註平臺Annotator 5.0以及MagicHub.com開源社群已經構成了愛數智慧業務的三大基石。
一方面,對於沒有自己資料的企業,或者企業在合規的角度不能觸碰資料又需要解決AI的問題,都可以從愛數智慧採購合規的資料集。這些資料已經按照一定的行業和場景的規則,進行了個人資訊的脫敏性處理,同時有著嚴格的保密性儲存,從而幫助企業既快又合規地搭建自己的基礎系統。
值得一提的是,愛數智慧是國內第一批拿到ISO27701認證的資料服務商,27701是全球最新的個人隱私認證,在資料處理上遵循國際國內的最高標準。
目前,愛數智慧擁有超過200000小時資料集,其中超過140000小時對話式AI訓練資料集,這些資料集經過多維度的標註,包括語音到文字的轉換,以及說話人性別、年齡、情感等標籤,這些標籤能夠幫助開發者在解決多語言對話式AI上提供更多的資訊,從而幫助最佳化對應的模型。
在語種上,愛數智慧擁有超過60種語言的資料集,還有部分針對外語資料構建的雙語混合資料集,如泰語英語混合資料集、馬來語英語混合資料集等,從而幫助開發者解決混合語音識別的問題。
在場景和行業上,愛數智慧構建了五大行業垂類AI資料集,包括智慧出行、智慧社交、智慧金融、智慧家居以及智慧終端。以智慧座艙為例,整個行業在語音識別、語音合成、自然語言理解方面,普遍還面臨識別率低、機器聽不懂、合成聲音比較假等難題。
愛數智慧合夥人兼銷售副總裁 張濤
據愛數智慧合夥人兼銷售副總裁張濤介紹,國內車企在拓展海外市場時,會涉及到要能夠識別不同地區使用者的英語口音問題。透過大量的對話資料集或者語料庫,愛數智慧已經將這些共性抽取出來,從而形成了一個標準AI訓練資料集。
客戶透過這些資料集來訓練它的模型,就能夠讓整個人機互動提升到更高的水平。除此之外,愛數智慧還能夠提供智慧化標註平臺Annotator 5.0,為企業提供私有化部署,在保證資料安全的情況下幫助客戶降本增效。
目前,有不少傳統車企和造車新勢力都已經成為愛數智慧的客戶。
在大多數人的印象中,會把資料標註認為是一項沒有技術含量的活兒,甚至認為只需要中專生、大專生稽核對錯、是否敏感即可。但其實,資料標註是要將現有的專家知識體系和知識圖譜融入到系統中去,也就是“教機器做事”。
隨著AI資料處理的複雜度越來越高,就需要更多垂直行業和場景的背景知識。因此,AI資料標註這個動作未來會越來越會由懂行業knowhow的專家來完成。
但是每個企業不可能都請到專家天天做資料標註這樣最基本的動作。要能夠做到真正地降本增效就需要一款能夠高效且自動化、智慧化的資料處理工具,愛數智慧將其稱之為office for AI——Annotator 5.0智慧化標註平臺。
經過5年的迭代,這套系統不斷給各大企業處理音訊、影片、文字等多模態資料,如今Annotator 5.0不僅僅是一個數據標註平臺,更是在此之上同步完成了企業的數字化、資訊化以及智慧化這三個步驟。
眾所周知,企業的系統中都存在大量的音影片等非結構化資料,並沒有被智慧化的挖掘出來釋放出其價值。而這套系統就可以幫助企業把這些雜亂無章的資料進行相應的標籤化,並存儲到企業的資料庫中,從而便於企業基於這些資料再進行挖掘,為決策分析提供參考。
張濤談到,在這個標註系統中,已經有大量專業術語的知識沉澱。在標註的過程中,機器可以像幫助人工解決一部分標籤化的工作,而人只需要在此基礎上做一些校正即可。整體操作效率預計能夠提高100%以上,綜合成本反而可以降低50%。
同時,為了滿足更多行業和AI從業者對於訓練資料的需求、降低資料使用門檻,解決找資料難的問題,今年4月上線的MagicHub.com開源社群也體現出了愛數智慧在整個行業中的前瞻式佈局。
迄今為止,開源社群已擁有超過60個包含語音識別、語音合成、發音詞典、自然語言理解等不同型別的開源資料集,覆蓋全球超過3000名開發者,資料集累計下載量超過7萬小時。MagicHub.com開源社群除了開源大量資料集外,還與各大高校和相關機構合作,透過組建開發者社群、開展培訓和賽事,致力於打造全球AI開發者生態。
科學家創業重在思維轉換
要以客戶為中心
回顧愛數智慧5年來的發展,也是一部科學家的創業史。有投資人就曾說過,科學家創業者掌握著核心技術以及商業轉化的能力,這是投資者最為關注的。但對於這些科學家創業者,最大的挑戰可能在於缺乏傾聽市場和客戶需求的意識。
剛剛創業時,張晴晴感覺到的是既有未知的興奮,也同時有創業0到1所帶來的不確定感。“最開始,甚至財務的小姑娘都在幫我們標資料,大家沒有什麼區別,只要能夠一起解決,大家都會伸把手”。從研究學術的科學家到成立公司面臨商業化的難題,給張晴晴帶來的最大挑戰來自於思維上的轉換。
“最開始和市場銷售的同事、客戶交流的時候,可能大家都不是在一個頻段上。”但對於張晴晴來說,其實並沒有什麼退路,只能迎難而上去解決這些問題。
科研人員普遍追求的是類似於1+1=2這樣一個客觀真理,然後不斷地思考、迭代,並且很多時候都是獨立完成,但作為一家商業化定位的企業服務公司,更多時候要去看客戶遇到了什麼問題,並且在考慮投入產出比的情況下,如何幫助客戶解決現有的問題。
張晴晴談到,我們很多時候追求的理論上極致,不見得是一件好事,加之AI本身的發展速度非常快,如果按照現有規則解決,有可能半年後會發生一些調整,這麼看來,當期的投入其實可能是不合適的。所以,科研出身的創始人在思維上很重要的轉變就是要從理想化、追求極致的狀態轉變為以客戶為中心。
實際上,這對於一個已經做了十幾年科研的人來說是一個極大的挑戰,但作為一個公司的創始人來說,學習能力是最為重要的能力之一,包括對於新事物的接受能力、思考問題的體系方法。這考驗的是創始人是否能夠基於自身的學習能力,舉一反三的不斷克服新的問題。
梅花創投、明勢資本、策源創投、凡創資本等投資人從早期一路陪伴愛數智慧走過來的投資機構也見證了張晴晴從一個科學家到企業家的轉變。
張晴晴還清楚地記得,“天使輪的投資人看到我的狀態時有一種焦慮感,怕我hold不住創業這件事情。但隨著公司的發展,他們也看到了我學習和成長的過程,現在已經很信任我來做這件事情了。”
沒有一個所謂天生的企業家,企業也不是一成之規,投資人最為看重的是創始人在面臨挑戰的過程中能不能快速成長、解決問題。“在公司早期階段的時候,更重要的是要尋找到那些相信你並認為你是潛力股的投資人。面對投資人的疑慮,公司規模的發展就是對所有投資人最好的解釋。”她說道。
今年8月,海天瑞聲在科創板成功上市,成為了AI資料資源和資料服務領域的首家上市公司。對於整個行業來說,海天瑞聲的上市是一個利好訊息。
對於上市,張晴晴也給出了自己的答案:早期投資人更多時候還是希望公司能夠按照我們認為對的方向發展。“我們也希望,在為行業提供訓練資料集這樣的基礎之上,能夠透過智慧化標註平臺這樣系統化的輸出,為未來各行各業提供更具價值的服務,從而可以幫助公司完成未來3-5年上市的目標。”
“上市是對過去工作的一個證明,肯定不是終極目標。”她認為,尤其對於企服領域,更要重視業務的紮實度。判斷一家公司優劣與否不僅要看當期,也要看這家公司在當期之上未來的可能性,這也是有時兩家公司營收相差不多,估值、市值卻有天壤之別的原因。
不僅身為科學家,同時作為女性創業者的張晴晴也表現出了其堅韌的一面。“我在創業過程中都沒有考慮過性別或是年齡的問題,作為一名擁有五年經驗的創業者,我認為任何人創業之前不應給自己太多的預設,而是應該專注在事情本身,實現這個結果是最重要的。尤其在企服ToB領域,更講求專業性,能不能利用你的專業給客戶帶來價值,而這與創始人是否是女性都沒有關係。”
對於一個創始人來說,只有兩件最重要的事:一是看方向看戰略;二是找到願意做這件事的人一起往前走。最後,張晴晴笑著說,公司基於資料的戰略是一件難而正確的事,如果還有什麼遺憾的話,那就是吸引更多優秀的夥伴更早加入愛數智慧,一起創造價值。
愛數智慧五週年大合影