9月26日,開源生態論壇在浙江烏鎮召開。在論壇第四個環節上,百度集團副總裁吳甜發表演講,題為《人工智慧開源開放平臺支撐產業科技創新》。
全文如下:
尊敬的各位領導、各位嘉賓、各位產業界的朋友們:
大家下午好!
我們下午聽到了很多RISC-V相關的報告,在我的環節裡,將嚮應用接近,我帶來的主題是《人工智慧開源開放平臺支撐產業科技創新》。
相信開源的重要性已經不用再贅述,今天下午整場論壇中,我們從各個角度都看到了開源軟體開發、開源生態建設及其重要性,透過國家的一系列政策也可以看到,人工智慧平臺以及開源社群等創新聯合體的建立也是政府在大力推進的方向。
開源是將原始碼、技術文件等在社群當中透過開源的方式共享出來,它是群智協同創新的一種方式。現在,全球企業都在積極參與開源開放,開原始碼在各行業中廣泛應用。對於人工智慧創新來說,人工智慧技術本身具有自己的一些特點。
首先,我們面向場景解決問題的時候,往往需要用多項技術進行整合來解決同樣一個場景的問題。第二,人工智慧技術在逐漸建設和使用過程中,越來越存在著複用性,不需要從頭開始重複開發的工作。第三,在人工智慧和產業進行結合的過程中,因為人工智慧技術應用本身都會需要結合到業務邏輯本身,和產業有深度的融合。所以在產業中落地應用,越來越呈現出產業鏈打通的特色,需要有多生態角色結合創新、融合創新。第四,人工智慧接觸到大量資料,自主創新的平臺對於產業及國家安全也是非常重要的。
我今天跟大家的分享是以飛槳作為代表的人工智慧開源開放平臺。
飛槳作為深度學習開源開放平臺,在飛槳的建設中以核心框架為基礎,核心框架部分支援了開發者在使用時候進行開發、訓練、部署的整個環節。基於核心框架,在飛槳平臺上構建了基礎模型庫。當產業在使用技術的時候,往往學術級的模型不能給大家解決所有問題,需要和產業中的各種場景相結合,在各種資料當中打磨。所以基礎模型庫對產業應用非常重要。
面向場景建設端到端的開放套件,以及由深度學習技術延展開的一系列工具元件,同時也提供了實訓學習平臺,供給整個開源社群進行學習和實訓。飛槳平臺從開發角度,結合了應用性和效能的便捷開發框架,以及超大規模深度學習模型訓練技術,還有多端多平臺部署的高效能推理引擎,讓有產業級開源模型庫供給開源社群中的開發者學習和使用。
依託于飛槳平臺,我們進行了一系列的AI技術與突破。舉個典型的例子,知識增強的語義理解技術,這項技術以預訓練技術為核心思想,透過對任務的設定和學習,透過知識的引入,能夠進行核心模型的學習和訓練。
最新發布的知識增強大模型ERNIE3.0,依託于飛槳強大的分散式訓練技術,將自然語言理解網路和自然語言生成網路融合在一起。ERNIE3.0在50多項中文NLP評測集上取得最好結果,在Super GLUE榜上位居榜首,超越了現在國際上所有的相應模型。
飛槳持續和硬體平臺進行適配,廣泛的適配使得作為生態中承上啟下的角色,能夠更好地發揮自己的作用。大量的開發者在飛槳平臺上進行創新的工作,年齡小的有6年級的小學生,年齡大的也有退休專家。
我們依託于飛槳平臺,也致力於培養人才,為產業界培養既懂得原有的業務邏輯,又能懂得新技術的複合型人才。
今天非常榮幸能夠釋出一批飛槳的最新資料。飛槳平臺上,不管是開發者數量還是應用的企業數量以及模型數量,都在持續增長。這是最新資料:目前已凝聚了370萬開發者,服務了14萬企事業單位,建立了42.5萬的模型。這表示人工智慧技術正在與產業廣泛結合起來,技術一天比一天繁榮。
謝謝大家!