記者 | 彭新
編輯 |
開源和數字化潮流下,國內初創軟體企業正趁勢發展。
近日,軟體企業Alluxio宣佈,完成近5000萬美元C輪融資,高瓴創投領投,戰略投資方和原股東Andreessen Horowitz(A16Z)、Seven Seas Partners、火山石投資跟投。資金將主要用於產品研發與推廣、擴大全球市場等。
Alluxio是李浩源在加利福尼亞大學伯克利分校(UC Berkeley)博士在讀期間的研究專案,最終由UC Berkeley的AMP實驗室孵化,主要研發分散式資料編排系統。2012年年底Alluxio有了第一個版本,在2013年開源,兩年後Alluxio公司成立,獲得了A16Z 750萬美元的風投。2018年,李浩源將研究成果以《Alluxio: A Virtual Distributed File System》為題,作為學業論文發表。
作為商業化公司,北京開元維度科技有限公司在Alluxio軟體的基礎上進行封裝,並向企業客戶提供服務,李浩源為創始人兼執行長。
“資料編排”是一種雲計算、大資料和AI應用環境下誕生的新技術。Alluxio軟體在資料分析中的計算和儲存之間插入“資料編排層(Data Orchestration Layer),提供了一種方法來統一訪問混合雲和多雲環境中的資料,使所有資料無論儲存在何處都看起來是本地的,並使分散式資料的管理更加高效,提升了資料排程效率。其應用場景包括為網際網路、金融、電信行業提供資料整合、分析、管理等。
“我們的軟體平臺處在所有的資料應用和所有的儲存部署之間,而我們做的工作是把在不同儲存中的所有資料虛擬化和抽象化,再用編排為上層的資料應用做更好的資料服務。”在此次融資釋出會上,李浩源以主要的大資料框架工具TensorFlow、Pytorch等舉例稱,經過Alluxio的資料編排層,資料人員帶來的工作效率提升可以達到2-6倍,這就意味著原來一年需要做的工作量,同樣的人現在兩到四個月就能完成。
“從方法論的角度來講,著名的計算機專家David Wheeler就提到過:在計算機領域所有的問題都不能透過新增一層抽象來解決,我們也是遵循了這個方法論。Alluxio在整個技術棧中提出了新的抽象的一層,也就是統一了資料入口,可插拔所有的大資料、AI機器學習的軟體棧,打通全域資料,這是我們所做的工作。”李浩源稱。
值得一提的是,作為李浩源自身博士論文直接誕生的創業專案,他認為Alluxio目前來看“沒有競品”。
李浩源解釋稱,Alluxio最早作為一個很獨特的學術研究,後期採取開源策略後,又花了很多時間和精力去統一社群,把所有的頭部核心企業放在Alluxio社群之內,“所以你能看到的絕大部分頭部網際網路企業和頭部雲廠商以及全球前兩名的晶片廠商英特爾和英偉達都在我們社群裡面,從這個角度來講,市場不大會給其他類似軟體這種機會了。”
他還進一步強調,在應用上,Alluxio單一使用者單一叢集已經做到了三四千臺伺服器,甚至存在單一使用者有上萬臺機器的應用案例。從軟體工程的實現上,其他人無論花多少時間、精力和資金,沒有幾年時間是很難做出此類上萬臺機器上穩定執行大型分散式軟體的成果。
“我們在國內外的絕大部分客戶都是單一來源,而且90%的客戶都是全球500強,這點我們還是很自豪的。”李浩源說,這構成了Alluxio的戰略優勢,“從戰術的角度來講,有的時候並不是所有的使用者上來就把你做平臺來用,所以有一些戰術上切入進客戶的小案例。從這個角度來講,我們是有一些小的競爭對手,但是都不重要。”
作為開源專案,Alluxio的應用和社群生態頗為成功。開源是加速軟體傳播的途徑之一。開源軟體是指在發行軟體時,附上軟體的原始碼,允許使用者進行更改,但並不反對商業收費。開源軟體和免費軟體有本質區別,後者不一定會公開原始碼。
從Alluxio部署採用的情況來看,全球市值最高的前十名網際網路廠商中也有八家在生產環境裡面部署了Alluxio的軟體系統。與此同時,在全球前六名的雲廠商中也有五家雲廠商已經嵌入了Alluxio的技術。Alluxio開創的資料編排技術已經在不同垂直領域的國內外頭部公司被廣泛應用。 Alluxio的使用公司有騰訊、 阿里巴巴、 聯通、 星展銀行、 Meta(原Facebook)等。
李浩源認為,無論從行業應用分佈還是市場接受程度來看,Alluxio的商業程序都是隨數字化程序而推動。由於社會和行業都更加數字化,導致了資料本身越來越多,而基於資料的儲存產品以及資料分析、機器學習等各種各樣的資料產品都在增加,進而導致了低效。當下,各家企業都在探索如何用技術手段提升效率和降低成本。
“當一個行業數字化程序越深,我們的軟體價值就越高,滲透率就會越高,自然而然使用我們(產品)的客戶就越多。”李浩源解釋道。