作者 | 王耐
編輯 | 石亞瓊(郵箱:[email protected])
**
為了服務企業的數字化轉型,資料科學平臺(Data Science and Machine Learning Platform,簡稱DSML)的服務商大量湧現,比如Databricks、Dataiku、Domino Data Lab、Alteryx等企業,其中Databricks被納斯達克列為2022年最值得關注的IPO之一。
根據Gartner的調研,63%的企業計劃加大在DSML方面的投入,這也是CIO優先順序最高的品類。Gartner將DSML平臺定義為核心產品和相關整合產品、元件、庫和框架(包括專有、合作伙伴和開源)的支援產品組合。該平臺還支援將數字化解決方案合併到實際業務流程、組織的基礎架構及產品和應用程式中。簡而言之,就是把集中的資料資源、技術能力和分散的業務團隊、業務場景打通,讓資料變成更有價值。
成立於2015年4月的和鯨科技(全稱:上海和今資訊科技有限公司)前身為資料競賽平臺科賽網,目前是一家專注於“資料科學協同平臺”的資料智慧科技公司和平臺服務商,公司以“Connect People with Data”資料與人的價值連結”為使命。公司在近日還獲得A+輪融資,由考拉基金領投,五源與線性跟投數千萬人民幣。
公司搭建的資料科學協同SaaS產品“ModelWhale”,可滿足資料科學家、人工智慧工程師、商業分析師等資料工作者線上完成演算法建模、資料分析、資料視覺化等任務,並支援私有化部署和雲端協同,幫助企業、高校、科研機構、政府機構開展工業級資料科學與人工智慧的應用研發。除此之外,公司還經營中國最大的資料科學開源社群——“和鯨社群”,幫助中國的企業和機構對接優質開源演算法、開源資料、演算法人才。
和鯨最大的差異化,在於將協同能力的核心落實到資料應用的全流程中
數字化轉型已是共識,業界討論的重點也從“為什麼數字化”,變成了“如何數字化”。埃森哲和工信部下屬機構聯合完成的《2021中國企業數字轉型指數研究報告》(以下簡稱為《報告》)發現,中國企業數字轉型指數從2018年的37分,已上升至2021年的54分。轉型成效顯著的領軍企業達到16%,比去年提升了5個百分點。
值得注意的是,《報告》中還提到,儘管領軍企業的數字化優勢在持續擴大,但多數企業因為戰略部署落後、基礎薄弱、組織架構不合理、人才不足等因素,只能採取小修小補的方式,兩者的差距不斷拉大,數字化的馬太效應已經凸顯。成本高、風險高、見效慢、差距大的問題,使企業在數字化轉型上如履薄冰、舉步維艱,如何破冰成為企業急需解決的問題。
為了幫助企業應對這個難題,和鯨科技的回答是:以資料人才為槓桿,以組織協作為樞紐,實現資料要素的價值閉環和價值迴圈。
和鯨科技的主要產品是資料科學協同平臺——ModelWhale,其主要是為了幫助企業打通“資料協同、資料利用、業務落地、能力複用”的端到端流程,從而讓資料變得有用處、有價值,同時實現人才和技術資產的積累,最終構建起“人才技能、技術落地、業務效益”三者的良性迴圈,進而支撐企業的數字化轉型。
在企業級資料平臺市場中,和BATH等巨頭的競爭是繞不開的話題,和鯨科技創始人範向偉對此表示,BATH的定位是做數字化底座,和鯨科技專注於上層應用的協同場景,也就是資料要素的“最後一公里”。
相對於市場的同類產品,和鯨的差異化在於將協同能力作為核心,將敏捷開發、DevOps的理念,落實在了模型開發與應用的全流程之中。BCG的研究報告《金融機構如何駕馭大資料》顯示,協同是大資料應用最主要的瓶頸,挑戰要高於技術因素和資源因素。尤其是區域性驗證了資料對於業務的價值之後,當企業希望規模化地放大這種價值,協作的瓶頸就會凸顯。
和鯨科技的主營業務是資料科學協同平臺ModelWhale的SaaS產品,該產品專注於實現組織內部的資料人員和業務人員的實時協同,也支援跨地域、跨組織的協同場景。
資料科學協同平臺ModelWhale,分為三大板塊,分別 包括基礎層、協同層、開放層。透過三大板塊的層層遞進,來實現資料科學能力從IT端到業務端的銜接,將開放、協作、複用的理念落地,最終構成了資料智慧應用的敏捷開發和精益創新的閉環。
在基礎層,需要實現的是技術能力的彈性利用、動態組合。ModelWhale可實現統一高效的資料管理和資源排程,支援低程式碼、Notebook和CloudIDE的三種開發模式。其中,ModelWhale的資源排程能力,可滿足不同級別的模型訓練需求。該平臺以雲計算能力為基礎,自主研發了高可用的算力排程器,具備按需計算、彈性擴容的優勢,從而可以支援從1個使用者到數千個使用者的低成本、高效率地快速拓展,幫助企業節約可觀的算力成本。低程式碼、Notebook和CloudIDE的支援,對應了不同背景的使用者的技能條件與需求特點,也覆蓋了資料應用從探索到開發、從工程化到生產上線、從運維到迭代的整個生命週期的開發需求。
在協同層,實現的是個人、團隊和基礎設施三者的持續拉通、成果複用。ModelWhale積累了資料科學的全要素、全流程的協作能力元件,能對各類研究課題、演算法專案、分析任務,進行分工拆解、任務分配、資料接入、資源分配、進度監控、成果驗收、成果複用等專案管理工作。該平臺也可支援對單個成員的資源用量監控和使用者群組管理,在專案開展前後可以有效規劃資源、避免浪費、保障計算資源的合理分配使用。透過協作層的支撐,可以讓合適的資料,被合適的團隊,在合適的任務上,實現緊密地咬合、持續地迭代、高效地複用。簡而言之,也就是實現敏捷開發理念和資料科學實踐的結合。
在開放層,實現的是個人、企業與開源技術生態的協同共生、成果共享。在基礎層和協同層的能力之上,ModelWhale可以與和鯨社群實現系統化的打通。基於和鯨社群資料開發者的演算法能力、建模能力,企業可以將企業的資料應用需求,與高校、科研機構、社群開發者進行對接。透過ModelWhale的全流程的託管,可以保障開放層開發過程中的安全性、高效率,以及開發成果的可用性、可維護性。透過ModelWhale的開放協同的能力,個人和企業都可以用更低的成本、更快的速度,實現"(資料+演算法+算力)*人才"的價值閉環和價值放大。
服務多個行業top3客戶,用頭部的影響力拉動增長飛輪
資料科學協同平臺ModelWhale目前主要使用場景在科研機構、企業和高校。在採訪中,範向偉提到,自從ModelWhale產品問世,連續三年,產品收入均保持了每年2倍以上的增長,並在市場的競爭中,佔據了相對領先的位置。標準產品的年銷售收入,從三年前的百萬級,達到現在的千萬級。目前公司的營收佔比中,科研的份額佔到了2/3,政企佔到了1/3。對此範向偉補充到,資料協同的能力是不斷驗證、不斷迭代、不斷疊加的,靠的是滾雪球,打的是持久戰,沒法一口吃個胖子,也沒有這個可能性。
資料科學平臺的國內市場還處於成長期,離歐美髮達市場還有3-5年的距離。和鯨科技認為,技能賽事、培訓教育、科研協同是國內平臺型產品的一個很好的切入點。在數字化的程序中,這些場景是頭部客戶在人才和組織成長方面的剛需。從科研切場景切入,也可以幫助平臺完成核心能力、核心使用者的原始積累與需求驗證。透過教育、科研、企業的有序分層,形成有梯度的市場滲透、能力疊加,能幫助平臺繞開“城牆”,實現更快、更穩、更精準的迭代升級與產品增長。
和鯨科技目前的平臺客戶場景包括氣象、醫院、藥企、高校、科研、新能源、傳統能源、金融等多個場景。客戶包括清華大學、上海交通大學、中石油、國家氣象資訊中心、中國電信、中國醫學科學院、解放軍總醫院、強生醫療、默克製藥、信通院、國家人口與健康資料中心、北京醫保局、金風科技、九坤投資等多個國家級和行業級的頭部客戶。
和鯨科技的典型客戶,如國家氣象資訊中心、解放軍總醫院、協和醫學院、金風科技,有著共同獲客、轉化、增購的路徑。和鯨科技對此補充到,機構內的資料科學家、資料分析師,透過和鯨社群的內容與活動,可體驗到ModelWhale在特定場景的資料應用的功能優勢。經歷個人版的試用之後,再向所在的團隊進行組織版和企業版的推薦。這也實現了從個人到團隊,再到機構的價值驗證和價值放大。ModelWhale在經過金風科技資料部門的驗證、採購、區域性落地之後,進一步拓展場景,在一年的時間中,實現了平臺使用者從30人到300人的增長,覆蓋了集團公司三十餘個部門。
以解放軍總醫院、協和醫學院等頭部的醫療客戶為例,範向偉在採訪中介紹到,醫學的複雜性很高,資料智慧也是剛需,但醫生、研究人員普遍不具備專業的程式設計能力。ModelWhale可以透過低程式碼的簡單易學的方式,最小化技能門檻,並透過協同能力,使IT、臨床、研究等不同崗位的人才相互配合,透過背靠背的協作,實現資料應用的價值閉環。透過社群使用者覆蓋頭部客戶,再透過頭部客戶的實踐,實現腰部客戶的複製,成為了和鯨的業務增長的效率槓桿。
頭部客戶的成功落地,為其他的機構、企業提供了平臺落地的背書與示範。基於頭部機構知識庫、案例庫的沉澱,資料平臺從產品到落地,也逐漸走向了標準化、普及化。範向偉對此介紹到,和鯨在和解放軍總醫院、協和醫學院等頭部醫院的合作中,其實也是在共建演算法庫、知識庫、案例庫。頭部機構的機器學習、人工智慧的課程與案例,本身就是面向行業中的醫生和學生的。目前和鯨與頭部醫院、頭部藥企共同組織的資料競賽,每年覆蓋的人數可達到上千人、幾百家醫院。
除了醫療、生命科學等科研場景,在企業場景中,資料平臺不僅要面對大量IT系統的對接、打通需求,還要面對複雜的業務場景,這使得銷售成本、實施成本、研發成本都很高。如果產品無法定位到精準的應用場景、使用者人群,無法用可控的成本滿足客戶需求,實現資料價值的落地,那麼資料平臺產品的採購、復購的成功率就會很低,研發和分銷也無法實現提速,這會形成一種惡性迴圈。
資料科學平臺的選型和落地,有著很高的複雜性和實施風險,客戶的產品選型是高度謹慎的,公司在頭部客戶在選型和落地上的經驗積累,提升了公司標準產品的服務能力和規模商用的影響力。公司表示,目前和鯨科技已在氣象、醫療、科研、能源、金融等領域實現了部分頭部客戶的覆蓋與轉化,以及高比例的復購與增購。
堅持PLG路線,和鯨社群成為留住客戶的流量池
SLG(銷售驅動增長)賣軟體靠的是銷售渠道,而PLG(產品主導型增長)更注重使用者和產品,透過產品自身實現獲客。此模式獲客成本低、增長速度快、迭代效率高,典型公司比如Atlassian、Canva、Zoom等。PLG對產品研發與市場營銷,都提出了很高的要求,中國目前能夠面向頭部客戶,走通PLG的企業仍是少數。
隨著企業對成本-效益和可持續性的敏感度提升,為了滿足客戶需求,服務商就需要提供更低成本、更快迭代、更高效率的方案。PLG模式對於企業客戶也意味著更低的試錯成本、部署成本和維護成本。順應企業客戶的需求和技術發展的趨勢,是整個SaaS行業在重點探索的方向。
PLG模式的商業邏輯是產品主導、加速迭代。推出高質量的產品是前提,而產品優質首先需要有足夠深的使用者洞察。只有圍繞使用者洞察和使用者痛點,才能持續地驗證產品設計、提升產品效能、疊加產品壁壘。所以PLG的邏輯起點是,平臺公司需要先找到核心使用者、形成與核心使用者之間的共生關係。
和鯨科技的前身是科賽網,現在已經演化為擁有25萬註冊的和鯨社群,社群在過去六年保持了每年100%的增速,成為了最大的第三方的資料人才社群之一,註冊人群覆蓋了全國的主流高校、研究院和企業。和CSDN等傳統開發者社群相比,和鯨社群的差異化能力,在於資料分析的流程、程式碼、結果是可以線上執行、實現端到端的復現,其他使用者可以對社群內的模板進行執行、修改和進一步的分享。
和鯨社群透過和各個行業的頭部客戶合作,已組織了超過200場專業資料科學與人工智慧競賽,累計有10萬多資料人才參加,解決了超過20類人工智慧業務問題,累計算法解決方案2000多項。資料競賽將資料、演算法、人才和行業應用場景彙集在一起,形成了聚集效應。多年的資料競賽服務經驗,也提升了和鯨在資料人才和行業企業中的知名度和影響力。
競賽和社群為和鯨帶來了大量精準的專業使用者群體,也為資料科學協同平臺ModelWhale的發展提供了多方面的賦能。在採訪中,範向偉提到社群和競賽,一定程度上降低了資料平臺的綜合成本。對此他解釋到,建設資料平臺的成本上包括三個方面,一是開發成本,開發起步階段常常需要超過數十人的開發團隊、上億的投資金額;二是銷售成本,平臺的銷售週期很長,面對激烈的競爭,需要維護龐大的銷售團隊和售前團隊,很多技術廠商的銷售成本會佔到總成本的五成以上;三是服務成本與定製化成本,因為資料平臺在企業的落地場景豐富而複雜,資料平臺解決不了的業務問題,往往需要較高強度的定製化和服務來打補丁。
擁有一個規模領先、增長領先的一個開發者社群,就可以在社群做使用者需求的調研、測試。這些使用者既是產品當前的使用者,也是潛在的產品使用者。相比傳統的市場渠道,社群的觸達面更廣、增速更快。透過社群也可以觸達數字化成熟度更高的標杆客戶,這相應也可以降低銷售成本、縮短銷售週期,帶來更高的客戶匹配度和滿意度。
和鯨透過在競賽和社群積累了大量註冊使用者,這些使用者透過內容和活動拉動,進一步成為ModelWhale平臺的使用者、推薦者和分享者。從個人使用者向機構客戶的轉化,為打通一個B2C2B的鏈條閉環提供了可能。範向偉在採訪中表示,資料科學平臺是通用技術平臺,數字化轉型是全面變革,只有體驗足夠好、迭代足夠快的產品,才能夠滿足企業客戶數字化的需求。經過七年的積累,和鯨實現了社群增長、產品打磨、銷售增長的飛輪,也成功跑通了PLG的商業模式。目前的產品訂單中,約80%來自於社群使用者的推薦,80%以上的簽約客戶完成了復購和增購。
社群和競賽,不僅幫助和鯨科技實現了平臺產品研發、推廣、落地的閉環,還促進了平臺的使用者洞察和快速迭代。社群模式和PLG模式,形成的疊加效果,為資料科學平臺的落地構建了一個價值更高、成本更低、速度更快的良性迴圈。在競爭激烈、門檻堅硬的資料平臺的市場中,和鯨佔據了一個相對獨特的生態位。
在採訪中,範向偉也表示,資料科學平臺是天花板很高、壁壘也很高的通用技術平臺,也是有著樞紐地位的兵家必爭之地,一邊要對接體系龐大的雲計算生態、開源生態、資料資源,一邊要對接高增長、跨行業、跨場景的業務需求。市場需求和底層技術,都在快速、深刻的演變過程中,如何把握住不變的核心變數,才是行業終局的勝負手。長週期的平臺的發展,主要矛盾在於:要持續平衡好“產品迭代、行業資源、業務增長”三個飛輪的關係。在把握技術趨勢和需求趨勢的同時,既要防止定製化、同質化的過擬合,也要儘早佈局行業的稀缺要素與入口位置,形成企業的產品迭代飛輪、資源壁壘飛輪,疊加之後形成業務增長飛輪。
對於和鯨來說,產品迭代飛輪是產品體系和使用者反饋的良性迴圈,資源壁壘飛輪是頭部的企業客戶和高潛力的個人使用者。這是在迭代資料能力、分享開源成果、跑通應用閉環的過程中,形成的一種難以替代、持續演化的共生關係。