出品:新浪財經上市公司研究院
作者:Leyla
引言:隨著我國經濟發展進入更加重視質量與創新的新時代,一批“專業化、精細化、特色化、新穎化”的企業逐漸成為我國創新的發源地。資本市場的發展也在與時俱進,北交所設立的核心目標之一就是為“專精特新”中小企業服務。為此,新浪財經推出“專精特新TOP100”系列報道,旨在挖掘一批主營業務聚焦,創新能力強,成長性高,專注於細分市場的小巨人。
海天瑞聲成立於2005年,專注於將自然資料來源專業化加工為可供AI公司訓練使用的工程化資料集,服務於AI演算法設計,目前已經覆蓋微軟、騰訊、百度、科大訊飛等頭部AI企業客戶。
作為國內領先的AI模型訓練資料提供商,公司在中國語音類基礎資料服務領域企業中營收份額佔比排名第一。2020年,海天瑞聲獲評工信部國家專精特新“小巨人”企業。今年8月,公司在科創板首發上市。
AI語音訓練資料領軍
公司的主營業務包括訓練資料庫產品、訓練資料定製服務和資料資源相關的應用服務,前兩者收入佔比超過95%。
其中,智慧語音是海天瑞聲的優勢領域。公司所提供的訓練資料覆蓋語音識別、語音合成等、計算機視覺、多語種發音詞典、自然語言五個領域,服務於人機互動、智慧駕駛、智慧城市等多種創新應用場景,客戶覆蓋了主要的大型知名科技公司、人工智慧企業及科研機構。
訓練資料庫產品,是公司自行開發的訓練資料產品,開發後直接授權客戶使用。而訓練資料定製服務,根據客戶需求提供訓練資料定製,透過“採集+加工”或“純加工”形式,形成個性化的訓練資料集。在資料定製服務中,智慧語音營收佔比 70%以上;在資料庫產品中,智慧語音營收佔比 85%以上。
根據艾瑞諮詢《2020年中國AI基礎資料服務行業研究報告》,2019年海天瑞聲在國內基礎資料服務行業以約8%的市場份額位列第二;同時,公司主攻著中國語音類基礎資料服務細分市場,營收份額佔比排名第一。
近年來公司不斷加大研發投入,2018年-2020年公司研發費用分別為2734.53萬元、4169.61萬元和4349.75萬元,累計研發投入佔收入比重為16.96%。
截至目前,公司已取得26項專利授權、擁有134項計算機軟體著作權,另有2項專利已提交申請且已經受理,處於行業領先地位。
目前,海天瑞聲建設完成了760多個自有智慧財產權的AI訓練資料集,積累了豐富的多語種語言學家團隊,並與下游的阿里、騰訊、百度、微軟等客戶形成了合作關係,並向下遊客戶提供了累計超3600次/個訓練資料定製服務或訓練資料產品,
在智慧語音領域,公司已覆蓋超過160餘個主要語種及方言。在深耕國內市場的同時,也在拓展加拿大美國、日韓及“一帶一路”地區的佈局,目前已覆蓋“一帶一路”地區54個國家的42個語種及方言,累計詞條數近350萬條,構建自身人工智慧訓練資料資源叢集。
AI落地剛需帶動業績空間
隨著智慧物聯網、產業網際網路等新型場景催生增量新需求,人工智慧領域相關技術的產業化程序開啟。與此同時,隨著AI技術的不斷成熟,AI 的商用化落地已經在全球各地全面展開。根據IDC統計預測,2020 年全球人工智慧產業規模達到 501 億美元,預計2024年將達到1100億美元,年複合增長率為 21.73%。
千億藍海市場逐步促進 AI 技術和演算法模型的最佳化和創新,基礎訓練資料服務得以從中分羹。訓練資料資源是機器學習的基本素材,應用場景的創新和機器學習演算法的迭代直接帶動了訓練資料需求的大幅增長。艾瑞諮詢的研究報告顯示,2019年中國基礎資料服務行業的市場規模達到30.9億元,預計2025年將突破100億元,複合年增長率達到21.8%。
專業化的訓練資料是當前AI演算法發展迭代的剛需。具體而言,約1/3的演算法模型每月至少更新一次,約1/4的演算法模型每日至少更新一次,演算法模型持續更新的特點將進一步拓展各領域訓練資料的需求空間。在創新應用場景和新型演算法的帶動下,訓練資料產品和高定製化的訓練資料服務需求將逐步成為主流,這正是海天瑞聲目前的主營業務。
2017年至2020年,海天瑞聲的營業收入從1.19億元增長至2.33億元,年均複合增長率達25.15%。其中,訓練資料定製服務和訓練資料產品是主要收入來源,從2020年資料來看,二者佔總營業收入的比例分別為50.26%、45.48%。不僅如此,這兩類業務均表現出較強的盈利能力,帶動公司總體盈利水平的提高。2020年公司綜合毛利率水平為67.70%,淨利率達到了35.17%。
目前,國內基礎資料服務行業集中度較低。根據艾瑞諮詢資料,2019 年以海天瑞聲、百度眾包為代表的國內基礎資料服務行業前五大企業AI市場份額為 26.2%。行業整體仍處於低集中競爭階段,行業活力充足,發展空間較大,作為中國領先的基礎資料服務商,公司在品牌效益、技術資質等方面均有優勢,市場份額仍有較大的提升空間。