中國經濟導報 中國戰略新興產業雜誌 中國發展網 記者 | 杜壯
目前人工智慧市場發展依然火熱,各行各業對資料的需求也呈現井噴態勢。然而現在很多企業的大部分非結構化資料無法用於AI(人工智慧)模型訓練,需要大量的人工進行標籤化處理。人工智慧企業要想在資料標註上降本增效,必須選擇更加高效、體驗更好的標註工具,從而提升標註團隊的工作效率。
在2021年中國國際服務貿易交易會期間,雲測資料釋出了“雲測資料標註平臺-AI資料集管理系統”,專注於AI資料集的上傳、管理、儲存、分享,資料型別標籤化管理,同時支援標註結果的儲存、標註結果視覺化等功能,從而助力企業進行資料管理,提升資料訓練的匹配度。作為AI訓練資料頭部服務商,雲測資料總經理賈宇航接受中國經濟導報記者專訪時表示,只有把海量的訓練資料進行有效管理,才能減少冗餘資料、最大化地發揮訓練資料的價值,從而推動資料要素有序發展及高效利用。
在人工智慧產業鏈中,演算法、算力和資料共同構成技術發展的三大核心要素。從人工智慧產業鏈的發展情況和未來發展趨勢來看,中國人工智慧資料服務行業的市場規模正在逐步擴大。據IDC預測,中國的資料量增速最快,平均每年的增長速度比全球快3%。2018年,中國的資料量為7.6ZB,佔全球總量的23.4%,預計到2025年將增至48.6ZB,佔全球總量的27.8%,年複合增長率達30.35%。在這樣的資料增長背景下,資料資產管理的重要性不言而喻。
如今,各行各業紛紛搭乘數字化轉型的快車,以取得市場競爭力。值得注意的是,在企業爭先擁抱數字化轉型的同時,部分中小企業也面臨著“不會轉、不能轉、不敢轉”的現狀。相關資料顯示,目前我國僅有25%的企業開啟了數字化轉型,中小企業比例則更小。
賈宇航認為,數字化轉型的本質,是利用軟體技術、網際網路、人工智慧等數字手段,降低企業運營成本,提升生產運營效率,為對外開源拓客創造更多價值的過程。也正因為如此,企業的數字化轉型必然離不開應用、軟體、系統等資訊基礎設施的建設與運用,這背後必然產生大量的資料。
“人工智慧落地商業化時代,企業面臨著自身AI資料量大、對某個特殊問題場景很難找到有價值AI資料的普遍困境。同時在人工智慧資料訓練過程中,AI資料管理更是面臨著資料資產不能充分利用、管理方式不完善等新的挑戰。”賈宇航說。
“企業在使用系統的過程中會有一個‘拎包入住’的體驗。”賈宇航告訴記者,這次推出的平臺將AI資料服務的流程具象化,變成了一個產品。原來用於管理雲測資料內部的服務流程,如今可以擴充套件到AI相關企業中應用。再結合雲測資料標註平臺,客戶可以一站式、流程化進行資料採集、資料標註、資料管理。
據瞭解,自主研發的雲測資料標註平臺為AI相關企業提供了一站式、大規模處理訓練資料的能力,可以助力AI資料訓練綜合效率提升200%,標註精準度最高可達99.99%。
“作為AI技術的三大要素之一,資料從本質上決定了人工智慧的落地水平。通常來講,資料標註得越精準,資料量越大,模型就越好,最後的AI產品效果也就越好。”對於未來,賈宇航充滿了信心。他告訴記者:“人工智慧被列入新基建中的新技術基礎設施,將會有更多的資本或者政策關注,而人工智慧三要素之一的資料,勢必會伴隨著人工智慧行業的增長而增長。”
在人工智慧的大潮中保持技術和行業的領先性並非易事。賈宇航也道出了他們發展的秘密,那就是“一橫一縱”戰略。
談到“一橫”,賈宇航解釋道:“伴隨著整個人工智慧的發展,我們在自動駕駛、智慧家居、智慧城市和智慧金融等多個行業,有端到端的訓練資料服務解決方案。隨著越來越多的行業進行智慧化、數字化轉型,我們將積極地為這些具有潛力的賽道和行業,去制定資料解決方案,幫助更多的人工智慧技術商業化落地。”
“‘一縱’更多地是對熱門行業和技術發展趨勢進行前瞻性預測,提前準備相關的工具鏈以及資料服務能力,確保有充足的準備去應對新的AI資料需求。”賈宇航說。