作為計算機科學領域的“諾貝爾獎”,圖靈獎(A.M. Turing Award)評獎非常嚴格,一般每年只評選一位獲獎者,極少有兩名以上計算機科學家能共享殊榮。
而2018年圖靈獎罕見地宣佈,當年獲獎者為三人。
美國計算機協會(ACM)這樣介紹他們的成就:他們在概念和工程學上取得突破,使深度神經網路成為計算科學的關鍵部分,從而促使計算機視覺、語音識別、自然語言處理和機器人等領域取得突破性進展。
三位獲得者分別是——著作被業內譽為“聖經”的約書亞·本吉奧(Yoshua·Bengio),在計算機視覺領域掀起革命的傑弗裡·辛頓(Geoffrey·Hintion),卷積神經網路之父楊立昆(YannLe·Cun)。
正是他們共同發明了深度學習的概念,幫助AI技術從自動駕駛領域到自動醫療診斷領域逐漸滲透,應用於社會各行業,讓人類社會進入了智慧時代。
可以說,梯智眼電梯智慧攝像頭電動車識別的技術應用也離不開這三位科學家的研究成果。
基於深度學習演算法,梯智眼為相機設計了電瓶車識別演算法,讓相機成為一個能終端感知、決策和執行的邊緣計算智慧裝置。
與普通攝像頭不同,電梯AI相機不僅需要看得清、看得懂,還需要自己學會主動判斷,思考及決策。
電動車存在不同設計樣式的外觀,如何才能讓相機從千變萬化的情況中正確識別出電動車呢?
為了讓相機學會思考,梯智眼研發團隊給了相機一個算力足夠的晶片作為“心臟”,然後將演算法作為“大腦”植入晶片,讓相機能感知周圍環境並做出決策,再結合邊緣計算嵌入式部署方案,讓整體方案能完美部署進小小的相機裡。
怎麼做到的?這裡面涉及到複雜的AI演算法識別邏輯。
首先,為了讓相機擁有強勁的心臟,梯智眼用上了功能最為豐富的SoC(System on a Chip,系統級晶片),其上集成了CPU、NPU、RAM、ADC/DAC、Modem、高速DSP等各種計算單元,可以提供不錯的算力,能同時併線執行多種演算法。
有了算力的支撐,就可以為相機設計最為核心的、用於感知和思考決策的演算法部分了。
演算法的應用是一個複雜的過程,科學的方法是先建模,再對演算法模型進行訓練,不斷最佳化調整模型引數,最終移植到晶片上。
基於深度學習CNN演算法(Convolutional Neural Networks,卷積神經網路),梯智眼研發團隊透過大量的圖片和標記訓練神經元的核和連線,創建出一個可以識別電動車的卷積神經元網路,也就是演算法模型。
電動車的尺寸變化範圍很大,進入電梯角度、姿態不定,更何況還需要對電動車和腳踏車、輪椅、嬰兒車等進行區分,牽涉到多類別檢測。
因此,梯智眼研發人員為電動車識別演算法模型設計了合理的目標檢測流程。
為了驗證演算法模型的準確性,梯智眼研發團隊還使用了大量的電梯場景圖片對演算法模型持續訓練。同時透過對訓練資料的清洗、混淆和增強,賦予演算法模型“實戰經驗”,提高了模型的魯棒性,進一步提高識別精度,降低誤檢率。
經過反覆的引數調優後,成熟的電動車識別演算法模型終於能落地到晶片上,能在轎廂電梯內準確識別出各種不同樣式的電動車,並實現腳踏車、嬰兒車、拖車等誤檢過濾。
得益於精準的識別演算法、優越的成像方案及合理的嵌入式部署方案,在實際測試中梯智眼T2相機哪怕是在受到各種因素干擾的情況下,也能保持穩定執行,準確識別出電動車。
目前,梯智眼T2相機不僅能識別新舊國標各類電動車,同時能準確排除嬰兒車、腳踏車、輪椅、擔架等因素的干擾,專案實測中識別準確率超過98%,幫助眾多小區電梯解決電動車上樓進梯的難題,取得了卓越的效果。