sponsored links

視覺感知智慧在人工智慧中佔有重要地位

清華大學人工智慧研究院主任張鈸院士將人工智慧劃分為感知智慧認知智慧兩個方面。

從感知智慧的角度分析,其涉及的技術範圍主要是各類智慧機器和智慧系統輸入資訊的獲取和認知。在智慧體獲得的資訊中,視覺資訊佔據著十分重要的地位。

視覺感知智慧在人工智慧中佔有重要地位


生物視覺是機器視覺的學習方向

按照生物來類比機器,眼睛對各類生物起到了絕對重要的作用,生物的各類感知資訊中,視覺資訊佔到了80%以上,甚至更高。生物依靠視覺為自己定位,識別環境和物體,依靠視覺控制行走、覓食、追蹤和捕獲獵物,依靠視覺與同伴交流等等。

人類一定是先有了視覺,才會產生語言交流,有了語言才產生了文字,最後產生了人類文明和科學。

如果把智慧機器當做一個封閉的資訊處理系統,各類資訊的輸入、獲取、處理、識別和理解,構成了智慧機器系統對外界世界的認知,在這些認知的基礎上將逐步形成智慧機器系統自己的知識體系,進而利用這些知識,來指導智慧機器的執行機構進行各類行動。

對這些輸入資訊的處理、理解和識別所產生的知識體系,基本就可以構成人工智慧的核心知識結構。就像人類一樣,智慧機器系統也需要建立起一套自己的系統對外界輸入進行充分感知後,自己可以學習、吸收、消化、理解、復現、應用的知識表達體系。

從目前人工智慧的發展來看智慧感知,首先,已經解決得比較好的是傳統的感測技術,包括:位移、溫度、壓力、加速度、位置和姿態等方面;對於語音的智慧感知,解決的也相對比較理想,語音識別的應用產品也已經開始進入大眾的生活;但機器的視覺智慧感知相對做得很差,雖然深度學習技術解決了一些場景下的識別問題,但機器的視覺智慧感知距離生物一樣的視覺感知能力,還相差的太遠,還需要有很長的路要走

視覺感知智慧在人工智慧中佔有重要地位


無人機三維測量系統採集的電網三維點雲與二維影象

目前的視覺智慧感知技術水平,只能解決特定場景下、特定物體的智慧感知問題。拿現有的影象識別來說,識別的影象基本是建立在二維影象的基礎上,無法像生物視覺一樣將物體三維幾何能在特定物體特定場景下做到定性的識別,而且不能實現泛化的識別,增加識別目標就需要重新組織學習;學習時,需要做大量的標註工作,且需要許多的機器學習資源,才能完成新的學習,耗能極高。

目前視覺智慧感知技術,還不足以建立起一套關於視覺智慧感知的知識表達體系。對於人眼能夠輕鬆實現的高速三維成像,對物體三維幾何特徵、視覺特徵、運動特徵的動態識別方面,目前的任何視覺智慧感知系統都難以達到人眼的水平。

按照哲學關於物質和意識關係的學說,是先有物質然後才有意識,物質決定意識,這是對於人類意識來說的。

對於機器智慧,或者也可以叫做機器意識來說,這個關於物質和意識的學說同樣適用。機器的視覺對外界環境和物體的智慧感知,零零落落,模糊不清,那機器也無法按照視覺智慧感知的資訊,來組織有效的視覺認知的知識結構,也就是說,目前的機器視覺智慧感知的能力很差,感知的實踐經驗明顯不足,無法形成有效的機器視覺的 “意識”。

所以,如果拿生物輸入資訊的佔比來做分析,目前在智慧感知領域,還有至少80%以上的工作沒有完成,或者說還沒有進行,特別是對於視覺感知智慧來說更是如此。

如果這個推斷成立的話,那麼現有的機器智慧系統,由於對視覺智慧資訊獲取、處理和理解能力的不足和缺失,將無法建立起智慧系統的有效知識體系,這個問題不解決,未來人工智慧之路將舉步為艱。

再舉個具體的例子來說明以上推斷:假設智慧機器已經形成了對高山、河流、大海、落日的視覺感知和記憶的話,那麼對於王之渙的“白日依山盡,黃河入海流”的詩句就可以在機器的“大腦”中建立起一個鮮活的畫面,如果再加上智慧機器對日出日落、黃河奔流可能的視覺動態感知體驗,那麼對於智慧機器,將會完全可以理解這首詩,並透過顯示螢幕或其它技術手段展示出本詩的場景和意境,如果再結合機器語音識別,機器與人在這方面交流就不會存在障礙。

現有的智慧音箱在使用體驗上,使用者反映效果不佳,核心的問題就在於語音識別言之無物,沒有視覺場景的體驗和共鳴及數字表達的技術支援,缺乏視覺體驗和相關數字解釋的所謂語音,目前,只能是一個個獨立的數字孤島,無法建立有效的語音和視覺之間的溝通和聯結,無法實現對具體場景的視覺註釋以及語音或文字解釋中的視覺解釋,無法建立起在視覺記憶和視覺理解基礎上的視覺聯想和場景復現,使智慧語音對話無法像人類語音溝通一樣,達到順暢的交流。

所以,未來人工智慧發展的核心問題,應該聚焦在視覺智慧感知上面,讓機器能夠感知到的視覺資訊,包括各類物體的幾何拓撲特徵、視覺屬性、視覺特徵、運動特徵、空間位置特徵等,形成視覺資訊知識圖譜和知識網路,這樣的知識結構再與目前的知識圖譜和語音知識圖譜進行有效的結合,那麼,人工智慧時代必將會產生翻天覆地的變化。

視覺感知智慧在人工智慧中佔有重要地位


三維相機實時測量大型紅熱鍛造件的外形三維尺寸和表面溫度分佈

分類: 數碼
時間: 2021-11-23

相關文章

200萬的富商保姆車,如今30萬都沒人要,福特E350內飾翻新效果

200萬的富商保姆車,如今30萬都沒人要,福特E350內飾翻新效果
有位老闆聯絡我說,想把他的福特E350的內飾重新翻新一下.這是一臺2011款的E350,搭載的是5.4L的8缸發動機,車長6米,寬2米,高2.55米.它的碩大空間以及豪華的內飾改裝,曾經火爆一時,一度 ...

第四代萬達廣場開啟“元宇宙”世界

第四代萬達廣場開啟“元宇宙”世界
如果問當下最火的概念是什麼,那必然是元宇宙. 1. 元宇宙是什麼 元宇宙的英語是 Metaverse,Meta 表示"超越"."元", verse 表示&quo ...

怎麼選購家用監控器,選購家用監控器要注意哪些事項

怎麼選購家用監控器,選購家用監控器要注意哪些事項
在為您的家庭選擇購買家用安防監控裝置時,不妨使用 無線WiFi攝像頭,它的功能特性以及用途會對你很有幫助.沒必要說在家庭牆上或者門框上打孔佈線,無線WiFi攝像頭免佈線,這就不會影響家庭裝飾的美感.按 ...

手機上的影片照片,怎樣存到隨身碟或移動硬盤裡?原來方法這麼簡單

手機上的影片照片,怎樣存到隨身碟或移動硬盤裡?原來方法這麼簡單
怎樣把手機上的圖片.影片.歌曲等內容,轉移到U盤裡存放?不管是什麼手機,儲存記憶體都是有限的,目前主流手機的儲存記憶體基本上都是64G.128G.256G.512G,如果你喜歡拍攝影片記錄生活或喜歡玩 ...

禁止“遮蔽網址連結”!這可是個大事,並不是為了方便分享短影片

禁止“遮蔽網址連結”!這可是個大事,並不是為了方便分享短影片
你還記得現在在微信上分享淘寶和短影片的麻煩嗎? 分享一堆奇怪符號的連結,對方複雜貼上到相應平臺開啟. 或者把影片下載後再進行分享,再刪除掉自己手機裡多餘的影片.都很麻煩. 這些,以後都會成為過去了. ...

短影片裡的古籍修復

短影片裡的古籍修復
#85後女孩修古籍走紅抖音# 必須一直有人在修復才能儲存這種獨門手藝,一旦斷掉手藝就會消失. 短影片中展示了古籍文獻修復細節.圖/受訪者提供 本刊實習記者/馬銘澤 古籍修復師廉成春的工作室坐落在京郊一 ...

《我的旅遊影片裝備》

《我的旅遊影片裝備》
太多的人都想知道我是用什麼裝置拍攝的旅遊影片,今天我就詳細的告訴大家. 一.由於戶外活動量較大,不適合使用重灌備,十幾萬的攝影裝置都背不動了.只好選擇兩部蘋果12手機,記憶體在256G以上.並非國產手 ...

我用了4年,成功毀掉了孩子的好奇心,“一分鐘影片”看清全過程

我用了4年,成功毀掉了孩子的好奇心,“一分鐘影片”看清全過程
孩子從小具有強烈的好奇心,對世界上的一切都充滿好奇,他們喜歡天馬行空的幻想,說出一些讓人啼笑皆非的話.長大以後,很多父母卻驚訝地發現,孩子的好奇心好像不見了. 我兒子就是個好奇心很強的孩子,從小就喜歡 ...

央行行長易綱:要求支付迴歸本源 斷開支付工具和其他金融產品不當連線

央行行長易綱:要求支付迴歸本源 斷開支付工具和其他金融產品不當連線
每經編輯:杜宇 據央行網站9月18日訊息,央行行長易綱在中德"金融科技與全球支付領域全景-探索新疆域"視訊會議開幕致辭中表示,中國監管當局也在努力平衡好鼓勵發展和防範風險的關係.一 ...

家用監控器手機遠端看家寶,無視距離連線手機APP

家用監控器手機遠端看家寶,無視距離連線手機APP
家用監控器手機遠端看家寶是什麼?體積微小的家用監控器材,透過攝像頭傳輸影片到使用者手機,這種無距離限制的WiFi網路攝像機就是常見的家用監控器裝置.手機遠端看家寶是利用無線WiFi進行影片訊號傳輸的, ...

“吹糖藝人”馬青旺:做影片不帶貨,只為傳承

“吹糖藝人”馬青旺:做影片不帶貨,只為傳承
2021年中秋節前,河北省非物質文化遺產傳承人.石家莊市藁城區西辛莊村的吹糖藝人馬青旺收到了一箱來自上海的蘋果,這是他的一個"不見面的徒弟"寄來的.寄件者是上海一家飯店的麵點師,喜 ...

內行評測:98鍵、熱插拔、三模連線,你想要的全都有丨Akko 3098B

內行評測:98鍵、熱插拔、三模連線,你想要的全都有丨Akko 3098B
說來你們可能不信,甚至有點像廣告,這是一把在張大媽數碼編輯部覆蓋率高達100%的鍵盤.它在618期間發售,首發預售價低至339元,98鍵.熱插拔.三模連線我想要的全都有.因為實在太香太有價效比了,再加 ...

技術不夠,裝置來湊!這款桌面雲臺靠自動跟拍提升你的影片質量

技術不夠,裝置來湊!這款桌面雲臺靠自動跟拍提升你的影片質量
智慧手機越來越普及的當下,很多人習慣用手機拍影片的方式記錄.分享身邊發生的人.事.物.絕大多數沒有攝影基礎的普通人面臨自拍技術不夠.他拍放不開手腳,專業工具的不會用,簡單的裝置影響影片質量等窘境.總之 ...

V社釋出Steam掌機拆解影片 警告使用者不要自己拆解

V社釋出Steam掌機拆解影片 警告使用者不要自己拆解
V社釋出了Steam掌機SteamDeck的拆解影片,V社強烈建議使用者永遠不要自己拆解機器. 拆解影片: 雖然該公司警告說,如果使用者選擇開啟這款手持裝置,他們將面臨財務和健康風險,但該公司表示,他 ...

3D人臉識別、影片對講安防監控,給爸媽裝臺德施曼月光寶盒Q8FPro

3D人臉識別、影片對講安防監控,給爸媽裝臺德施曼月光寶盒Q8FPro
大概19年時候給父母家安裝了一套德施曼智慧指紋鎖T11,外觀好看功能全面不用鑰匙一握開鎖也確實方便.老兩口晚上睡覺都比原來安心了很多.不過可能因為父母年歲大了指紋變淺,前陣子有幾次老媽給我打電話說家裡 ...

刷臉秒開觸動未來,德施曼3D人臉智慧影片鎖月光寶盒Q8FPro首體驗

刷臉秒開觸動未來,德施曼3D人臉智慧影片鎖月光寶盒Q8FPro首體驗
隨著大眾對智慧鎖安全性以及便利性的認可,智慧鎖行業呈現井噴式的高速增長,與此同時也讓大眾對於智慧鎖的選擇有了更多更廣的需求,除了排在首位的安全性之外,便捷與否,功能多少,顏值等等都成為大家選擇智慧鎖的 ...

新零售依然是零售,改變的是連線的效率
新零售的概念被提出來有幾年了,新零售倒底是什麼,改變了什麼? 在理解新零售之前,先理解一下零售的本質.零售的本質是有效連線消費者.我們的實體小店,就是一個連線人與貨的場.顧客進店,購買商品.門店連線了 ...

人臉開鎖體驗如何?德施曼月光寶盒Q8FPro3D人臉智慧影片鎖體驗

人臉開鎖體驗如何?德施曼月光寶盒Q8FPro3D人臉智慧影片鎖體驗
前言 現在科技發展很快,在手機廣泛應用的人臉識別技術現在已經開始加持到智慧鎖上,我家裡之前用的是德施曼的指紋密碼鎖,已經體驗了出門不用怕忘帶鑰匙的好處,現在看到德施曼又推出了支援3D人臉識別.可視對講 ...

HypeDrive推兩款4K HDMI擴充套件塢 為M1 Mac擴充套件連線外部顯示器

HypeDrive推兩款4K HDMI擴充套件塢 為M1 Mac擴充套件連線外部顯示器
透過新的 HyperDrive 4K HDMI 擴充套件塢,採用 Apple Silicon 的 MacBook Air/Pro 使用者可以不再侷限於一個外部顯示器.這個擴充套件塢允許 M1 Mac ...

聯想miix510平板二合一電腦出現已:連線介面卡,未充電
聯想miix510,出現:已連線介面卡,未充電.此電腦為平板電腦,電池不可拆卸,如果電腦長時間不用,即使之前滿電的狀態,也開不了機,需要插電源才能使用,感覺他自己會漏電. 關於電池問題: 一般都不好充 ...