sponsored links

AI保姆靠譜嗎?它將如何理解真實世界?

AI保姆靠譜嗎?它將如何理解真實世界?


不知道大家有沒有遇到過這樣的事情,就是在要出門的時候,突然忘記了鑰匙在哪兒了。或者當你需要某一件物品的時候,卻突然找不到這件物品到底在哪兒了,可能在找這件物品的時候,就需要花費很久的時間,甚至還會影響到你的情緒。如果家裡人在的話,你可以喊一聲媽或者媳婦,讓她們幫忙找一下。如果旁邊沒人的話,你可能也會想過,如果有一個叮噹貓或者能記錄自己生活的人工智慧就好了。

而現在,這項技術出現了。

AI保姆靠譜嗎?它將如何理解真實世界?


就在上個月,Facebook 的首席研究科學家 Kristen Grauman 曾說過這樣的一段話:“在未來,我們將透過可穿戴裝置可以在某些的時間段幫助我們大腦來提供資訊和獲取記憶,這些裝置將在未來幫助到我們方方面面。”

可能大家不理解 Kristen Grauman 在說的是什麼,實際上目前 Facebook 正在做一項研究,這項研究可以用來分析我們的活動,幫助我們找到一些忘記的物品,所以說,如果以後我們再忘記鑰匙丟在哪兒的話, AR 眼鏡就會告訴我們鑰匙在哪兒。

AI保姆靠譜嗎?它將如何理解真實世界?


這種技術剛好也跟前不久 Facebook 與雷朋合作推出的眼鏡對應上了,不過當時推出的眼鏡只有藍芽和拍照功能,並沒有 AR 基本功能,所以只能叫做拍照眼鏡。目前 Facebook(現更名 Meta)已經與 13 所大學的實驗室合作,總共招募了 750 人來做這項研究,目前他們在兩年內總共拍攝超過 2200 小時的第一人稱的影片。這些參與者大多居住於英國、義大利、印度、日本、沙烏地阿拉伯、新加坡、美國、盧安達和哥倫比亞,拍攝的主要內容是一些日常活動的影片。他們使用了各種可穿戴裝置,而拍攝的裝置比較隨意,包括 GoPro 相機、Vuzix Blade 智慧眼鏡和 ZShades 影片錄製太陽鏡。

AI保姆靠譜嗎?它將如何理解真實世界?


此舉的目的主要是為了訓練人工智慧系統去理解人們拍攝的照片和影片,當然這方面的主要工作室為了培訓 AI 系統,讓他們更好地去理解影片當中的內容,從而讓 AI 能夠幫助人們記住重要資訊。

1)AI 是如何幫助人類理解世界的?

AI保姆靠譜嗎?它將如何理解真實世界?


AR 識別與處理作為 Facebook 其中的專案之一,其本身理解非常的簡單,就是構建一個系統的框架來對影片識別的內容進行資料的評估,並且為了幫助 AI 更好的去了解第一人稱的影片,AI 人工智慧還會從觀眾的第三人稱視角拍攝的影象中學習。比如當你記錄自己踢足球或坐過山車時,諸如動作模糊和不同角度的鏡頭等 AI 自我學習就會發揮作用。

並且在上個月的時間段裡, Texas 大學和 Facebook AI 研究所做了一篇《Anticipative Video Transformer》的論文,裡面就提出了一種讓 AR 去理解真實世界的 AVT 攝像淮安預測架構。

簡單來說,就是透過 AI 之前觀察到的影片預測未來的行為。讓 AI 訓練模型來預測影片當中的下一個動作,同時學習其影片幀的特徵。

AI保姆靠譜嗎?它將如何理解真實世界?


論文當中提到,觀察和預測人類行為將是 AI 未來發展所必須經過的一條路。其實現在很多技術都在應用 AI 來輔助人類,比如一輛自動駕駛汽車停在停車標誌前 ,它需要預測行人是否會穿過馬路,而這個決定的預判需要去對複雜的視覺訊號進行建模,從而去判斷這個行為的動作、行走速度和方向。這需要大量的計算。

另外,一臺完整的 AR 裝置還需要去觀察使用者的活動以及情緒,例如行走的速度和方向,比如當用戶做菜或者裝傢俱的時候,AI 需要預測使用者的行為,並提供響應的幫助。但人類可以做的事情實在是太多了,如果真的想要全部讓 AI 去做預判,一方面需要大量的計算量,另一方面也需要更多的基準來進行設定,而這一點更像是網際網路初期的時候。

在《Anticipative Video Transformer》這篇論文裡面提到的預測的難度是要遠遠大於識別和理解的,這就好比當你丟了一把鑰匙,普通的 AI 會提醒你鑰匙在哪兒,而預測行為不僅會告訴你鑰匙在哪兒,還會告訴你如何用鑰匙開門,以及如何做菜。

AI保姆靠譜嗎?它將如何理解真實世界?


論文裡主要介紹了一種替代的影片建模架構 Predictive Video Transformer(AVT)。它用預測架構來取代基於“聚合”的時間建模。與週期性模型類似,AVT 可以無限期預測未來,它利用了流行的 transformer 架構,每個輸入幀只關注它前面的幀。從而訓練模型來共同預測下一個動作,同時學習預測與真實未來特徵及其中間動作標籤相匹配的未來特徵。

AVT 的 attention 還做了如何在兩個先前觀察到的幀傳播的示例(上圖)。目前 AVT 不僅能夠處理特定的幀,而且能夠在一個統一的框架中處理幀內的空間特徵。

AI保姆靠譜嗎?它將如何理解真實世界?


當 AI 進行影片訓練時,模型會自發地學習與此物件相對應的空間特徵。

2)未來人類科技保姆概念會成為現實嗎?

其實目前有關 AI 的應用已經很多了,但大多都是針對於企業端的產品,比如三一將AR運用到了三一樁機燈塔工廠,美國空軍正在用 AR 訓練士兵等等,針對於消費級別的裝置很少,但這也至少說明了一點,技術目前還是有的,只是時機還並沒有成熟。

但未來人類科技保姆概念確實是有一定的說法的,比如上述技術一旦真正實現以後,或許人們真的就可以像很多科幻電影一樣,把更多的精力用在真正的事情上面,從而讓 AI 來處理這種瑣事。

關於用 AI 來訓練 AR 或許真的是未來科技發展的畢竟之路,蘋果的 CEO 庫克曾經表達過類似的觀點,“AI 將會解決或代勞許多繁瑣而重複的工作,從而大幅釋放使用者的時間,以便人們可以做更多自己喜歡的事情,我非常相信增強現實(AR),它可以增強並真正放大技術與人的價值,而不是圍住或關閉現實世界。”。

3)AR 消費級眼鏡的未來還有多遠?

AI保姆靠譜嗎?它將如何理解真實世界?


不管是雷朋和 Facebook 共同推出的眼鏡,還是之前國內小米推出的小米智慧眼鏡探索版,或者是蘋果明年將要上線的 AR 眼鏡,無不都在證明著資本的流動正在超我們嚮往的方向上進行,但可惜的是,未來三年以內所有有關 AR 或者 AI 級別的眼鏡都將成為概念級的,也就是說這些眼鏡的出現只是為了證明技術的進步,實際上並不會像上文所提到的技術一樣,可以讓成為人類的“第二大腦”來起到幫助的作用。

並且一旦 AR 消費級眼鏡出現以後,還會涉及到更多的問題,比如使用者個人隱私和保密問題、資料儲存問題、算力問題等等。如何更好的保護使用者的隱私、以及如何證明企業可以做到不侵犯使用者的隱私、資料儲存在雲端還是儲存卡里,如何讓儲存卡可以儲存更多的資料量、如何在肖肖的眼鏡裡面放置更多的計算單元,這些都會成為大大小小的問題,而且這裡面的每一項拿出來都會讓企業的研究人員忙上很久。

不過關於 AR 消費級眼鏡我們仍然可以進行期待。AR 真正消費級的眼鏡不是一家媒體侃侃而談就可以做到的,他所需要的是整個行業不斷的研究與發展,需要供應鏈不斷努力不斷進步才能夠真正實現。

分類: 文化
時間: 2021-11-09

相關文章

《論語》讀後感
[每日閱讀打卡]day2 原文: 有朋自遠方來,不亦樂乎!人不知而不慍,不亦君子乎! 釋義: 有志同道合的朋友從遠方來,那是人生一大樂事!人家不理解我,我也不生氣,那不才是君子嗎? 感悟: 今日讀論語 ...

我希望,新房子裡沒有書櫃
我明白了一個道理:想要的東西得不到,人會難過.但是想扔的東西扔不得,會更痛苦. ---山下英子<斷舍離> 週末,我要給兒子聽寫語文詞彙,然而他找不到聽寫材料了.這提示著: 兒童房的書.學習 ...

校長心語(二十四) 在“師徒結對"儀式上的講話

校長心語(二十四) 在“師徒結對"儀式上的講話
一."師徒結對"的意義 春風化雨承傳古風神韻, 志美行厲創造和美未來. 二."師徒結對"的原則 學校牽線半私半公, 徒弟誠心為己為生. 三."師徒結對"的期望 透過"師徒 ...

“中國整形第一刀”陳煥然:“獨一無二就是更美的”

“中國整形第一刀”陳煥然:“獨一無二就是更美的”
58歲的陳煥然見過整形行業的太多變遷:曾經被視為病態的駝峰鼻,在某部電影大火後,成了無數男士的"心頭好":風靡一時的"錐子臉",短短几年就被流行拋棄,成為過時的 ...

1955年“戰犯”衛立煌返回大陸,為何驚動六大元帥親自作陪?

1955年“戰犯”衛立煌返回大陸,為何驚動六大元帥親自作陪?
他曾是蔣介石的頭號心腹,著名的常勝將軍.建國前夕成為我黨公佈的43名戰犯之一,後來又成為國民黨釋出的頭號戰犯.迫於兩邊的壓力,他攜家人在香港躲藏六年之久.1955年返回大陸受到黨中央的高度重視,還當上 ...

聚創考研學姐說:考雙非研究生不如不考?雙非研究生值得讀嗎?

聚創考研學姐說:考雙非研究生不如不考?雙非研究生值得讀嗎?
研究生考試都快要報名了,最近有些小夥伴問我要不要降低考研目標,選一個雙非院校. 雙非研究生確實不如重點大學的研究生那麼搶眼,但讀研能跨上更高的門檻,也意味著多一份選擇,雙非大學的研究生值不值得讀,需要 ...

一年級拼音難學?前五張圖必須學會,老師建議:一年級每天讀五遍

一年級拼音難學?前五張圖必須學會,老師建議:一年級每天讀五遍
一年級拼音難學?學得快,跟不上,前五張圖必須學會,老師建議:貼在牆上日讀五遍 備註:9月份要上一年級的家長,我這有挺多一年級上冊的語文數學資料,需要看上圖獲取. 需要一年級學習資料的家長: 點我頭像, ...

論語史鑑:正確理解王陽明的“心學”

論語史鑑:正確理解王陽明的“心學”
第十五篇第33章 子曰:"知及之,仁不能守之: 雖得之,必失之.知及之,仁能守之.不莊以蒞之,則民不敬.知及之,仁能守之,莊以蒞之.動之不以禮,未善也." 及:逮也!從人從又(手) ...

《領讀中國》藝術研學之旅 皇家宮廷建築群——故宮的大智慧

《領讀中國》藝術研學之旅 皇家宮廷建築群——故宮的大智慧
中國的傳統文化源遠流長,五千年來我們偉大的中華民族,孕育了輝煌的歷史,留下了璀璨的中華文化.文化是一個民族的靈魂和血脈,是中華民族共同的精神家園,體現了民族的認同感.歸屬感,反映了民族的生命力.凝聚力 ...

孩子英語學不好?家長安利讀書郎智慧掃讀筆

孩子英語學不好?家長安利讀書郎智慧掃讀筆
期末考試公佈英語成績那天,孩子給了我一個大大的擁抱.我以為她受打擊了考得不夠理想,連忙安慰她,你盡力就好,下次一定沒問題. 她手一揚,說"92分!,老師說讓下學期在全班同學面前分享英語學習經 ...

大寶讀一年級學拼音特別費勁,各位大神有不有什麼秘訣快速學拼音
我家老大讀一年級了,就是學拼音好老火哦,她總是說記不住,各位大神家長們有不有什麼方法求指教,天天盯著她讀還是讀不好,我都快崩潰了,今天晚上老師打電話來了,問為什麼還沒有交讀書影片作業,[流淚][流淚] ...

夜讀︱那些年我們學過的英語
呂京笏 對於大部分年輕網友來說,提起華爾街英語,最先想到的大概就是門店門口那些似乎從不知疲倦的"營銷小哥".在不少平臺已經被玩成段子的營銷話術,以及時不時出現在網路上的,關於課程. ...

《論語今讀》:“天厭之”,聖人也有難以溝通的時候
子見南子,子路不說.夫子矢之曰:"予所否者,天厭之!天厭之!" [譯] 孔子拜會了南子,子路不高興.孔子發誓說,"我如果做了錯事,老天會懲罰我!老天會懲罰我!" ...

《論語》學而篇第八節
子曰:"君子不重則不威,學則不固.主忠信,無友不如己者,過,則勿憚改." 這句是學而篇裡比較難懂的一句,不太好講.什麼是不重則不威?我的理解是一個人如果不莊重嚴肅,就不能讓人感覺威 ...

一日一句——學論語

一日一句——學論語
<論語·泰伯>曾子曰:"士不可以不弘毅,任重而道遠.仁以為己任,不亦重乎?死而後已,不亦遠乎?" 曾子說:"有志者不可以不培養堅強的意志,因為責任重大而且道路 ...

論語,學而篇
巧言令色 原文 子曰:"巧言令色① ,鮮②矣仁!" 註釋 ①巧言令色:巧言,花言巧語,好聽而實際上是言不由衷的話. 令色,面孔和善,內心另有盤算,即偽善的面貌.令,美好.②鮮: 少 ...

《國學經典》-《論語譯本》-學而篇
第九章:曾子說:"謹慎地對待父母的去世,追念久遠的祖先,自然會導致老百姓日趨忠厚老實了." 第十章:子禽問子貢說:"老師到了一個國家,總是預聞這個國家的政事.(這種資格) ...

《論語今讀》:“舉一隅以三隅反”,舉一反三
子曰:"不憤不啟,不悱不發.舉一隅不以三隅反,則不復也." [譯] 孔子說,"不刺激便不能啟發,不疑慮便沒有發現.指出桌子一個角,不知道還有另外三個角,我也就不再說了.& ...

《論語》學而篇第十三節
有子曰:"信近於義,言可復也.恭近於禮,遠恥辱也.因不失其親,亦可宗也." 這句話直譯過來,我們會不太理解這句話的意思.有子說:"信接近於義,言而有信.恭接近於禮,遠離恥 ...

【學黨史】黨史百年·天天讀(第58期)

【學黨史】黨史百年·天天讀(第58期)
重要論述 1938年7月2日 毛澤東會見世界學聯代表團柯樂滿等,並回答他們提出的問題.關於邊區在中國的意義和作用,指出:邊區是一個民主的抗日根據地,它把抗日戰爭與民主制度結合起來,以民主制度的普遍實行 ...