知道嗎?AI處理的視覺數(shù)據(jù)中99%是無用的
數(shù)據(jù)是新經(jīng)濟的源泉,是新的能量。我們用不同的單位來衡量數(shù)據(jù),從最初的KB、MB,到如今的GB、PB、TB,數(shù)據(jù)量越來越大,單位層級越來越高。在過去10年中,每年產(chǎn)生的數(shù)據(jù)量比過去幾年產(chǎn)生的數(shù)據(jù)總和都多。
2020年會怎么樣?大數(shù)據(jù)將走向何方?AI又在其中扮演怎樣的角色?
99%的無用數(shù)據(jù)是什么?
很多數(shù)據(jù)中心現(xiàn)在已經(jīng)建成,它們在處理大量的數(shù)據(jù)的同時,要消耗能量。數(shù)據(jù)量每4年可能會翻番,數(shù)據(jù)中心的規(guī)模也會翻番。
這么多數(shù)據(jù)中,只有1%是真正的純信息,99%的數(shù)據(jù)是無用的,其中80%的大數(shù)據(jù)來自攝像頭或其它拍攝裝置,大多數(shù)是圖片。什么是純信息數(shù)據(jù)?怎么區(qū)分?這些數(shù)據(jù)對于設備、對于機器人、對于各種應用場景是不是有用?為什么要收集、處理這么多數(shù)據(jù)?
我們一直在研究這些問題。
150年前一位英國人發(fā)明了攝像機。攝像機不能完整地捕捉整個運動的過程, 而是捕捉到一系列連續(xù)的畫面,將畫面連接起來才形成了類似連續(xù)的一段影像。直到今天,我們?nèi)詫⒁曨l視作一系列的圖片。
因此,我們需要改變傳統(tǒng)的數(shù)據(jù)收集和處理方式,從而在視覺領域做出更多的貢獻。
利用AI技術(shù)捕捉關鍵數(shù)據(jù)
在汽車、超高速相機、實時游戲及工業(yè)應用中,我們關注兩點:一是抓取真正有意義的圖像,二是節(jié)省能源。
所有的視覺數(shù)據(jù)都是由傳感器按預定的節(jié)奏獲取的。傳統(tǒng)的方式是獲取海量數(shù)據(jù), 通過一層層剝離來減少數(shù)據(jù)量,逐漸提取有價值的關鍵視覺信息并最終做出決策。
我們要減少無效數(shù)據(jù)的收集,有效利用資源,提高效率和安全性。
數(shù)碼相機每秒大概30幀,在高速運轉(zhuǎn)時,一些圖像會出現(xiàn)邊緣模糊的情況。如果提高精細度,則會面臨增加消耗電能的問題。
我們利用AI的感知和處理,通過增強感應器的性能, 努力改善動態(tài)過程中邊緣模糊的情況。同時優(yōu)化取樣,抓取相關性大的圖像,并且通過過濾90%以上的無用信息,來實現(xiàn)節(jié)能。
現(xiàn)在的數(shù)據(jù)如同一種新形式的石油,非常珍貴。我們需要不斷抓取有用的數(shù)據(jù), 使這些數(shù)據(jù)服務于我們。
構(gòu)建先進的仿生視覺系統(tǒng)
想一想人的眼睛。人眼是如何看東西的?我們捕捉動態(tài)信息,而非關注靜止不動的部分,這時大腦和眼睛協(xié)調(diào)工作。人腦只收集有意義的信息,從而快速做出響應和決定,這非常高效。大腦要處理的信息量很大,而大腦的功率是25W,非常節(jié)能。
我們要打破傳統(tǒng)方式,開發(fā)出與拍攝裝置和AI結(jié)合的新技術(shù),模擬大腦和眼睛的工作,依賴場景動態(tài)學, 僅捕捉關鍵信息,同時綜合考慮時間、能量、計算成本等參數(shù),讓人與機器能夠和諧共存。
例如,在自動駕駛中100%地避免事故,在永不關閉的監(jiān)控系統(tǒng)上實現(xiàn)高安全性和效率,無人機憑直覺避免碰撞,甚至讓失明的人都可以恢復視覺。
我們希望汽車能檢測并繞開各種障礙以及道路上的其他汽車和行人。
交通場景下有一些動態(tài)過程,如汽車從隧道里開出來突然一亮,司機的眼睛被晃到就可能發(fā)生事故。運用芯片的感應器能夠了解相關光照情況下的具體交通量, 如同神經(jīng)形態(tài)傳遞。
我們利用基于事件的視覺系統(tǒng)來改革所有的動態(tài)應用,實現(xiàn)嵌入式事件流控制及被動邊緣檢測,采用低功耗傳感器,并使用高時間分辨率重建。
我們的系統(tǒng)只感知場景核心,運算數(shù)據(jù)僅為傳統(tǒng)方法的十分之一到千分之一;小于10mW的低功耗;微秒級的事件采樣,等同于每秒10000幀圖像;捕捉極端光照條件下的隱藏信息,大于120dB的高動態(tài)范圍;每個像素異步曝光,不產(chǎn)生運動模糊。
我們的系統(tǒng)可以用于安防/人工智能機器人,提高機器和工藝生產(chǎn)率,調(diào)試和維護感興趣的區(qū)域;在移動/可穿戴設備物聯(lián)網(wǎng)中,實現(xiàn)智能存在檢測以及實時高速SLAM ,進行眼動追蹤;在無人駕駛中,用實時高速的機器視覺以及HDR和低數(shù)據(jù)速率來提高安全性,并降低系統(tǒng)的復雜性和成本。