小編與大家一起了解了機器人的起源發(fā)展和常見的種類。隨著機器人越來越多地參與到我們的生產生活中,它們的“類人”屬性逐漸凸顯,有時我們甚至產生它們擁有人的感官和思維的錯覺。它們可以靈巧躲避障礙物,甚至能聽會看可交流,逐漸成為了我們工作生活中不可或缺的伙伴。其實,機器人這一系列類人能力的背后離不開日益成熟的感知技術。今天與大家一起了解下機器人那些“神奇”的感知技術。
一、機器人是什么?你不知道的那些事兒二、形態(tài)各異、功能多樣,機器人種類知多少?
機器人感知系統(tǒng)的基礎硬件單元是由不同種類的傳感器構成的,它們作為機器人身上的感覺器官,充當了眼睛、耳朵、鼻子等重要角色。不同類型的傳感器用于收集不同的測量信息,經過數(shù)據(jù)處理階段,輸送到不同的感知算法,為機器人后續(xù)的規(guī)劃、控制階段提供支持。
感知技術是機器人獲取和理解環(huán)境信息的基礎,它可以給應用層帶來更多可能。一般可分為視覺感知、聽覺感知和觸覺感知等大類。
視覺感知
機器人視覺感知技術包括硬件傳感器的研發(fā)、軟件算法的研發(fā)等。主流視覺傳感器系統(tǒng)包括單目、雙目立體、全景、混合等。依據(jù)不同的應用場景選擇合適的傳感器配置,從而得到目標視覺信息的全周期、全覆蓋。
單目視覺系統(tǒng)僅使用一個攝像頭,由于三維空間的深度信息在成像過程中丟失,這種系統(tǒng)無法直接測量物體的距離,通常依靠其他技術或算法間接估計深度。單目系統(tǒng)的視角取決于攝像頭鏡頭的參數(shù),通常視角有限,但可以通過調整鏡頭來改變,廣泛應用于目標跟蹤、室內定位導航等不需要非常高精度深度信息的場合。
雙目視覺系統(tǒng)通過兩個攝像頭模仿人眼的體視功能,利用三角測量原理獲得場景的深度信息,可以比較準確地恢復視覺場景的三維形狀和位置。雙目系統(tǒng)的視角較寬,因為兩個攝像頭從不同角度捕獲圖像,有助于深度信息的獲取。用于需要高精度深度信息的應用,如移動機器人的定位導航、避障和地圖構建。
全景視覺系統(tǒng)是具有較大水平視場的多方向成像系統(tǒng),突出的優(yōu)點是有較大的視場,可以達到360度,全景視覺系統(tǒng)可以通過圖像拼接的方法或者通過折反射光學元件實現(xiàn),適合需要大范圍監(jiān)測的應用,但本質上是一種單目系統(tǒng),無法直接獲取深度信息。適用于機器人導航和某些監(jiān)控任務,需要大范圍監(jiān)視但不需深度信息的場景。
混合視覺系統(tǒng)結合了多種視覺系統(tǒng)的優(yōu)點,例如單目或雙目視覺系統(tǒng)與其他傳感器如激光雷達的結合,能夠同時提供寬廣的視場和精確的深度信息?;旌舷到y(tǒng)的視角取決于組合的各個傳感器,可以實現(xiàn)廣角監(jiān)測同時也能精確測距。混合系統(tǒng)結構配置復雜,需要多種傳感器的配合,多用于復雜的應用環(huán)境,如自動駕駛,既需要廣闊的視野又需精確的障礙物檢測與測距。
觸覺感知
機器人的觸覺感知能力是實現(xiàn)與物體之間柔性交互的重要部分。觸覺感知技術是現(xiàn)代機器人領域中的關鍵技術進步,它模擬人類的觸覺,使機器人能夠更智能地與環(huán)境和人類進行交互。觸覺傳感器根據(jù)其信號轉換機制的不同,可以分為多種類型,每種類型具有不同的工作原理和應用場景:
壓阻型傳感器:利用彈性體材料的電阻率隨壓力變化的性質制成。當外力作用在傳感器上時,彈性體發(fā)生形變,導致電阻變化,進而將機械刺激轉化為電信號。
電容型傳感器:利用兩極板間電容的變化來檢測受力信息。當外力作用于傳感器時,兩極板間的相對位置或介質厚度發(fā)生變化,導致電容值變化,通過檢測電容變化量來獲取受力信息。
壓電型傳感器:基于壓電效應,當受到外力作用時,材料內部發(fā)生電極化現(xiàn)象,從而產生電信號。常用的壓電材料如鋯鈦酸鉛因其高靈敏度和快速響應被廣泛采用。
光電式傳感器:利用光學原理進行工作,通常由光源和光電探測器構成。當施加在界面上的壓力發(fā)生變化時,傳感器敏感元件的反射強度和光源頻率也會相應變化。
磁導式傳感器:在外力作用下磁場發(fā)生變化,并把磁場變化轉換為電信號,以此感受接觸面上的壓力信息。
聽覺感知
機器人聽覺感知的應用包括讓機器人能夠聽懂人說的話,此時需要在機器人系統(tǒng)上增加聲波傳感器、語音接口,對應的傳感器陣列可以全面向接受聲音信息,解析復雜的聲波頻率,提取連續(xù)自然語言中單獨語音和詞匯,結合自然語言處理技術實現(xiàn)人機語音交互。自ChatGPT等大語言模型、語音智能、自然語言處理技術爆發(fā)以來,服務型機器人如引導服務機器人、迎賓機器人、展廳講解機器人、智能音箱等產品廣受推崇。
當然機器人聽覺感知,不單單指對于人類語音的識別,還包括通過聲音傳感器對于一切物體發(fā)出聲音的判斷。相比較機器人視覺感知對于物體判斷的簡單直接,聽覺感知確實是人們一直忽略的領域。
在我們的日常生活場景中,其實除了用視覺來判斷物體的遠近、顏色和大小之外,我們通常也會用到聽覺來識別物體的距離遠近、質地,推測事件的發(fā)生。聲源定位技術也是機器人主要的聽覺感知技術之一。例如在巡檢任務中,機器人的聽覺感知可以幫助其快速定位到異常聲源,實時監(jiān)測工業(yè)設備的噪聲狀態(tài)。
激光雷達
激光雷達成像可以簡單理解為使用激光發(fā)射部件向一定視場角FOV(Field OfView)內發(fā)射光線,同時使用接收部件接收范圍內反射回的光線,利用已知和獲取的發(fā)射光線與反射光線的相關信息,直接計算或推導出反射點的信息(速度、距離、高度、反射強度等)。
激光雷達探測技術可以分為TOF飛行時間法與相干探測法。
飛行時間(ToF)法:通過計算光波發(fā)射與返回的時間差來測量目標的距離。
相干探測法:與ToF直接測量時間不同,相干探測法通過測量發(fā)射電磁波與返回電磁波的頻率變化解調出目標的距離及速度。這種方法的優(yōu)勢在于其高精度和抗干擾能力,特別適用于需要長距離和高精度測量的領域。
FOV即視場角,指激光雷達能夠探測到的視場范圍,可以從垂直和水平兩個維度以角度來衡量范圍大小。
垂直FOV:常見的車載激光雷達通常在25°,形狀呈扇形:
水平FOV:常見的機械式激光雷達可以達到360°范圍,通常布置于車頂;常見的車載半固態(tài)激光雷達通??梢赃_到120“范圍,形狀呈扇形,可布置于車身或車頂。
多傳感器融合
在自動駕駛、移動機器人應用里,當機器人處于未知環(huán)境中,移動機器人的運動規(guī)劃前提是要有精確的自主定位和環(huán)境感知,雖然攝像頭和激光雷達都可以產生對環(huán)境進行信息感知,同時配置兩者在一定程度上可以做到信息互補,補完路況中不確定性。
將攝像頭與激光雷達產生的信息進行融合,利用冗余互補的信息形成更全面、更可靠的感知結果。目前比較常見的多模態(tài)傳感器數(shù)據(jù)融合的方法有如下三種:
1、數(shù)據(jù)級融合(前融合):直接將不同模態(tài)的原始數(shù)據(jù)在空間上對齊后進行融合。
2、特征級融合(深度融合):分別對不同模態(tài)的原始數(shù)據(jù)進行特征提取并在特征空間中將各模態(tài)特征混合在一起。
3、目標級融合(后融合):在每個模態(tài)都對目標進行預測,然后綜合不同模態(tài)的結果形成單一的目標輸出。這種方法可以當成一種集成學習方法。
機器人感知技術的發(fā)展趨勢指向更加智能化、綜合化的方向。多模態(tài)感知融合技術將視覺、觸覺、聽覺等多種感知方式結合起來,使機器人在復雜多變的環(huán)境中具備更強的適應性和決策能力。深度學習的應用推動了感知技術的快速進步,通過大量的數(shù)據(jù)訓練,機器人可以更準確地識別和處理復雜的感知信息。隨著研究的深入,未來的機器人將不僅僅是執(zhí)行命令的工具,而是成為能夠理解人類意圖和情感,與人類協(xié)同作業(yè)的智能伙伴。