8月18日,威邁爾VMR正式發(fā)布人形機(jī)器人頭部模組OmniHead(奧視知腦)。
當(dāng)前,人形機(jī)器人在實(shí)際應(yīng)用中普遍面臨環(huán)境感知能力弱、決策依賴預(yù)設(shè)邏輯的痛點(diǎn),導(dǎo)致難以擺脫人工遙控,制約了實(shí)際應(yīng)用場(chǎng)景的拓展。OmniHead的推出將有效解決這些技術(shù)瓶頸。
OmniHead是威邁爾專為具身智能打造的頭部模組,搭載高精度RGB-D視覺(jué)系統(tǒng)和AI大模型。通過(guò)OmniHead開(kāi)發(fā)者可輕松提升機(jī)器人的視覺(jué)感知能力和環(huán)境魯棒性,從此擺脫遙操。
01、視覺(jué)全景感知
OmniHead的RGB-D深度視覺(jué)系統(tǒng)由三組十個(gè)RGB-D陣列相機(jī)組成,分布于頭部模組的正前方、左后側(cè)和右后側(cè),形成360°x90°的全景視野,實(shí)現(xiàn)機(jī)器人在復(fù)雜場(chǎng)景中的定位、感知和自主導(dǎo)航。
視覺(jué)定位技術(shù)
OmniHead采用視覺(jué)定位技術(shù),通過(guò)RGB-D陣列相機(jī)實(shí)時(shí)獲取周圍環(huán)境的三維信息并快速建圖,為機(jī)器人定位導(dǎo)航提供可靠數(shù)據(jù)。
多模態(tài)感知與語(yǔ)義識(shí)別
OmniHead的RGB-D相機(jī)融合語(yǔ)義感知算法,實(shí)現(xiàn)環(huán)境物體類別的精準(zhǔn)識(shí)別,經(jīng)過(guò)訓(xùn)練可識(shí)別桌子、椅子、人、機(jī)器人、狗等多類物體,為機(jī)器人行為決策提供準(zhǔn)確依據(jù)。
多機(jī)協(xié)同數(shù)據(jù)同步
三組RGB-D陣列相機(jī)可實(shí)現(xiàn)視覺(jué)數(shù)據(jù)同步采集與傳輸,最終獲得全景三維重建與實(shí)時(shí)感知。
02、AI大模型+麥克風(fēng)陣列
深度集成DeepSeek或通義千問(wèn)大模型和環(huán)形麥克風(fēng),支持360°聲源定位與自然語(yǔ)義理解,實(shí)現(xiàn)多輪對(duì)話與情感化響應(yīng)。
環(huán)形麥克風(fēng)陣列6麥協(xié)同降噪,支持5米遠(yuǎn)場(chǎng)拾音,搭配聲紋識(shí)別算法,實(shí)現(xiàn)多人對(duì)話場(chǎng)景下的聲源分離與語(yǔ)音增強(qiáng),并且支持中英雙語(yǔ)交流。
03、開(kāi)放接口多模態(tài)數(shù)據(jù)融合
OmniHead擁有豐富的開(kāi)放接口,支持視覺(jué)、語(yǔ)音多模態(tài)數(shù)據(jù)聯(lián)合推理,適配各類人形機(jī)器人平臺(tái),可拓展具身智能多場(chǎng)景應(yīng)用,包括商業(yè)辦公、智能制造、智能家居、醫(yī)療陪護(hù)等領(lǐng)域。
04、主要參數(shù)
OmniHead是具身智能的“傳感中樞",它的誕生讓機(jī)器人真正具備了人的感知與思維模式,為具身智能擺脫遙操提供可靠的技術(shù)支撐。
OmniHead(奧視知腦) | |
高度210mm;頭圍480mm;脖圍220mm | |
重量 | |
自由度 | 2 自由度:轉(zhuǎn)頭土75° 點(diǎn)頭±45° |
通訊接口 | GMSL |
軟件開(kāi)發(fā) | ROS2 SDK |
視場(chǎng)角 FOV | 360° x 90° |
分辨率 | 深度: 720x160;RGB: 1920x3240 |
深度測(cè)距 | 0.1~18m@10% 反射率室內(nèi) |
測(cè)量精度 | 3cm(1σ) |
抗陽(yáng)光干擾能力 | 100KLUX |
幀率 | 20HZ |
輸出數(shù)據(jù)接口 | Serdes |