近日,昆仲天使投資企業(yè)「戴盟機器人」聯(lián)合創(chuàng)始人兼首席科學家王煜受邀出席以“讓AI成為創(chuàng)新生產(chǎn)力”為主題的聯(lián)想Tech World2025創(chuàng)新科技大會。大會上,二百余位產(chǎn)學研各界精英與權威專家匯聚一堂,共同分享具身智能的最新科研成果及實踐經(jīng)驗,積極探索 AI 技術在具身智能領域的創(chuàng)新突破路徑與商業(yè)化落地模式。
圍繞機器人如何獲得豐富的操作能力、機器人如何落地實用場景等問題,王煜教授分享了《具身智能——機器人操作技能與人工智能技術融合》的主題演講。
機器人落地工業(yè)應用場景,關鍵在于靈巧操作能力
王煜教授在演講之初提出:今年或為人形機器人工業(yè)應用元年。他強調,機器人實現(xiàn)工業(yè)場景落地的核心在于突破精細操作與任務泛化能力——一旦機器人掌握靈巧操作技能,其應用場景將廣泛拓展。
以半導體和電子產(chǎn)品的制造場景為例,雖然前端工序已高度自動化,但后端異形零件裝配仍嚴重依賴人工。普通工人經(jīng)短期培訓即可勝任的工作,對機器人卻是巨大的挑戰(zhàn)。王煜教授認為,機器人系統(tǒng)需構建具備認知決策能力的“大腦”與泛化操作能力的“小腦”協(xié)同架構,讓機器人真正擁有靈巧操作的能力。
機器人無法完成簡單任務的背后——論觸覺對于靈巧操作的重要性
王煜教授指出,當前業(yè)界普遍采用視覺-語言-動作(Vision-Language-Action,VLA)大模型來實現(xiàn)機器人操作。在該框架下,視覺模塊(V)使機器人能夠解析環(huán)境場景,語言模塊(L)幫助其理解操作指令,而動作模塊(A)則負責將語義信息轉化為具體的運動、操作執(zhí)行。然而他強調,機器人實現(xiàn)從語言理解到精準動作的執(zhí)行仍面臨挑戰(zhàn)。
他補充,實現(xiàn)機器人的基礎移動功能(Locomotion)相對簡單,而使其完成復雜操作任務(Manipulation)則有難點——這要求機器人必須掌握真正的操作技能與執(zhí)行能力。
人類可以輕松完成擰螺絲、擰瓶蓋等操作,這得益于雙手敏銳的觸覺、力覺反饋和手指形變等感知信息。但對機器人而言,這些看似簡單的動作卻極具挑戰(zhàn)——關鍵在于缺乏觸覺感知。沒有觸覺感知的機器人,不僅操作速度緩慢,更難以完成精細、復雜的任務。
王煜教授介紹,戴盟在開始做人形機器人之初,便將觸覺傳感器確立為最重要的產(chǎn)品開發(fā)。今年4月,戴盟發(fā)布了全球首款多維高分辨率高頻率視觸覺傳感器DM-Tac W。DM-Tac W采用了基于單色光的圖案追蹤原理的技術路線,成功攻克了視觸覺傳感器算力要求高、發(fā)熱量大、耐用性差等難題,顯著降低了生產(chǎn)成本。
DM-Tac W賦予夾爪等執(zhí)行末端類人觸覺能力,已應用于工業(yè)自動化、消費電子、智慧物流等場景。基于此,戴盟還將視觸覺傳感器的厚度開創(chuàng)性地減少到毫米級別,可輕松集成于五指靈巧手等執(zhí)行末端。
業(yè)界共識與趨勢:通過大規(guī)模、高質量數(shù)據(jù)進行機器人模仿學習
王煜教授引用其導師Matthew Mason的觀點指出:機器人操作面臨的根本挑戰(zhàn)在于與真實世界的交互,真實世界既遵循物理規(guī)律,又充滿不確定性——并非所有現(xiàn)象都能被完全理解和預測。若缺乏豐富的感知能力,機器人將難以應對環(huán)境變化,從而影響任務完成度。
今年,戴盟全球首款多維高分辨率高頻率視觸覺傳感器DM-Tac W,已在具身智能領域樹立了技術與產(chǎn)品的雙重標桿,基于前沿的觸覺感知技術,戴盟將持續(xù)挖掘機器人學習方法。
王煜教授分享了行業(yè)最新動態(tài):波士頓動力與英偉達達成戰(zhàn)略合作,共同開發(fā)基于人類行為建模的“大行為模型”(Large Behavior Model)。該技術路線不依賴傳統(tǒng)物理事件模型,采用仿真數(shù)據(jù)建立基礎的模型,通過引入真實數(shù)據(jù)來進行訓練并得到真實可靠的模型,進一步引入操作與人機交互的真實數(shù)據(jù)來提升模型可靠性。
他提到,當前機器人模仿學習主要采用兩種訓練路徑:一是通過仿真環(huán)境生成的數(shù)據(jù)進行訓練,二是通過真實物理世界中機器人操作的數(shù)據(jù)進行訓練。第二種方式需要大規(guī)模、高質量數(shù)據(jù)支撐,低質量數(shù)據(jù)反而會影響學習效果。為此,戴盟推出了穿戴式遙操作系統(tǒng)DM-EXton,專為機器人遠程操控、數(shù)據(jù)采集及學習訓練而設計。
從神經(jīng)科學視角看機器人設計:聚焦于核心功能需求
王煜教授還從神經(jīng)科學的角度分享了他對未來機器人設計的思考。人類大腦皮層的功能分配揭示了操作能力的生物學基礎,通過經(jīng)典的感官腦皮小人(Sensory Homunculus Model)可見,大腦皮層中負責面部和手部功能的區(qū)域占據(jù)了最大比例,這印證了人類的智慧主要服務于精細操作、語言交流和社會互動等需求。
他認為,真正實用的機器人未必會完全仿照人類形態(tài),而是聚焦于核心功能需求。未來的機器人可能會擁有一雙高度發(fā)達的手,憑借強大的感知能力、豐富的靈巧度完成精細、復雜的操作任務,滿足不同落地場景的需求,展現(xiàn)真正的社會價值。