淘寶聯(lián)盟合作網(wǎng)站api廣告推廣方式
在GDC全球開發(fā)者先鋒大會期間,2月23日,由GDC組委會指導(dǎo)、國家地方共建人形機器人創(chuàng)新中心(以下簡稱“國地中心”)承辦的“人形機器人的開源之路”主題論壇在上海西岸藝術(shù)中心成功舉辦。
在人工智能與機器人技術(shù)飛速發(fā)展的今天,人形機器人和具身智能正成為全球科技領(lǐng)域的新焦點。本次論壇上,大家圍繞人形機器人與具身智能的前沿技術(shù)、開源生態(tài)建設(shè)及產(chǎn)業(yè)融合等核心議題展開深度探討。本文將為您帶來這場論壇的精彩內(nèi)容,分享行業(yè)大咖們的真知灼見,以及對未來的展望與思考。
以下是圓桌討論的內(nèi)容整理:
關(guān)鍵詞一、研究領(lǐng)域介紹
江磊(國地中心首席科學家)
首先感謝大家參與我們的論壇。我相信通過今天的圓桌討論,與在座嘉賓共同探討大家最關(guān)心的課題——開源生態(tài)如何真正解鎖人形機器人與具身智能的未來。接下來,請四位嘉賓簡要介紹各自深耕領(lǐng)域的研究內(nèi)容。首先有請王松總介紹樂聚機器人的探索。
王松(樂聚(蘇州)機器人總經(jīng)理)
謝謝江老師。樂聚成立于2016年,一直專注于人形機器人領(lǐng)域。我們從最早的35厘米、16自由度人形機器人,到65厘米、20自由度人形機器人,再到如今1.7米的全尺寸夸父人形機器人,一路不斷探索與成長。在2022年之前,人形機器人還是一個比較小眾的行業(yè),但如今已經(jīng)受到廣泛關(guān)注。
目前,我們的產(chǎn)品主要面向三個應(yīng)用場景:
第一是科研和展廳,這是我們現(xiàn)階段正在批量交付的人形機器人產(chǎn)品;
第二是工業(yè)領(lǐng)域,今年我們針對工業(yè)分揀和搬運工作,正在開展大量POC(概念驗證)項目;
第三是面向未來,我們正在積累人形機器人的實際數(shù)據(jù)集,用于開源數(shù)據(jù)的訓(xùn)練模型部署,推動本體迭代的飛輪。至于面向家庭的應(yīng)用,可能還需要3到5年的時間來進一步探索。
盧國強(商湯大裝置產(chǎn)品高級總監(jiān))
商湯是一家專注于人工智能的老牌公司,已經(jīng)成立11年。我們的核心業(yè)務(wù)是模型,從早期的機器視覺到如今的大模型。近兩年,大模型迅速崛起,商湯的核心業(yè)務(wù)主要集中在三個方面:大裝置、大模型和應(yīng)用。大裝置是基礎(chǔ)設(shè)施的底座,大模型是大腦應(yīng)用,而應(yīng)用則是將底座和模型的能力拓展到各個行業(yè)。
具身智能是商湯未來兩三年的重點發(fā)展方向,我們目前正重點發(fā)展多模態(tài)大模型。我們堅信多模態(tài)大模型將成為機器人的“大腦”。無論是大模型的訓(xùn)練、數(shù)據(jù)處理還是模型在各個領(lǐng)域的應(yīng)用,我們希望通過與具身智能的結(jié)合,與大家一起拓展數(shù)據(jù)和模型的能力。
王啟斌(北京靈初智能科技CEO)
靈初智能是一家專注于通用靈巧操作的公司,我們以算法驅(qū)動為核心,采用VA模型,并通過強化學習實現(xiàn)雙手雙臂的靈巧操作系統(tǒng)。
聶凱旋(松應(yīng)科技創(chuàng)始人)
松應(yīng)科技打造了國內(nèi)首款具身智能仿真系統(tǒng),主要為機器人提供物理仿真模擬和合成數(shù)據(jù)生成。我們自建了一個包含近百套機器人的仿真訓(xùn)練場,這是一個全虛擬的高清環(huán)境。在這個環(huán)境中,我們提供了多種類型的機器人,包括仿生、雙足、四足以及復(fù)合型機器人的全量仿真訓(xùn)練。仿真系統(tǒng)涵蓋傳感器模擬、物理仿真、熱力學、電磁學等多個領(lǐng)域,不僅包括傳統(tǒng)的剛體和柔體仿真,還增加了許多物理世界中的各種模擬類型,逐漸深入到物理存在的各項指標,為具身智能提供全類型、逼真的訓(xùn)練環(huán)境。
后續(xù),我們將與國創(chuàng)中心深度合作,共同打造更深入的技術(shù)模型和更大規(guī)模的數(shù)據(jù)。
關(guān)鍵詞二、硬件開源
江磊(國地中心首席科學家)
好的,感謝四位企業(yè)家的分享。今天我們有幸邀請到來自人形機器人整機企業(yè)、老牌人工智能企業(yè)、具身智能大模型企業(yè)和國內(nèi)首個具身智能仿真平臺的代表。
國創(chuàng)中心一直致力于推動開源,開源開放已經(jīng)成為當前的重要方向。去年,在WAIC和GDC大會上,大家還在討論閉源與開源的優(yōu)劣。但經(jīng)過DeepSeek在春節(jié)期間的火爆,大家已經(jīng)認識到開源在大模型領(lǐng)域是行之有效的。那么,開源對人形機器人這樣一個軟硬件一體化的新產(chǎn)業(yè)是否依然有效呢?今天我們將圍繞四個問題展開討論:開源硬件是否可行?具身智能是否需要仿真平臺?是否需要社區(qū)支持?以及是否需要其他方面的推動?
首先,我們從開源硬件的角度出發(fā),討論人形機器人的開源硬件對傳感器、執(zhí)行器、控制器的標準化路徑將起到怎樣的促進作用。我們先請聶總分享一下他的看法。
聶凱旋(松應(yīng)科技創(chuàng)始人)
我認為在具身智能領(lǐng)域,開源技術(shù)對行業(yè)的推動是非常有價值且有效的。從歷史上看,許多技術(shù)創(chuàng)新都是由開源驅(qū)動的,大量開發(fā)者基于開源平臺進行學習和訓(xùn)練,進而推動技術(shù)進入商業(yè)生產(chǎn)。
在相關(guān)零部件,尤其是傳感器和上游零部件生態(tài)中,開源可以幫助企業(yè)投入更多資源。因為開發(fā)者的需求和反饋會在平臺上顯現(xiàn),相關(guān)企業(yè)會更深入地考慮機器人的技術(shù)生態(tài)和開發(fā)者用戶群,進而推動技術(shù)的統(tǒng)一和標準化。在標準化的基礎(chǔ)上,更容易實現(xiàn)傳感器或上游供應(yīng)鏈的快速進步和成本大幅下降。我認為開源的作用非常大,甚至比許多商業(yè)公司的單向推動更有效,至少高出一個數(shù)量級。
王啟斌(北京靈初智能科技CEO)
我對硬件開源的態(tài)度相對沒那么樂觀。通常,行業(yè)發(fā)展需要先出現(xiàn)一家獨大的企業(yè)來引領(lǐng),才能實現(xiàn)百花齊放。目前具身智能領(lǐng)域的問題在于,還沒有一家企業(yè)能做出讓用戶覺得體驗極佳的產(chǎn)品,真正引爆市場。所以,硬件開源不是一個“是與否”的問題,而是一個“時機”的問題。在當前這個階段,硬件開源可能類似于當年MIT的開源模式,但工業(yè)界真正需要的是1到2家能夠引領(lǐng)產(chǎn)業(yè)發(fā)展的企業(yè),將產(chǎn)業(yè)推向更高水平。
江磊(國地中心首席科學家)
好的,正好兩位嘉賓的觀點針鋒相對,我們論壇就要有這個話題的高度性,我們再聽聽盧總對于開源硬件的想法與意見。
盧國強(商湯大裝置產(chǎn)品高級總監(jiān))
謝謝主持人。我們雖然不做硬件,但作為硬件的使用者,也有一些深刻的體會。這兩天,我注意到會場門口有一個機器人體驗項目,很多學生和孩子都積極參與。我在一旁觀察時發(fā)現(xiàn),研究員提到控制機器人前進后退的踏板在兩天內(nèi)就損壞了。這件事讓我深刻感受到機器人領(lǐng)域的復(fù)雜性。與我們熟悉的軟件模型不同,機器人涉及硬件、軟件和算法等多個層面。雖然數(shù)據(jù)和訓(xùn)練很重要,但硬件問題同樣關(guān)鍵。研究人員更希望專注于算法和模型這些核心創(chuàng)新,然而基礎(chǔ)硬件問題卻可能讓他們花費大量精力去解決。
因此,我非常期待開源能夠推動硬件產(chǎn)業(yè)更快成熟。這樣,無論是團隊、個人還是企業(yè),都可以專注于自己的核心創(chuàng)新,而不必被硬件問題束縛。這對整個產(chǎn)業(yè)的發(fā)展或許會更好。以上是我的一些個人看法。
江磊(國地中心首席科學家)
好的,接下來聽聽真正做硬件的樂聚如何看待開源硬件這件事。
王松(樂聚(蘇州)機器人總經(jīng)理)
從我們的角度來看,人形機器人是一個從硬件結(jié)構(gòu)設(shè)計、核心控制器到整機應(yīng)用的超長產(chǎn)業(yè)鏈。一家公司顯然無法獨立完成所有環(huán)節(jié)。如果從整機角度出發(fā),開源可能僅在結(jié)構(gòu)或部分軟件層面實現(xiàn),但這并非最終解決方案。正如剛才啟斌總提到的,硬件開源或許并非終極答案。原因在于人形機器人的最優(yōu)構(gòu)型和參數(shù)仍在快速動態(tài)變化中,而且核心零部件如一體化關(guān)節(jié)或驅(qū)動器往往屬于供應(yīng)商的核心技術(shù),難以開源。
然而,開源仍有其積極意義。一方面,人形機器人企業(yè)目前面臨的一大挑戰(zhàn)是人才短缺。國內(nèi)高校尚未普遍開設(shè)相關(guān)專業(yè),機器人工程專業(yè)也是2020年才開始設(shè)立,人才培養(yǎng)和使用的門檻較高。開源可以降低這一門檻,為機器人企業(yè)輸送更多專業(yè)人才。另一方面,對于專注于算法或特定領(lǐng)域的開發(fā)者來說,開源能夠降低進入行業(yè)的門檻,推動技術(shù)創(chuàng)新。
盡管如此,對于整機企業(yè)來說,開源可能仍需持保守態(tài)度。開源一個迷你版或小版本或許是對開源社區(qū)有益的嘗試,但如何平衡開源與核心競爭力的保護,仍是一個值得深入探討的問題。
關(guān)鍵詞三、具身智能大模型
江磊(國地中心首席科學家)
好的,開源硬件的討論確實是一個永恒的話題。國創(chuàng)中心正在考慮開發(fā)人形機器人的開發(fā)板,以推動行業(yè)生態(tài)建設(shè)。當然,開源硬件部分也需要持續(xù)關(guān)注和討論,我們將在開放原子基金會的指導(dǎo)下完成這件事。
第二個問題是關(guān)于具身智能大模型的開源。今年,DeepSeek開源了其語言大模型,引發(fā)了行業(yè)對開源具身智能大模型的思考。同時,Figure AI與OpenAI的“分手”事件也引發(fā)了對開源與自主開發(fā)的討論。Figure AI在與OpenAI合作一年后,選擇終止合作,轉(zhuǎn)而開發(fā)自己的端到端AI模型。這一事件表明,人形機器人企業(yè)需要在開源與自主技術(shù)之間找到平衡,以實現(xiàn)可持續(xù)發(fā)展。
目前,雖然已有模型開源,但仍未完全解決人形機器人的實際問題。今天,我們想討論兩個問題:一是開源的具身智能模型是否有用?二是開源具身智能大模型何時能真正落地?首先請王啟斌王總分享一下他的看法,因為靈初智能是做具身智能大模型的,大家更關(guān)心的是這些模型何時能落地應(yīng)用在機器人上。
王啟斌(北京靈初智能科技CEO)
在人形機器人領(lǐng)域,VOA(具身智能大模型)的技術(shù)架構(gòu)尚未完全收斂,目前存在多種技術(shù)范式。一些方案直接將大模型與傳統(tǒng)運控NPC結(jié)合,比如采用大模型與特定架構(gòu)(如LAM + Division)結(jié)合的方式,還有端到端的解決方案。
從中期來看,人形機器人技術(shù)將遵循大模型的發(fā)展規(guī)律,開源將成為推動生態(tài)建設(shè)的重要力量。然而,短期內(nèi)技術(shù)架構(gòu)尚未收斂,行業(yè)呈現(xiàn)出多種方案并存的局面。以DeepSeek為例,其開源的單模態(tài)模型在推理能力上已取得顯著進展,證明了技術(shù)架構(gòu)的收斂趨勢。但人形機器人技術(shù)的復(fù)雜性在于從大模型端到硬件端的技術(shù)棧極為深厚,一家公司難以獨立完成所有環(huán)節(jié)。
靈初智能作為行業(yè)內(nèi)的新興企業(yè),其策略是利用全球最新的開源模型進行后訓(xùn)練,結(jié)合底層操作層面的數(shù)據(jù),進一步優(yōu)化模型性能。對于江老師的問題,我認為中期一定會有一個開源模型來推動生態(tài)發(fā)展,但短期內(nèi)可能仍沒有主架構(gòu)收斂,呈現(xiàn)出百花齊放的態(tài)勢。
江磊(國地中心首席科學家)
架構(gòu)不收斂也是業(yè)內(nèi)的一個共識,希望能加速收斂。下面請我們盧總講一下怎么看待這個問題。
盧國強(商湯大裝置產(chǎn)品高級總監(jiān))
確實商湯本身是做大模型,尤其是多模態(tài)的,在這方面的話我可能跟啟斌總有點類似的看法,我認為開源是未來一定會有,從過往的發(fā)展來看,開源是真正推動產(chǎn)業(yè)發(fā)展的。
以DeepSeek為例,其開源模型之所以能夠迅速火爆全球,一方面得益于OpenAI的前期鋪墊,另一方面是因為其以更低的成本和開源的方式,為國內(nèi)提供了與OpenAI相媲美的技術(shù)方案。如果沒有OpenAI的前期鋪墊,其實對大家的開源教育的過程可能很漫長,所以其實開源對我們來說,不是說開源本身,而是這個開源它能不能快速的去一統(tǒng)天下,而不是百花齊放。如果市場上存在過多開源大模型,反而可能導(dǎo)致市場分散。其實我們內(nèi)部也在討論開源,如果開源了但在社會上沒有太大的反響,開源可能沒有太大意義。
在產(chǎn)業(yè)起步階段,開源的作用可能并不顯著,但在大規(guī)模拓展和落地階段,開源將成為加速產(chǎn)業(yè)發(fā)展的關(guān)鍵。我認為,未來開源大模型的出現(xiàn)將有助于推動人形機器人產(chǎn)業(yè)的加速落地,但前提是社會對相關(guān)技術(shù)的認知和接受程度需要達到一定高度。
江磊(國地中心首席科學家)
現(xiàn)在DeepSeek讓大家把思路都拉到我們真正進入大模型時代,而我也特別想聽王總關(guān)于開源大模型這樣的一個看法與思路。
王松(樂聚(蘇州)機器人總經(jīng)理)
前兩天Figure的演示讓整個機器人圈都備受振奮。然而,從開源的角度來看,人形機器人面臨的問題可以分為三個層面:首先是本體的運控,包括基本的移動和操作能力;其次是抓取能力或上肢操作能力;最后是對多模態(tài)信息的理解能力,這可能需要更大的參數(shù)量。對于機器人從業(yè)者來說,一個長期困擾的問題是:人形機器人到底能解決現(xiàn)實場景中的哪些問題?現(xiàn)實環(huán)境是動態(tài)且復(fù)雜的,不可能依賴專業(yè)化的編程,因此寄希望于通過模型的方式來解決問題。
盡管樂聚并非專門從事大模型開發(fā),但一直在密切關(guān)注開源大模型的生態(tài)發(fā)展。如果出現(xiàn)合適的思路或方案,也愿意開展合作。從目前的判斷來看,在開放場景下實現(xiàn)人形機器人的大模型可能短期內(nèi)難以實現(xiàn),但在一些專有場景,例如簡單的分解搬運、特定的工業(yè)場景或商戶場景,未來1~2年可能會出現(xiàn)1~2個針對人形機器人的開源大模型的示范標桿案例,證明其可行性和實用性。然而,面向更廣泛的場景,可能仍處于早期的野蠻發(fā)展階段,或許需要再過5年才能實現(xiàn)更廣泛的落地應(yīng)用。
江磊(國地中心首席科學家)
王總提到的其實是一個非常關(guān)鍵的點:具身智能大模型的現(xiàn)狀對機器人產(chǎn)業(yè)來說是不足夠的?,F(xiàn)在,具身智能領(lǐng)域也有另一種觀點,認為目前還沒有一個通用且優(yōu)秀的硬件平臺。在我看來,像我們這樣的開發(fā)者大會,更應(yīng)該關(guān)注如何快速彌補這個差距。
再請聶總從我們仿真平臺角度來研究看待如何看待這件事。
聶凱旋(松應(yīng)科技創(chuàng)始人)
我認為模型是可以開源的,但每家企業(yè)即使開源模型,也會保留自己私有化的數(shù)據(jù)。因為企業(yè)的差異在于所處行業(yè),比如康養(yǎng)、醫(yī)療、家庭服務(wù)、工業(yè),甚至特種行業(yè),每家都有特殊行業(yè)的知識和經(jīng)驗。在這種情況下,大家可以共享開源模型,同時保留特殊行業(yè)的私有化數(shù)據(jù)和知識。這兩者并不沖突。
目前,國內(nèi)幾乎所有做具身大模型的公司都在參考國外的開源架構(gòu),我們從中受益。既然受益于開源,我們在完成訓(xùn)練后提升開源模型的水平,并再次開源,這將進一步推動行業(yè)發(fā)展。在這個過程中,我們自身的行業(yè)數(shù)據(jù)和專屬知識不會受到太大影響,同時也能為行業(yè)做出貢獻。一旦形成這樣的循環(huán),技術(shù)迭代過程中大家都能受益。對行業(yè)、用戶和最終消費者來說,這無疑是巨大的利好。
以我早期做云計算的經(jīng)歷為例,2013—2014年,大家普遍使用開源協(xié)議和社區(qū),如Apache和OpenStack。當時,華為從OpenStack的第一個版本一直跟進到第八個版本,期間我們做了大量技術(shù)研發(fā)和產(chǎn)品能力提升,并反饋給開源社區(qū)。在這個過程中,每家企業(yè)都在豐富自身能力,就像你提供了3個饅頭,別人又給你貢獻了4個甚至6個饅頭回來,大家都是受益者。最終,用戶和消費者是最大的受益方。
基于這種立場,我認為開源是最快實現(xiàn)預(yù)期目標的方式。包括我們自己搭建的仿真訓(xùn)練場,既有自主研發(fā)的部分,也借鑒了一些開源成果。我們從來不會對外宣稱,我們的百萬行代碼都是自己手寫的,因為我們也是開源的受益者。在獲得開源平臺后,我們將訓(xùn)練成果反向開源,包括在OpenLoong社區(qū)和GitHub社區(qū),我們也開源了自己的技術(shù)和模型。
尤其是在技術(shù)尚未收斂的階段,大家共享更多方案和經(jīng)驗,能夠快速形成共識。這個階段更多是共同推動社會、市場和消費者對機器人產(chǎn)業(yè)的信心,而不是進入商業(yè)化競爭。只有當行業(yè)獲得大量關(guān)注、需求和資金支持時,才能真正成為大產(chǎn)業(yè)。我們堅信開源是當前階段的最佳選擇。
由于篇幅過長,后面關(guān)于具身智能仿真平臺的進展與倫理與安全問題的討論放在下篇,各位移步下篇繼續(xù)閱讀~
OpenLoong開源社區(qū)介紹
“OpenLoong”是一個全球領(lǐng)先的綜合性人形機器人開源社區(qū)。社區(qū)秉持著技術(shù)驅(qū)動和開放透明的價值觀,致力于匯聚全球開發(fā)者,共同推動人形機器人產(chǎn)業(yè)的發(fā)展,為全球人形機器人產(chǎn)業(yè)賦能。
我們的使命是通過在機器人本體技術(shù)、平臺軟件、具身智能、具身數(shù)據(jù)集以及上層應(yīng)用等多個方面做出重大貢獻,從而推動整個產(chǎn)業(yè)的進步。
注冊成為 OpenLoong 開源社區(qū)的一員,與機器人研究者和愛好者共同開啟人形機器人探索之旅!
注冊地址:潛龍在源