2024年,自動(dòng)駕駛?cè)ψ顭衢T(mén)的話(huà)題一定是端到端和大模型,繼BEV和OCC之后,
再次帶領(lǐng)自動(dòng)駕駛行業(yè)向前進(jìn)化,而另一個(gè)領(lǐng)域也在特斯拉的帶動(dòng)下,開(kāi)始進(jìn)入公眾視野,而且熱度頗有追趕自動(dòng)駕駛的趨勢(shì),它就是具身智能。
具身智能(Embodied Intelligence)指的是機(jī)器通過(guò)與物理環(huán)境的交互來(lái)實(shí)現(xiàn)智能行為的能力。
其核心在于「具身」,即機(jī)器必須具備物理形態(tài),而且對(duì)于物理形態(tài)的類(lèi)型沒(méi)有嚴(yán)格限制,因此工業(yè)機(jī)器人、機(jī)器狗甚至自動(dòng)駕駛汽車(chē)都可以視為具身智能的一種形式。
在當(dāng)前這波具身智能的創(chuàng)業(yè)浪潮中,幾乎所有公司都將人形機(jī)器人視為最終的產(chǎn)品形態(tài),
據(jù)不完全統(tǒng)計(jì),截至2024年11月,國(guó)內(nèi)具身智能領(lǐng)域的投融資事件已超過(guò)60起,總金額突破50億元,其中最大單筆融資金額超過(guò)10億元
隨著資本熱情的高漲,國(guó)內(nèi)的具身智能初創(chuàng)企業(yè)也開(kāi)始加速涌現(xiàn),技術(shù)大咖和天才少年紛紛加入具身智能這一浪潮。
僅在2023年和2024年兩年內(nèi),國(guó)內(nèi)擁有融資記錄的具身智能公司就已超過(guò)20家。
前華為天才少年稚暉君創(chuàng)立的智元機(jī)器人,至今已完成7輪融資,估值超過(guò)70億元;而北大教授王鶴創(chuàng)立的銀河通用機(jī)器人,天使輪融資高達(dá)7億元,創(chuàng)下了行業(yè)新紀(jì)錄。
2024年2月,宇樹(shù)科技完成10億元B+輪融資,宇樹(shù)的機(jī)器人還在前不久登陸了春晚。
此外,許多科技公司也紛紛跨界布局。小米集團(tuán)在2022年推出了首款人形機(jī)器人——CyberOne鐵大;而
盡管機(jī)器人公司的數(shù)量稍遜于中國(guó),但作為全球資本的中心,美國(guó)的融資金額依然處于領(lǐng)先地位。
例如,F(xiàn)igure AI今年完成了6.75億美元的融資,背后支持者包括微軟、英偉達(dá)、OpenAI和亞馬遜等科技巨頭,估值已達(dá)到26億美元。
資本的熱情讓人仿佛回到了2017年,那是自動(dòng)駕駛行業(yè)夢(mèng)想起步的時(shí)刻。全球?qū)I的想象從自動(dòng)駕駛延伸到了具身智能。
當(dāng)特斯拉首次宣布機(jī)器人計(jì)劃時(shí),很多人無(wú)法理解為什么一家汽車(chē)公司要涉足機(jī)器人領(lǐng)域。
把純視覺(jué)的AI算法、自研的芯片和數(shù)據(jù)中心視為特斯拉的核心產(chǎn)品,而將汽車(chē)和機(jī)器人視為承載這些技術(shù)的載體
自動(dòng)駕駛汽車(chē)和具身智能都依賴(lài)傳感器來(lái)感知環(huán)境并理解物理世界,從而做出相應(yīng)的動(dòng)作決策。自動(dòng)駕駛汽車(chē)的算法需要輸出駕駛路徑,而具身智能算法則需指導(dǎo)機(jī)器人在三維空間中完成各種任務(wù)。
例如,圖像語(yǔ)義分割和OCC網(wǎng)絡(luò),這些廣泛應(yīng)用于自動(dòng)駕駛的視覺(jué)算法,同樣適用于機(jī)器人領(lǐng)域。
在規(guī)則算法時(shí)代,自動(dòng)駕駛的駕駛策略依賴(lài)于工程師編寫(xiě)的代碼,系統(tǒng)根據(jù)不同場(chǎng)景做出響應(yīng)。然而,由于應(yīng)用場(chǎng)景的不同,這些代碼很難直接用于具身智能。
通過(guò)不同的數(shù)據(jù)輸入,系統(tǒng)可以完成相應(yīng)任務(wù),二者之間不再存在明顯壁壘,自動(dòng)駕駛領(lǐng)域?qū)Υ竽P偷膬?yōu)化經(jīng)驗(yàn)也能夠順利遷移到具身智能中。
許多自動(dòng)駕駛領(lǐng)域的公司和人才正是看到了這一發(fā)展趨勢(shì),紛紛轉(zhuǎn)向具身智能。
例如,小鵬和小米等科技公司早早就意識(shí)到具身智能的潛力,已經(jīng)推出了自己的相關(guān)產(chǎn)品。
同時(shí),多個(gè)自動(dòng)駕駛領(lǐng)域的技術(shù)專(zhuān)家也紛紛加入了具身智能的創(chuàng)業(yè)隊(duì)伍,其中包括前小米自動(dòng)駕駛技術(shù)產(chǎn)品負(fù)責(zé)人劉方、前地平線(xiàn)軟件副總裁余軼南,以及前華為車(chē)BU自動(dòng)駕駛系統(tǒng)CTO陳亦倫等技術(shù)大拿。
因?yàn)槲覀冎車(chē)囊磺卸紘@人類(lèi)的形態(tài)發(fā)展和演化,只有機(jī)器人以人類(lèi)形態(tài)出現(xiàn),才能像人類(lèi)一樣行動(dòng),應(yīng)對(duì)更廣泛的任務(wù)。
在古希臘和古埃及時(shí)期,就有利用杠桿、滑輪和氣動(dòng)技術(shù)制作的簡(jiǎn)單「自動(dòng)人偶」。
中世紀(jì)和文藝復(fù)興時(shí)期的歐洲,工匠們借助鐘表機(jī)械和彈簧動(dòng)力制作出會(huì)敲鐘、打鼓或揮手的人偶,為早期人形機(jī)器人概念奠定了基礎(chǔ),但這些機(jī)械裝置仍然不算真正的機(jī)器人,因?yàn)樗鼈儾痪邆涓兄妥灾鳑Q策能力。
第二次世界大戰(zhàn)后,隨著計(jì)算機(jī)、電子技術(shù)和控制理論的進(jìn)步,人們開(kāi)始嘗試制造能夠模仿人類(lèi)行為特征的機(jī)械裝置。
1973年,早稻田大學(xué)研發(fā)出「WABOT-1」,這是世界上第一臺(tái)具備腿部運(yùn)動(dòng)功能、以及視覺(jué)和聽(tīng)覺(jué)傳感系統(tǒng)的完整人形機(jī)器人原型。
進(jìn)入80、90年代,越來(lái)越多的科研機(jī)構(gòu)和企業(yè)開(kāi)始投入到人形機(jī)器人的研發(fā)中。
公司自1986年起便開(kāi)始開(kāi)發(fā)系列人形機(jī)器人(E系列),并最終于2000年推出了著名的ASIMO機(jī)器人,具備平穩(wěn)行走、跑步、上下樓梯、識(shí)別人臉和與人互動(dòng)等能力。
進(jìn)入21世紀(jì),隨著機(jī)器學(xué)習(xí)、傳感技術(shù)和材料科學(xué)的飛速發(fā)展,人形機(jī)器人朝著特定應(yīng)用方向演進(jìn),特別是在動(dòng)態(tài)平衡和穩(wěn)定控制方面取得了顯著進(jìn)展。
其中,波士頓動(dòng)力的代表性人形機(jī)器人Atlas,不僅能夠奔跑、跳躍,還能做出空翻等動(dòng)作。在一段時(shí)間內(nèi),波士頓動(dòng)力幾乎成為人形機(jī)器人技術(shù)的代名詞。
盡管這一時(shí)期的機(jī)器人能夠完成許多人類(lèi)的動(dòng)作,但它們并不具備像人類(lèi)一樣的思考能力,只能根據(jù)預(yù)設(shè)程序完成特定任務(wù),適用場(chǎng)景十分有限,同時(shí)成本高昂。因此,人形機(jī)器人長(zhǎng)時(shí)間以來(lái)僅限于科研和特種領(lǐng)域,缺乏可持續(xù)的商業(yè)模式,距離進(jìn)入普通消費(fèi)市場(chǎng)仍遙不可及。
過(guò)去的幾十年,盡管技術(shù)上實(shí)現(xiàn)了讓機(jī)器人動(dòng)起來(lái)像人,但卻未能解決如何讓它們像人類(lèi)一樣思考的問(wèn)題。
ChatGPT的出現(xiàn)讓業(yè)界看到了大模型的潛力,使得機(jī)器能夠像人類(lèi)一樣思考并作出回應(yīng)成為可能。而端到端的概念則激發(fā)了科技界的熱情,端到端+大模型的技術(shù)路線(xiàn)為人形機(jī)器人的未來(lái)發(fā)展指明了方向。
端到端和大模型的出現(xiàn),讓科技界對(duì)具身智能充滿(mǎn)了信心。然而,算法和硬件的研發(fā)都需要巨額資金,雖然資本看到了潛力,但由于迄今為止沒(méi)有一家機(jī)器人公司真正取得成功,因此不敢輕易入局。
2021年,在特斯拉的AI Day上,馬斯克首次公布了機(jī)器人的研發(fā)計(jì)劃,
Tesla Bot采用人形結(jié)構(gòu),身高約5英尺8英寸,體重大約125磅,具備接近人類(lèi)的靈活性,能夠行走、奔跑、彎腰以及搬運(yùn)物體。其目標(biāo)是開(kāi)發(fā)能夠執(zhí)行重復(fù)性、高風(fēng)險(xiǎn)或枯燥任務(wù)的人形機(jī)器人,旨在幫助人類(lèi)減輕體力勞動(dòng),并提供更智能的服務(wù)。
他設(shè)想中的特斯拉機(jī)器人能夠適應(yīng)各種任務(wù)類(lèi)型,并通過(guò)可控的成本最終實(shí)現(xiàn)替代部分人類(lèi)勞動(dòng)的目標(biāo)。然而,盡管如此,這次發(fā)布的信息仍然相對(duì)有限,算法和硬件的細(xì)節(jié)并未披露,連原型機(jī)都是由真人代替,這讓許多人當(dāng)時(shí)對(duì)該項(xiàng)目持懷疑態(tài)度。
到了2022年AI Day,特斯拉不僅公布了大量新信息,首次展示了原型機(jī),還為機(jī)器人正式命名為Optimus。
從這次展示的原型機(jī)來(lái)看,Optimus的整體結(jié)構(gòu)包括一個(gè)中間的計(jì)算單元和電池,配備1顆FSD芯片,電池容量為2.3KWh,整機(jī)有28個(gè)執(zhí)行器,手部設(shè)計(jì)模仿人類(lèi)手的結(jié)構(gòu),擁有11個(gè)自由度。
在傳感器方面,Optimus采用了3顆攝像頭組成的純視覺(jué)系統(tǒng),算法與Autopilot系統(tǒng)共享,使用深度神經(jīng)網(wǎng)絡(luò)為機(jī)器人進(jìn)行重新訓(xùn)練。
發(fā)布會(huì)上,特斯拉重點(diǎn)介紹了自研驅(qū)動(dòng)器,工程師通過(guò)建模和仿真分析機(jī)器人的使用場(chǎng)景,評(píng)估各個(gè)關(guān)節(jié)驅(qū)動(dòng)器的能量效率,并在成本、效率和性能上找到最優(yōu)組合,簡(jiǎn)化驅(qū)動(dòng)器種類(lèi),最終設(shè)計(jì)了6種不同的驅(qū)動(dòng)器,分別應(yīng)用于機(jī)器人的不同部位。
此外,還介紹了機(jī)器人仿真工具、視覺(jué)導(dǎo)航、運(yùn)動(dòng)規(guī)劃和運(yùn)動(dòng)控制等方面的內(nèi)容。
馬斯克強(qiáng)調(diào),Optimus是按照汽車(chē)設(shè)計(jì)的原則進(jìn)行設(shè)計(jì)的,目標(biāo)是打造一種可量產(chǎn)、低成本、高可靠性的機(jī)器人。
過(guò)去,人形機(jī)器人仍停留在實(shí)驗(yàn)室或小規(guī)模制造階段,而特斯拉親自下場(chǎng),從工程角度展示了如何設(shè)計(jì)一款可大規(guī)模量產(chǎn)、成本可控的人形機(jī)器人。
加上特斯拉在自動(dòng)駕駛算法上的積累,業(yè)界對(duì)人形機(jī)器人的未來(lái)有了更加清晰的認(rèn)知。
特斯拉的示范作用激發(fā)了大量資本進(jìn)入機(jī)器人領(lǐng)域,推動(dòng)了國(guó)內(nèi)機(jī)器人產(chǎn)業(yè)的蓬勃發(fā)展,現(xiàn)如今,國(guó)內(nèi)機(jī)器人市場(chǎng)百花齊放。
雖然現(xiàn)在機(jī)器人行業(yè)一片火熱,許多初創(chuàng)公司在成立幾個(gè)月內(nèi)就能展示樣機(jī)視頻,看起來(lái)機(jī)器人似乎變得很簡(jiǎn)單。
如果只是構(gòu)建一個(gè)可以展示的樣品,功能要求不高,能夠做些簡(jiǎn)單的搬箱子演示,機(jī)器人確實(shí)不難。
但如果從一個(gè)需要大規(guī)模量產(chǎn)的消費(fèi)品角度來(lái)看,機(jī)器人仍然面臨許多難題需要克服。
各個(gè)關(guān)鍵部件并未標(biāo)準(zhǔn)化,也沒(méi)有統(tǒng)一的行業(yè)標(biāo)準(zhǔn),這導(dǎo)致當(dāng)前的機(jī)器人生產(chǎn)依賴(lài)大量手工操作,產(chǎn)量和質(zhì)量都無(wú)法得到保障。
要解決這一問(wèn)題,需要從設(shè)計(jì)階段就開(kāi)始思考,采用模塊化的設(shè)計(jì)思路,確保零件符合工業(yè)質(zhì)量標(biāo)準(zhǔn),并從裝配角度優(yōu)化生產(chǎn)線(xiàn)。
特斯拉在這方面已做出示范,按照汽車(chē)設(shè)計(jì)的原則和標(biāo)準(zhǔn)來(lái)設(shè)計(jì)機(jī)器人。特斯拉在汽車(chē)行業(yè)積累的經(jīng)驗(yàn)對(duì)機(jī)器人制造有很大幫助,但對(duì)于缺乏量產(chǎn)經(jīng)驗(yàn)的初創(chuàng)公司來(lái)說(shuō),仍然是一個(gè)巨大的挑戰(zhàn)。
目前購(gòu)買(mǎi)機(jī)器人主要的客戶(hù)仍然是科研機(jī)構(gòu)和政府,實(shí)際商業(yè)場(chǎng)景中的應(yīng)用相對(duì)較少,而價(jià)格是一個(gè)重要原因。
雖然像宇樹(shù)G1這樣的機(jī)器人價(jià)格僅為9.9萬(wàn)元,但其尺寸和功能有限,大部分人形機(jī)器人的價(jià)格仍需數(shù)十萬(wàn)元。
在傳感器方案上,Optimus放棄了昂貴的激光雷達(dá),改用3個(gè)攝像頭,傳感器成本比其他機(jī)器人使用激光雷達(dá)和前后攝像頭的方案低了一半,當(dāng)然,這需要強(qiáng)大的算法支持。在關(guān)鍵部件驅(qū)動(dòng)器和靈巧手方面,特斯拉選擇自研,滿(mǎn)足性能要求的同時(shí),通過(guò)優(yōu)化設(shè)計(jì)來(lái)降低成本。
雖然隨著機(jī)器人產(chǎn)業(yè)鏈的不斷成熟,量產(chǎn)和成本的問(wèn)題會(huì)逐漸得到解決,但對(duì)機(jī)器人而言,
如何讓機(jī)器人像人類(lèi)一樣思考,適應(yīng)人類(lèi)的環(huán)境,完成人類(lèi)的任務(wù),是每一家機(jī)器人公司當(dāng)前必須面對(duì)的難題。
自動(dòng)駕駛行業(yè)從2017年開(kāi)始爆發(fā),經(jīng)歷過(guò)那段時(shí)間的人一定還有印象,大家談?wù)摰氖窃?022年實(shí)現(xiàn)L4級(jí)別的無(wú)人駕駛,對(duì)未來(lái)充滿(mǎn)希望。
8年時(shí)間過(guò)去了,我們距離真正的無(wú)人駕駛依然遙遠(yuǎn),但是換來(lái)了智能輔助駕駛的欣欣向榮。
人形機(jī)器人的熱潮才剛開(kāi)始,也許距離賽博朋克的場(chǎng)景還有一段距離,但是能做家務(wù)的機(jī)器人也許不久就會(huì)出現(xiàn)在你的購(gòu)物車(chē)?yán)铩?a href="http://www.gkcy003.com" target="_blank">必威-官方西漢姆聯(lián)