具身智能:人工智能的下一個浪潮 市場規(guī)模已展望到3萬億?
來源:全景財經(jīng)作者:全小景2023-05-30 20:52
(原標(biāo)題:具身智能:人工智能的下一個浪潮 市場規(guī)模已展望到3萬億?丨黃金眼)

特斯拉人形機器人的高速成長、英偉達創(chuàng)始人半導(dǎo)體大會重點提及、上交大提出實施方案,正讓“具身智能”成為市場資金的焦點。

01、什么是“具身智能”?

具身智能其實是智能科學(xué)的一個基礎(chǔ)問題,是指具有身體體驗的智能。

從認(rèn)知角度看,人類是第一人稱視角的智能,但給機器喂很多數(shù)據(jù)進行學(xué)習(xí),屬于第三人稱的智能,比如給機器很多盒子,并且標(biāo)注這就是盒子,然后機器就會知道這種模式是盒子。但其實,人類是怎么知道這是盒子的?是通過體驗才知道的。

1963年的一個實驗?zāi)芤欢ǔ潭日故緝烧叩膮^(qū)別,圖中的兩只貓,一只貓被綁起來,只能看這個世界,與其連接的另一只貓則可以主動去走。被動的貓是一種旁觀的智能,而主動的貓是具身的智能,實驗的最后,主動體驗的貓學(xué)會了正常行走,但旁觀的貓并沒能獲得行走能力。

資料來源:“機器之心”公眾號

人工智能屬于很多概念的總和,但其中有些概念很難被測量和驗證,例如讓機器理解什么是社會、什么是責(zé)任,雖然能輸出一個表征,但很難檢驗機器是否真正理解這些概念,因此可在一些可驗證、可測量的概念上做出一個閉環(huán),而具身智能剛好是這樣的閉環(huán),是邁向通用智能很好的起點。

近期,英偉達創(chuàng)始人黃仁勛也在ITF World 2023半導(dǎo)體大會上表示,AI下一個浪潮將是“具身智能”,其描述的“具身人工智能”是能夠理解、推理并與物理世界互動的智能系統(tǒng),包括機器人技術(shù)、自動駕駛汽車,甚至是聊天機器人,它們會更聰明,因為它們能了解物理世界。

02、“具身智能”離我們有多遠?

早在1950年,圖靈首次提出具身智能的概念。在此后幾十年里,具身智能作為很重要的概念,但并沒有取得很大的進展,因為當(dāng)時的技術(shù)還不足以支撐其發(fā)展。

到了今天,多學(xué)科的技術(shù)已經(jīng)改變了這一局面。當(dāng)前各路大模型百花齊放,計算機視覺、計算機圖形學(xué)、自然語言、認(rèn)知科學(xué)等技術(shù)成熟,將推動具身智能進入快速發(fā)展階段。

不斷高速發(fā)展的AI大模型,有望突破局限,讓機器人生“智”。

機器人的大模型包含LLM(大語言模型)、VLM(視覺-語言模型)、VNM(視覺導(dǎo)航模型)。機器人的“大腦”AI域不局限于ChatGPT運用的語言大模型,谷歌在LM-Nav的研究中提到,LLM+VLM+VNM三個模型相互結(jié)合,從自然語言(冗余口語化描述)到文本(地標(biāo)的字符串)到圖像(根據(jù)文本找圖像中的物體),能夠最終生成機器人的路徑規(guī)劃。以此行為模式為基礎(chǔ),機器人能進行人機互動,同時實現(xiàn)一定程度的“隨機應(yīng)變”。

不久前,上海交通大學(xué)盧策吾教授在機器之心AI科技年會上發(fā)表主題演講《具身智能》,提出PIE方案,認(rèn)為具身智能包括3個模塊:具身感知(Perception)、具身想象(Imagination)和具身執(zhí)行(Execution),有望加速推動具身智能落地。

目前看來,AI+機器人或許正是“具身智能”當(dāng)前的落點。

由于具身智能相較于非智能普通人形機器人有更高的工作效率,其具備的理解力、交互力、規(guī)劃能力等,在機器人進入千行百業(yè)后,擁有極強的落地實用性。同時其能夠用自然語言控制的特性,是未來規(guī)?;瘏f(xié)助普通工作人員的必要條件。

因此,未來可關(guān)注目前可用大模型進行改造的硬件機器人類型及應(yīng)用場景,例如對話為主的服務(wù)機器人、工業(yè)機器人、復(fù)雜場景下的人形機器人等領(lǐng)域。

諸多大廠已在具身智能領(lǐng)域進行布局,谷歌發(fā)布史上最大通才模型PaLM-E;微軟探索如何將ChatGPT擴展到機器人領(lǐng)域;阿里巴巴-千問大模型正在實驗接入工業(yè)機器人等。

其中特斯拉人形機器人Optimus讓人眼前一亮。

自去年10月特斯拉人形機器人Optimus首次亮相無法自主行走需要人攙扶,5月17日,特斯拉股東大會展示視頻中Optimus已經(jīng)可以在車間靈活行走、抓取物體,已經(jīng)擁有環(huán)境探索與記憶、電機轉(zhuǎn)矩控制能力、基于人類跟蹤運動的AI訓(xùn)練以及物體操縱能力,且已打通了FSD底層模塊,實現(xiàn)了一定程度的算法復(fù)用。

Tesla Bot邊走路邊識別并記憶周邊環(huán)境資料來源:計算機視覺聯(lián)盟

FSD算法指的是其全自動駕駛(Full Self-Driving)系統(tǒng)所采用的算法,采用它是為了實現(xiàn)車輛的自主導(dǎo)航和自動駕駛功能,讓車輛能夠在各種交通環(huán)境下進行感知、決策和控制。其主要依賴于神經(jīng)網(wǎng)絡(luò)和計算機視覺技術(shù),核心是神經(jīng)網(wǎng)絡(luò)模型:通過對實時傳感器(如相機、激光雷達等)獲取的數(shù)據(jù)進行處理和分析,并從中提取有關(guān)道路、車輛、行人和障礙物等信息,可以實現(xiàn)車輛的環(huán)境感知和物體識別。

加上之前OpenAI投資挪威人形機器人公司1X,以及三花智控與綠的諧波在墨西哥合資設(shè)立諧波減速器公司,AI+機器人已經(jīng)讓人看到產(chǎn)業(yè)爆發(fā)的跡象。

03、市場規(guī)模有多大?

短期看來,由于技術(shù)不成熟,人形機器人在B端難有明晰應(yīng)用場景,且未量產(chǎn)的價格對C端用戶恐較難接受,所以市場集中在特定消費人群當(dāng)中。

首先,ASIMO、Atlas、Tesla、小米、優(yōu)必選發(fā)布的機器人側(cè)重于其運動能力,對其手眼協(xié)同執(zhí)行生產(chǎn)任務(wù)的能力未過多描述,這意味著短期內(nèi)其難以走入工廠大規(guī)模補充勞動力。從技術(shù)看,當(dāng)前人形機器人還只能基于固定規(guī)則運動,即使投入生產(chǎn)性工作,亦只能局限在有限動作與場景,而這又與對人形機器人“跨場景靈活工作”的期望相悖,尚待控制算法的進一步成熟。

其次,當(dāng)前人形機器人服務(wù)能力主要體現(xiàn)在講解引導(dǎo)、表演方面,還無法較好地完成家務(wù),在家庭場景其與智能音箱的功能更為相似,再加之價格較高,C端用戶在短期內(nèi)可能不會大量接受。

雖實用功能不夠豐富,發(fā)布初期仍可能吸引科技發(fā)燒友、可支配收入充裕的高端消費者進行購買,此時人形機器人滿足的是用戶的科研、嘗鮮、炫耀需求。

前期Tesla Bot價格或定在50萬元左右,與之相應(yīng)的消費人群與當(dāng)前豪華車、超豪華車的購買者重合度較高。不過考慮到人形機器人購買后實用性較弱且難以攜帶外出展示,故在高收入人群中的滲透率或?qū)@著低于汽車。

機構(gòu)預(yù)計2025-2027年,TeslaBot在豪華車購買者中的滲透率將分別為1%、2%、3%,在超豪華車購買者中的滲透率將分別為6%、7%、8%,帶來的市場規(guī)模分別為520.5、1,022.0、1,523.5億元

資料來源:東吳證券研究所

之后隨著技術(shù)的完善,會逐步助力機器人填補制造業(yè)用工缺口。

此階段機器人的運動控制能力、續(xù)航持久性得到提升,得以發(fā)揮優(yōu)勢,承接制造業(yè)中跨場景的工作。據(jù)《制造業(yè)人才發(fā)展規(guī)劃指南》,至2025年我國制造業(yè)將有3,000萬的人才缺口,占全球缺口的主要份額。

假設(shè)人形機器人售價為37萬元,且2026-2030年在制造領(lǐng)域人形機器人對人工的新增滲透率相同。預(yù)計人形機器人對人工的累計替代率分別為9%、11%時,2030年新增滲透率分別為1.8%、2.2%,創(chuàng)造的市場規(guī)模分別為1,998、2,442億元.

再伴隨綜合服務(wù)、情感交互能力的完善,人形機器人或許會在家庭場景的滲透率開始提升。

此時人形機器人或可完成多種較復(fù)雜的家務(wù),實用能力得以提升,加上價格下降的因素,此時不局限于高端消費者,有更多家庭愿意在家中添置人形機器人。以此階段機器人價格為25萬元為前提,機構(gòu)預(yù)測在較悲觀、中性、較樂觀的三種情境下,家庭場景創(chuàng)造的市場規(guī)?;蛟S能分別達到1.47萬、1.88萬、2.3萬億元,加上工業(yè)、商業(yè)服務(wù)場景總合市場規(guī)?;?qū)⒎謩e達到1.9萬、2.55萬、3.16萬億元。

之后受益于AI技術(shù)發(fā)展,人機交互進一步提升,能承擔(dān)陪伴、照顧人的功能,還可能在有孩子與老人的家庭中滲透率進一步提升。

資料來源:東吳證券研究所

04、產(chǎn)業(yè)鏈相關(guān)企業(yè)有哪些?

參考工業(yè)機器人,AI+人形機器人本質(zhì)上也是“硬件+軟件”的組合,雖然特斯拉等企業(yè)會有一定領(lǐng)先優(yōu)勢,但硬件通常也會外購。

機器人產(chǎn)業(yè)鏈由零部件廠商、機器人本體廠商、系統(tǒng)集成商、終端用戶四個環(huán)節(jié)組成,本體廠商處于核心地位。工業(yè)機器人的軟件部分涉及到機器人的控制以及對下游工藝的理解,需要做到可復(fù)制的同時滿足不同客戶的需求,這是本體廠商的核心競爭力。而硬件的生產(chǎn)需要規(guī)模效應(yīng),通常采用外購的方式。

目前看來,機器人產(chǎn)業(yè)鏈相關(guān)企業(yè)有執(zhí)行器總成相關(guān)的三花智控;旋轉(zhuǎn)執(zhí)行器-諧波減速器相關(guān)的綠的諧波、豐立智能、漢宇集團、國茂股份,RV減速器相關(guān)的雙環(huán)傳動、秦川機床、中大力德;直線執(zhí)行器-力矩電機相關(guān)的步科股份,滾珠絲杠相關(guān)的鼎智科技、秦川機床;指關(guān)節(jié)微型電機-空心杯電機相關(guān)的鳴志電器、鼎智科技、江蘇雷利;環(huán)境探索-機器視覺相關(guān)的奧普特、凌云光。

資料來源:東吳證券研究所繪制

其中三花智控是全球領(lǐng)先的生產(chǎn)和研發(fā)制冷空調(diào)控件元件和零部件的廠商,也是特斯拉汽車熱管理系統(tǒng)核心供應(yīng)商,且已布局機器人產(chǎn)業(yè)。2023年4月,擬與綠的諧波在三花墨西哥工業(yè)園設(shè)立一家合資企業(yè),主營業(yè)務(wù)為諧波減速器相關(guān)產(chǎn)品的研發(fā)、生產(chǎn)制造及銷售。

綠的諧波則從事精密傳動裝置研發(fā)、設(shè)計和生產(chǎn),業(yè)務(wù)聚焦諧波減速器、機電一體化產(chǎn)品、工業(yè)自動化等產(chǎn)品。諧波減速器是機器人核心零部件之一,公司已打破了國際品牌在機器人用諧波減速器領(lǐng)域的壟斷,實現(xiàn)批量出口。

鳴志電器主營業(yè)務(wù)為控制電機及其驅(qū)動系統(tǒng),控制電機是核心工業(yè)裝備,公司曾打破日本壟斷,是十年之內(nèi)唯一改變HB(混合式)步進電機全球競爭格局的國內(nèi)企業(yè)。其子公司安浦鳴志,瑞士Tmotion,鳴志派博思深度布局異動機器人行業(yè)。

同時,還有專注于計算機視覺領(lǐng)域,為行業(yè)提供算法授權(quán)及系統(tǒng)解決方案,在全球范圍內(nèi)為智能終端機智能駕駛提供視覺算法產(chǎn)品線的虹軟科技,以機器視覺、人工智能和導(dǎo)航控制為核心的智能物聯(lián)網(wǎng)龍頭??低?,以及視頻物聯(lián)網(wǎng)頭部玩家的大華股份,都是機器視覺相關(guān)受益企業(yè)。

此外,還有中科創(chuàng)達、商湯科技、云從科技、科大訊飛在內(nèi)的大模型相關(guān)受益類企業(yè)。

責(zé)任編輯: 高蕊琦
聲明:證券時報力求信息真實、準(zhǔn)確,文章提及內(nèi)容僅供參考,不構(gòu)成實質(zhì)性投資建議,據(jù)此操作風(fēng)險自擔(dān)
下載“證券時報”官方APP,或關(guān)注官方微信公眾號,即可隨時了解股市動態(tài),洞察政策信息,把握財富機會。
網(wǎng)友評論
登錄后可以發(fā)言
發(fā)送
網(wǎng)友評論僅供其表達個人看法,并不表明證券時報立場
暫無評論
為你推薦
時報熱榜
換一換
    熱點視頻
    換一換