信息技術(shù)-人工智能行業(yè)動(dòng)態(tài)：多模態(tài)大模型首次實(shí)現(xiàn)像素級(jí)推理UniPixel發(fā)布

上傳人：策*** IP屬地：河北上傳時(shí)間：2025-10-23 格式：DOCX 頁(yè)數(shù)：28 大?。?97.40KB 積分：19.9 舉報(bào) 版權(quán)申訴

信息技術(shù)-人工智能行業(yè)動(dòng)態(tài)：多模態(tài)大模型首次實(shí)現(xiàn)像素級(jí)推理UniPixel發(fā)布_第2頁(yè)

信息技術(shù)-人工智能行業(yè)動(dòng)態(tài)：多模態(tài)大模型首次實(shí)現(xiàn)像素級(jí)推理UniPixel發(fā)布_第3頁(yè)

信息技術(shù)-人工智能行業(yè)動(dòng)態(tài)：多模態(tài)大模型首次實(shí)現(xiàn)像素級(jí)推理UniPixel發(fā)布_第4頁(yè)

信息技術(shù)-人工智能行業(yè)動(dòng)態(tài)：多模態(tài)大模型首次實(shí)現(xiàn)像素級(jí)推理UniPixel發(fā)布_第5頁(yè)

已閱讀5頁(yè)，還剩23頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

證券研究報(bào)告·行業(yè)動(dòng)態(tài)人工智能多模態(tài)大模型首次實(shí)現(xiàn)像素級(jí)推人工智能維持維持強(qiáng)于大市于芳博辛俠平市場(chǎng)表現(xiàn)-7%相關(guān)研究報(bào)告核心觀點(diǎn)UniPixel是香港理工大學(xué)與騰訊PCGARC實(shí)驗(yàn)室聯(lián)合研發(fā)的多模態(tài)AI模型，該模型首次實(shí)現(xiàn)視頻理解、像素級(jí)分割與區(qū)域推理的統(tǒng)一，支持點(diǎn)、框、掩碼三類視覺(jué)提示交互，核心創(chuàng)新在于“對(duì)象記憶銀行”機(jī)制，可動(dòng)態(tài)存儲(chǔ)目標(biāo)時(shí)空特征，實(shí)現(xiàn)多輪對(duì)話的上下文感知。基于Qwen2.5-VL構(gòu)建，通過(guò)多模態(tài)提示編碼器、SAM2.1掩碼解碼器及三階段漸進(jìn)訓(xùn)練，3B參數(shù)版本在ReVOS、MeViS等10個(gè)基準(zhǔn)測(cè)試中刷新SOTA，性能超越72B傳統(tǒng)模型。該模型已開(kāi)源，在醫(yī)療影像分析、教育可視化、內(nèi)容創(chuàng)作等領(lǐng)域具實(shí)用價(jià)值，推動(dòng)多模態(tài)AI從“全局通感”邁核心觀點(diǎn)產(chǎn)業(yè)要聞【滲透率已達(dá)63%！預(yù)計(jì)2030年L2智能輔助駕駛在我國(guó)將成標(biāo)配L3/L4也快來(lái)了】【科大訊飛同傳大模型再升級(jí)：上海、迪拜同發(fā)訊飛AI翻譯耳機(jī)】【馬斯克挖角NVIDIA兩員大將！xAI研發(fā)“世界模型”用于游戲及機(jī)器人】風(fēng)險(xiǎn)提示：北美經(jīng)濟(jì)衰退預(yù)期逐步增強(qiáng)，宏觀環(huán)境存在較大的不確定性，國(guó)際環(huán)境變化影響供應(yīng)鏈及海外拓展；芯片緊缺可能影響相關(guān)公司的正常生產(chǎn)和交付，公司出貨不及預(yù)期；公司生產(chǎn)和交付延期，導(dǎo)致收入及增速不及預(yù)期；信息化和數(shù)字化方面的需求和資本開(kāi)支不及預(yù)期；市場(chǎng)競(jìng)爭(zhēng)加劇，導(dǎo)致毛利率快速下滑；主要原材料價(jià)格上漲，導(dǎo)致毛利率不及預(yù)期；匯率波動(dòng)影響外向型企業(yè)的匯兌收益與毛利率；人工智能技術(shù)進(jìn)步不及預(yù)期；汽車與工業(yè)智能化進(jìn)展不及預(yù)期。人工智能行業(yè)動(dòng)態(tài)報(bào)告一、行業(yè)變化 1二、行情回顧 3三、產(chǎn)業(yè)要聞 6大模型 6機(jī)器人 7智能駕駛 8四、重要公告 8五、風(fēng)險(xiǎn)提示 9圖表目錄 1 1 2 3 3 3圖表7：人工智能行業(yè)一周重要公告..............................................................................................8人工智能行業(yè)動(dòng)態(tài)報(bào)告一、行業(yè)變化來(lái)自香港理工大學(xué)和騰訊ARCLab的研究團(tuán)隊(duì)提出了首個(gè)統(tǒng)一的像素級(jí)多模態(tài)大模型——UniPixel。只需UniPixel一個(gè)模型，就能完成目標(biāo)指代（Referring）、像素級(jí)分割（Segmentation）與區(qū)域推理（Reasoning）三大任務(wù)，兼具靈活性、精確性與可擴(kuò)展性。該模型首次實(shí)現(xiàn)了視頻理解與精確物體標(biāo)注的統(tǒng)一，通過(guò)創(chuàng)新的對(duì)象記憶機(jī)制和多模態(tài)提示編碼，支持用戶通過(guò)點(diǎn)擊、框選等自然交互方式獲取細(xì)粒度視覺(jué)信息，并生成時(shí)空對(duì)齊的分割掩碼與語(yǔ)言回答。圖表1：現(xiàn)有模型與UniPixel的范式對(duì)比UniPixel基于Qwen2.5-VL模型構(gòu)建，支持圖像與視頻輸入，并整合三大核心模塊實(shí)現(xiàn)端到端多任務(wù)處理：多模態(tài)提示編碼器支持點(diǎn)、框、掩碼三種視覺(jué)提示的統(tǒng)一編碼，將空間坐標(biāo)、時(shí)間位置及提示類型融合為高維向量，并與視覺(jué)Token對(duì)齊。例如，用戶在視頻第5秒點(diǎn)擊某物體，系統(tǒng)可自動(dòng)解析該點(diǎn)的時(shí)空信息并生成特征向量。對(duì)象記憶機(jī)制（ObjectMemoryBank）動(dòng)態(tài)存儲(chǔ)用戶指定的目標(biāo)區(qū)域，通過(guò)“記憶預(yù)填充”和“記憶注入”機(jī)制實(shí)現(xiàn)多輪交互中的上下文感知。當(dāng)用戶首次框選目標(biāo)時(shí)，系統(tǒng)生成唯一標(biāo)識(shí)符并記錄其時(shí)空特征；后續(xù)對(duì)話中只需引用該標(biāo)識(shí)符，即可快速激活對(duì)應(yīng)區(qū)域的特征進(jìn)行推理。SAM2.1掩碼解碼器采用SegmentAnythingModel2.1作為底層分割工具，結(jié)合時(shí)空信息生成高精度掩碼。在視頻場(chǎng)景中，該模塊可自動(dòng)處理物體運(yùn)動(dòng)與變形，確保多幀標(biāo)注的一致性。1人工智能行業(yè)動(dòng)態(tài)報(bào)告為實(shí)現(xiàn)最大程度的自由交互，UniPixel設(shè)計(jì)了PromptEncoder模塊對(duì)三類視覺(jué)提示進(jìn)行統(tǒng)一編碼。無(wú)論是點(diǎn)、框，還是掩碼，均可被統(tǒng)一編碼為同一空間中的高維向量。這一編碼方式融合了空間坐標(biāo)、時(shí)間位置、提示類型等信息，并借助編碼投影層與視覺(jué)Token進(jìn)行對(duì)齊。在訓(xùn)練流程上，UniPixel采用了模塊化、分階段的訓(xùn)練策略?；A(chǔ)階段：通過(guò)85萬(wàn)區(qū)域描述數(shù)據(jù)學(xué)習(xí)視覺(jué)提示理解，如點(diǎn)擊與物體的對(duì)應(yīng)關(guān)系；協(xié)同階段：利用8.7萬(wàn)指代表達(dá)分割數(shù)據(jù)訓(xùn)練語(yǔ)言與分割的對(duì)齊；綜合階段：在多任務(wù)數(shù)據(jù)上聯(lián)合優(yōu)化，涵蓋物體指代、視頻問(wèn)答等復(fù)雜場(chǎng)景。這些數(shù)據(jù)為模型提供了統(tǒng)一、多樣的訓(xùn)練環(huán)境，提升了其在不同任務(wù)設(shè)置下的適應(yīng)能力。僅3B參數(shù)的UniPixel-3B在多項(xiàng)任務(wù)中超越72B傳統(tǒng)模型，基準(zhǔn)測(cè)試全面領(lǐng)先。分割任務(wù)：在ReVOS（62.1J&F）、MeViS（68.3J&F）等數(shù)據(jù)集上超越現(xiàn)有模型，尤其在視頻動(dòng)態(tài)物體分割中優(yōu)勢(shì)顯著。指代理解：在Ref-YouTube-VOS（73.5J&F）、RefCOCOg（85.2%準(zhǔn)確率）等任務(wù)中表現(xiàn)最優(yōu)。綜合推理：在新提出的PixelQA任務(wù)中，UniPixel-3B以58.7%的準(zhǔn)確率超越72B模型（41.2%展現(xiàn)出跨模態(tài)推理的深度整合能2人工智能行業(yè)動(dòng)態(tài)報(bào)告圖表4：中證人工智能指數(shù)、上證指數(shù)、滬深300(-14.41%)、晶晨股份(-113.36%)、歌爾股份(-13.02%)、樂(lè)鑫科技(- 金山辦公圖表5：金山辦公圖表6：人工智能（中證）個(gè)股周漲幅后十名（%）虹軟科技股票代碼公司名稱行業(yè)單位202320242025202320242025E本周月初至今年初至今NVDA.O英偉達(dá)(NVIDIA)GPU億美元43.7297.60.01019.3149.6#DIV/0!0.0%-1.8%36.5%AMD.O超威半導(dǎo)體(AMD)GPU億美元8.516.441.4442.9230.591.48.5%44.1%93.0%688041海光信息GPU億元12.619.331.7420.0274.7167.6-5.5%-5.5%-9.6%-9.6%52.6%52.6%3人工智能行業(yè)動(dòng)態(tài)報(bào)告688107688256QCOM.O3004586038936880990020362382.HK603501300691603197688048688167300620603297002273002222688127安路科技寒武紀(jì)-U高通(QUALCOMM)全志科技瑞芯微晶晨股份聯(lián)創(chuàng)電子舜宇光學(xué)科技豪威集團(tuán)聯(lián)合光電保隆科技長(zhǎng)光華芯炬光科技光庫(kù)科技永新光學(xué)水晶光電福晶科技藍(lán)特光學(xué)FPGAASICSoCSoCSoCSoC汽車攝像頭汽車攝像頭CIS毫米波雷達(dá)毫米波雷達(dá)激光雷達(dá)激光雷達(dá)激光雷達(dá)激光雷達(dá)激光雷達(dá)激光雷達(dá)激光雷達(dá)億元億元億美元億元億元億元億元億元億元億元億元億元億元億元億元億元億元億元(2.0)(8.5)5.0(9.9)11.0(0.9)6.02.11.8(2.1)(4.5)8.2(5.5)27.0(1.0)(1.7)#####3.510.610.81.636.044.70.02.8(55.8)(615.2)24.41664.7573.478.7(10.6)75.9276.371.621.7(122.1)140.0437.747.454.698.564.0(53.6)(1153.9)17.4229.2130.047.7(19.1)30.946.2119.327.2(112.6)(72.5)389.753.531.894.152.2(58.3)252.616.1109.572.736.365.823.234.4#DIV/0!18.5349.3(5852.8)221.539.926.574.533.5--9.0%-7.2%-9.0%15.0%0.0%-5.8%6.4%-1.7%--3.9%89.6%8.2%56.1%10.6%-10.8%-13.4%-8.0%-9.9%-67.9%18.5%-35.5%16.3%-6.4%12.1%-11.7%15.8%-10.3%-9.6%-10.8%-7.3%-6.9%-2.4%-10.8%-12.8%-11.4%-14.3%-15.8%-10.3%-13.7%-15.9%-7.6%-11.8%-10.6%-10.9%-11.9%-12.0%22.1%12.9%3.4%63.4%121.5116.08.4%7.5%35.6%6.2%4人工智能行業(yè)動(dòng)態(tài)報(bào)告6887870024156883270020.HK6882076880030029200029066883266006990285.HK300496301221688088002405002373300552688777海天瑞聲?？低曉茝目萍?UW商湯-W格靈深瞳天準(zhǔn)科技德賽西威華陽(yáng)集團(tuán)經(jīng)緯恒潤(rùn)-W均勝電子比亞迪電子中科創(chuàng)達(dá)光庭信息虹軟科技四維圖新千方科技萬(wàn)集科技中控技術(shù)數(shù)據(jù)服務(wù)計(jì)算機(jī)視覺(jué)計(jì)算機(jī)視覺(jué)計(jì)算機(jī)視覺(jué)計(jì)算機(jī)視覺(jué)計(jì)算機(jī)視覺(jué)Tier1Tier1Tier1Tier1Tier1汽車軟件汽車軟件汽車軟件汽車軟件智慧交通智慧交通智慧工業(yè)億元億元億元億元億元億元億元億元億元億元億元億元億元億元億元億元億元億元(0.3)141.1(6.4)(64.4)(0.9)(2.2)10.840.44.7(0.2)0.9(13.1)5.4(3.9)11.00.1119.8(7.0)(42.8)(2.1)1.220.06.5(5.5)9.61.8(10.9)(11.9)(3.9)11.20.2##########0.01.827.08.80.015.312.1(220.8)21.5(23.6)(14.1)(42.5)45.844.834.3(63.4)37.621.065.4(315.7)221.3(17.3)31.0(13.6)37.9591.925.3(21.8)(21.2)(18.2)79.134.624.5(25.0)42.419.974.8163.7110.8(20.7)(14.1)(13.6)37.4269.022.3(34.9)(34.1)#DIV/0!55.625.718.03343.026.617.059.5#DIV/0!80.0(52.8)43.0#DIV/0!34.4--6.3%13.3%-6.3%13.8%-2.5%-11.5%-11.3%-8.5%-9.2%6.1%11.7%-20.7%15.6%-57.7%18.7%-4.1%14.4%-18.7%12.5%---14.8%10.7%-7.5%10.7%-7.5%-0.4%10.2%36.6%13.3%14.3%89.0%10.5%16.1%-8.9%-8.7%-8.5%11.3%10.5%14.7%1.4%-1.5%9.0%27.8%14.5%17.7%-0.2%0.1%-0.8%-8.0%-7.6%4.9%-8.3%12.3%28.4%-9.2%-4.2%7.9%5人工智能行業(yè)動(dòng)態(tài)報(bào)告000682301269301095東方電子華大九天廣立微智慧億元工業(yè)智慧億元工業(yè)智慧億元工業(yè)28.822.818.52.01.12.0336.4616.8332.0118.6190.3117.9-8.1%-8.1%-3.2%9.5%1.6%-2.0%2.4%47.2%10.7%14.4%大模型【火山引擎：豆包大模型日均tokens使用量突破30萬(wàn)億】據(jù)媒體報(bào)道，今日在FORCELINKAI創(chuàng)新巡展武漢站上，字節(jié)跳動(dòng)旗下火山引擎披露最新大模型token調(diào)用數(shù)據(jù)?；鹕揭婵偛米T待現(xiàn)場(chǎng)表示，豆包大模型使用量從2024年5月1200億tokens增長(zhǎng)253倍至今年9月的超30萬(wàn)億tokens?，F(xiàn)場(chǎng)，火山引擎還發(fā)布了豆包大模型的系列更新，包括豆包大模型1.6原生支持多種思考長(zhǎng)度，并推出了豆包大模型1.6lite、豆包語(yǔ)音合成模型2.0、豆包聲音復(fù)刻模型2.0等全新模型?；鹕揭婵偛米T待指出，全球AI大模型正在三個(gè)方向上快速發(fā)展：一是深度思考模型正與多模態(tài)理解能力融合，二是視頻、圖像、語(yǔ)音模型逐步實(shí)現(xiàn)生產(chǎn)級(jí)水平，三是企業(yè)級(jí)復(fù)雜Agent正在走向成熟，為企業(yè)激發(fā)新的生產(chǎn)力潛能。（快科技）【科大訊飛同傳大模型再升級(jí)：上海、迪拜同發(fā)訊飛AI翻譯耳機(jī)】科大訊飛在上海世界會(huì)客廳舉行“對(duì)話世界，溝通無(wú)限——AI同傳技術(shù)升級(jí)暨翻譯耳機(jī)新品發(fā)布會(huì)”，并同步聯(lián)動(dòng)迪拜GitexGlobal科技盛會(huì)，向全球展示中國(guó)AI翻譯技術(shù)的最新突破。發(fā)布會(huì)上，科大訊飛展示了AI同傳技術(shù)的第三次重大升級(jí)，同時(shí)發(fā)布AI翻譯耳機(jī)，訊飛雙屏翻譯機(jī)2.0也迎來(lái)功能與應(yīng)用場(chǎng)景的全面升級(jí)。此次技術(shù)升級(jí)的亮點(diǎn)集中在中英同傳效果的持續(xù)領(lǐng)跑。新一代技術(shù)將翻譯的主觀體驗(yàn)提升至4.6分（滿分5分有效消除了傳統(tǒng)機(jī)器翻譯的“碎片化”和“機(jī)械感”。其首字響應(yīng)時(shí)間低至2秒，真正實(shí)現(xiàn)了“實(shí)時(shí)同步”的極致體驗(yàn)。專業(yè)化能力的提升同樣令人矚目，通過(guò)將專業(yè)詞庫(kù)擴(kuò)充至10萬(wàn)+，新模型成功攻克了醫(yī)療、金融、法律等高壁壘行業(yè)的翻譯難題。此外，語(yǔ)音播報(bào)的自然度與擬人度也實(shí)現(xiàn)大幅提升。更具創(chuàng)新性的是中英同傳新增"聲音復(fù)刻"功能，用戶僅需一句話的語(yǔ)音樣本，便可用自己的聲音播報(bào)翻譯結(jié)果。在戰(zhàn)略布局上，科大訊飛宣布新增中英到阿拉伯語(yǔ)、西班牙語(yǔ)的同傳互譯功能。（快科技）【vivo智能助手“藍(lán)心小V”再升級(jí)豆包大模型讓AI原生體驗(yàn)拉滿】近期，vivo全新發(fā)布的originOS6操作系統(tǒng)，集成私人助手“藍(lán)心小V”全新升級(jí)，在藍(lán)心大模型和豆包大模型的協(xié)同支持下，為用戶帶來(lái)更專屬、更智能的AI原生體驗(yàn)。作為AI手機(jī)領(lǐng)域先行者，vivo率先提出“AI原生操作系統(tǒng)”戰(zhàn)略，以藍(lán)心大模型打造系統(tǒng)級(jí)AI應(yīng)用。這一次，vivo進(jìn)一步發(fā)布了“2025藍(lán)心智能戰(zhàn)略”，并攜手火山引擎，為“藍(lán)心小V”打造出完整高效的AI協(xié)同體系。當(dāng)藍(lán)心大模型精準(zhǔn)識(shí)別用戶意圖后，會(huì)將用戶需求分發(fā)給豆包大模型和火山引擎聯(lián)網(wǎng)問(wèn)答Agent，基于聯(lián)網(wǎng)問(wèn)答、視覺(jué)理解、音頻生成等多模態(tài)能力，讓“藍(lán)心小V”既能讀懂用戶的深層需求，也能更智能、更多樣化的響應(yīng)和回答。（快科技）【中科院自研AI大模型紫東太初4.0問(wèn)世：國(guó)際權(quán)威基準(zhǔn)測(cè)試中全面刷新紀(jì)錄】日前，中國(guó)科學(xué)院自動(dòng)化研究所聯(lián)合武漢人工智能研究院研發(fā)的紫東太初4.0多模態(tài)推理大模型正式發(fā)布。這款國(guó)產(chǎn)大模型實(shí)現(xiàn)關(guān)鍵技術(shù)突破，標(biāo)志著AI從被動(dòng)分析邁向“邊看、邊識(shí)、邊思”的主動(dòng)思考新階段。它更在六大關(guān)鍵能力維度、十六6人工智能行業(yè)動(dòng)態(tài)報(bào)告項(xiàng)國(guó)際權(quán)威基準(zhǔn)測(cè)試中全面刷新SOTA紀(jì)錄，展現(xiàn)出國(guó)際領(lǐng)先的綜合性能。據(jù)介紹，紫東太初4.0完成了從“純文本思考”“簡(jiǎn)單操作帶圖思考”到“細(xì)粒度多模態(tài)語(yǔ)義思考”的三重躍遷。它模仿人類交叉注意力機(jī)制，能對(duì)圖像進(jìn)行平移、放大、定位等細(xì)粒度操作，處理180分鐘長(zhǎng)視頻時(shí)可實(shí)現(xiàn)片段精準(zhǔn)定位與內(nèi)容總結(jié)。還能在音頻理解中自動(dòng)操作APP幫用戶掛號(hào)，在真實(shí)場(chǎng)景中通過(guò)汽車、機(jī)器人“動(dòng)手操作”，形成“自主任務(wù)規(guī)劃—交錯(cuò)思考執(zhí)行—綜合分析反饋”的完整推理閉環(huán)，推理過(guò)程清晰可解釋。為加速技術(shù)落地，同步發(fā)布的“紫東太初云”平臺(tái)，作為國(guó)內(nèi)首個(gè)多模態(tài)大模型原生協(xié)同云與全棧國(guó)產(chǎn)化萬(wàn)卡智算云，涵蓋算力服務(wù)、大模型訓(xùn)推等四大板塊，為企業(yè)提供全鏈路支持。目前，紫東太初4.0已在具身智能、低空經(jīng)濟(jì)、智慧醫(yī)療等領(lǐng)域布局，助力千余家企業(yè)數(shù)智化升級(jí)，未來(lái)將持續(xù)推進(jìn)全棧國(guó)產(chǎn)化。（快科技）機(jī)器人【馬斯克挖角NVIDIA兩員大將！xAI研發(fā)“世界模型”用于游戲及機(jī)器人】據(jù)報(bào)道，埃隆·馬斯克的xAI正加速構(gòu)建所謂的“世界模型”，與Meta和谷歌等對(duì)手一同角逐下一代AI系統(tǒng)。世界模型被視為實(shí)現(xiàn)通用人工智能（AGI）的關(guān)鍵路徑，谷歌、Meta、NVIDIA等巨頭均已在此領(lǐng)域布局。報(bào)道稱，xAI已從NVIDIA挖走了兩名核心研究員——ZeeshanPatel和EthanHe，以加速“世界模型”的研發(fā)。兩人曾參與NVIDIAOmniverse平臺(tái)的開(kāi)發(fā)，該平臺(tái)以先進(jìn)的物理仿真技術(shù)著稱，為世界模型的研發(fā)提供了關(guān)鍵技術(shù)基礎(chǔ)。ZeeshanPatel專攻多模態(tài)模型與物理AI，而EthanHe的研究方向涵蓋視頻自監(jiān)督學(xué)習(xí)與多模態(tài)模型，兩人都具備豐富的世界模型開(kāi)發(fā)經(jīng)驗(yàn)。xAI計(jì)劃通過(guò)世界模型實(shí)現(xiàn)對(duì)“物理規(guī)律”的理解，使AI能夠模擬真實(shí)環(huán)境并進(jìn)行實(shí)時(shí)交互，首批應(yīng)用將聚焦于游戲領(lǐng)域，目標(biāo)是在2026年底推出由AI動(dòng)態(tài)生成的3D游戲。這些游戲的場(chǎng)景將能夠根據(jù)玩家的行為實(shí)時(shí)變化，提供全新的沉浸式體驗(yàn)，從長(zhǎng)期規(guī)劃來(lái)看，該技術(shù)有望延伸至機(jī)器人、自動(dòng)駕駛等領(lǐng)域，并與馬斯克旗下的特斯拉、Neuralink等形成協(xié)同效應(yīng)。（快科技）【智元精靈G2機(jī)器人發(fā)布：全球首款十字腕力控臂】據(jù)媒體報(bào)道，智元機(jī)器人正式發(fā)布新一代工業(yè)級(jí)交互式具身作業(yè)機(jī)器人——精靈G2。該產(chǎn)品在硬件性能、場(chǎng)景通用性等方面實(shí)現(xiàn)全面升級(jí)，并憑借已鎖定的數(shù)億元首發(fā)訂單，標(biāo)志著人形機(jī)器人正式從技術(shù)驗(yàn)證邁向規(guī)?；虡I(yè)應(yīng)用的關(guān)鍵階段。硬件方面，精靈G2搭載高性能關(guān)節(jié)執(zhí)行器與多類型傳感器，其腰部采用3自由度設(shè)計(jì)，賦予其接近人類肢體的靈活運(yùn)動(dòng)能力。全球首款十字腕力控臂集成了全臂高精度關(guān)節(jié)扭矩傳感器，通過(guò)關(guān)節(jié)阻抗控制實(shí)現(xiàn)細(xì)膩外力感知與柔順響應(yīng)，配合快速部署工具鏈，有效降低用戶操作門檻。續(xù)航能力上，G2采用雙電池?zé)岵灏渭夹g(shù)并集成自主補(bǔ)能功能，可滿足24小時(shí)連續(xù)作業(yè)需求，適配工業(yè)產(chǎn)線的高強(qiáng)度運(yùn)行節(jié)拍。AI技術(shù)方面，依托智元全棧自研的通用基座大模型GO-1與世界模型GE-1，精靈G2在復(fù)雜任務(wù)處理方面表現(xiàn)突出。GO-1采用“三層大腦”架構(gòu)，實(shí)現(xiàn)從語(yǔ)音指令到任務(wù)規(guī)劃再到動(dòng)作執(zhí)行的全流程閉環(huán)；GE-1則具備時(shí)空預(yù)測(cè)能力，可提前預(yù)演動(dòng)作以應(yīng)對(duì)長(zhǎng)周期任務(wù)。（快科技）【Figure人形機(jī)器人全面升級(jí)阿里/微美全息構(gòu)筑競(jìng)爭(zhēng)護(hù)城河搶占行業(yè)先機(jī)！】10月8日，ABB集團(tuán)宣布將旗下機(jī)器人業(yè)務(wù)以53.75億美元出售給日本軟銀集團(tuán)。這一交易不僅重塑了工業(yè)機(jī)器人“四大家族”的競(jìng)爭(zhēng)格局，更揭示了AI巨頭向物理世界滲透的戰(zhàn)略意圖。更深層次的原因在于，工業(yè)機(jī)器人行業(yè)正面臨臨界點(diǎn)。傳統(tǒng)機(jī)器人市場(chǎng)增速放緩，而AI驅(qū)動(dòng)的下一代機(jī)器人需求激增。業(yè)內(nèi)人士坦言，軟銀收購(gòu)ABB機(jī)器人業(yè)務(wù)，將加速工業(yè)機(jī)器人行業(yè)的顛覆性變革。未來(lái)，AI與機(jī)器人深度融合，到2028年，大多數(shù)新部署的工業(yè)機(jī)器人將具備一定的自主學(xué)習(xí)和決策能力。恰巧僅僅過(guò)一天，人形機(jī)器人領(lǐng)域再次迎來(lái)重磅消息——FigureAI官宣全新一代“Figure03”將于10月9日正式發(fā)布。這款被CEOBrettAdcock稱為“迄今最強(qiáng)大的人形機(jī)器人”的產(chǎn)品，不僅憑借外觀與功能的全面升級(jí)吸引業(yè)內(nèi)多方關(guān)注，其上的編織物外衣和仿生充電的足部模組等新變化更是引爆行業(yè)話題。Figure03作為FigureAI旗下Figure02的指定迭代機(jī)型，延續(xù)了前代產(chǎn)品的雙足形態(tài)。相比前一代產(chǎn)品，F(xiàn)igure03的研發(fā)聚焦“成本控制與大規(guī)模量產(chǎn)”，計(jì)劃采用注塑成型、壓鑄等工藝，以降低硬件成本，7人工智能行業(yè)動(dòng)態(tài)報(bào)告為后續(xù)商業(yè)化落地奠定基礎(chǔ)。（快科技）智能駕駛【滲透率已達(dá)63%！預(yù)計(jì)2030年L2智能輔助駕駛在我國(guó)將成標(biāo)配L3/L4也快來(lái)了】近日中國(guó)長(zhǎng)安汽車集團(tuán)有限公司黨委書記、董事長(zhǎng)朱華榮公開(kāi)表示，預(yù)計(jì)2030年汽車L2輔助駕駛在我國(guó)將成標(biāo)配。朱華榮認(rèn)為，智能網(wǎng)聯(lián)汽車全球化發(fā)展既有重大機(jī)遇，又面臨眾多挑戰(zhàn)。智能網(wǎng)聯(lián)汽車產(chǎn)業(yè)規(guī)?？焖偬嵘?，數(shù)智新汽車必將成為真正的未來(lái)，未來(lái)汽車就是可自進(jìn)化的“智能汽車機(jī)器人”。統(tǒng)計(jì)顯示，2025年1-7月，中國(guó)乘用車L2輔助駕駛滲透率已達(dá)63%；預(yù)計(jì)到2030年，L2輔助駕駛將成為標(biāo)配，L3及以上自動(dòng)駕駛搭載率將超10%，L4級(jí)別的自動(dòng)駕駛將逐步推廣。值得一提的是，2025年9月12日，工信部等八部門在《汽車行業(yè)穩(wěn)增長(zhǎng)工作方案（2025-2026年）》（以下簡(jiǎn)稱《工作方案》）中明確提出推進(jìn)智能網(wǎng)聯(lián)汽車準(zhǔn)入和上路通行試點(diǎn)，并首次寫入“有條件批準(zhǔn)L3級(jí)車型生產(chǎn)準(zhǔn)入”。（快科技）【雷軍最新演講：小米YU7智能化配置非常高輔助駕駛第一期投入達(dá)57.9億元】小米集團(tuán)創(chuàng)始人、董事長(zhǎng)兼CEO雷軍出席了2025世界智能網(wǎng)聯(lián)汽車大會(huì)，并作為嘉賓上臺(tái)發(fā)表演講。演講期間，雷軍提到，小米YU7智能化配置非常高，并且下決心全系一個(gè)配置。智能化方面，小米YU7全系標(biāo)配700Tops算力、全系標(biāo)配激光雷達(dá)、4D毫米波雷達(dá)，大幅提高輔助駕駛的體驗(yàn)和安全性。據(jù)雷軍介紹，小米在輔助駕駛第一期投入達(dá)57.9億元。小米智能駕駛研發(fā)團(tuán)隊(duì)規(guī)模超過(guò)了1800人，并聯(lián)合清華大學(xué)、香港大學(xué)等頂級(jí)學(xué)院進(jìn)行了前瞻創(chuàng)新。與此同時(shí)，小米把手機(jī)上的相機(jī)技術(shù)應(yīng)用到汽車上，也廣受好評(píng)。雷軍透露，小米利用車上的攝像頭做了車載影像，好看的風(fēng)景，有趣的瞬間，都可以拍下記錄下，還可以下載到手機(jī)上分享給朋友，效果也不錯(cuò)。此外，雷軍還表示，AI大模型是智能網(wǎng)聯(lián)汽車的未來(lái)趨勢(shì)，蘊(yùn)藏巨大創(chuàng)新機(jī)遇。端側(cè)AI模型無(wú)需聯(lián)網(wǎng)，可整合車內(nèi)外攝像頭、麥克風(fēng)等多傳感器信號(hào)，通過(guò)情緒識(shí)別與多模態(tài)交互技術(shù)，實(shí)現(xiàn)擬人化語(yǔ)音控車，還能自定義手勢(shì)控制車內(nèi)設(shè)備，且本地算力調(diào)用可保障數(shù)據(jù)隱私安全。小米的核心戰(zhàn)略是“人車家全生態(tài)”，汽車是重要節(jié)點(diǎn)。通過(guò)不同場(chǎng)景、終端的互聯(lián)互通，汽車可調(diào)用整個(gè)生態(tài)的AI算力，提供豐富場(chǎng)景應(yīng)用，未來(lái)產(chǎn)業(yè)機(jī)會(huì)廣闊。（快科四、重要公告圖表7：人工智能行業(yè)一周重要公告公司簡(jiǎn)稱寒武紀(jì)發(fā)布日期公告內(nèi)容公司發(fā)布三季報(bào)，前三季度營(yíng)業(yè)收入達(dá)46.07億元，同比增2386.38%，其中第三季度單季營(yíng)收17.27億元，同比增長(zhǎng)1332.52%。前三季度歸母凈利潤(rùn)16.0年同期虧損7.245億元；第三季度首次實(shí)現(xiàn)單季盈利5.67億元?？鄯莾衾麧?rùn)14.19億元。光庭信息公司發(fā)布三季報(bào)，前三季度實(shí)現(xiàn)營(yíng)業(yè)收入4.21億元，同比增長(zhǎng)23.05%，歸母凈利潤(rùn)4477.54萬(wàn)元，同比增308.53%；扣非凈利潤(rùn)2907.77萬(wàn)元，增幅達(dá)445.95%。?？低暪景l(fā)布三季報(bào)，前三季度實(shí)現(xiàn)營(yíng)業(yè)收入657.58億元，同比增長(zhǎng)1.18%；歸母凈利海光信息公司發(fā)布三季報(bào)，前三季度實(shí)現(xiàn)營(yíng)業(yè)收入94.9億元，同比增長(zhǎng)54.65%，第三季度單季營(yíng)收40.26億元（同比+69.6%），歸），8人工智能行業(yè)動(dòng)態(tài)報(bào)告資料來(lái)源：Wind，中信建投北美經(jīng)濟(jì)衰退預(yù)期逐步增強(qiáng)，宏觀環(huán)境存在較大的不確定性，國(guó)際環(huán)境變化影響供應(yīng)鏈及海外拓展；芯片緊缺可能影響相關(guān)公司的正常生產(chǎn)和交付，公司出貨不及預(yù)期；公司生產(chǎn)和交付延期，導(dǎo)致收入及增速不及預(yù)期；信息化和數(shù)字化方面的需求和資本開(kāi)支不及預(yù)期；市場(chǎng)競(jìng)爭(zhēng)加劇，導(dǎo)致毛利率快速下滑；主要原材料價(jià)格上漲，導(dǎo)致毛利率不及預(yù)期；匯率波動(dòng)影響外向型企業(yè)的匯兌收益與毛利率；人工智能技術(shù)進(jìn)步不及預(yù)期；汽車與工業(yè)智能化進(jìn)展不及預(yù)期。9人工智能行業(yè)動(dòng)態(tài)報(bào)告分析師介紹于芳博分析師介紹中信建投人工智能組首席分析師，北京大學(xué)空間物理學(xué)學(xué)士、碩士，2019年7月加入中信建投，主要覆蓋人工智能等方向，下游重點(diǎn)包括智能汽車、CPU/GPU/FPGA/ASIC、EDA和工業(yè)軟件等方向辛俠平中信建投證券人工智能行業(yè)分析師，中央財(cái)經(jīng)大學(xué)碩士，曾從事通信行業(yè)研究工作，2022年加入中信建投人工智能團(tuán)隊(duì)，重點(diǎn)覆蓋人工智能、AI芯片、智能駕駛等領(lǐng)域。人工智能行業(yè)動(dòng)態(tài)報(bào)告評(píng)級(jí)說(shuō)明投資評(píng)級(jí)標(biāo)準(zhǔn)評(píng)級(jí)說(shuō)明報(bào)告中投資建議涉及的評(píng)級(jí)標(biāo)準(zhǔn)為報(bào)告發(fā)布日后6香港市場(chǎng)以恒生指數(shù)作為基準(zhǔn)；美國(guó)市場(chǎng)以標(biāo)普500指數(shù)為基準(zhǔn)。股票評(píng)級(jí)相對(duì)漲幅15％以上增持相對(duì)漲幅5%—15%相對(duì)漲幅

人人文庫(kù)> 全部分類> 應(yīng)用文書 > 研究報(bào)告

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

信息技術(shù)-人工智能行業(yè)動(dòng)態(tài)：多模態(tài)大模型首次實(shí)現(xiàn)像素級(jí)推理UniPixel發(fā)布

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

信息技術(shù)-人工智能行業(yè)動(dòng)態(tài)：多模態(tài)大模型首次實(shí)現(xiàn)像素級(jí)推理UniPixel發(fā)布

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔