商汤大装置“解题”人形机器人 商汤pm
大模型和具身智能的融合,正在将人形机器人推给AI进步的新浪潮。
作为国内AI基础设施服务的领导者,商汤大装置将为推动人形机器人的技术创造和应用,提供领先的算力、模型和数据处理能力支撑。
在本周举办的第二届中国具身智能和人形机器人创造进步大会上,商汤科技大装置事业群生态总监刘远辉同享了商汤在AI和自动驾驶领域的创造操作对于具身智能、人形机器人的借鉴价格。他指出,AI基础设施将是驱动人形机器人端到端进步的新引擎。
一段式端到端AI体系
开始人形机器人通往AGI之路
过去十年间,AI技术已在多个垂直领域突破了工业红线,成功和各行业的实际应用场景融合,但其进步仍面临诸多挑战。
比如,各行各业中的长尾场景众多,但需求规模小,而大规模的研发投入又会导致投资回报率降低。除了这些之后,行业中的AI模型种类众多,但单一模型能够化解的难题仍特别有限。
机器人的进步也呈现近似动向。大多数机器人产品仅局限于执行单一、特定的任务,缺乏足够的通用性和泛化能力,成为广泛普及和应用的一大障碍。
商汤在端到端自动驾驶大模型方面的创造研发操作,为具身智能、人形机器人的突破提出了可以借鉴的新途径。
传统的自动驾驶体系由多个感知小模型和制度定义的规控体系组成。在2024年底,商汤及其联合实验室提出了行业首个感知决策一体化自动驾驶通用模型UniAD,将感知、决策、规划等模块都整合到壹个全栈Transformer端到端模型中。
UniAD作为“一段式”端到端的代表,相较于业内其他将感知和规控分为两个模型的“两段式”端到端方法,能够实现感知信息的无损传递,拥有更好的复杂场景领会、泛化能力和化解corner case的能力。
“一段式”端到端体系完全由数据驱动,其能力将随着训练数据量的增加而实现跃迁,让自动驾驶体系和人形机器人拥有更通用、更泛化的复杂场景领会能力,有望创新自动驾驶和具身智能进步的“ChatGPT时刻”,开始自动驾驶和人形机器人通往AGI之路。
而“一段式”端到端体系的训练,需要更高算力、最新数据生产管线、全球模型等作为平台支撑,带来了对人工智能基础设施需求的激增。
商汤大装置+日日新大模型体系
为具身智能打造新一代AI基础设施
商汤对人工智能基础设施的定义,源于AI进步的三要素:算力、算法和数据。
充足的算力资源储备,强大的基模型、AI平台软件和数据能力优势,以及面给场景生态的AI专家服务体系,是AI基础设施成功的决定因素要素。
在算力层面,商汤大装置运营总算力规模已突破20,000 PetaFLOPS,同时也在积极“云、边、端”协同的算力布局,以更高的算力利用率,为人形机器人的应用提供更高推理智价比。
根据IDC公开报告《中国智算服务市场(2024下半年)跟踪》,商汤科技在中国云计算基础设施厂商中脱颖而出,和火山引擎、阿里巴巴共同跻身2024年下半年中国GenAI IaaS服务厂商TOP 3,以显著的市场份额优势位居GenAI IaaS领域的第一梯队。
在算法层面,商汤的“日日新”大模型体系在尺度定律下快速迭代。新鲜的“日日新5.5”在语言能力、多模态能力已综合对标GPT-4 Turbo和GPT-4o,可赋能人形机器人的“眼力”和“脑力”。
作为国内首个具备流式原生多模态交互能力的大模型,“日日新5o”实现了语音、视频和语言模型的原生融合,响应延迟达到560ms,能够满足人形机器人实时的流式多模态AI交互能力需求。
同时,商汤端到端AGI大模型,让机器人能够像人一样领会复杂的现实全球,提高各种环境下的交互和决策力。比如,在自动驾驶场景中,该模型可以让车辆平稳通过路障限宽路段,胜任传统制度体系无法应对的场景。
具身智能进步的决定因素,正是多模态大模型能力和人形机器人的有效结合。
在数据层面,通过虚实结合的方法进行数据生成,可以化解人形机器人开发广泛存在的数据匮乏乃至标准不统一等难题。
对此,商汤正和行业伙伴联合开发仿真模拟方法,通过商汤大模型和新型AI基础设施加速仿真场景生成,提高开发效率。除了这些之后,商汤大装置紧密联动机器人产业上下游软件及硬件合作伙伴,如人形机器人国创中心、松应科技、北京银河通用机器人等,发挥商汤在算力及算法层的优势,共同寻觅具身智能行业应用和操作,助推人形机器人产业新一轮更新。
在人形机器人的浪潮下,商汤将坚决基础设施的行业定位,基于商汤大装置和日日新大模型体系,提供算力、数据、模型能力的全栈支持,加速人形机器人的一体化定制化研发和落地,构建机器人智能体的最新行业生态。
(来源:商汤科技)