商汤科技董事长兼CEO徐立：AI 商汤科技董事长女儿叫什么--云顶智能网

摘要：“AI 2.0时代，生成式AI被视为推动生产力进步的重要技术，如果能在知识、推理、执行三层能力上实现突破，将真正带来整个社会生产力的跨越式发展。,商汤科技董事长兼CEO徐立：AI 商汤科技董事长女儿叫什么

“AI 2.0时代，生成式AI被视为推动生产力提高的重要技术，如果能在姿势、推理、执行三层能力上实现突破，将真正带来整个社会生产力的跨越式进步。” 商汤科技董事长兼CEO徐立在2024 GDC上提出了这一前瞻性见解。

3月23-24日，2024全球开发者先锋大会(GDC)在上海隆重召开。商汤科技董事长兼CEO徐立受邀出席开幕式，并发表《AI 2.0时代的“新质生产力工具”》主旨演讲，同享了对AI 2.0时代生产力工具“质”变背后的思索和突破途径。

下面内容为徐立演讲内容梳理。

新生产力工具仍需持续进化

最近，“新质生产力”成为热议话题，尤其在开发者领域，生成式AI被视为引领生产力突破的技术，也标志着人工智能进入了壹个新的进步阶段，大家称之为AI 2.0时代。

ChatGPT、Copilot、Blackwell是AI2.0时代的热度代名词。搜索数据显示，中国对于这些词的关注热度位居全球榜首，这代表着中国近千万的开发者以及普罗大众对于AI能够带来的变化热切关注。当然，这也是中国AI进步的特别好的基础。

随着AI 2.0时代的来临，GitHub上的相关项目数量呈指数级增长。生成式AI项目、大模型项目以及辅助编程、辅助开发的工具项目层出不穷。但反过来看，中国数字人才缺口也在逐年增大，且短缺比例在快速扩大。

还有一组数据值得关注。虽然中国对AI 2.0的关注极高，但在实际应用方面排行却落后于美国和印度等民族。这其中，语言一个不要忽视的难题。以通过天然语言完成编程任务为例，英语和现有程序的匹配度等于高，而杰出的中文语言工具相对欠缺。

虽然大家已经开始运用AI 2.0时代的生产力工具，但这些工具带来的生产效率提高效果并不明显，所能化解的难题占比不足10%，给生产链路带来的突破相对有限。

众所周知，软件开发全生活周期包括需求解析、设计、开发、测试、部署和维护诸多环节。虽然目前AI能够带来很多革新，或者扩展到很多场景，但目前仅能化解其中特别小众的部分。

具体而言，AI目前能化解的是在过往基础上抽象成相对标准化、甚至以姿势库的形式固化下来的内容，包括代码补全、代码增写以及部分测试用例等。如果把它分摊到整个软件或者产品设计的全流程当中，占比并不高。

当然，随着扩展能力变强，很多工具会从前端的设计、测试用例再到维护的横给拓展，一步步往前演进。

除了横给能力的拓展，从纵给来看，当前，新生产力工具的准确率和完成度也普遍较低。

根据SWE-bench评估，Claude 2 和 GPT-4在特定任务上仅差点5%的任务完成度，即使是新鲜的Devin完成度也仅13%，虽然整个行业在往前走，但目前还是处于相对雏形。

另壹个有意思的现象是，编程经验越丰盛，不代表就越能用好新的生产力工具。统计数据显示是相反的：职业五年下面内容的程序员运用新生产力工具化解难题时长超过一小时，但五年以上的程序员反而更短。这意味着越是高阶、复杂的任务，对于当前新生产力工具来说还有一定的挑战。

大模型能力的三层架构

大模型能力可分为三层架构，而且这三层之间互有依赖，但又相对独立。

第一层姿势(Knowledge)，全球姿势的综合灌注。目前，许多生产力工具化解的都是姿势层的难题，当用户提出难题时，其底层的逻辑都来自于“世上无新事”——你所面临的难题，前人也许已经遇到过并化解了，因此通过大模型可以很好地完成这些任务。

第二层推理(Reasoning)，理智思考的质变提高。有了全球姿势之后，再往前演进。即使不了解这件事实，也可通过AI逐步把这个事实推理出来，给出更多的也许性。

姿势和推理是作为生产力工具——大模型最重要的两层，但目前在推理层，成长还相对有限，这也是今后要集中突破的能力其中一个。

第三层执行(Execution)，全球内容的互动变革，即怎样跟这个全球互动反馈。某种意义上，如今火热的具身智能，在执行上会有很大的突破。

总体来讲，这三层可以组成壹个完备的对于全球提供生产力工具模型的三层能力。

“KRE”三层架构操作：商汤“小浣熊”快速进化

商汤结合“KRE”三层架构打造出壹个办公辅助软件——“小浣熊”。

在壹个已开发完成的基模型的基础上，大家从需求解析到最终完成产品开发，共需投入100人天的职业量。

如果去年用“小浣熊”代码补助工具，可节省30%的职业量。它在整个经过中主要化解的还是一些重复性的劳动，在壹个很好的代码库基础上，能够做一些代码的完成任务。

在此基础上，大家进一步整合了从需求解析、需求设计到长尾应用等各个环节，推出了更为强大的“小浣熊”2.0版本。它真正意义上基于大家给出的海量数据筛选出需求，制定产品特征，在产品的特征之上完成产品的自主开发。

最终，大家期待它在获取全球姿势的基础上，在真正的全球当中应用到更多的机器人场景当中。

再以“KRE”三层来领会“小浣熊”。姿势层是代码的补全，补全的代码来自他人写过的代码;推理层则深入到软件开发的全流程;执行层进入切分到垂直场景当中，以场景化的智能为依归。

那么姿势、推理，这两层是不是相关?以GPT4为例，它拥有强大的代码解释器，能够处理各种数学难题。在面对某些特定难题时，例如“请列出一百以内全部的两个质数相乘”以及“一百以内两个质数相乘加1”，它能够正确地列出前者，但在处理后者时却出现了错误。两个难题难度一样，何故会出错?缘故在于这类难题没有见过，它的全球姿势没有办法直接给出答案，需要调用代码解释器，但生成代码正确率不也许是100%，因此会有出错的概率。

可以说，姿势层主要化解高频、标准化难题，做别人做过的难题，显然准确率高。推理主要化解长尾、碎片化的难题。

举两个“小浣熊”场景化的例子。

场景一：管理智能化。在交通解析的场景中，大屏上的数据往往是固定化的，比如某个路口的流量、某个时刻的流量解析等等，一个标准化的难题。然而，当要结合天气影响、舆论影响、新闻影响，过去没有此类的解析结局，可以用软件强推理能力来完成一些长尾应用的解析。

场景二：办公智能化。当需要为产品推广制定预算时，把财务报表、账户信息、产品说明等各类文档资源全部输入到商汤的“办公小浣熊”当中，它能够根据输入的数据和需求，给出壹个既合理又科学的预算方法，展现出强大的推理能力。

总之，生产力工具如果在姿势能力、推理能力、执行能力三层能力上都有突破，首先受益的是广大开发者以及场景化的核心应用，最终将真正带来整个社会生产力的跨越式进步。

（来源：商汤科技）

商汤科技董事长兼CEO徐立：AI 商汤科技董事长女儿叫什么

延伸阅读