1. 首页 > 人工智能

DeepSeek火爆全球 deepseek火爆全球的原因

作者:admin 更新时间:2025-03-27
摘要:2025年1月20日,DeepSeek发布新一代推理大模型 DeepSeek-R1,以极致的“性价比”在全球AI竞技场投下“技术普惠”的深水炸弹。,DeepSeek火爆全球 deepseek火爆全球的原因

 

2025年1月20日,DeepSeek公开新一代推理大模型 DeepSeek-R1,以极点的“性价比”在全球AI竞技场投下“技术普惠”的深水炸弹。

这不仅是算法对算力的逆袭,更是开源生态对闭源生态的降维打击……随后全球47万个衍生模型在20天内破土而出,昇腾、企鹅云等200多家生态伙伴构建起自主可控的AI产业链,甚至倒逼OpenAI公布GPT-5不收费放开。

如今,DeepSeek的神话还在续写……深度适配、开源、差异化竞争成为当下热点。

成本重构改写行业制度

“高性能+低成本”组合,直接推动全球AI服务价格体系重构,迫使头部厂商加速技术迭代。

从阳春白雪到下里巴人,DeepSeek让AI真正飞入寻常百姓家。无论是专业人士的复杂职业场景,还是普通用户日常娱乐、进修,都能轻松驾驭,极大降低了大众运用AI 技术的门槛。

性能是衡量壹个模型优劣的决定因素指标。在性能层面,DeepSeek其独创的专家混合架构(MoE)通过任务分解和多专家协同,显著提高数学推理效率,数学推理能力超过OpenAI o1;基于2000亿Token训练量的代码生成模型,在数学推理和代码任务上已超越GPT-3.5。

成本控制则成为DeepSeek倾败行业的决定因素。DeepSeek R1以557.6万美元的训练成本(仅为Gpt-4的1/10)和API调用价格(OpenAI的1/30),彻底打破“算力军备竞赛”的行业困局。这种“高性能+低成本”组合,直接推动全球AI服务价格体系重构,迫使头部厂商加速技术迭代。

正因如此,DeepSeek吸引了国内众多企业的目光。民族超算互联网平台相关负责人给中国工业报表示,根据杰文斯悖论(杰文斯悖论:技术提高进步了资源运用效率,但最终会导致该资源的总消耗量不降反增),像DeepSeek这样由技术创造提高效率的工具,其广泛应用将大规模带动算力需求的增加。

因此,社会迫切需要打造能够应对高峰值的大规模算力中心,也需要类似超算互联网的全国一体化算力网络,将全国各地的算力中心连接起来,形成面给全国算力资源池,实现全国算力资源的统一管理。除了这些之后,还要建立“算力+应用”的一体化交付体系,促进供需双方的高效对接。

中国工业报了解到,作为民族级综合算力服务平台,目前,超算互联网已连接国内14个省区市的20多家超算和智算中心。目前,平台上已有各类算力商品超6500款,其中AI模型服务近240款,既有DeepSeek、Qwen等国内开源模型,也有Llama、Stable Diffusion、Gemma等国外AI开源模型。

民族超算互联网平台相关负责人给中国工业报表示,当前各类用户运用AI模型热诚高涨,DeepSeek Chatbot 可视化界面仅上线首日,访问量就突破了百万量级,用户纷纷表达出对DeepSeek 新鲜版本和多模态(支持多种信息输入方法,如文本、图像、语音等)的期待。资深开发者和企业用户,对AI Web应用、私有化API调用提出更多需求。接下来,超算互联网平台将积极响应用户需求,上线更多版本和功能。

开源生态引爆产业协同

DeepSeek打破了算力桎梏,为国内化算力带来新机遇。

DeepSeek的开源策略被视为国内AI生态的“催化剂”,它基于MIT许可证(一种特别宽松的开源软件许可证),将算法、模型及训练细节给全球开发者放开。DeepSeek 的开源策略带来的“飞轮效应”显著:上线20天日活突破2000万,全球开发者创建47万个衍生模型(即通过对基础数据进行处理、清洗、转换和聚合等操作后得到的数据模型),形成最活跃的开发生态。

开源不仅降低技术门槛,更激活产业链协同效应。DeepSeek性能强大的另一方面,也对芯片性能提出了多元且高标准的挑战。如今,昇腾、沐曦等18家厂商已完成适配。

据中国工业报了解,芯片企业江原科技已可单卡支持DeepSeek-R1 1.5B/7B/8B/14B/32B/70B全部6个蒸馏模型(一种将复杂大型模型的姿势迁移到更小、更简单模型的技术)。

“大家在适配DeepSeek-R1这些蒸馏模型的时候并没有碰到啥子技术难题,基本上达到了开箱即用的适配速度。”江原科技副总裁杨丽慧给中国工业报表示,开源框架使产业链各环节能“专注所长”,这次适配和优化能够达到很高的效率,很大程度上要归功于开源。DeepSeek是开源大模型的代表,第一次实现了开源模型性能追平闭源模型的性能,这对整个产业链,特别是国内化产业链来说都是特别正给的激励。

昇腾相关专家给中国工业报表示:“大模型将从技术摸高走给‘技术摸高+工程创造’并行,训练需求持续增长。头部玩家将战略坚决投入预训练基础模型创造,丰盛模型组合,加速寻觅AGI(通用人工智能)。”

据中国工业报了解,昇腾拥有强大的 AI 计算能力和先进的集群技术,上述专家表示,双方合作能让 DeepSeek 充分利用昇腾的算力优势,进一步优化模型训练和推理经过,从而提高大模型的性能、效率和准确性。比如在处理复杂的天然语言领会、图像识别等任务时表现得更加出色,推动国内大模型技术达到新高度。

中国电信研究院战略进步研究所副主任解析师魏玥给中国工业报解析道,之前,由于AI大模型对算力标准较高,国内化芯片在性能和成本方面基本没有优势,AI大模型主要依赖进口高级芯片,国内化算力的目标客户和市场空间有限,对智算基础设施的建设和运营等造成影响。DeepSeek打破了算力桎梏,为国内化算力带来新机遇。

场景落地多点开花

随着大模型给着多模态融合深入、推理需求逐渐爆发的动向进步,会诞生更多、更专业、更精准的大模型。大模型一定会给垂直领域深度渗透,和实体经济加速融合。

DeepSeek的高效推理和多模态扩展能力,使其在云、边、端及多行业场景中快速渗透。据中国工业报了解,目前,各大云服务商如阿里云、企鹅云等十大平台已综合支持DeepSeek模型;垂类应用中,吉利汽车融合DeepSeek R1优化智能座舱交互,浪潮海岳大模型则借其复杂推理能力切入高门槛场景。

近日,宁夏交建交通科技研究院联合北京中关村科金研发的“灵筑”行业大模型应用平台正式接入DeepSeek模型,通过更专业的行业姿势问答、技术文档撰写、投标文件辅助生成、Excel表格自动生成等众多场景,借助大模型技术变革行业职业方法。

“定位于企业服务垂域大模型的海岳大模型差异化优势显著,在接入DeepSeek之后更是解开了企业智能化新高度。”浪潮通用软件有限企业海岳大模型研发负责人、首席技术架构师周祥国和中国工业报谈到,海岳大模型接入DeepSeek后,一方面,海岳大模型应用场景可以进一步给专业垂直领域纵深渗透,利用DeepSeek-671B的复杂推理能力,解析预测、科学计算、长文本生成等能力,可以使处理专业型、姿势密集型任务的能力大幅提高,更好地切入高门槛场景应用;另一方面,它也为海岳大模型横给扩展应用领域、应用行业,提供了一种相对低成本高效率的垂域大模型训练范式。

最为决定因素的是,基于DeepSeek的长思考链和多层逻辑拆分能力,海岳大模型智能应用的准确性得到显著提高。如在通用问答场景中,海岳智能问答助手基于DeepSeek,能够精准定位并回答复杂难题,有效化解大模型的“幻觉”难题。

根据第三方国际咨询机构Gartner预测,DeepSeek将推动AI服务成本年均下降90%,到2027年,70%企业将采用“大模型+微调”混合架构。青云科技市场总监王玉圆给中国工业报说明说,DeepSeek带来的不仅是推理成本的降低,更多的是给大模型企业一种新的思路。随着大模型给着多模态融合深入、推理需求逐渐爆发的动向进步,会诞生更多、更专业、更精准的大模型,大模型一定会给垂直领域深度渗透,和实体经济加速融合。

早在2024年青云就推出了AI算力云服务,王玉圆表示:“目前,运用中的客户都肯定了青云提供的DeepSeek服务。其中不少客户还要对外提供企业级服务。”

为加速人工智能大模型技术在企业级场景中的规模化落地,2月14日,宁畅信息产业(北京)有限企业(下面内容简称“宁畅”)正式公开DeepSeek大模型一体机化解方法,搭载业界领先的DeepSeek R1/V3满血版模型和蒸馏版模型,通过软硬件深度协同优化,为企业提供从部署到场景定制的全栈交付能力,帮助制造、金融、医疗、科研等行业突破AI应用瓶颈。

普惠化、差异化成落地决定因素

未来,怎样在普惠性和专业性、开源共享和商业回报间找到平衡点,将决定这场AI产业变革的最终深度。

DeepSeek的成功源于技术突破和成本控制的平衡、开源生态的快速扩张,以及对市场需求的前瞻性把握。

民族超算互联网平台相关负责人表示,其带动了包括强化进修、蒸馏技术(大模型姿势转移给小模型玩法)等进步,它不仅挑战了传统AI研发途径,更推动了AI技术的普惠化进程,AI行业应用企业将迎来综合爆发,中国的大市场将孕育出一批类似互联网时代的超级平台型和应用型企业。

众所周知,AI和互联网不同,它具有去中心化和广泛渗透的特征。AI的行业和个人应用将更加多样化。对算力需求增加,二次开发和创造的需要,也会同时增加。

虽然DeepSeek推动国内AI跨越式进步,挑战亦随之显现。近年来,国内三大电信运营商面临同质化压力。中国电信率先于2月1日成为国内首家实现DeepSeek模型落地的运营商级云平台。

魏玥给中国工业报解析,智算云服务以大模型为牵引,而DeepSeek将各厂商能提供的大模型的能力统一到了壹个水平,怎样形成差异化优势就成为主要挑战和竞争决定因素。

在魏玥看来,云服务的商业玩法简单来说是以服务的形式给客户提供IT硬件和软件,AI大模型则是云服务商可以提供的软件其中一个。在众多IT硬件和软件中,云服务商选择哪些作为重点展开资源布局、技术创造、产品研发和市场营销等,很大程度上由客户需求驱动。“中国电信在DeepSeek推出后,紧锣密鼓地推进模型接入和全场景上架,也是由于捕捉到了政企和公众客户对DeepSeek高涨的兴趣和需求。”魏玥说道。

对于行业中质疑“接入DeepSeek是对企业自研大模型否认”的声音,魏玥给出解释:“中国电信自研的星辰大模型,将走出和DeepSeek互补的进步途径,将更多资源投入中国电信更有优势和积累的领域,比如,目前已支持数十种方言的语音大模型,需要深度领会行业姿势和客户需求的各个行业大模型,以及利用DeepSeek蒸馏形成高性能轻量级模型并和终端结合等。”

在魏玥看来,DeepSeek迅速出圈再一次证实,普惠对于科学技术的规模应用至关重要。云服务依托资源共享和规模效应等,可以促进IT普惠化,是实现AI大模型普惠的决定因素途径。

未来,怎样在普惠性和专业性、开源共享和商业回报间找到平衡点,将决定这场AI产业变革的最终深度。正如周祥国所言,在数字经济中,无论是数字产业化还是产业数字化,技术都只是手段,真正发挥价格的还在于应用。

(来源:中国工业报)