DeepSeek有望激发 deeptech
中国人工智能(AI)企业深度求索(DeepSeek)日前公开其新鲜开源模型DeepSeek-R1,用较低的成本达到了接近于美国放开人工智能研究中心(OpenAI)开发的GPT-o1的性能。这一进展破解了全球人工智能产业长期以来“堆算力”的途径依赖,其影响波及资本市场。业界人士认为,DeepSeek模型有望激发一波创造浪潮,推动全球AI继续提高。
据深度求索企业官网说明,DeepSeek-R1在后训练阶段大规模运用了强化进修技术,在仅有很少标注数据的情况下极大提高了模型的推理能力,在数学、代码、天然语言推理等任务上,测评性能和GPT-o1模型正式版接近。
国际投行摩根士丹利表示,“更大(的模型)不再等于更伶俐”,DeepSeek通过显著进步数据质量和改进模型架构,展示了一条和之前大模型不同的高效训练途径。摩根士丹利说,DeepSeek的模型现在低成本优势突出,和国际知名大模型相比,其成本大约低了壹个数量级。
高盛集团也认为,DeepSeek新模型的成本远低于现有模型,这意味着开发利用大模型的门槛降低,互联网巨头将面临初创企业的潜在竞争。
英国《金融时报》发表的一篇点评文章指出,DeepSeek挑战了人工智能产业在过去一段时刻的核心信仰,即认为更强大的硬件才是推动人工智能进步的决定因素。
摩根士丹利认为,DeepSeek的模型表明,前沿AI能力也许不需要大量计算资源就能实现。通过巧妙的工程设计和高效的训练方式,高效利用资源也许比纯粹的计算能力更重要。这也许会激发一波创造浪潮,各家企业会寻觅具有成本效益的AI开发和部署方式。
DeepSeek的模型是开源共享的。近日,全球知名开源平台抱抱脸企业等多个团队已公布复现了DeepSeek-R1的训练经过。美国“元”企业首席AI科学家杨立昆在社交媒体上发文说,DeepSeek-R1的面世,意味着开源模型正在超越闭源模型。
英国《金融时报》的点评文章说,开源模型DeepSeek-R1对全球用户产生极大吸引力,有利于推动人工智能技术的开发和应用。文章说,对于大多数商业用户来说,拥有一款足够可靠而且好用的模型比拥有完全领先的模型更重要。“并不是每个司机都需要一辆法拉利。像R1这样模型的推理能力提高,也许会为和客户互动或处理职业任务的‘智能体’带来突破性变化。”如果能以更低的成本拥有这些模型,企业的盈利能力将提高。
瑞士瑞银集团指出,如果AI训练和推理成本显著降低,预计更多终端用户将利用AI来改善他们的业务或开发新的用途。
(来源:人民日报)