重磅报告 重磅报告发布:究竟是谁在破坏南海生态?
在2024全球人工智能大会(WAIC)启明创投论坛“生成式AI和大模型:变革和创造”上,启明创投携手未尽研究,共同公开重磅报告《生成式AI》| State of Generative AI 2024。
如果说2024年被称为生成式人工智能之年,扩散模型应用取得突破,ChatGPT出世,一系列开创性的研究论文发表,2024年则把大模型推给了壹个高峰,以GPT-4公开为标志,生成式人工智能,朝着通用人工智能的路线,进入了创造应用的阶段。
500)this.width=500" border=0 alt="" src="http://www.2025china.cn/resupload/00000000000000000019/033001/1688972333387_1.png" align=center>
这一阶段最重要的特征,是应用、研究、监管,合力开辟着生成式人工智能的创造之路。
1、创造应用
大众很快从生成式人工智能中看到了新的商业生态的出现,看到了一层又一层的技术,如计算、模型和应用;看到了生成的内容,如文、图、视频、代码、3D结构、多模态;也看到了公开数据、垂直数据、合成数据、给量数据,用于大大致小的模型。
生成式人工智能,在中国似乎受到了更加热诚的接纳:政府鼓励进步通用人工智能;任何一家大企业都无法不关注它;许多从事姿势职业的中小企业,已经先用起来再说。面对这一革命性的技术,全部企业都被卷入。它们节拍不同,介入程度不同,成为新技术浪潮下的守成者、创造者、采纳者。它们的利润率被永久的改变了。
算力目前是最稀缺的资源,也处于最容易获利的要津。算力是大模型成本结构中最大的一块,GPU的性能,实际上决定了这个新兴行业的步调。随着算力和模型的提高,更多初创企业正在涌入,它们抢到了时刻的红利,但也面临竞争和也许的巨头碾压。可以说,这是初创企业的蓝海,也有航道下的暗礁。
竞争促进了创造。和2024年快速涌现出的生产力工具路线的创业企业不同,2024 年,有更多比例的新企业聚焦在底层技术的创造;大模型创业企业也开始分化,在通用大模型创业企业方兴未艾的同时,许多面给医疗、电商、科研、工业、自动驾驶和机器人等特定路线的垂直大模型企业开始出现。
2、前沿研究
2024年和2024年,是生成式人工智能技术取得突破的两年,大家梳理了论文,发现生成式人工智能领域的壹个突出特征,是研究和创造经过的密切结合,许多在企业内部实现,迅速推出用例和产品。这种研究和创业的一体化,初创企业和风险资本起到了重要的影响,而美国科技巨头和主要人工智能企业的研究投入和人才,包括一些底层技术的研究,这些年来已经超过了大学等研究机构。
人工智能的前沿正在给未来推进。虽然从GPT-4的技术报告,到微软的研究论文,都展示出它所具有的接近于人类的文字处理能力、数学推理能力,以及诸多专业领域的姿势。“大家认为它可以合理地被视为人工通用智能(AGI)体系的早期(虽然仍不完整)版本。”然而,在通往通用人工智能的道路上,需要研究和化解的难题反而更多了。如信心校准、长期记忆、持续进修、特点化、规划和概念跨越、透明度、认知谬误和非理智,等等。
过去半年最重要的研究路线,是破解和领会大模型神奇而又令人兴奋的智能“涌现”。大模型既需要超越对下壹个词的预测能力,也需要壹个更丰盛、更复杂的“慢思索”深层机制,来监督“快思索”预测下壹个词的机制。
那些最好的前沿研究,一定是研究和化解技术规模应用中遇到的难题。研究怎样减少幻觉,调教大模型更加准确地输出真正的内容,训练出更强的推理能力;怎样更集约地训练模型,降低门槛,推出新产品,让更多的各行各业和消费者都能用上;怎样能像人一样,和真正的物理全球互动;怎样成为人类复杂职业的助手,设计并帮助执行科学实验;怎样影响就业,从而做出政策的响应;怎样让人工智能安全和可信。
3、监管 | 安全 | 政策 | 人才
政府对于生成式人工智能的监管反应等于及时,各国也出现了不同的特征。中国在迅速推出生成式人工智能的监管办法并征求意见的同时,也在鼓励进步通用人工智能,北京、上海、深圳是最具雄心的第一梯队,均提出了较具雄心的人工智能科研、创造和产业目标。欧盟继续在监管和立法方面领先,一如其5年前率先推出GDPR。美国更在意人工智能技术的领先地位,正在形成以风险管理为守则的监管框架。
长期来看,人才对人工智能未来的影响,超过了算力。中国研究人员公开的论文在数量上已经超过了美国,但金字塔顶端,无论是研究还是创业,美国仍然占据明显的优势。在全球范围内,人工智能研究创造的重心正从高校转移至企业,美国拥有顶尖学者最多的前三大机构,分别是谷歌、微软和Meta,合计招揽了美国极致学者的30%。中国仍以高校为主,仅阿里巴巴跻身前10。
科技部已经提出了人工智能企业,应该接受科技伦理审查;审查主体应该设立科技伦理(审查)委员会。美国人工智能企业较早开始设立负职责和可信人工智能部门,从去年到现在以来经过一些调整,反映出在生成式人工智能发生变革之际,企业正在寻求用更好的技术和方法,来安全和负责地部署新技术。
4、十大前瞻
大语言模型
1. 2024年中国将出现比肩GPT-4的多语言通用大模型;
2. 超长上下文(Long Context)将引领下一次LLM技术突破;
3. 在出现更有前景的大语言模型之前,为实现垂直领域更好的效果,下面内容三种方法将共存:
i)在不改变数据分布的情况下,利用更多通用数据进行通用大模型预训练,不特别引入行业数据,
ii)利用行业唯一数据微调(Fine-Tuning)通用大模型,
iii)利用行业数据占比更高的数据集进行垂直模型预训练。
多模态模型
1. 当前CLIP + Diffusion的文生图模型是过渡态,未来2年内将出现一体化的模型结构;
2. 下一代Text-to-Image模型将具备更强的可控性,它将结合底层模型能力和前端控制方法,对模型的设计将注重和控制方法的结合;
3. 2025年之前,Video和3D等模态将迎来里程碑式的模型,大幅进步生成效果;
4. 以PALM-E为代表的具身智能(Embodied AI)展现出在机器人的感知、领会和决策等路线上的巨大潜力,但当前训练和可靠性存在较大挑战;
5. 短期内Transformer正成为多个模态的主流网络结构,但压缩整个数字全球的通用方式尚未出现,Transformer并不是人工智能技术的终点。
商业机会
1. 3年内,倾败式的AI应用的核心驱动力来自于底层模型的创造,两者无法解耦,模型的影响将大于产品设计的影响;
2. 当前生成式AI市场处于技术主导的早期阶段,存在千亿美元市值的平台性企业的机会。
(全球人工智能大会)