国内 AI大模型产业发展现状及展望
近年来,我国始终高度重视人工智能发展机遇和顶层设计,发布多项人工智能支持政策。国务院于2017年发布《新一代人工智能发展规划》,科技部等六部门于2022年印发《关于加快场景创新 以人工智能高水平应用促进经济高质量发展的指导意见》对规划进行落实。2024年《政府工作报告》中提出开展“人工智能+”行动。
政策、技术、市场驱动AI大模型产业发展
伴随人工智能技术的加速演进,AI大模型已成为全球科技竞争的新高地、未来产业的新赛道、经济发展的新引擎,发展潜力大、应用前景广。
AI 大模型的出现,使得利用人工智能技术来生成内容,从 “可用” 跨越到 “好用” 。生产内容是所有行业共有的需求,如今大模型已经在电商、影视、传媒等领域被规模应用。大模型与电力、零售、出版等传统行业的成功融合,展现对传统产业改造提升的潜力。大模型赋能金融、医疗等行业提质增效,对推动新质生产力快速发展起到重要作用。
近年来,我国始终高度重视人工智能发展机遇和顶层设计,发布多项人工智能支持政策。北京、上海、广东、安徽、福建和深圳、杭州、成都等地均发布了AI大模型的相关产业政策。出台一系列扶持政策和规划,为 AI 大模型产业发展创造了良好的环境。
2024 年,多重利好因素将推动大模型快速发展,首先是“人工智能+”行动等来自政府层面的有力支持,其次用户提升生活、工作效率的需求激增,再加上科技公司加大对 AI 领域投入资金、人力、技术研发,各环节协同支撑大模型发展。
当前大模型产业也面临挑战,包括算力分散不足、Transformer 结构是否为最优的疑问、领域数据稀缺、缺少现象级应用的问题。就产业趋势而言,投入基础模型训练的公司未来可能会大幅减少,转而更多的公司会去寻找应用场景和爆款应用。
在大模型盛行的时代,产业发展到何种阶段,遇到何种挑战,未来将走向何方,这些都是需要面对的问题,亟需社会各界共同努力。
中国 AI 大模型产业发展背景及政策驱动力
近年来,我国始终高度重视人工智能发展机遇和顶层设计,发布多项人工智能支持政策,国务院于 2017 年发布《新一代人工智能发展规划》。科技部等六部门也于 2022 年印发《关于加快场景创新,以人工智能高水平应用促进经济高质量发展的指导意见》对规划进行落实。
( 图片来源:国务院印发《新一代人工智能发展规划》_滚动新闻_中国政府网 )
( 图片来源:科技部等六部门关于印发《关于加快场景创新以人工智能高水平应用促进经济高质量发展的指导意见》的通知_国务院部门文件_中国政府网 )
2024 年《政府工作报告》中提出开展“人工智能+”行动。伴随人工智能领域中大模型技术的快速发展,我国各地方政府出台相关支持政策,加快大模型产业的持续发展。
当前,北京、深圳、杭州、成都、福建、安徽、上海、广东等地均发布了关于 AI 大模型的相关政策。详情如下:
● 北京着力推动大模型相关技术创新,构建高效协同的大模型技术产业生态;
● 上海强调打造具备国际竞争力的大模型;
● 深圳重点支持打造基于国内外芯片和算法的开源通用大模型,支持重点企业持续研发和迭代商用通用大模型;
● 安徽从资源方面着手吸引大模型企业入驻;
● 成都着力推动大模型相关技术创新,重点研发和迭代 CV 大模型、NLP 大模型、多模态大模型等领域大模型以及医疗、金融、商务、交通等行业大模型;
● 杭州支持头部企业开展多模态通用大模型关键技术攻关、中小企业深耕垂直领域做精专用模型。
AI 大模型产业发展技术驱动力
近年来,AI 大模型得到快速发展,当前大模型热潮主要由语言大模型相关技术引领。语言大模型通过在海量无标注数据上进行大规模预训练,让模型学习大量知识并进行指令微调,从而获得面向多任务的通用求解能力。
2022 年,OpenAI 推出 ChatGPT,其拥有强大的自然语言交互与生成能力。2023 年,OpenAI 多模态预训练大模型GPT-4 发布,其具备多模态理解与多类型内容生成能力。2024 年,OpenAI 发布视频生成大模型 Sora,提出时空碎片和扩散 Transformer 技术,大模型的多模态生成能力的进一步成熟。
中国 AI 大模型产业发展市场驱动力
从功能角度,包括文本生成、语言理解、文本翻译、知识问答、逻辑推理、数学计算、代码生成、图像生成、多模态等,这也是我们广义理解的通用大模型。
从行业角度,包括金融、电商、教育、医疗、出行、制造、政务、传媒等
从业务域角度,包括设计、生产制造、营销、销售、售后、行政、人力、财务、风控等
从受众客户角度,包括 C 端客户(主要关注生活便捷性、娱乐体验和个性化服务等方面)、B 端客户(关注数据分析和处理、生产效率和产品质量提升以及创新智能应用产品的构建等方面)、G 端客户(关注政务服务效率提升、政策制定的合理性和前瞻性以及数据安全等方面的需求。
国内 AI 大模型应用侧的投融资趋势
近年来,中国 AI 大模型应用侧的投融资活动较为频繁,尤其是在 2023 年大模型爆发之后,投融资事件和金额都有所增加。然而,与过去移动互联网时期的 PE/VC 机构站“ C 位”不同,当前产业资本成为了这轮 AI 浪潮最坚定的投资者。
投资领域
AI 大模型应用侧的投融资主要集中在金融、政务、医疗、电商、教育、终端等六大行业领域。这些行业对 AI 大模型的需求旺盛,希望通过引入 AI 技术来提高效率、降低成本、优化服务。在产品方向上,跨模态(数字人等)、语言及音乐、影像、多模态等成为重点投资的产品场景。
投资阶段
从投资阶段来看,AI 大模型应用侧的投融资活动涵盖了从天使轮到 B 轮及以后的各个阶段。其中,天使轮、Pre-A 轮、A 轮等早期投资轮次分布较多,B 轮及以后较为成熟的投资轮次分布较少。但值得注意的是,随着 AI 技术的不断成熟和应用场景的拓展,B 轮及以后的投融资活动也在逐渐增加。
地域
从地域分布来看,中国 AI 大模型应用侧的投融资活动主要集中在北京、上海、广东、江苏和浙江等地。这些地区经济发达、科技实力强、人才资源丰富,为 AI 大模型的发展提供了良好的环境和条件。
应用场景多元化
AI 大模型应用侧的投融资活动涉及多个应用场景,包括金融领域的智能客服、风控管理;政务领域的智能办公、信息公开;医疗领域的辅助诊断、健康管理;电商领域的智能推荐、个性化营销;教育领域的智能教学、学习辅导;终端领域的智能车载、智能家居等。这些应用场景的多元化为 AI 大模型的发展提供了广阔的市场空间。
中国 AI 大模型产业典型案例
科大讯飞—讯飞星火认知大模型
大模型简介:
讯飞星火认知大模型是科大讯飞推出的新一代认知大模型,可实现基于自然对话方式的用户需求理解与任务执行。讯飞星火从赋能万物互联时代的人机交互、赋能知识学习与内容创作、提升数智化生产力三个方面展现其应用能力。讯飞星火认知大模型具备七大核心能力:文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力和多模态能力。
大模型优势:
2024 年 1 月,讯飞星火认知大模型 V3.5 发布,七大核心能力全面提升。据科大讯飞宣称,数学、语言理解超 GPT-4 Turbo,在代码能力方面已经达到 GPT-4Turbo 的 96%。另外,星火大模型在多模态理解方面达到 GPT-4V 的 91%,其中语音的多模态能力已经超过 GPT-4。
百度公司—文心一言大模型
大模型简介:
文心一言是百度研发的人工智能大语言模型产品,具备跨模态、跨语言的深度语义理解与生成能力,在文学创作、文案创作、搜索问答、多模态生成、数理逻辑推算等众多领域都能为用户提供高质量服务。文心一言拥有四大基础能力:理解能力、生成能力、逻辑能力、记忆能力。
大模型优势:
2023 年 10 月发布的“文心大模型 4.0”,相比上一代文心大模型,四大能力显著升级,其中逻辑提升幅度是理解的 3 倍,记忆提升幅度是理解的 2 倍。
理解能力方面,文心一言能听懂潜台词、复杂句式、专业术语、前后乱序、模糊意图等复杂提示词,也能胜任代码理解与调试任务;
生成能力方面,文心一言能快速生成风格多样的文本、代码、图片、图表、视频,比如进行文案创作、制定生活计划、编写高质量代码;
逻辑能力方面,文心一言能帮用户解决复杂的逻辑难题、困难的数学计算、重要的职业/生活决策、代码纠错、常识推理、逻辑校验、立体几何、辩论灵感等;
记忆能力方面,经过多轮对话后,文心一言依然能记住对话的重点,轻松胜任复杂问题、沉浸体验角色对话。
阿里巴巴—通义千问大模型
大模型简介:
通义千问是阿里云研发的预训练语言模型,基于先进的自然语言处理技术(NLP), 执行理解、生成和解释人类语言、图片和文档等任务。通义千问能在创意文案、办公助理、学习助手、趣味生活等方面为使用者提供丰富的交互体验。
通义千问具备中英文理解、数学推理、代码理解等能力。
大模型优势:
2023 年 10 月,千亿级参数大模型通义千问 2.0 发布,相比 1.0 版本,其在复杂指令理解、文学创作、通用数学、知识记忆、幻觉抵御等能力上均有显著提升。
中英文理解能力是大语言模型理解和表达的基础能力,英语任务中,通义千问 2.0 的 MMLU(伯克利大学、哥伦比亚大学等联合发布)基准得分是 82.5。中文任务中,通义千问 2.0 在模型训练中学习了更多中文语料,在 C-EVAL(上海交大和清华联合研发的中文大语言模型测试集)基准上获得最高分;
数学推理方面,在推理基准测试 GSM8K(OpenAI 发布的小学数学测试集)中,通义千问排名第二,展示了强大的计算和逻辑推理能力;
代码理解方面,HumanEval(OpenAI发布)测试衡量大模型理解和执行代码片段的能力,通义千问排名第三,这一能力是大模型在编程辅助、自动代码修复等场景的基础。
中国 AI 大模型产业发展所面临的挑战
随着 AI 大模型规模呈现指数级增长,训练大模型越发依赖高性能 AI 芯片。
AI 大模型的训练速度、产出质量,都和算力直接相关,对于 GPT 这种大语言模型(LLM)来说,算力的要求更高,也决定了模型的“智商”。目前主要以英伟达的 A100、H100 为代表的高性能 AI 芯片应用到主流 AI 大模型的训练过程。
以ChatGPT 为例,微软 Azure 云服务为其提供了 1 万枚英伟达 A100 GPU,这个算力也正是国内云计算技术人士共识的 AI 大模型门槛。然而国内拥有 1 万枚 GPU 的企业很少,而且单枚 GPU 普遍弱于英伟达 A100。
从我国自研 AI 芯片来看,中国本土的高性能芯片龙头以华为海思、寒武纪、地平线、昆仑芯等为代表。我国正在高性能芯片领域加大投入并取得极大进展,部分解决方案正替代英伟达成为一些大厂的选择。
但国产芯片性能目前仍与国际顶尖水平存在一定差距。总体而言,国内 AI 高性能芯片市场受进口限制和国内技术瓶颈的双重影响,大模型产业发展受到算力层面的一些制约。
未来,随着全球 AI 高性能芯片不断迭代升级,也将持续推动大模型性能和能力的提升。
面对未来,我国需进一步加强资源与研发力量的统筹,强化大模型在发展中的场景牵引作用,促进经济社会的高质量发展,以实现大模型技术的高质量应用突破,驱动实体经济的蝶变和产业变革。
培养实战型IT从业者&你的技能提升好帮手--创想云教育
参考内容:人民网财经研究院 & 置顶科技
ai大模型产业发展报告2024 (nineteen17114578641.pdf)