来源:发现报告
ChatGPT正在以颠覆性的使用体验,从科技领域破圈,重建了全球用户对人工智能的认知。
作为一款生成式人工智能模型,ChatGPT兼具理解力、创造力和记忆力,主要功能是与用户进行自然语言的交互,即与用户对话。
上周《聊聊你知道和不知道的ChatGPT》中,我们详细介绍了ChatGPT是什么,商业模式及国内相关公司发展现状。ChatGPT能理解并生成文字,属于AIGC(AI-Generated Content,人工智能生产内容)技术应用中的文本生成模态应用模型。
本文,报告酱就来聊聊ChatGPT背后的概念AIGC,看它的上下游,算力、算法和下游应用和发展前景。
对此,报告酱梳理了多篇报告,精选其中10篇文末查看,本文将与大家一起分享上述问题。(公众号私信回复【AIGC】免费领取相关报告合集)
AIGC是什么,与ChatGPT的关系?
AIGC的全称是AI-Generated Content,人工智能生产内容。
也就是利用人工智能技术自动生成内容,包括文字、图片、音频、视频、代码等。AI绘画、AI写作、AI对话、AI播客、AI搜索引擎等都属于AIGC的分支。
在AIGC技术应用的模态中,有一种模态是文本生成,而ChatGPT就是文本生成的代表产品之一。
过去传统人工智能偏向分析能力,而现在人工智能正在生成新内容,通过大量的训练数据和生成算法模型,自动生成文本、视频等各种形式的内容。
AIGC代表AI技术发展的新趋势,也会带来内容创作的新变革。例如,智能数字内容孪生能力、智能数字内容编辑能力、智能数字内容创作能力。
AIGC的核心命门
从ChatGPT的模型演变看,它经历了3次——收集反馈数据→训练奖励模型→PPO(一种算法)强化学习,综合看,成功的关键原因有四点:
-
强大的基座模型能力(Instruct GPT);
-
大参数语言模型(GPT 3);
-
高质量的真实数据(精标的多轮对话数据和比较排序数据);
-
性能稳定的强化学习算法(PPO 算法)。
可以发现,ChatGPT依赖于GPT大模型,而GPT大模型则需要依靠微软Azure超算中心提供算力训练。同样的,我们也可以认为ChatGPT等AIGC产业依然离不开算力、算法模型、应用的基本框架。
AIGC模型有大量参数及数据参与训练,因此对算力基础设施有较高要求,这使得头部大厂的规模优势更加突出。例如ChatGPT选择微软Azure云服务,Stability AI选择了亚马逊AWS云服务。当下国内主要算力提供商包括阿里、腾讯、百度、商汤。
模型的构成除了以上,还需要强大的AI团队和资金支持。AI团队,不仅是构建模型,还需要能够根据行业趋势对模型做持续优化和架构升级;大模型的算力要求高,模型训练超过千万美金需求量。
据Open AI测算,自2012年起,全球头部AI模型训练算力需求每3-4个月翻一番,每年头部训练模型所需算力增长幅度高达10倍,而ChatGPT训练阶段总算力消耗约为3640PF-days(即 1 PetaFLOP/s 效率跑3640天)。据测算,GPT-3训练成本预计在500万美元/次。
华西证券判断AIGC领域头部企业将逐渐构建自身壁垒,剩下的初创公司将依附于头部企业去做应用,例如游戏公司可以利用大模型去生成NPC里面自然式对话。
从而,也可以看出AIGC产业链将会分为技术提供方和应用开发者两种。
AIGC多场景快速落地
目前AIGC很典型的应用是:利用自然语言描述作为输入,生成各种模态的数据。包括:文本、代码、图像、语音、视频、3D模型、场景、音乐等。
文本生成方面,AIGC目前可以较好地完成新闻播报等结构化写作、推荐相关内容、帮助润色等非结构化内容,同时在虚拟男/女友、心理咨询等闲聊机器人中应用较为广泛。剧情续写、营销文本、文本交互游戏等应用还没实现规模化应用,期待未来某一天,AIGC的终稿能媲美甚至超越人类。
图像生成方面,随着算法模型的不断迭代,AI 作画水平不断提高。在图像编辑工具上,去除水印、提高分辨率、特点滤镜等已较广泛应用。根据要求生成画作、海报、模特图等功能性图像生成发展也接近成熟。但与专职艺术家、设计师和摄影师的产品设计作品存在一定差距。
音频生成的发展较为成熟,消费与企业级的应用正在铺开。当前,AIGC在语音克隆、生成虚拟人的特定歌声/播报等的文本生成特定语言、包含作曲与编曲的乐曲/歌曲生成上得到广泛应用,代表企业和应用的有倒映有声、Deepmusic、网易-有灵智能创作平台等。AI 降噪去除压缩和采样中的噪音仍需改善,AI作曲不再机械化与人类创作音乐水平相仿,在未来值得期待。
视频生成方面,AIGC对于删除特定主体、生成特效、跟踪剪辑等的视频属性编辑已较广泛应用,视频换脸等的视频部分剪辑预计不久将规模化应用。当前,全自动生成长视频作品还不能实现,距离依个人梦想定制电影和剧集还较为遥远。
其他应用领域还有游戏、代码、3D等。代码补全生成已较为成熟,大量应用早已落地;游戏中游戏操作策略生成和NPC逻辑及剧情生成尚需进一步完善;3D生成尚处于早期阶段,还没实现规模化应用。相关领域的更加智能将成为未来增长方向。
由这些基本模式的生成任务,可以衍生出各种各样的应用场景。随着AIGC技术的发展和人们想象力边界的扩展,这些场景还将继续增加。
AIGC使得C端以较低的门槛使用,但B端仍然是AIGC目前主要商业模式。C端的付费逻辑在于高效获取信息,替代表达以及扩大用户创造力;B端主要原因是它能为企业节省大量成本,使企业可以节省大量人力成本。
近期微软、谷歌等全球软件互联网大厂大力投入AIGC,并开始探索应用层面的突破,AIGC已经来到2年前自动驾驶的应用突破拐点,2023年有望成为AIGC大年。
传统商业时代,驱动力是产品本身,互联网商业时代,驱动力是用户流量,数字商业时代,消费升级(场景要素、体验要素、服务要素)和数字技术同步驱动,以互联网、物联网、大数据和人工智能等数字技术为核心,加速商品、营销、服务、供应链数字化改造,以更高的效率、更好的体验为用户提供商品和服务。
AIGC作为AI数字商业的探路者,有望开启下一场数字商业模式的新篇章!
#你用过哪些AIGC产品,感觉如何?