作者:鹤山
3月16日14:00,百度创始人、董事长兼CEO李彦宏亲自坐镇,通过线上直播的形式发布了旗下新一代大语言模型文心一言(Ernie)。
继昨日凌晨GPT-4发布之后,百度紧急预告了文心一言的发布。作为国内第一个面向大众群体的大语言模型,文心一言被人们寄予了厚望,甚至出现了其将成为中国AI新旧时代划分里程碑的判断。
但其实在此之前,百度的“文心”阵营早已成型,涵盖文心大模型、工具与平台、产品与社区三个层级,本次发布的文心一言,即是产品与社区中的一员,与之前发布的文心一格(AI艺术和创意辅助平台)等产品是兄弟关系。
被寄予万千期待的“中国版ChatGPT”文心一言到底表现如何,今天的发布会终于为我们揭晓答案。
01 文心一言的五大能力
在李彦宏演讲环节,首先公布了文心一言的五大能力,即文学创作、商业文案创作、数理逻辑推算、中文理解、多模态生成。
1、文学创作
在文学创作能力方面,李彦宏向文心一言提出几个问题(提前录制好的演示视频):包括《三体》的作者是哪里人、从哪些角度可以续写《三体》、如何从哲学角度续写,演员张鲁一和于和伟的身高对比等。
在演示中,文心一言准确地回答了《三体》作者的籍贯,并列出4个可以续写的方向,甚至从哲学角度给出了续写《三体》的几个梗概方向。
李彦宏表示,这几轮问答体现出文心一言总结分析、推理能力,对于一个生成式大模型来说,能把这些问题都答对并不容易,文心一言可以相对保证事实性的内容比较准确。
2、商业文案创作
对于很多人关心的文心一言在商业内容的生产力方面,百度展示了文心一言生成公司名称、slogan、新闻稿三方面的能力。可以看出,文心一言在中文语境下面对商业问题的处理,确实有望与GPT-4一决高下。
3、数理逻辑推算
这一环节,李彦宏提出了经典的“鸡兔同笼”问题,这也是早期导致ChatGPT“翻车”的问题之一。
但在演示中,文心一言确实表现出了强大的数理计算和推理能力。第一次提问故意把题目出错,文心一言发现算不出来时,会提示“是不是题出错了?”并在题目更正后给出了正确答案。
不仅知道题对不对,也不仅给出答案,文心一言还给出了详细的解题步骤,很像真实的学生解题过程。李彦宏表示,在百度过去的内测中,虽然还不能百分百保证把题目做对,但能看到能力一直在进步。
4、中文理解
作为中文互联网界的搜索引擎大厂,百度对中文的理解远超其他互联网企业,李彦宏也表示:“文心一言对中文的理解应该超出世界上任何一个大模型。”
这一环节,李彦宏分别让文心一言对成语“洛阳纸贵”做出解释、告诉用户洛阳的纸到底有多贵,分析其经济学原理,并用“洛阳纸贵”写一首藏头诗。文心一言均做出了比较完美的回答。
5、多模态生成
在文心一言发布会的前一日GPT-4刚刚发布,并凭借对图片的多模态处理能力狠赚了一波眼球,好在,文心一言在发布之初就要具备这项能力了。
演示环节中分别让文心一言根据图片生成一张海报,一段视频,并将一段文字用四川话“读”了出来。
图片生成的能力虽不如GPT-4惊艳,但现阶段能做到如此程度已实属优秀。视频能力则是意外之喜,相信会解放很多视频内容工作者的生产力。
可惜的是,李彦宏表示生成视频因计算成本较高,暂未开放,但百家号的创作者,每天有几万篇的视频内容,其实已经在用这个技术在进行创作和分发。
对这五大能力,李彦宏强调:从对文心一言的体验看,其已经具备了一部分人类的理解能力,并在不断完善之中,在使用时会惊喜,会发生错误,但可以肯定的是,它的进步速度很快。
在介绍产品之后,李彦宏还解释了文心一言是怎么做出来的,以及百度在AI时代的独特优势。
李彦宏称,进入AI时代后,IT技术栈从三层变为四层,芯片层从CPU变为GPU,文心一言处于模型层,AI时代的应用,会基于大模型进行开发,之后不管是搜索、聊天还是其他,都会基于预训练大模型进行开发。百度每天有数十亿的问答,文心一言之后也会在这个量级,生成式AI非常耗费算力,费用相当昂贵,但四层架构之间相互进行协同,优化,可以使效率比别人高很多,并降低成本。框架层的协同已经让百度在过去几个月的测试期间享受到了效率的收益。
在全球范围内,在四个层级都拥有领先产品的,百度是世界唯一,这将大大支持文心一言的迭代速度。
02 中国需要有自己的GPT
很多人在发布会前会问一个问题:百度版的ChatGPT为什么现在发布?李彦宏的回答是:因为客户需要。百度深耕国内市场多年,积累了众多B端客户,据百度所说,其中相当多的客户希望百度能尽快发布文心一言。
在这之外,李彦宏也在发布会现场表示,文心一言其实在19年就发布了,每年也都会发布新版本,但现在因为ChatGPT和GPT-4的发布,用户心理预期是要对标GPT-4的,这直接拉高了技术门槛。
百度是全世界大型互联网企业中第一个发布大语言模型的,微软是直接调用GPT,谷歌,Meta等并没有发布。
虽然能明显看出,发布会上的李彦宏希望尽量降低用户预期,并反复强调文心一言发布后会不断、快速的进步,但市场似乎并不买账,截至发稿时,百度的股价已闪崩9%,用户的关注度也并没有放在文心一言产品本身上,而是在关注李彦宏的紧张和颤音、全程没有实际体验,以及需要邀请码才能体验的机制上。
但正如李彦宏所说,文心一言不是中美对抗的工具,而是百度一代代技术人员追求的结果,是服务亿万客户的最新平台,更是创新驱动发展的证明。文心一言十月怀胎,一朝分娩,作为用户,可能也需要给文心一言、给百度,足够的时间。
彩蛋:
文心一言的英文名叫“Ernie”,取自美国公共广播协会制作播出的儿童教育电视节目《芝麻街》,之所以取这个名字,是因为百度老冤家谷歌的自然语言模型“Bert”同样来自于《芝麻街》,多少有些“相爱相杀”的味道。