撰文/ 陈邓新
编辑/ 高 智
文心一言,终于揭开了神秘面纱。
2023年3月16日14时,百度在北京总部召开新闻发布会,宣布正式邀请测试基于百度新一代大语言模型的生成式AI 产品文心一言。
百度创始人、董事长兼首席执行官李彦宏表示:“百度希望和大家一起,推动人工智能技术进步,让所有人都能使用最先进的生产力工具,让所有人都能从中受益。”
反应到资本市场,当天百度美国股价收盘上涨3.8%,次日百度香港股价早间高开高走,大幅拉升,盘中涨幅最高近15%,资本认可的态度可见一斑。
凭借在AI领域的长期投入,百度站在历史的拐点。
对标GPT-4,文心一言底气十足
时代,变了。
2023年3月15日凌晨,OpenAI正式发布了升级后的GPT-4,具备了图像处理,尽管如此仍有不足之处:在新版本中,AI依旧存在社会偏见、捏造事实、对抗生成等问题。
对此,“虎嗅科技组”进行了“胡编乱造”测试,发现GPT-4与GPT-3.5一样,从容地编造了“林黛玉倒拔垂杨垂杨柳”“鲁智深败走麦城”等故事,并没有改进。
而一天之隔,百度的“文心一言”也横空出世。
巧合的背后,则是棋逢对手,标志着AI正式迈入“iPhone时刻”,拉开新时代的序幕。
事实上,文心一言虽然对标GPT-4,却大有不同:走了一条“人有我有,人有我优”之路,寻求差异化竞争力,与GPT-4形成错位竞争。
具体来看,文心一言对人类意图的理解颇深,在现场展示的互动中,准确性、逻辑性与流畅性已逐渐接近人类的水平。
譬如,文心一言不但可以正确解释“洛阳纸贵”的成语含义,还可以阐述“洛阳纸贵”背后的经济学理论,更可以借此创作一首藏头诗。
展开全文
再譬如,鸡兔同笼是著名的数学趣题,文心一言不但可以解题、一步步算出正确答案,更可以判断题目是否正确,逻辑思维与常人无异。
以上可见,文心一言的文学创作、商业文案写作、数理逻辑推算等能力,可与GPT-4正面叫板。
此外,文心一言也有独到之处。
一方面,大模型更懂中文。
中文博大精深,哪怕同一个词汇,在不同语境或有不同的意义,对AI是一个巨大的挑战,这难不倒文心一言。
毕竟,作为一家中国公司,百度天然占据中文语境的优势,再叠加持之以恒地深耕,从而对中国文化的理解更深:文心一言大模型的训练数据包括万亿级网页数据,数十亿搜索数据和图片数据,百亿级语音日均调用数据,及5500亿事实的知识图谱。
一言以蔽之,百度的文心大模型扎根于中国本土,比国外开发的大语言模型更适合中文语境和中国市场。
另外一方面,多模态更丰富。
相比GPT-4,文心一言可以生成视频与方言语音,前者降低了视频制作的门槛,一次创作,触及文本、图片、视频等全域内容生态;后者覆盖不同地区的群体,方便用户流畅地进行智能互动。
百度多模态的实力,可见一斑。
未来,百度多模态统一大模型的能力增强,文心一言的多模态生成能力也会不断提升。
厚积薄发,才能水到渠成
需要注意的是,Open Al为美国创业公司,而正式发布对标GPT产品的,百度是全球大厂的第一个,值得高看一眼。
这并非突击数月就办得到的,而是厚积薄发的结果。
首先,十年投入超千亿元。
2013年起,百度陆续成立了百度美国研究院、百度深度学习研究院、大数据实验室、硅谷人工智能实验室,从此不断加码勇攀AI技术的高峰。
这十年来,百度在AI累计投入了超1000亿元,其中核心研发投入占核心收入比例连续多个季度超过了20%。
以2022年为例,百度的研发费用为233亿元,占核心收入的比例高达24.42%,而全年的净利润也不过206.8亿元。
专注之下,回报也肉眼可见。
据《中国人工智能专利技术分析报告(2022)》报告显示,百度AI专利申请量为16754件,AI专利授权量为5705件, AI专利申请量与授予量连续五年全国第一。
实际上,从全球AI专利数量排名来看,百度已稳压微软、谷歌一头,这意味着百度AI在中国乃至全球范围均具有综合优势。
其次,持续夯实算力底座。
技术占优之外,百度也有承接AI算力的底气。
多年以来,百度一直是“新基建”的主力之一,在算力基础设施上一向未雨绸缪,并规划2030年百度智能云服务器数量超500万台。
如此一来,百度自然没有算力瓶颈的困扰。
更为重要的是,百度在山西阳泉、江苏盐城等地建设智算中心;其中,百度阳泉智算中心是亚洲最大单体智算中心,建设规模为4 EFLOPS(每秒400亿亿次浮点运算)AI算力,可满足各行业超大规模AI计算需求。
再次,打造AI闭环。
百度是中国唯一一家拥有全栈AI技术架构的公司:从高端芯片昆仑芯,到飞桨深度学习框架,到文心预训练大模型,再到行业AI落地,在芯片层、框架层、模型层与应用层都有关键自研技术。
早在2019年3月,百度提出知识增强的语义理解框架ERNIE,曾一举登顶全球权威数据集GLUE榜单,首次突破90分大关,刷新榜单历史。
同年9月,百度发布全球首个百亿参数的对话大模型PLATO-XL,一举超过Facebook Blender、谷歌Meena和微软DialoGPT,成为全球首个百亿参数中英文对话预训练生成模型。
截至2022年11月,文心已累计发布11个行业大模型,涵盖电力、燃气、金融、航天、传媒、城市、影视、制造、社科等领域。
换而言之,由于掌握了关键自研技术,百度在模型、框架、芯片、应用这四层架构之间的协同势必更为通畅,这是其他玩家不可比拟的优势。
百度首席技术官王海峰表示:“文心一言是百度多年技术积累和产业实践的水到渠成,尤其是飞桨深度学习平台和文心大模型的联合优化,为文心一言提供了坚实的技术支撑。”
赋能千行百业,百度智能云提速
文心一言落地,百度智能云一马当先。
过去多年间,价格战成为全球云计算行业的关键词,“带头大哥”亚马逊AWS降价近百次,而国内更是杀红了眼。
一度,出现“一元中标”“一分钱中标”的怪事,令人唏嘘不已。
旧时代一味追求低价,新时代从拼价格走向拼AI。
这意味着,用户今后选云更为聚焦智能服务,AI能力成为首要指标,那么谁掌握了AI的战略高点,谁将成为下半场的最大赢家。
随着云市场游戏规则的根本改变,百度智能云有了后来居上的资本,路将越走越宽、越走越顺、越走越远。
更为关键的是,百度智能云可以为产业带来AI普惠。
百度智能云的打法为云智一体,以云计算为基础,以AI为抓手,聚焦重要赛道,借助百度大脑、飞桨平台等对产业输出百度强悍的AI能力,推动产业走向智能化转型,从而不断革新生产力,以到达降本增效的目的。
眼下,百度智能云已与汽车、电子、能源电力、装备制造、钢铁、化工、水务等超过22个行业的300多家标杆企业建立合作,为超过18万家工业企业提供服务,让行业认识到智能化的实际价值。
有了文心一言加持,百度智能云赋能千行百业势必更为得心应手。
譬如,百度智能云为国能绥中打造了“设备故障知识库”,实现运维数据快速查询、运维需求即问即答,信息查找速度较之前提升90%;同时,对历史设备故障经验和运规数据进行智能分析,为维修人员提供辅助决策,设备故障检修周期缩短50%以上。
截至2023年3月17日10点,申请文心一言AIP调用服务测试的企业已达7.6万家,涉及互联网、媒体、金融、汽车、软件等行业,而百度智能云已与5家企业完成首批签约合作,并与650家企业启动签约。
让每一家公司离客户更近,成为百度智能云最大的诉求。
中信证券认为:“百度具备‘模型、框架、芯片、应用’的全栈布局,上述领域的产业落地有望带动百度云计算业务在AI领域的持续拓展,持续强化公司智能云业务的竞争力与远期市场空间。”
总而言之,文心一言承载了百度科技改变世界的梦想,是赋能千行百业的新平台,势必成为产业的智能牵引,驱动产业不断降本增效。
毕竟,文心一言的一小步,百度的一大步。
特别声明
本文仅代表作者观点,不代表本站立场,本站仅提供信息存储服务。