火爆全球的ChatGPT ,张江也有!_人工智能_模型_一言

2023

ChatGPT

让我们聊聊人工智能

新年刚过,一款被称为“史上最强 ”的聊天机器人ChatGPT迅速火出了圈。似乎一夜之间,所有人都在玩ChatGPT,聊人工智能。

2022年11月30日,ChatGPT发布上线,5天之内收获了100万用户。推出仅仅2个月,ChatGPT的月活跃用户就超过了1亿人,成为历史上增长最快的消费者应用程序。

遗憾的是,中国用户暂时还没办法直接使用这款火爆全球的应用。不过,我们不用等待太久——2023年2月7日,百度官方公众号发布了一条极为简短的通告——《官宣:文心一言》。“文心一言”正是百度内部所研发的类ChatGPT聊天机器人,其英文名称为ERNIE Bot。

据悉,“文心一言”将于三月份完成内测,面向公众开放。

展开全文

消息一出,刷爆热搜。

▲2023年2月6日,有用户使用手机和电脑访问OpenAI的网站,显示ChatGPT目前已满负荷运转,暂时关闭服务,用户可要求ChatGPT在恢复服务时收到电邮通知。(来源:IC photo )

01

什么是ChatGPT?

ChatGPT(Chat Generative Pre-Trained Transformer,聊天生成式预训练转换器)是人工智能公司OpenAI开发的一种全新聊天机器人模型,它能够通过学习和理解人类的语言,并进行对话,还能根据聊天内容的上下文进行互动,并协助人类完成一系列任务,因此有望成为提高办公、学习效率的工具。

这款AI语言模型让撰写邮件、论文、脚本,制定商业提案,创作诗歌、故事,甚至敲代码、检查程序错误都变得易如反掌。和ChatGPT“聊过天”的网友纷纷感叹:“只有你想不到,没有ChatGPT办不到的。”

一些人感觉即将失业,大家明显感到,ChatGPT掀起一股时代巨浪,它的影响力不亚于蒸汽机、铁路、电报、互联网的诞生和运用,以ChatGPT为代表的AI自生成技术,让人工智能实现从感知理解世界到生成创造世界的跃迁。

新时代的大幕徐徐拉开。

最新消息一次次爆出,话题一个比一个夺人眼球。

#ChatGPT让苹果急了#

#美国89%的大学生都是用ChatGPT做作业#

#ChatGPT被多方抢注商标#

#多家学术期刊禁止将ChatGPT列为合著者#

#ChatGPT有多靠谱#

#马斯克曾称ChatGPT好得吓人#

▲能写代码写作业,能写剧本能做题, 甚至还能代写辞职信……网友直呼:ChatGPT实在厉害。

以ChatGPT为代表的AIGC(利用人工智能自动生成内容)技术自面市以来,就以迅雷不及掩耳的“狂飙”之势,引爆多个热搜话题。 人们难掩心中的好奇——人工智能怎么一下子突然变得这么“聪明”了?

其实说来也简单,ChatGPT如此强大,离不开背后丰富的知识储备。

用于训练ChatGPT的数据集至少包含4990亿个token(token为语言中最小的语义单位,在英文中等于一个单词,在中文中等于一个词语), 把这些内容全部打印下来汇总到一起,相当于把648.5万本《哈利·波特与魔法石》垒到一起。

这4990亿个token覆盖海量的博客、书籍、新闻资讯、网站内容等。

02

博观约取后仍有局限,为什么

“博观约取”在ChatGPT的学习中被发挥到了极致。AI是如何做到这一点的?

首先,AI学习来自网络的文本数据,并在类似文字接龙的训练中给出随机答案以获得基础预感。然后,通过人工标注的问答数据微调模型的使用,使其在一定程度上理解人类的意图,这一步,训练进入引导接龙阶段。

然后,人工对AI生成的结果进行排序,就排序相关数据训练奖惩模型;奖惩模型就像一名“助教”,通过训练这一助教模型学习大量的由人工打分的问答,帮助其学会判断回答的质量; 助教模型负责为ChatGPT的练习回答打分,回答得好奖励高分,否则惩罚给低分。此时,训练进入模仿喜好阶段。

最后,根据打分更新参数,强化AI学习,训练其输出高质量回答的能力。

说得通俗一点

整个过程和教小朋友数学差不多:先上课给例题;然后,给作业;针对作业打分后,挑出一些总是出错的题目,再进行有针对性的练习。最关键的一点是,对于不同的学科和知识点,我们并不需要从头训练从而得出一个新模型;这一次,人类不再需要含辛茹苦数十载进行数据训练,只要拿出之前训练好的模型,给出一些指导,AI就能get一个新技能。

眼下,ChatGPT正在通过和全球上亿用户的互动,不断增强自身的能力。

不过,值得注意的是,ChatGPT 看上去功能强大,但它的数据更新仍然停留在2019年,尚无法做到及时更新。在日新月异、瞬息万变的现代社会,ChatGPT的数据集无疑有些落伍。

其次,受制于数据集的质量,ChatGPT无法克服用语啰嗦繁复、内容虚假或带有偏见等问题。

但 从目前的结果来看,这些都不足以阻挡ChatGPT迅速进入各行各业,并引发各种涉及社会经济发展、商业模式、道德伦理的大讨论。

03

百度出击 :“文心一言”已被官宣

ChatGPT火热的同时,谷歌、微软等欧美巨头掀起又一轮“AI大战”。在国内AI行业下了重注的百度,自然反应迅速。

2月7日,百度宣布即将推出类似ChatGPT的对话式AI工具“文心一言”,其英文名为ERNIE Bot。

有意思的是,该“官宣”的责任编辑为:希加加、度晓晓、叶悠悠、林开开,即百度打造的AI虚拟数字人家族,正是百度通过文心PLATO对话大模型和全球超百亿规模中英文对话预训练模型参数生成的数字虚拟人。

据悉,百度目前正在对“文心一言”进行内部测试,将于3月完成全部测试。鉴于目前ChatGPT的火热程度,不排除提前发布“文心一言”的可能性。

早在2022年9月,百度CEO李彦宏就做出判断,认为人工智能发展在“技术层面和商业应用层面,都有方向性改变”。

有媒体据此推测

百度很可能从那时候就开始做“文心一言”。毕竟,涉及到类似ChatGPT相关的技术部分,在百度的人工智能框架中是现成的。在百度人工智能的架构中,“文心一言”位于模型层,属于百度的全栈布局的其中一层。

百度在人工智能领域深耕数十年,拥有产业级知识增强文心大模型ERNIE,具备跨模态、跨语言的深度语义理解与生成能力。2021年9月,百度在上海科创高地张江启动百度飞桨人工智能产业赋能中心,将百度飞桨的先进AI能力和上海本地产业的需求、应用结合起来,支持上海企业低门槛、高效率地应用AI技术、AI资源。

百度飞桨全景图

截至2022年5月,飞桨平台已拥有477万开发者,创建56万模型,占据中国深度学习平台市场综合份额第一。在全球范围内,其AI开源开放生态也位列前三。

短短两年时间,百度与张江强强联合,让赋能中心成为人工智能产学研技术成果转化的“桥头堡”。

ChatGPT是人工智能里程碑,更是分水岭,这意味着AI技术发展到临界点。我们有理由相信,在张江的赋能之下,百度的“文心一言”将会给中文世界的用户一个满意的答案。

特别声明

本文仅代表作者观点,不代表本站立场,本站仅提供信息存储服务。

分享:

扫一扫在手机阅读、分享本文