各家AI大模型内心OS:名字而已,我卷“死”你_模型_华为_盘古

30秒快读 俗话说,不怕生错命,就怕安错名,可见中国人对起名的重视。为了在这场AI军备竞赛中占上风,大小厂的开发者们纷纷引经据典,只为给自家的大模型取个响亮的名字。 百度“文心一言”、阿里“通义千问”、华为“盘古”、腾讯“混元”,甭管好不好记,气势先得出来,名字必须配得上“野心”。 京东ChatJD、达观数据“曹植”系统则另辟蹊径,聚焦于特定行业,在垂直领域“精耕细作”。

作者|杨文

编辑|六耳

来源|创头条

大洋彼岸,大佬们还就“是否暂停AI大模型研发”争得面红耳赤。国内的大小厂却忙活得脚不沾地。

百度打了头阵,其他各家的AI大模型也都迫不及待交“答卷”。

创头条统计,4月8日至18日,这短短10天就有5场大模型发布会与众人见面。

4月8日,华为“盘古”大模型官宣。

4月10日,商汤“日日新”大模型面世。

4月11日,阿里“通义千问”大模型正式推出。

4月14日,同花顺AI产品发布会。

4月18日,阿里行业类模型发布会。

可谓是“你方唱罢我登场”,甚是热闹。

更有意思的是,为了在激烈的竞争中突出重围,开发者们引经据典,只为给自家的大模型取个响亮的名字。毕竟名字起得好,富贵跑不了。

-1-

展开全文

说起来也奇怪,这批互联网大厂当年像商量好了一样,名字起得都相当接地气。要么是小米、苹果、搜狐等动植物齐上阵,要么就是滴滴、陌陌、探探等叠音型,再不就是360、58、51等数字型,总之,主打一个好记。

反观他们研发的大模型,那名字起得一个比一个拗口玄乎。百度“文心一言”、阿里“通义千问”、华为“盘古”、腾讯“混元”,甭管好不好记,气势先得出来,名字必须配得上“野心”。

论起名,阿里似乎颇有心得。

最为人津津乐道的就属阿里的“花名”。马云“风清扬”,张勇“逍遥子”,“东邪”“虚竹”“苗人凤”……大佬上班犹如武林开大会,大佬退休则为退隐江湖。

带有浓浓武侠风的阿里,这次却给自家的大模型起了个正经的名字“通义千问”。

“通义”取自《汉书》中的“天地之常经,古今之通义也”,有“普遍适用的道理与法则”之意。作为一个大型预训练语言模型,“通义千问”在训练过程中学习了大量的文本数据,从而具有广泛的知识和普适性,可以针对各种领域的问题“对答如流”。

而“千问”,阿里巴巴达摩院给出的官方解释是“千万次的问,千万的学问,能问出千问的一定是真爱,能回答千问的也一定是真有学问,以及AI和我们一样,都有千万次交互的热情”。

是否经得起“千万次的问”,该模型在内测中已然交了答卷。除了敲代码、算算术等常规操作外,“通义千问”还搞了一个针对不同场景的小应用集合“百宝袋”,可以写提纲,给出放飞的菜谱,甚至还生成彩虹屁。

百度的“文心一言”大有与阿里的“通义千问”一唱一和的架势。

马云痴迷武侠小说,李彦宏酷爱唐诗宋词。众所周知,“百度”这个名字就是取自辛弃疾的《青玉案》,“众里寻她千百度,蓦然回首,那人却在,灯火阑珊处”。

作为“全球首家发布类GPT产品的大厂”,在大模型起名上,百度煞费苦心。

据文心一言解释,“文”是语言文字,“心”是用心理解,“文心”从诞生之初就是致力于理解和运用语言文字的自然语言理解模型,同时也呼应《文心雕龙》,寓意用雕缕龙纹一样精细的功夫去研究语言文字的内涵和魅力。

“一言”既有“一言为定、一言九鼎”之寓意,也有人机之间“你一言我一语”自由流畅沟通之期盼。文心“一言”既出,即可“一生二、二生三、三生万言”。

只不过,百度发布会上“ Demo 演示”的形式不及预期,网友纷纷调侃应该改名为“一言难尽”。

-2-

网易在起名这事上向来佛系,只要不带“哥、爷、姐……”,昵称随便取,于是“富贵”“二狗”等名字成了网易打工人眼中的“香饽饽”。

自家人关起门来叫啥都行,但面向公众的大模型要是起个“土得掉渣”的名字实在说不过去。因此,网易一改以往的“土味”,给自家大模型取了个极文雅的名字——“玉言”。

“玉言”,取自“金口玉言”一词,即对别人所说话的敬称。

“玉言”大模型脱胎于网易伏羲,训练语料主要来自小说、百科和新闻等,模型规模从最早的一亿参数增长至千亿参数,模型领域也从文本拓展到图文、音乐、行为序列等多种模态,其具备的自然语言处理能力可应用于语言助手文本创作、新闻传媒、智能客服等领域,甚至在多项任务上超过人类水平。

此外,网易有道还将于近期推出教育场景下类ChatGPT模型——“子曰”。基于“子曰”研发的AI口语老师和中文作文批改DEMO已完成,近期开放内测。

“子曰”在古代是各家学生对老师的尊称,作为国内首个教育场景下的类ChatGPT模型,这个名字与其定位十分契合。

据悉,“子曰”类ChatGPT模型将尽快在网易有道建立起的“内容+硬件+AI”产业链条上实现商业化落地。

网易有“伏羲”,华为有“盘古”。

上周末,华为发布最新的盘古大模型。延续华为取名的霸气,此大模型的名字来自于“盘古开天”的神话,外界解读称这寓意着华为将通过输出技术能力与产业融合,使AI走向千行百业打开新空间。

事实也确实如此。

不同于“文心一言”等通用型大模型,华为“盘古”在消费端的应用并不惹眼,反倒是B端应用更惊艳。据华为介绍,华为更看重AI赋能产业,希望为煤矿、水泥、电力、金融、农业等行业创造更多产业价值。

-3-

取名同样“霸气侧漏”的还有腾讯。

与国际接轨的腾讯素有起英文名的传统,例如马化腾“Pony”、 刘炽平“Martin”。而此次腾讯AI大模型却从道家学说中“取经”——“混元即无极,无极生太极,太极生两仪,两仪生四象,四象生八卦,八卦衍万物”。

在这句经典的道家语录中,腾讯有了灵感,将机器学习平台命名为“太极”,基于此平台研发的AI大模型命名为“混元”。

腾讯的混元AI大模型包括计算机视觉、自然语言处理、多模态内容理解、文案生成、文生视频等多个方向,已广泛应用于腾讯微信搜索、腾讯广告等业务场景。

据总裁Martin所言,该大模型未来还会应用于各业务当中,除社交、通讯和游戏业务外,聊天机器人、数字助手、资讯获取等方面也将是腾讯的尝试方向。

作为人工智能领域的独角兽,商汤科技不负众望,已经成功研发了320亿参数量的全球最大的通用视觉模型。

3月中旬,商汤科技发布多模态多任务通用大模型“书生(INTERN)2.5”,不到一个月,又祭出“王炸”——日日新(SenseNova)大模型体系。

之所以命名为“书生”,一方面是因为研发团队的学院派背景,另一方面,书生作为中国古代读书人的经典形象,代表着一个通过不断学习、不断成长进而拥有各方面才能的人格化角色。

商汤将全新的通用视觉技术体系命名为“书生”,意在体现其如同书生一般的特质,可通过持续学习,举一反三,逐步实现通用视觉领域的融会贯通,最终实现灵活高效的模型部署。

如今,“书生2.5”已具备通用场景下图像描述、视觉问答、视觉推理和文字识别等感知和问题处理能力,在自动驾驶和居家机器人等场景下,可辅助处理各种复杂任务。未来的发展方向也将专注于通用模型的技术突破和创新应用。

而“日日新”,取自《礼记·大学》中“苟日新、日日新、又日新”,虽然目前“日日新”大模型仍集中在自然语言处理、图片生成、自动化数据标注、自定义模型训练等,但研发团队期望模型的迭代速度及处理问题的能力可以日日更新,不断解锁AGI更多可能。

此外,京东旗下言犀人工智能应用平台将推出ChatJD,定位为产业版ChatGPT,未来将聚焦零售和金融两块业务。

同样“不做通用大模型”的还有达观数据,其正在研发的“曹植”系统是一个专注于金融、政务、制造等垂直领域的大语言模型。

它的名称引自曹植“七步成诗”的典故,“我们想让大语言模型和曹植一样,才思敏捷,知识渊博,‘培养’出人工智能版的‘曹植’来”。

.END.

图片来源|摄图网

特别声明

本文仅代表作者观点,不代表本站立场,本站仅提供信息存储服务。

分享:

扫一扫在手机阅读、分享本文