chatGPT国内版为什么是百度?_数据_一言_训练

业内专家强调,ChatGPT的突出优势其实并不在于基础技术,而是高品质训练数据集。据了解,ChatGPT的数据来源主要包含:互联网上的文本数据、社交媒体数据、问答网站数据、新闻站数据、文学作品信息等。这些数据能通过爬虫程序自动收集,也可由有关的机构提供。另外,ChatGPT也可以利用比较成熟的语料库,例如GloVe、Bert等。可是,OpenAI从来没公开过训练ChatGPT的数据集来源和细节问题,后来者只有靠自己摸索。

搜索业务20多年以来,百年掌握了全球丰度较大和品质佳的海量中文数据资源。再加上文心大模型数年来的训练成果,再有月活6亿的搜索消费群体,非常希望能在较短的时间内构建成自身的高品质训练数据集,反哺文心一言大模型,实现功能上的飞轮效应。

这些年,微软在搜索市场拳打两头,国外与谷歌竞争,国内和百度对抗。可惜表现始终不是太好,国外不敌谷歌,国内也落后了百度,ChatGPT的成功让它重新燃起雄心。

2月8日,微软宣布将和OpenAI合作,在其新版Bing搜索和Edge浏览器集成对话机器人ChatGPT,用AI带来了全新的搜索体验。正是此后,必应搜索的全球日活跃用户首破了1亿,加持效果十分明显。

这个现象之下,百度做为搜索巨头无法漠视ChatGPT带来的负面影响。假如自己没相应的产品,同样会在的市场竞争中失去优势,甚至于淘汰出局也有可能。毕竟现在用户早已被科技狠活惯得越来越“懒”,操作便利性和市场优势,足够改变用户多年所形成的使用习惯。

2023年2月7日,百度正式官宣自己的chatGPT国内版项目——文心一言,团队阵容之强大,令人震惊。百度CTO王海峰任项目总指挥,百度集团副总裁吴甜(同时担任深度学习技术及应用国家工程研究中心副主任)、百度技术委员会主席吴华等人担任高管,足以看出百度对该项目的重视程度。

据悉,目前美国已经有上百家垂直小企业用ChatGPT的API打造垂直场景。

中国更是类似情况,百度很多产品,从搜索到智能,再到智能驾驶,行业和合作伙伴都有明确需要,期待尽快使用新的前沿大语言模型,来提升服务水平和质量。这也就是为什么短短几个月内宣布加入文心一言生态的合作伙伴就达到650家的原因。

生成式AI非常砸钱,不仅投入研发经费巨大,并且带宽、算力的经营成本也持续上升。但是它市场发展前景也非常看好,几乎所有数字化的行业都适合,生态规模起码万亿等级。这么大超级蛋糕,哪一家巨头会不动心呢,百度也同样如此。

以上内容就是简致科技给大家介绍的关于chatGPT国内版相关信息资讯,希望可以帮助到大家。接下来我们还会持续给大家更新更多关于chatGPT相关内容介绍,大家可以随时关注我们,或者有任何问题可以直接来电咨询.

特别声明

本文仅代表作者观点,不代表本站立场,本站仅提供信息存储服务。

分享:

扫一扫在手机阅读、分享本文