“百团大战”或将重燃!AI“卷”入短视频、数字人直播赛道_直播_视频_场景

继AI生成文字、AI生成图片之后,生成式AI开始“卷”入短视频、直播赛道。

3月30日,腾讯发布全新的AI智能创作助手“腾讯智影”,推出了智影数字人、文本配音、文章转视频等AI创作工具。其中,智影数字人能实现“形象克隆”和“声音克隆”,创作者通过上传少量图片、视频和音频素材,就能得到自己的数字人分身和定制音色,进而快速生成自己的数字人播报视频。据介绍,腾讯智影还接入了数字人直播,智影数字人可以直接替代真人,不受时间、空间限制,无需搭建任何拍摄场地,使用虚拟背景即可进行播报、访谈、连线、互动等多种操作,实现7×24小时不间断开播。

3月31日,万兴科技副总裁张铮在2023中国虚拟人产业大会暨AIGC创新发展论坛会上宣布,万兴科技正式面向出海营销领域,发布AIGC“真人”短视频出海营销工具“万兴播爆”,并开启移动端公测。据了解,无需外籍演员出镜,用户调用万兴播爆中的上百套专业级场景化模板,以及多国籍AI数字人功能,即可一键生成AIGC“真人”出海营销短视频。

此外,3月27日,百度正式推出“文心千帆”大模型平台,这是百度面向客户提供企业级大语言模型服务的平台。据现场实时演示,文心千帆可实现三分钟做PPT、数字人直播带货、订机票和酒店等操作。

在AIGC的企业级应用场景中,数字人直播和短视频创作正在成为各家共同的发力方向,其背后是高频应用场景驱动。近日发布的《中国网络视听发展研究报告(2023)》显示,我国短视频用户规模达10.12亿,网络直播用户规模达7.51亿,成为仅次于短视频的网络视听第二大应用。商务部数据显示,2022年重点监测电商平台累计直播场次超1.2亿场,累计观看超1.1万亿人次,直播商品超9500万个,活跃主播近110万人。

AIGC的风起云涌将会在直播和短视频赛道搅动怎样的变局?

互联网大咖创业潮起,AIGC或将掀起“百团大战”

对于AIGC接下来会否大规模落地应用,万兴科技副总裁张铮认为还需要大厂推动,未来甚至会重现当年的“百团大战”,“如果几个大厂愿意砸钱进来,AI在衣食住行、消费的各个方面会普及得比较快。但算力的消耗不知道能不能烧得起,因为互联网烧钱更多的是在市场普及和运营上,要烧到算力层面是非常昂贵的,不是几十亿的问题了。”

展开全文

事实上,过去一个月,AI大模型赛道已经吸引了众多互联网领域的大咖离职加入创业。大佬齐聚AI领域,都立志于创造出中国的ChatGPT、OpenAI等,并实现创新突破,发掘新的发展方向。

如3月初,亚马逊首席科学家李沐宣布离职,与其导师携手创办Boson.ai,专攻面向所有人的大模型。美团元老王慧文也在3月8日称其将参与王慧文的AI领域公司“光年之外”的A轮投资,并出任董事。此外前京东 AI 掌门人周伯文在朋友圈发文称,“希望通过生成式AI、多轮对话人机协同,帮助企业与消费者颠覆式地完成人工智能时代的产品创新和数智化的正确认知。”展示了自己的思考和研究方向,寻觅志同道合的合伙人。

3月19日,创新工场 CEO 李开复也发布朋友圈称正在筹组Project AI 2.0,要成为中文版ChatGPT,却不仅仅成为中文版的ChatGPT。“Co-pilot 和如今看到的应用都还只是 AI 2.0 能力的开端。”李开复在朋友圈中写道。

“中国企业要想抓住这个风口资金是一方面,是一个硬性门槛,其次在人才方面,尤其是软件、算法类的人才是一个必须的条件。”张铮向南都记者表示,“这个行业目前才刚刚开始,但现在行业从萌芽状态到快速发展,成熟稳定,再到回落衰退的发展周期在缩短。对比以前硬件制造的周期可能长达20年、30年甚至60年,软件行业可能10年就能到一个成熟期。”

据介绍,万兴科技的技术研发团队为百人规模,尽管与大厂存在差距,但持续研究生成类算法和实时类算法应用方法,可以在不到半年时间内研发出“万兴播爆”数字人直播平台,且研发团队中,90后占比70%。

谈及与互联网大厂的差异化竞争,张铮向南都记者表示,“百度更偏向于为其生态链路上的合作伙伴赋能,而万兴科技则是更注重于为新生代创作者提供帮助,在用户具体使用场景以及应用场景上与百度存在差异,其次,百度文心一言注重于文字领域,致力于为文字内容创作者赋能,而万兴旗下的万兴播爆以及万兴爱画等AIGC应用则是专注于图形图像领域,在专注的领域方面存在差异。”

寻找场景机会,虚拟人主播瞄准跨境直播痛点

在张铮看来,大厂是技术驱动型,需要重金投入去开创新技术,行业内其他玩家则更适合从自身优势出发寻找场景机会。

“我们的运作模式与大厂不同,万兴科技是先寻找场景机会,以商业化变现为目的,利用已有的技术框架最大程度上创造生产力工具”,张铮称,万兴科技的企业理念是创作出得心应手、适合新手使用的生产力工具,因此产品必须结合易用性和专业性,易于上手的同时又为有更高使用需求的用户提供较为专业的功能。

据张铮分析,目前AI在短视频和虚拟人直播领域的应用可以粗略划分为三大类,第一类是泛娱乐,比如大家在短视频平台上看到的小姐姐跳舞;第二类是泛知识,比如说教大家怎么做菜,或者讲课分享知识;第三类是泛营销,比如直播带货场景。

万兴科技之所以选择营销场景切入,是因为这一领域商业模式更清晰。张铮称,“泛营销领域的商业价值机会更大,泛娱乐不是没有,但是我们公司不太适合,我们长期做出海营销,对一块的应用场景和痛点了解得比较通透。”

以跨境直播场景来看,据万兴播爆业务负责人Dour透露,在国内找一个海外的模特价格200—1000美元不等,拍摄、剪辑成本高且周期长,这是海外营销的一大痛点。通过软件则无需聘请外国模特演员或真人出镜进行拍摄和录制,制作完成的视频支持商用,预计可节省约80%以上的预算。

“我们的软件可以做到用几元钱的成本完成一条短视频制作。同时可以选择12种语言,输入文字之后直接导出12个视频,效率大幅提升”,Dour表示。当前,万兴播爆支持中英西法德意日韩等120+国家的不同语种和口音。万兴播爆已于Android、iOS移动端平台率先上线,并计划于今年上半年覆盖Windows等桌面端平台。未来,万兴播爆还将提供数字人、声音克隆、3D场景、品牌模板等定制方案。

采写:南都记者 马宁宁 实习生 张硕麟 叶羽洁

特别声明

本文仅代表作者观点,不代表本站立场,本站仅提供信息存储服务。

分享:

扫一扫在手机阅读、分享本文