来源:脑极体Unity

很多朋友不知道的是,数字人以及相关的虚拟主播、虚拟主持等概念由来已久。几十年来,我们都在畅想能不能让数字人带来普惠的社会经济价值。
早在20世纪90年代CG技术开始成熟,就有人设想过让数字人融入产业;2007年初音未来的走红,又将市场对数字人的期待拉高;时间来到最近几年,AIGC给数字人带来了新的想象空间,恰好遇上直播电商热潮,大家认为数字人终于找到了用武之地。
但现实总是很骨感,数字人在直播电商产业中扮演的角色,更多还是停留在“尝鲜”阶段,距离大规模的产业化应用还有距离。那么,能够撬动商家全面接纳数字人的核心要素是什么?

3月28日,百度慧播星发布了“真人一键克隆”数字人直播功能,可以实现无需专业设备、无需真人值守、无需运营团队、上传视频即可同步复刻声音、形象、装修,一键打造数字人直播间。
我们就以“真人一键克隆”为线索,一起来破解数字人融入直播电商的产业难题。
百度慧播星带来的数字人变革,正在构成一个行业奇点。奇点之后,数字人全面进军电商直播间的产业新阶段,宣告正式到来。

事实上,一直以来直播电商行业对数字人都有着旺盛的需求。根据中研普华发布的《2025—2030年中国直播电商行业深度分析及发展前景预测报告》显示,2025年全国直播电商交易规模将突破4万亿元,保持25%左右的年复合增长率。但在旺盛的市场活动之下,是电商主播人才不足、工作过于饱和、同质化严重等一系列问题。大电商主播不够用,中小型电商无力开直播。

以AIGC模式驱动的数字人,在理论上可以显著解决这个问题。但传统意义上的AI数字人在很多方面并不成熟,比如应变能力较差,需要专业运营团队和专人值守,反而增加了用人成本;互动效果与拟真能力不足,不仅无法满足用户需求,反而容易激发“恐怖谷效应”;数字人从生成到使用,都需要专业的技术能力与设备,给企业带来了门槛等。除此之外,数字人解决方案高昂的价格更让电商企业望而却步。以我们曾经采访过的一个案例为代表,某企业希望使用3D数字人进行直播,但相关报价普遍在几万元每分钟,最终导致企业用户望而却步。
这些难题的存在,让广大直播电商在真人主播与数字人解决方案之间左右为难。而想要破除这个难题,让数字人真正能够融入业务一线,核心就在于两个词:实用、低成本。

3月28日,百度慧播星数字人上线了域内免费的“真人一键克隆”功能。这对直播电商为代表的用户来说,真正做到了实用性与低成本的融合。
首先来看低成本。“真人一键克隆”只需要上传最低3分钟的真人直播回放或真人录制的短视频,无需专业录制,就可以通过慧播星生成专属的数字人直播。用户可以通过此前的直播回放视频来同步复刻声音、形象、装修;而不像其他数字人平台需要分别复刻这些要素,并且不支持大幅度动作。如此一来,用户的应用成本就被降到了最低。
除此之外,真人一键克隆还能在百度域内免费使用,实现真正无资金门槛的0成本启动。而在使用方法上,用户只需要登录慧播星官网,选择数字人>真人一键克隆>立即制作就可以进行体验,做到了“零门槛”使用。
从实际应用中可以看到,“真人一键克隆”可以用非常简单的方式生成数字人,完全颠覆了传统数字人解决方案需要操作多个步骤的专业门槛。而在低成本之外,可以看到“真人一键克隆”的实用性。
数字人进行电商直播,最佳状态就是能够复刻真人直播间。而百度慧播星的“真人一键克隆”拥有业界领先的唇动生成技术,能够实现精准的口型匹配。同时还支持360°大角度侧转、手持商品细节展示、复杂动作呈现等能力,从而去除了传统数字人呆板、生硬、动作与声音不同步等问题,让数字人的实用性极大增强。

“真人一键克隆”的另一重实用性,来自其可以进行矩阵规模化的传播:只需要一个主播素材,就可以生成N个差异化脚本,进而裂变出N个数字人直播间,满足商家多样性、多渠道覆盖的电商直播需求。
完美复刻、低成本应用、高效率传播,这三点让“真人一键克隆”极致演绎了数字人的降本增效,让数字人大规模融入直播电商产业成为可能。
而在这场“克隆之战”背后,是数字人领域正在发生整体迭代。一个全新的数字人时代,正在悄然降临。

一般意义上来说,我们可以将数字人发展分为三个阶段:视效驱动,以初音未来为代表的数字人1.0时代;能够进行AI互动,但成本较高,体验较生硬的数字人2.0时代;以及今天正在到来的,以大模型驱动数字人发展的3.0时代。
数字人3.0时代的整体特征,是大模型技术全方位渗透到了数字人的形象生成、脚本定制以及互动体验升级过程中,从而在各个维度剔除掉数字人的粗糙与简陋感,成为产业级的创新应用。
百度慧播星正是“大模型数字人”的代表。“真人一键克隆”功能是其智能主播能力的一部分,非常代表性地展示了百度的大模型技术如何与数字人应用紧密结合。除了智能主播之外,百度慧播星还打造了一系列以智能化技术为底座的数字人创新,比如说:

智能脚本。基于文心大模型,慧播星可以实现个性化的全文生成、精准局部定制,从而让商家可以快速获得符合自身需求的数字人直播脚本,实现更好的直播效果。

智能展现。除了数字人自身外,百度慧播星还能提供直播间的丰富展现风格,从而实现对商品的多样性展示,比如PPT模式的展示功能等等。这让传统意义上直播间需要花费大量成本进行搭建的展示能力也可以由AI来进行生成。

智能互动。数字人最需增强的就是互动能力。而百度慧播星可以让数字人吃透商品信息,做到与用户进行积极、友好、有深度的互动,最终促进下单转化。
可以看到,百度慧播星实现了从数字人生成、直播间打造、脚本创作,再到互动效果提升等能力的全面创新。从各个维度上引入大模型能力,在不同环节上都实现了数字人的降本增效。
数字人“大模型时代”,就在这种全面升级中到来。

以“真人一键克隆”为代表的数字人创新,已经在实践中给商家与个人创作者带来了极大便利。回到我们在开头讨论过的问题,数字人正在跨越多重限制,真正走到直播电商这个舞台的中央。
比如说,我们可以看到,通过百度慧播星的数字人方案,传统有直播能力与习惯的商家,可以利用“真人一键克隆”能力,只需要用过往的直播回放就完成数字人生成,从而让真人主播下播后的时间也得到充分利用,实现24小时的不间断直播带货。

目前,“真人一键克隆”已吸引1000余家中小商家完成内测,涵盖教育、酒水、生鲜、旅游等10多个细分领域。内测数据显示,酒水商家醉美江湖通过该功能实现7×24小时无人直播,并进行多矩阵分发,订单增长10倍;教培机构子贤讲学习则克隆名师分身进行批量答疑,直播间ROI提升超170%,转化率提升50%以上,均停留时长达到了5分钟;遵义供销社销售直接售出4.8万余斤粉红水晶蜜柚,帮助400+农户增收。

另外,值得关注的是,该功能也将于今年4月中下旬在APP端开放,人人可用,在直播电商之外,普通消费者也可以打造自己专属的数字人形象,满足更多元化的直播需求,体验新奇的赛博之旅。
在大模型能力与数字人应用的全面融合下,数字人终于完成了从能看的1.0、能互动的2.0,到低成本、高实用性的3.0时代的跨越。
整体来看,百度慧播星带来的数字人变革,有着多方面的行业意义。首先从数字人领域本身来看,大模型+数字人的3.0跨越是众望所归,也是数字人走向大规模产业化应用的起点。而从更广义的AI技术发展脉络上来看,数字人是一种绝佳的AI应用形态,百度慧播星已经形成了大模型的领先应用,可以通过应用形态变迁牵引AI技术发展,让大模型未来升级有的放矢。而从产业需求层面来看,直播电商在刺激消费,构建国内市场大循环的政策下获得了巨大的发展利好。而数字人的迭代与创新,恰好可以应对直播电商高速发展的需求,为直播电商带来极大的生产力解放。
综合了提振消费、自主创新的政策因素,直播电商快速发展的产业因素,以及应用形态牵引AI发展的技术因素,百度慧播星可谓占据天时地利人和。让数字人大规模融入经济活动,以数字人释放新质生产力的产业变革契机已经到来。
