AIGC的“输出”需要预先“输入”大量的图文数据,因此AIGC无法创造出它所不了解的、从未接触过的、不存在的东西。但AI也会“胡说八道”,如果用到电商场景会产生问题:比如顾客问洗衣机是多少升,是什么材质、性能如何,都有特定的答案,要从知识库中查阅。如果为冰箱生成海报,面对一款高价奢侈款冰箱,节能就不是宣传的重点。这些领域知识也需要AI学习。
2023年大模型火热,催熟了以数字人为代表的AIGC产品。从虚拟偶像到智能客服、虚拟主播,业界对数字人的产业价值迅速达成共识,不再是仅供娱乐的吉祥物,而是能创造利润、优化成本的数字员工。
去年,京东率先给出了大模型的价值公式,如今成为了产业共识。京东认为,大模型的价值=算法×算力×数据×产业厚度的平方。京东集团CEO许冉指出,从产业端切入大模型,就如同从北坡攀爬珠峰,这条路虽然难走,却有更波澜壮阔的风景,有巨大的探索价值。本次刘强东做为第一位以数字人下场带货的企业家,也坚定地彰显了京东对于技术创新的决心。
日前,言犀大模型在财富管理领域的落地项目“百晓”也正式亮相,从“提供知识”延展到“做好服务”。打开京东金融APP,针对不同财富管理场景需求,百晓推出了面向普通投资者的“AI理财顾问”,助力财富运营工作的“AI驾驶舱”,以及面向机构投资者的“言犀解读AI”。
反观刘强东数字人,据京东云言犀团队介绍,“采销东哥”AI数字人为完全的AI驱动的大姿态数字人,通过小样本的演讲及日常交谈的影音素材训练而成,带货时的脚本则为AI学习丰富的商品等信息一键生成。全面升级的言犀数字人引入了直播中控台,如同言犀数字人的“大脑”,能实时监测和调整直播间商品库存变化,调整直播话术,比如跳过缺货的商品,或为爆品增加讲解频率;还能监测直播间交互是否过于频繁,并调整交互频次和机制,确保讲品顺利。
说好普通话并不难,但要让“采销东哥”AI数字人学习本人的发音习惯,比如要不要加鼻音,哪里要连读,就需要大模型给出准确判断。言犀也对语音风格进行了精细控制,捕捉并复制了说话时的情感,使得合成的语音不仅在音色上与真人相似,而且在情感表达上也保持一致,包括口音和节奏的细微差别、语速的快慢和语调的抑扬顿挫。结合语义理解,系统进行口唇、肢体驱动,让数字人说话时的动作与语义匹配,更加自然,比如在讲话时他偶尔会搓动手指,强调某件事时会配合更大幅度的手部动作,还有时不时的点头等。
AI学会各种专业知识,需要大量物料、方案和效果做对照,这些打过标记的样本只有京东这样自身具备丰富场景的公司才具备。可以说,AIGC应用于场景的能力,实际就是挖掘出企业的产业知识,灌输到AI的头脑中。
第二是京东再次发力内容生态。去年,主打“真便宜、无套路”的京东采销直播一跃成为行业“黑马”,展现了京东在内容赛道上的能力。4月10日,京东宣布将投入十亿现金和十亿流量作为奖励,吸引更多原创作者和优质内容机构入驻。
京东云此前2017就发了自研领域知识大模型K-PLUG,给了AI丰富的电商通用知识库。让“采销东哥”AI数字人对带货的商品“样样精通”。基于K-PLUG自动生成的优质产品描述,不仅能提高内容生产效率,还可以根据英语、泰语、四川话等不同语言和文化背景生成本地化内容,提升消费者体验。
外界认为,第一是京东对于技术创新的决心。受益于持续的技术研发投入,京东在“成本、效率、体验”上保持着领先优势。如今,以人工智能为代表的新一代技术正在加速与实体场景深度融合,而京东庞大复杂的业务体量,为技术落地提供了丰沃的实践土壤。
在内容生产方面,AIGC已成为了新的时代内容生产力。基于promt提示,AI可以生成各类内容。比如可以解决品牌商家的苦恼,“每次换品都要给主播预先培训,时间和费用都是成本”。
雨燕直播足球直播在线直播免费观看4月16日开始,刘强东接连现身京东采销直播间,从米面粮油到家电、图书,直接下场带货。京东官方显示,直播间的“采销东哥”AI数字人为京东云言犀团队制作的AI驱动大姿态数字人。很多网友在看到数字人后笃定不是AI,“这么多精细的小动作,肯定是真人!”“一直搓手就是东哥开会时候习惯做的”。在直播中,“采销东哥”还有看手机回复的动作,甚至会提醒工作人员上链接。很难让人相信只是AI。
技术能否与业务充分结合,是决定技术能否实现价值的关键因素。毫无疑问,数字人是现阶段AI大模型最可见的落地应用之一,也是一门好生意。宣传过数字人的企业并不少。但规模化落地依然面临着场景、内容和交互、成本等层层困难。其中,最关键的是场景,如何让数字人摆脱“迎宾花瓶”人设去干活是一道门槛;其次是内容和交互,如果不能为用户提供正确、有用的内容信息,以及自然、有趣的交互体验,用户很快就会失去兴趣。而对于企业商家来说,对内容准确性、互动性则要求更高,尤其是电商、金融等复杂商用场景提升更难。比如,对于客服场景中最普遍的产品对比,很多数字人因为缺少“知识储备”就不能给出有价值的参考信息。
全面升级后的言犀数字人,在商家零配置基础上,可回答直播间70%的常见问询,给出适合的商品推荐,应答准确率超90%。数字人还会借助大模型智能问答调优助手自我迭代。一方面根据商详页与脚本自动生成问答,一方面直播结束后自动补足没有覆盖的知识点,高效、实时地回答海量咨询。
但我们在直播发现,刘强东数字人并不是一昧地介绍产品,他也讲述了很多个人经历。言犀算法工程师告知,“这是因为训练时导入了东哥此前的个人著述、演讲、新闻报道等丰富素材”。
此外,视觉内容对于提升产品展示形象也至关重要。AIGC技术可以自动生成高质量的产品图像、视频等视觉内容,丰富产品展示形式,应用于品牌宣传、营销推广等场景,提高营销创意和效率。
目前,言犀数字人公共形象库已有70多款,大姿态形象有50多个,已有4000多家品牌选用了言犀数字人与真人主播接力,平均闲时转化率达30%,共带来GMV超10亿元,而直播成本不到100元/天。在这个直播成刚需的电商环境下,这一技术输出极大了降低了中小企业技术使用门槛。据了解,京东也已制作一批采销数字人,将陆续投入采销直播间。