2023年虚拟数字人行业专题研究 AI技术助力实现多模态交互_世界热议

2023-05-29 10:38:33

来源:华泰证券

AI 赋能虚拟数字人,行业发展有望加速

AI 技术助力虚拟数字人实现多模态交互

传统意义上,虚拟数字人指通过计算机图形学、图形渲染、语音合成技术、动作捕捉、深 度学习、类脑科学等聚合科技创设的非物理世界的可交互虚拟形象。


【资料图】

拟人化是虚拟数字人的核心特征

参考中国传媒大学《中国虚拟数字人影响力指数报告(2021 年度)》等相关研究,虚拟数 字人的核心特征是拟人化,具体表现出三方面特征: 1、 外观形象拟人化:具有“人”的形象,如特定相貌、性别等特征; 2、 行为表达拟人化:具有“人”的性格行为特征,如语言表达、面部表情、肢体动作等; 3、 思想交互拟人化:具有类“人”的互动能力,如觉察外界环境、交流互动等。

虚拟数字人的分类方式多样。由于虚拟数字人的核心价值是提供类“人”服务与体验,通 常从交互能力和拟人化视觉风格两方面分类: 1、按交互能力划分:虚拟数字人分为交互型和非交互型,划分标准为是否具有交互能力。 对于交互型虚拟数字人,进一步又可以按照驱动技术划分为 AI 驱动型和真人(中之人)驱 动型两类。相较于真人驱动型的虚拟数字人,AI 驱动型虚拟数字人能够通过智能系统自动 读写识别外部信息,自主决策并驱动人物模型完成用户交互。 2、按拟人化视觉风格划分:虚拟数字人可以分为二次元型、超写实型和数字孪生型。其中, 二次元型具有动漫风格,超写实型近似真人,数字孪生型是创造一个虚拟的“数字分身”。

AI 助力虚拟数字人多模态交互体验,“一站式”实现虚拟数字人生产全流程

AI 技术对虚拟数字人的赋能体现在两个方面: 1、 AI+虚拟数字人具有无需人工干预的自动交互能力,提供多模态交互体验。在 AI 技术 助力下,虚拟数字人交互方式发生转变,从文本语音拓展至图片、音视频等,提升交互体 验。在单模态大模型的自然语言处理技术下,虚拟数字人与用户的交互方式局限于文本、 语音等单一模式,如聊天机器人等。随着 AI 模型及应用向多模态的升级迭代,自然语言处 理能力与计算机视觉、图片与音视频生成能力得到有效结合,经过丰富数据库预训练,多 模态大模型应运而生。如 ChatGPT、文心一言等。 2、 AI 技术帮助实现虚拟数字人的创建、驱动与内容生成“一站式”全流程。传统的虚拟 数字人的核心技术流程主要包括 CG 建模(Computer Graphics)和 NLP(Natural Language Processing)交互技术,前者运用计算机技术完成虚拟数字人外观设计,后者用于建立对 话交互能力。AI 技术将帮助“一站式”实现虚拟数字人的创建、驱动与内容生成全流程, 降低相关成本。

未来趋势:虚拟数字人发展迈向 AI 驱动、工具化、系统化、低成本新阶段

当前,AI+虚拟数字人的发展趋势,主要包括如下三点:

1、 驱动方式迭代:从真人(中之人)驱动型向 AI 驱动型迭代。真人驱动型虚拟数字人的 人物语音动作、面部捕捉技术、动作捕捉技术和音视频合成等均需要中之人于后台配合完 成。随着 AIGC 全面赋能虚拟数字人,AI 驱动型虚拟数字人能够通过深度学习模型、神经 网络渲染、自然语言处理等技术的有机结合,使之具有感知、表达等无需人工干预的自动 交互能力,摆脱中之人的技术局限。同时,AI 驱动型虚拟数字人具有根据不同应用场景特 点配置相应的交互与内容创造能力,并“一站式”实现虚拟数字人的创建、驱动与内容生 成全流程。

2、 底层架构转变:迈向工具化与系统化,拓宽应用领域。一方面,AI 技术形成便捷开发、 高效系统的底层技术新架构,AI+虚拟数字人可以通过训练模型完成对不同行业知识图谱的 学习与应用、为用户提供高效率、低成本的实时服务。另一方面,AI+虚拟数字人应用领域 较传统虚拟数字人更广泛,未来有望从传统的虚拟偶像、游戏等核心领域,向外辐射至直 播、电商、教育、医疗、文旅、社交乃至全行业。

3、 成本转变:降低人力与开发运营成本,实现规模效益。首先,AI 技术助力完成文本、 图片、音视频等多模态内容的“一站式”智能化生成,有助于摆脱传统的“中之人”技术 对人力的依赖,降低人力成本。同时,随着底层架构的工具化与系统化,虚拟数字人开发 成本大幅下降,相关算法优化迭代也将降低运营传播成本。再者,此轮大模型变革催生出 的平台型基础技术架构,将大幅降低虚拟数字人的研发与推广成本,AI 交互技术门槛的降 低,也将带动 AI+虚拟数字人在多行业全领域的覆盖,实现规模效益。

AI+虚拟数字人行业处于高速发展期,政策环境友好

AI+虚拟数字人处于高速发展期,市场规模天花板高

根据头豹研究院《2023 年中国 AI 驱动虚拟数字人行业词条报告》,AI+虚拟数字人的发展 历程大致划分为三个阶段: 1、萌芽期(2010 年-2015 年):受限于 CG 技术、语音合成技术等的不成熟性,AI+虚拟数 字人市场规模小,仍处于技术探索的初级阶段; 2、探索期(2015 年-2020 年):随着愈发成熟的 AI 技术的加持,AI+虚拟数字人的应用场 景日趋多元,步入产业融合的探索期。2016 年 12 月,全球首个虚拟主播“绊爱”开设 YouTube 频道;2018 年,银行业出现首个数字虚拟员工;新华网和搜狗联合研发“AI 合成主播”; 3、高速发展期(2020 年至今):近年来,深度学习模型向多模态发展带来 AI+虚拟数字人 的多模态高速发展新阶段。AI 技术在全方位渗透全产业的基础上,进一步融合文字、语音、 图片、音视频等多模态方式促进虚拟数字人产业走向新的阶段。各公司把握行业发展机遇, 积极研发出一系列 AI+虚拟数字人,如创壹科技的虚拟美妆达人“柳夜熙”、元圆科技虚拟 偶像天妤、百度推出的全球首个实现 AIGC 的虚拟偶像希加加等,在艾媒咨询《2023 年中 国虚拟人百强榜》中表现亮眼。

我国虚拟数字人市场规模天花板高、潜在空间大。根据 iMedia Research 艾媒咨询数据, 近年来,我国虚拟数字人市场规模呈现加速增长趋势。2022 年虚拟数字人市场规模已达 120.8 亿元,带动周边市场规模为 1,866.1 亿元。当前,随着 ChatGPT、“文心一言”等大 语言模型的发布,AI+虚拟数字人的发展领域将进一步拓宽。艾媒咨询预计到 2025 年,核 心市场规模将达到 480.6 亿元,带动周边市场规模近 6,402.7 亿元。

虚拟数字人产业链由基础技术层、平台层和应用层组成,覆盖多领域应用场景

虚拟数字人产业链由上游基础技术层、中游平台层和下游应用层组成,覆盖多领域应用场 景。AI+虚拟数字人背后的技术流程较为复杂,基于虚拟数字人生产开发及应用过程中涉及 的不同阶段,其产业链主要由上游基础技术层、中游平台层和下游应用层组成。

1、 上游基础技术层:基础软硬件设施。以英伟达、Meta、Epic Games、Unity 等企业为 代表,为虚拟数字人的生产制造提供底层技术支持,包括 2D/3D 显示设备、数据采集所用 的传感器、承载算力的计算设备、数据预处理所用的芯片、动作捕捉所用的光学器件等基 础硬件设施,以及虚拟数字人三维建模、外形渲染引擎等基础软件设施;

2、 中游平台层:AI 厂商、综合性互联网厂商一站式技术支持。以微软、腾讯等综合性互 联网厂商,科大讯飞、商汤科技等 AI 专长类厂商,原力数字、相芯科技等 CG(Computer Graphics)和 XR(Extended Reality)技术厂商,以及魔珐科技、拟仁智能等垂直虚拟数 字人厂商为代表。平台层企业对上游基础硬软件技术加以融合,结合自然语言处理、计算 机视觉等虚拟数字人核心技术,为下游应用层提供动捕、建模、渲染等制作环节的进一步 技术支撑以及一站式虚拟数字人解决方案;

3、 下游应用层:从泛娱乐行业向全方位多领域应用场景辐射。运营方赋予虚拟数字人内 容生态和应用场景,包括影视、游戏、媒体等领域的数字角色、虚拟演员、虚拟主播、虚 拟主持人,教育领域的虚拟老师,医疗领域的虚拟问诊医生,金融领域的虚拟客服、虚拟 理财顾问,文旅领域的虚拟导游、虚拟讲解员,零售领域的虚拟代言人等。下游应用层企 业将虚拟数字人技术与传统行业相互融合,实现多领域应用场景覆盖。

国家高度重视支持,虚拟数字人行业政策环境友好

在人工智能、虚拟现实等技术快速发展和成熟的背景下,中国虚拟数字人行业进入高速发 展阶段,市场规模不断扩大,受到国家各级政府的高度重视。例如,浙江省政府办公厅近 日印发《关于进一步扩大消费促进高质量发展若干举措》中,倡导发展数字人虚拟主播、 元宇宙新消费场景等新业态新模式。近年来,国家也出台一系列政策鼓励和支持虚拟数字 人行业的发展和创新。

AI+虚拟数字人多场景应用:全方位赋能升级

按照是否有 IP 影响力,虚拟数字人分为身份型虚拟数字人和服务型虚拟数字人: 1、身份型虚拟数字人通过制定个性化 IP 吸引流量。以虚拟偶像、虚拟 IP 为代表的身份型 虚拟数字人的商业模式是设计定制个性化身份 IP 吸引流量变现,当前以真人驱动(中之人) 型为主,虚拟偶像、虚拟 IP、虚拟代言人等均属于此范畴,如虚拟美妆达人柳夜熙、创意 复现虚拟数字人苏小妹等; 2、服务型虚拟数字人通过提供定制化服务,直接变现。服务型虚拟数字人旨在代替真人服 务以降低服务业人力成本,涵盖领域包括营销、政务、文旅、金融等全行业,过去受到技 术限制,主要应用于代替基础标准化业务,交互能力不高。 AI 技术助力两类虚拟数字人行业发展,我们将从游戏、偶像文娱、新闻媒体、营销、电商、 社交、金融和教育文旅八个维度展开对 AI+虚拟数字人应用的场景分析。

游戏:虚拟数字人提升游戏体验,实现人格化

虚拟数字人从游戏中来:游戏行业是 AI 技术运用的前沿先行者,游戏技术研发推动虚拟数 字人行业发展。 1、游戏产业是 AI 技术赋能虚拟数字人的先行者。游戏行业在 AI 技术运用方面走在前沿, AI 技术通过生成游戏角色的动画表情、提供角色外型定制化、生成游戏角色的智能行为等, 使玩家在游戏中获得栩栩如生的虚拟数字人形象,增强玩家在游戏互动中的沉浸感,提升 游戏的可玩性、趣味性和互动性。 2、游戏产业推动虚拟数字人行业的形成和发展。游戏行业由于自身特点,在角色制作、IP 搭建、用户交互等方面积极研发与探索,在人物建模、动作捕获、虚拟数字人 IP 运营等方 面积累的了一系列经验,推动虚拟数字人行业的形成与发展。 3、游戏产业推动 AI技术迭代创新,打破虚拟数字人发展技术壁垒。如当前 Unreal Engine、 Creation 等游戏引擎已经基本上使虚拟数字人实现了从“很像”到“很真”的跨越。今年 4 月,世界上第 1 款基于 ChatGPT 制作的游戏《生成智能体:人类行为的交互式模拟》在斯 坦福大学和谷歌研究院诞生,开发者通过使用 25 个数字人填充一个类似模拟人生的沙盒 RPG 游戏。

虚拟数字人到游戏中去:打造虚拟游戏人 IP,AI 技术赋能下反哺游戏产业。 1、在游戏中加入 AI 驱动型虚拟 NPC,增强游戏人格化与陪伴感。2023 年 2 月 15 日,网 易旗下开放世界武侠手游《逆水寒》宣布实装国内首个游戏版 ChatGPT,让智能 NPC 能 和玩家自由生成对话,并基于对话内容,自主给出有逻辑的行为反馈,这也是国内类 ChatGPT 首次应用在游戏。据《逆水寒》官方介绍,游戏中智能 NPC 的所有对话文字、 表情、语音、镜头均由 AI 自由生成,其中语音为临时的机械版本,待正式上线时还会根据 NPC 性格进行迭代提升。通过使用和 ChatGPT 同源的底层 AI 技术,网易打造出了“会呼 吸的 NPC”,具备随机自由交互的能力,带动游戏情节延展;国产头部游戏 IP《仙剑奇侠 传》推出的首位虚拟数字人“龙葵”以轻短剧的形式登陆各大主流短视频平台,未来将实 现与玩家在虚拟世界跨次元互动,增强游戏人格化,提供更好的游戏体验;汤姆猫围绕“会 说话的汤姆猫家族”的虚拟形象,通过 AI 技术实现 IP 价值的深度变现。根据 23 年 3 月 6 日-8 日公告,公司已尝试应用 GPT-3.5 模型进行 AI 语音互动产品功能原型测试,已将汤姆 猫 IP 形象植入产品功能原型中,加入语音识别、语音合成、性格设定、内容过滤等功能, 并测试了语音交互、连续对话等产品性能,提高汤姆猫虚拟数字人 IP 的交互体验。

2、打造数字代言人,拓宽游戏变现模式。头部游戏公司推出的 AI 虚拟数字代言人如《QQ 炫舞》的星瞳和《和平精英》的吉莉,引发广大关注。吉莉就是典型的产生于游戏,终又 反哺游戏的代表,参加央视的《五四青年节特别节目》,出席联合国妇女署活动进行演讲, 打破了虚拟与现实间的墙壁。

偶像文娱:升级虚拟偶像,AIGC 赋能

虚拟偶像的盈利模式是平台流量变现,变现途径多元化。我国虚拟偶像主流活动身份分为: 虚拟歌手、虚拟 up 主(发布内容以视频为主)和虚拟博主(发布内容以图片和文字为主) 三类。当前,中国虚拟偶像行业进入高速发展期,根据艾瑞咨询《2022 年中国虚拟偶像行 业研究报告》预测,中国虚拟偶像行业 2019 年以来保持较高增速,未来随着 AI 技术加持, 有望开启新一轮高速增长。基于平台变现的商业模式,虚拟偶像商业变现途径多元,在广 告、电商主播、演出、代言、旅游、宣传等多领域辐射,实现粉丝经济变现。上海禾念信 息科技有限公司旗下虚拟歌手洛天依等 Vsinger 歌手以二次元形象出道,除推出个人专辑外, 还会售卖手办、生日卡片、节日礼盒等周边;其他创收渠道还包括品牌联动、代言等。在 2023 年(第二届)中国虚拟数字人产业大会暨 AIGC 创新发展论坛中,公司旗下虚拟歌手 洛天依、言和、乐正绫、乐正龙牙、墨清弦等均入围艾媒咨询《2023 年中国虚拟数字人百 强榜单》。

摆脱中之人,走向可交互的 AI 驱动虚拟偶像。当前,我国虚拟偶像驱动仍主要通过真人动 捕设备由中之人实时扮演虚拟偶像完成;在 AI 技术加持下,依靠 AIGC 能力的 AI 驱动型虚 拟偶像应运而生。如百度推出的国内首个可交互虚拟偶像度晓晓,基于百度大脑 7.0 技术展 现出强大交互能力;百度推出的全球首个实现 AIGC 虚拟偶像希加加,可以进行 AI 思维创 作,实现 AI 剪辑、AI 作画、AI 作曲等,成为麦当劳产品首位虚拟推荐官。

AI 赋能虚拟偶像的内容创作、平台支持等。除升级虚拟偶像的创建外,AI 在底层技术、内 容创作、平台支持等多领域赋能虚拟偶像产业。

1、赋能内容创作,推动 AI+音乐发展。一系列生成式 AI 大模型的出现,降低 AI 翻唱的技 术门槛。“冷门歌手”孙燕姿在 5 月重新成为活跃乐坛的顶流,“AI 孙燕姿”靠翻唱再次走 红,哔哩哔哩创作者“陈墨瞳 1995”“罗斯特_x”“Eternity | L”发布《下雨天》《发如雪》 等翻唱视频收获视频播放量破百万,开创华语乐坛复兴新模式。科大讯飞推出的 AI 虚拟歌 手 Luya,是旗下讯飞音乐在 AI+音乐领域的又一探索。作为 AI 虚拟歌手,Luya 出道的意 义不仅在于唱歌,更重要的是 AI 深度赋能音乐领域发展。Luya 与上海音乐学院合作,未来 会从唱歌进一步延伸到 AI 辅助作词、作曲等领域,和上音一起进行不同类型音乐风格的融 合实验,比如利用技术手段匹配风格相近的歌曲、拆解和弦和旋律走向、融合曲目等,从 而推动音乐在基础理论、创作方面进行创新和拓展。

2、推出数字藏品,走向超写实时代。格兰莫颐文化艺术集团推出的虚拟偶像 ALiCE,是国 内首个实现 AI 深度运用的超写实虚拟偶像,也是国内首个情绪艺术智能。ALiCE 以音乐、 时尚、艺术的多元身份在不同领域游走,已成为国内独一无二的时尚符号。出道以来,虚 拟数字人 ALiCE 已先后与多家知名品牌合作,其中包括 GUCCI、GIVENCHY、Urban Decay 等。2023 年 2 月,虚拟数字人 ALiCE 在唯一艺术平台推出 CODA 化身-R 主编 ALiCE 系列 数字藏品,讲述虚拟数字人眼中的元宇宙。虚拟数字人代言的产品具有收藏价值,能够抓 住更多年轻消费群体,实现价值变现。

3、搭建虚拟平台,IP 矩阵赋能多元领域。AI 技术还能搭建虚拟平台实现“底层技术-虚拟 偶像-平台支持”三位一体发展模式,如百度集团以度晓晓、希加加为核心的数字人 IP 矩阵, 兼具科技感基因属性、超强知识属性和独一无二的性格人设,有效满足品牌方的情感需求、 流量需求,全面赋能内容营销。AI 将向多领域辐射,如元圆科技推出的以天妤、安思鹤、 颜之初为代表的虚拟 IP 矩阵框架,通过“科技+文化”“小人物、大情怀”等形式讲述故事, 收获百万粉丝的喜爱。基于对元宇宙经济的敏锐洞察和对数字经济机遇的把握,元圆科技 以“前沿科技+多元化内容+全流程运营服务”,助力文旅抢占数智时代发展新机遇。未来, 元圆科技将加持“创意+内容+技术+运营”的行业优势,进一步实现 AI 技术对虚拟展厅、 数字藏品等的赋能。

新闻媒体:赋能新闻行业,推动媒体融合

在媒体行业,人工智能的应用最为突出的就是内容创作,AI 生成的文章、视频、音频等内 容已经逐渐成为了不可或缺的一部分。当前,AIGC 作为一种新兴且有前景的技术,在重塑 媒体业态中发挥着越来越重要的作用,AI 技术的引入不仅极大地提高了内容的生产效率, 而且还大大提高了内容的质量和个性化水平。

央视频手语主播“聆语”,正是腾讯云小微基于新一代多模态人机交互技术所打造的全新数 智人矩阵中的产品之一,依托于腾讯云小微深厚的 NLP、知识图谱、视觉等全栈 AI 底层能 力,这类 AI 虚拟数字人具有强大的形象表现力、识别力和感知理解能力,还可以根据不同 的媒体平台的特点和能力,生成适合其展示和传播的内容,并根据不同的媒体产品和受众, 调整其平台的选择和组合。能提高媒体平台效率、增强其呈现效果,同时增强媒体平台之 间的互动和融合。 新华社联合搜狗公司推出的全球首位 3D 版 AI 合成主播“新小微”,是以新华社记者赵琬微 为原型,基于多模态识别及生成、实时面部动作生成及驱动、迁移学习等多项人工智能前 沿技术,使机器可以基于输入文本生成逼真度极高的 3D 数字人视频内容。“新小微”不仅 立体、灵活,可控,还具有同时支持多机位多景深,360°任意角度呈现内容等能力,在应 用空间上拥有更多的可能性,为新闻节目多样化制作和呈现带来了更多选择。随着 3D 虚拟 场景不断拓展,“新小微”将走出演播室,在不同场景中更好地满足新闻呈现的多样化需求, 帮助媒体在融媒体转型、新闻时效性、跨语种传播能力等领域升级。

创新自媒体/短视频创作,扩大流量影响。AI+虚拟数字人具有真人不具备的一系列优势: 1、 从工作时长看,能够持续吸引流量。AI+虚拟数字人不知疲倦,不会辞职,保证 24 小 时无休等,能够源源不断地吸引流量; 2、 从成本看,降低人力和物力成本。AI+虚拟数字人没有培训费、月薪等软投入,只需在 前期缴纳一笔几千元的定制服务费,大大降低了人力成本和物力成本; 3、 从工作效率看,具有轻资产、冷启动短、效率高的特征。对各类短视频创作者或自媒体 而言,AI+虚拟数字人具有轻资产、冷启动短、效率高的特征,缓解了真人出镜的种种麻烦, 提高工作效率。

据新榜,目前已有不少网络大 V 借助虚拟数字人协助短视频制作,例如润米咨询创始人“刘 润”,“骆骆整理说”,“大巫聊装修”等。2022 年 10 月,刘润就透露其在短视频上的内容大部 分是数字虚拟数字人分身完成的。刘润抖音账号基本实现短视频日更,对于数字虚拟数字 人分身完成的短视频,屏幕侧边都打上了“本视频部分画面使用 AI 技术制作”的字样,从 效果来看,短视频里的数字人刘润五官神情生动、手势丰富多样、衬衫领处的褶皱都清晰 可见。

营销:创新营销模式,促进业务增长

AIGC 可以根据品牌、产品或服务的特点和目标,自动生成各种形式的营销内容,如广告语、 口号、标语、海报、视频等,并根据不同的市场、竞争对手和用户画像,调整内容的策略、 方向和效果。可提高营销内容的创意、针对性和转化率,同时降低营销成本。在 AIGC 和 ChatGPT 技术的加持下,虚拟数字人可变身为企业的数字员工,通过与各应用场景持续深 度融合,成为企业降本增效的重要帮手。 升级企业品牌代言,提升品牌影响力。华凌作为专注跟年轻人打交道的年轻家电品牌,抢 先占领了家电市场的元宇宙赛道。华凌为美的集团旗下面向年轻人群体的品牌,从 2019 年 就开始布局虚拟现实应用,探索年轻消费者的独特审美品味与消费需求,实现品牌与年轻 消费者的深度互动,并打造了“凌魂少女”作为品牌的形象代言人,与前卫先锋、年轻躁 动的 Z 世代消费者打成一片。而如今面对元宇宙的新数字化趋势,华凌进一步布局自有品 牌 IP 的数字化升级迭代,从二次元进阶为超写实虚拟数字人,始终以虚拟数字人“凌魂少 女”形象统领企业从产品端到消费者使用端的体验,通过商业、营销、产品应用,创新呈 现品牌“智能家居”形象,为企业创造营收。

产出定制内容 IP,深化品牌价值。海尔开创深度内容营销的先河,1995 年更推出 212 集动 画作品《海尔兄弟》,通过有趣的故事传播科学和人文知识,成功地将海尔品牌植入当时“小 朋友”的心中。在元宇宙时代,虚拟人技术赋能海尔兄弟“爷青回”,以 3D 全新形象重回 短视频平台。海尔兄弟内容 IP 的成功,是深入的内容营销,对品牌价值的生动诠释,对品 牌故事的完整讲述。伴随着时代和技术的进步,海尔兄弟仍可以在内容传播和社会互动方 面巩固品牌“基盘”,也收获了大量年轻粉丝和订单。

电商:助力电商直播,降本增效进行时

打造虚拟直播新场景,满足电商商家多种需求。中科深智基于自研的 CLAP 大模型算法和 Motionverse 业务中台,打造了能满足众多电商卖家需求的虚拟直播工具百宝箱“自动播”。 该工具可支持电商平台 3D 虚拟人主播、虚拟直播间、虚拟人客服、虚拟人直播助理等可 视化 RPA 功能。同时,中科深智汇集超写实虚拟人生成系统-AnyHuman、自研 3D AIGC 系列产品 AI 快速动画生成系统-自动画、高效的虚拟人实时交互和应答系统-云小七等,将 打造不同场景下的 AI 工具集,为包括电商场景在内的行业场景提供一站式的解决方案,全 方位实现降本增效。

遥望科技虚拟数字人直播业内领先。2022 年 9 月,遥望科技品牌直播号“遥望未来站”在 抖音平台正式开播,着重为优质农产品、国货品牌而打造的更高直播频次和时长的新平台, 在 300 多平方的遥望影棚内,可以进行数百个虚拟场景的切换直播。直播间通过遥望数字 影棚,运用虚拟+现实、场景瞬息变换、人物一秒换装等数字技术手段,让主播真正地做到 讲到哪个产地的商品就把观众带到哪里。虚拟数字人“遥望卷卷”首次在“遥望未来站” 直播间实现了 AI 换脸虚拟人与真人同屏直播。此外,遥望科技还推出直播电商新玩法—— 孪生主播技术,通过 AI 深度学习,让每一个 IP 突破时间与空间的维度,拥有无限扩展的可 能。公司在数字虚拟人 IP、数字化场景构建有丰富储备。2023 年 5 月 15 日,遥望科技与 小冰公司达成战略合作协议,推动人工智能技术在直播行业的持续开发和广泛应用,与小 冰公司共同在直播电商领域研发、升级、改进新型人工智能技术/产品,包括但不限于在虚 拟人、AI 产品等领域进行产品创新、升级。

腾讯云于 4 月 25 日发布智能小样本数字人生产平台,三分钟完成建模、成本仅有数千元; 也有深耕该领域的专业公司,硅基智能创始人兼 CEO 司马华鹏此前公布的数据显示:硅基 智能至今已生产了近 150 万个虚拟数字人,和 4 万多个电商带货直播间达成合作;此外, 一大批“野生卖家”栖息在闲鱼、拼多多、小红书等平台,几百元就可以打包售卖 AI+虚拟 数字人设备,还提供代运营服务。根据深响公众号发布的关于 AI 主播调研情况,直播间的 AI 主播为 2D 超写实,通过技术复刻还原表情、声音和形象,获得一个与真人相差无几的 虚拟数字人,用户只需一台电脑便可以产出短视频、实现 24 小时直播,成本更低、制作周 期更短、人人皆可用。

社交:创造虚拟形象,提供情感陪伴

在接入生成式 AI 后,人工智能算法在理解和生成自然语言方面的能力得到进一步提升,能 在很大程度上改善对话的流畅度和拟人化水平,保证虚拟数字人和真人之间的有效交流与 真实体验感。南京硅基智能科技有限公司推出面向逝者的虚拟数字人产品,基于先进的自 然语言处理、语音合成、计算机视觉等技术,公司通过 1 张照片和训练 50 句话,快速复刻 碳基生命,让逝去的亲人生动逼真地重现眼前,实现生命云端“永生”。AI 模拟逝者思维, 全息数字人仿真逝者身体。两者叠加,就能较为真实地“复活”逝者,达到人眼看近乎无 异的三维虚拟立体人像效果。

Snapchat 网红 Caryn Marjorie 出售其自己的 AI 虚拟分身女友,和网友谈恋爱收费每分钟 1 美元。23 岁的 Caryn Marjorie 是 Snapchat 上的头部网红之一,拥有 180 万粉丝,她通 过出售 AI 版自己,同粉丝谈恋爱。这款名为 Caryn AI 的 AI 虚拟女友产品,由她本人 2000 多个小时的 YouTube 素材训练而成,搭载 Open AI 的 GPT-4 技术,能够实现“动态、独 一无二的互动,就好像你是在直接和 Caryn 本人聊天一样”的 24 小时秒回互动体验,以每 分钟 1 美元的价格出售。Caryn AI 由 Forever Voices 人工智能公司提供技术支持,该公司 还打造了前总统特朗普、美国巨星泰勒·斯威夫特以及苹果创始人乔布斯等名人的 AI 电话聊 天产品,Caryn AI 是公司推出的首款以“治愈孤独”为目标的虚拟伴侣产品。当前,Caryn 每年的收入大约为 100 万美元,据 Caryn 本人预计,随着 Caryn AI 上线,她的收入能翻 60 倍,达到每年 6000 万美元。

金融:应用于金融领域,推动银行数字化转型

传统虚拟数字人在金融业的应用仅限于常规问题的自助问答、业务办理指引等,随着 AI 技 术发展以及相关技术在银行业等金融领域的落地,AI 虚拟数字人的开放式对话、跨模态语 义理解、金融数据处理及理解能力得到大幅提升,在智能客服、数字员工等场景的应用能 够进一步提升客户体验,提高运营效率。工商银行于2020年12月启用数字人员工“小天”, 主要提供业务咨询、产品介绍、机具引导、机器人协同、扫码取号、闲聊等服务。银行将 数字人互动区域部署在客户等候区和高柜附近,便于客户看到,“小天”借此机会介绍工 行产品和相关业务,产生自然互动。

银行业数字人的应用场景主要包括两个方向: 1、 对外:面向银行客户,作为线下网点的智能柜员与客户直接进行交互,通过银行线下大 屏来实现第一手的接待或服务。此外,还包括银行电销和关键业务办理引导的线上智能客 服等; 2、 对内:面向内部员工进行培训,除课程教学外,还需进行模拟性的演练,主要是针对客 服、营销的复杂场景模拟,数字人员工替代真人对练可以实现降本增效。

教育文旅:加码服务业,教育文旅齐发力

传统虚拟数字人在服务业领域应用当中互动性不足、互动场景有限,无法为用户提供个性 化的交互体验,在 AI 技术加持下,AI 虚拟数字人强大的自动交互能力为其在教育、文旅等 服务业领域打开市场。在教育领域,网易伏羲已开发出多款“AI+教育”的创新产品,向师 生普及人工智能相关知识、提供沉浸式互动学习体验,虚拟数字人正是其以 AI 技术驱动创 新的场景之一。网易伏羲联合有道乐读推出虚拟数字人学伴“可可”,提供轻量化、情感 化的 AI 交互体验,提高老师的备课效率和课堂趣味性。科大讯飞 AI 虚拟人在教育领域也 有相关运用:在自主研发的 T10 系列讯飞 AI 学习机中,瑞恩熊 AI 英语板块能够实现 AI 虚 拟人老师一对一互动,通过模拟真实口语对话场景,鼓励孩子开口说英语,并结合原创 IP 冒险系列故事,专为 5-10 岁打造少儿英语互动课程。

在文旅领域,中国电信已着手 AI+虚拟数字人布局,在 2022 年中国国际服务贸易交易会上, 中国电信开辟了元宇宙北京紫禁城“数字观光路线”,以数字虚拟技术在现场呈现出紫禁 城太和殿场景,古装仕女装扮的虚拟数字人“导游”负责介绍景点、与游客猜灯谜,实现 人机交互。此外,杭州中国丝绸城定制了一系列虚拟讲解员、虚拟诗人、虚拟舞者等多元 化的虚拟数字人,提升传统文旅地标的服务智能化水平和消费者购物体验。

他山之石:国外虚拟数字人技术领先,AI 创新突破

微软:研究院发力人工智能框架虚拟数字人“微软小冰”

微软研究院着重研究人工智能,开发人工智能框架“小冰”。微软小冰虚拟数字人是微软 公司基于自然语言处理技术和机器学习技术开发的一款虚拟数字人产品,技术实力和知名 度都非常高,可以实现多种功能,如智能聊天、语音交互、人脸识别等。微软小冰商业化 的边界不断拓展,赋能金融、零售、纺织、IoT、汽车、地产、内容、游戏、时尚等多个产 业,客户包括万得资讯、罗森、万科、万事利、中国联通、遥望科技、培生集团等业内头 部公司。自 2014 年发布以来,微软小冰团队不断深耕技术革新,最新“第九代”小冰在开 放域对话引擎、超自然语音及多模态交互等多项核心技术上实现了升级与突破,推出了社 交 App 小冰岛、第三版诗歌与绘画创作模型、AI 歌声合成技术 X Studio 2.0、艺术家创作 动机辅助技术和 AI “人类观察者”Merror 等覆盖社交、语音合成、内容生成等多领域的 商业化落地运用。

三星:布局 AI 驱动的“人工智人”项目 NEON

韩国三星长期布局人工智能领域,研发领域从早期人工智能助理 Bixby 进阶为现阶段 AI 驱 动虚拟数字人 NEON。致力于“确保领先的 AI 核心技术和平台是具有发言、识别、思考能 力的拟人化 AI 服务,且可为用户带来人工智能驱动的新体验及价值”,在通过研发人工智 能助理 Bixby 提升在手机、电视等硬件的使用体验后,公司在 2020 年由旗下独立研发机构 STAR Labs 推出以 CORE R3 平台、SPECTRA 平台等关键 AI 技术赋能虚拟数字人 NEON 项目。 2020 年 NEON 虚拟数字人作为 STAR Labs 独立开发的结合如人工智能、机器学习、虚拟 现实和增强现实等前沿技术和产品的“人工智人”(Artificial Human)项目在 CES 2020 上 正式展出。NEON 作为以真人尺寸存在于屏幕中的 AI+虚拟数字人,实现如真人般快速响应 对话、做出真实的表情神态等功能,同时在对人物原始声音、表情等数据进行捕捉并学习 后,形成如人脑般长期记忆功能,以构建机器学习模型。基于以上设定,每个 NEON 都形 成自己独特的记忆。

Activ8:MCN 公司开启主流二次元形象 vTuber 时代

日本虚拟娱乐公司 Activ8 主营 MCN,其商业模式和真人的 YouTuber 相似。2016 年 11 月, Activ8 推出世界第一个虚拟主播绊爱,并首次使用了 Virtual YouTuber 这一概念(以下简称 vTuber),开启以 vTuber 为主的二次元风格虚拟数字人新时代。

绊爱自称有思想的独立 AI,知道自己是人类开发的虚拟数字人。因开始思考“人类为什么 要开发我呢”而对人类感到好奇,由此开设频道试着与人类接触。由于自我意识觉醒于 2016 年 6 月 30 日,因此把 6 月 30 日当作自己的生日。与完全电子合成的初音未来不同,绊爱 的声音和动作都有真人(中之人)实时对应。通过动作及面部捕捉技术,绊爱能更加灵活 地与观众交谈互动,进行长时间直播。绊爱出道后很快走红,YouTube 主频道和游戏分频 粉丝总数超 400 万,视频总播放量超 6 亿。先后发行单曲、开演唱会、出演电视节目/游戏 /动漫等,以至于 Activ8 成立独立公司 Kizuna AI 事务所,专门处理绊爱相关事务。

Aww:拓展超写实 vHuman 虚拟数字人

日本第一家写实虚拟数字人经纪公司 Aww 创立于 2019 年,是日本第一家 vHuman 公司。 公司旗下拥有 imma、plusticboy、Ria 等知名 vHuman,全平台累积粉丝超 100 万。公司 以亚洲与北美为主营市场,KFC、SK-Ⅱ、Magnum 等品牌都与其合作过,目前公司整体已 进入头部 vHuman 公司队列。除了运营虚拟数字人并广告变现外,Aww 还开发了独家制作 引擎 MASTER MODEL,为公司拓展外包业务。 vHuman 虚拟数字人广告变现:与主流的二次元向 vTuber 相比,vHuman 作为其衍生出的 分支,其超写实与富有新颖感的特性让 vHuman 与广告代言高度匹配,可以通过广告实现 稳定变现。2019 年,Aww 推出日本第一个虚拟数字人 imma 在 Instagram 走红,其头部由 3DCG 制作,与实拍的身体和背景图片进行合成。另外,Imma 还有几位兄弟姐妹,Ria、 Zinn、plusticboy、Asu、Ella 几位虚拟人也都是出自 Aww 公司。”

Synthesia:利用 AIGC 技术打造虚拟数字人视频平台

Synthesia 是一家利用 AIGC 技术合成虚拟数字人视频的英国公司。2023 年 4 月,福布斯 发布 AI 50 榜单,Synthesia 被评为最有前途的人工智能公司之一。Synthesia 公司自成立 以来已经为客户制作了超过 100 万部视频,最知名的案例是为乐事薯片制作了以梅西形象 为主角的视频,用户做出不同的消息选择,会接受到来自梅西发出的个性化比赛观看邀请。 公司专注于合成视频创作,同时布局虚拟人领域。Synthesia 官方定位是快速利用文本创建 视频的 AI 视频创作平台,用户输入简单的文字,就能创建出逼真的虚拟人物视频。客户可 以从人工智能生成的演示者库中进行选择,或者通过上传自己录制和剪辑的视频来创建自 己的演示者。Synthesia 利用其 AI 技术来分析上传视频或公司演员目录中的外观和声音, 用机器学习技术解构音频和视觉元素,生成一个逼真的头像,可以很好地模仿人类。公司 只需要简单的三步:选模版—选人物形象—输入文本,稍等片刻即可获得一个完整的视频, 用户基本没有额外学习成本,操作简单无需掌握代码技能。

Epic Games:虚拟引擎加速虚拟数字人多领域应用

Epic Games 是美国电子游戏与软件开发的龙头公司,业务涵盖跨平台游戏引擎技术、游戏 开发。Epic Games 有名产品包括虚幻引擎(Unreal Engine)、游戏《无尽之剑》与《堡垒 之夜》等。 公司旗下引擎平台 Unreal Engine 发布 MHC,轻松制作高保真虚拟数字人。MHC (MetaHuman Creator)是一款用于创建和设计虚拟角色的应用程序。在一般的虚拟真人 创作中,创作者往往需要先进行细微数据采集后,再生成人物模型。但在 MHC 中,创作者 可以先跳过数据采集这一繁琐且昂贵的步骤,在一个丰富的素材库中选取例如发型、面部、 肤色等预设,来制作和生成想要的数字人模型,任何使用者都可以通过组合几十种人物特 征进行创作,比如发型、耳朵模样、胡须和嘴唇形状,可以对其随意添加、删减和调整。 MHC 可以让整个虚拟真人创作过程大量简化,在提升速度和可拓展性的同时还保证了作品 的质量。

Soul Machines:虚拟人底层技术优势助力企业营销

Soul Machines 是新西兰一家专注于虚拟数字人研发和服务的人工智能公司,通过 AI 和计 算机视觉开发具有智能和情感反应的头像模拟技术,使得 AI 交互更加直观自然。Soul Machines 为聊天机器人或 AI 助手打造了逼真的虚拟形象,并将这些虚拟人输送到世界各 地。Soul Machines 的联合创始人 Mark Sagar 曾从事《阿凡达》、《金刚》以及《蜘蛛侠》 的面部设计工作并凭借这些作品两度获得奥斯卡金像奖。

Soul Machine 有着 AGI(通用人工智能)、Autonomous Animation(自主动画)、Human OS Platform(虚拟人操作系统平台)三大硬核技术作为赋能虚拟人的顶梁柱,基于上述三大底 层技术,Soul Machines 推出了两款核心技术产品,分别是 Digital DNA Studio(数字 DNA 工作室)和 Digital CXO(数字 CXO,即数字首席体验官)。Digital DNA Studio 是公司自主 研发的基于云的自动化工作室,客户可以在工作室内置的面孔、语音、性格等资源库中自 由定制、快速创造出自己的一套虚拟数字人形象,这项服务能够大大简化虚拟人物设计流 程。Digital DNA Studio 还同时提供技能定制化等增值服务来优化虚拟数字人的应用表现, 提高虚拟数字人的综合价值。Digital CXO 是公司依托虚拟人形象打造的消费者体验优化系 统,以虚拟人形象出现的 Digital CXO 经过体验式的 CX(消费者体验)对话培训,能够在 线上与消费者直接沟通,并可以通过摄像头、麦克风收集客户的面部表情、情绪信息来得 到真实反馈,以使企业了解到客户的真实需求并优化消费者体验,提高客户留存率和品牌 忠诚度。

目前,Soul Machines 已在教育、娱乐、金融服务、卫生保健、公共部门、房地产、零售和 电子商务、科技与媒体、电信和呼叫中心等多个领域均有优秀的案例,奔驰、索尼、谷歌、 亚马逊、微软、宝洁等知名企业也纷纷与 Soul Machines 合作,探索虚拟人在自身领域的 应用。

把握行业发展机遇,国内数字虚拟人+AI 公司乘风破浪

新华网:开创新闻领域 AI 应用先河,成立数字人实验室

新华网是新华社控股的传媒文化上市公司,依托新华社作为国家通讯社的权威地位和作为 世界性通讯社的全球信息网络,新华网拥有权威的内容资源、广泛的用户基础、优质的客 户资源和强大的品牌影响力,并以此为基础开展网络广告、信息服务、移动互联网、网络 技术服务和数字内容等主营业务。在数字内容方面,公司利用人工智能、虚拟现实、增强 现实、混合现实、创意数字影视、创意艺术视觉、无人机等现代数字技术,瞄准视频化、 移动化、知识化、智能化方向进行融合形态数字内容的创意、策划、设计、开发、制作和 跨平台销售。

数字虚拟应用落地,助力“数字人”自由。2021 年,新华社与国家航天局等单位联合打造 了专门面向航天主题和场景的数字记者,该数字记者采用全新的制作管线和实时渲染技术, 使虚拟数字人物更加生动形象,并可担负太空报道、火星登陆等真人不能或很难完成的任 务。2022 年,新华网成立数字人实验室,继续深化人工智能技术应用探索,打造了虚拟数 字人“筱竹”。同时,由新华网和阿里巴巴合资成立的数字文化企业新华智云,2019 年便 试水数字人,开创了新闻领域实时音频与 AI 真人形象合成的先河。2020 年的地方两会报道 中,有 7 省的两会报道使用新华智云虚拟主播。据新华网,截至 2023 年 2 月,超过 500 家媒体、政府机构、金融机构、会议会展企业使用新华智云虚拟主播。

蓝色光标:积极布局元宇宙,为虚拟数字人增添 AI“智能芯”

蓝色光标作为我国营销行业龙头,具备丰富的 IP 积累经验,一直积极布局元宇宙生态。2021 年,公司以虚拟数字人为切入点,率先布局元宇宙赛道,“虚拟数字人+虚拟物+虚拟场景” 三条业务线并行,探索元宇宙生态全景。蓝色光标已发布虚拟数字人 IP“苏小妹”,以及高 性价比的真人数字分身驱动平台“分身有术”,为各行各业各领域的关键人通过建设数字分 身虚拟数字人,通过低成本和高效率解决“分享”场景下的写真需求。 AIGC 助力虚拟数字人快速成长,多场景创造价值。2022 年 1 月,蓝色光标发布首个虚拟 数字人“苏小妹”,这既是蓝色光标元宇宙战略的标志性落地,也开启了蓝色光标虚拟 IP 业务的全新布局。3 月 30 日,苏小妹社交平台账号首次发布使用 AI 绘画工具制作的海报内 容,此前,在苏小妹的小程序中也接入了 AI 作诗的能力,通过识别用户发送的关键词,创 作相关主题的七言诗歌。随着大模型的“多模态”发展,虚拟数字人 IP 能够结合文本、图 像、语音、视频等多种形式,在不同的场景中与用户互动,更高效地创造价值。2023 年 4 月,公司发布虚拟广告练习生“萧蓝”,从虚拟数字人设、形象设计、命名到音乐创作,全 部借助 AIGC 技术完成,使用了销博特、ChatGPT、MidJourney 等多款 AIGC 工具,全流 程仅耗时 72 小时。

捷成股份:参股公司世优科技专注数字人,智慧化服务垂直产业

公司主营业务为新媒体版权运营及发行,参股公司世优科技从事虚拟数字人业务,为客户 定制打造虚拟数字人,目前已经接入 ChatGPT,正在通过虚拟数字人自身的人设背景等相 关数据集,并基于 OpenAI 来训练虚拟数字人专有大脑形成个性化模型。世优科技的 AI+虚 拟数字人除了将拥有 ChatGPT 的超强“AI 大脑”通用能力外,特定虚拟数字人还将具备个 性化独有的人设背景表达能力,并将应用于线下展厅的 AI 讲解介绍虚拟数字人、线上 AI 主播、AIGC 快速短视频系统等多个场景,并积极探索挖掘更多应用场景。

推出“世优 BOTA”,打造企业下一代 AI 员工。4 月 20 日,世优科技正式发布新一代 AI 虚拟数字人现象级产品——“世优 BOTA”。世优 BOTA 基于世优自研的快速训练小模型能 力,与虚拟数字人形象结合,让 AI 从聊天窗口升级成人与“人”的直接交流,打造企业的 下一代 AI 员工。它专业、精准、成本低、懂业务、知企业、可无休。世优 BOTA 企业 AI 数字员工可根据各类具体应用场景构建专属 AI 模型,满足特定领域内的任务需求,并且可 应用在 PC、APP、小程序、VR/MR 等各种终端场景,满足各行各业多元化的场景需求和 服务,助力企业在营销层面获得长足发展。在发布会现场,接入世优 BOTA 的数字员工“阿 央”面对来自法律、金融、医疗和矿业的行业代表提问,都给出了让各位代表“非常满意” 的回答。

天娱数科:子公司元圆科技打造纯 AI 驱动数字人,推动虚拟艺人新风潮

元圆科技为天娱数科旗下子公司,致力于以虚拟艺人经纪和 AIGC 数字化营销为核心主业, 运用“前沿科技+多元化内容+全流程运营服务”的模式,重构品牌与消费者的互动方式, 让消费者深刻认知品牌,促成业务转化增长。公司打造了以“天妤”为代表的国内最具影 响力虚拟 IP,且为品牌提供包括虚拟代言人、虚拟展厅、虚拟发布会、智慧客服等全方位 技术开发营销服务,助力企业抢占数智时代营销新机遇。

L4 级别 AI 数字人直播首秀,推动虚拟数字人正式迈入 L4 级别 AI 数字人时代。IDC《中 国 AI 数字人市场现状与机会分析,2022》报告中,将数字人划分为 L1-L5 等级。其中 L3 级别以下的数字人不具备智能交互能力,仍需人类在后台进行决策和操作。L4-L5 阶段纯 AI 驱动的虚拟数字人才可以称为“AI 数字人”。如今,市面上的虚拟数字人大多处于 L1-L3 阶段,虚拟数字人技术体系构成主要包括建模、多模态 AI、数字化内容、动作捕捉等多个 环节。4 月 11 日,基于真正实现了 AI 建模+AI 驱动的自研智能云平台,元圆科技打造了一 场接入 ChatGPT 模型后的 L4 级别 AI+虚拟数字人直播首秀,虚拟数字人“朏朏”依托 AI 中台整合了数据、算法、场景多维度优势,通过大量训练和调优,形成了可以满足不同业 务场景个性化需求的能力。

构建虚拟 IP 矩阵,探索多业态合作。以朏朏为代表的 L4 级别的 AI+虚拟数字人产品,将不 止运用于直播带货领域。元圆科技已构建了由多个虚拟数字人组成的 IP 矩阵,并在新闻、 娱乐、金融、科技等领域为众多客户提供服务。例如公司旗下首个文化出海的国风虚拟数 字人“天妤”,在完成流量积累的初步阶段后,“天妤”先后与《倩女幽魂》手游、集度汽 车、抗老新国牌蔻之初等品牌展开营销合作,与明星艺人哈妮克孜联动,将声量转化为流 量,最终实现流量变现。此外,元圆科技旗下虚拟数字人安思鹤已通过 AIGC 快速生成图 文内容,其人物形象与真人无异,文字内容极为精准,实现了高度自动化自主创造内容。 近日,安思鹤在接入 AI 及人工智能语言模型后,发布了首部由 AIGC 主笔创作的连载科幻 短篇《时间少女日志》,成为全网首个由 AI 全流程制图,AIGC 主笔连载内容的虚拟数字人 IP,内容生产方式的降本增效已落地。

遥望科技:与小冰公司战略合作推动 AI+虚拟数字人、孪生主播产品升级

遥望科技是一家以直播为核心的综合型科技企业,当前已成为直播电商行业完成抖音、快 手、淘宝三平台全域布局的头部企业。遥望科技在直播业务板块以“明星+IP”两手并行, 已建立起拥有百余位明星+达人的多平台、多层次主播矩阵,多层次矩阵打法,明星+IP 双 手并行,已建立超过 2.5 万个国内外品牌入驻的供应链体系,覆盖美妆、生活、食品、服饰 等全品类。

公司在孪生主播、数字资产库、数字藏品等全新的数字资产相关领域积极布局。在虚拟数 字化领域,公司此前在数字虚拟人 IP、数字化场景构建已有丰富储备。公司 2022 年 4 月 推出的首款 IP“孔襄”是遥望网络推出的首位虚拟数字人,出道即搭档贾乃亮出演短剧。 公司还推出直播电商新玩法——孪生主播技术,通过 AI 深度学习,让每一个 IP 突破时间与 空间的维度,拥有无限扩展的可能,虚拟人直播目前可部分替代店播。2022 年 9 月,遥望 科技品牌直播号“遥望未来站”在抖音平台正式开播,以“科技+助农+国潮”出发点专为优质 农产品、国货品牌而打造,虚拟数字人“卷卷”也首次在“遥望未来站”直播间实现了 AI 换 脸虚拟人与真人同屏直播。截至 2023 年 3 月 31 日,遥望已在多平台构建起达人/主播/艺 人矩阵,覆盖粉丝超过 6 亿(不去重),月曝光量超过 40 亿。

硅基智能:率先布局国内 AI 虚拟数字人,迎来规模商业化

硅基智能作为率先布局人工智能独角兽企业、AIGC 赛道视频、直播内容生成领域的先行者, 一直致力于人工智能、数字人应用赋能实体升级发展。公司是国内首个入驻抖音群峰服务 市场的数字人产品公司、腾讯唯一重点投资的 AIGC 数字人企业以及华为云平台生态合作 伙伴,业务包括电话机器人、智能客服、屏数字人、同屏数字人、VPPT 数字人、直播数字 人和克隆人等虚拟数字人等。公司将“碳基生命的硅基化"作为核心目标,专注于 AI 技术深 度研发和落地应用,通过自主研发的人工智能核心技术,向社会源源不断地输出硅基劳动 力。一直致力知识生产、传播智能化、服务智能化、生产要素虚拟化,以数字人应用赋能 实体企业数字化升级发展。

AIGC 技术和超级算力形成驱动,全应用场景得以覆盖。硅基智能有独特的 AIGC 数字人解 决方案,以 AIGC 技术为核心,搭载人物形象模拟、智能语音交互、NLP(自然语言处理)、 无穿戴表情动作捕捉等技术,可以快速创造出外表接近真人,智力接近真人的 AI 数字人。 在“硅基 DUIX 引擎+华为鲲鹏引擎”的超级算力双向加持下,为高性能计算、数据库、云 计算负载进行高效加速,创造仿真人形象和声音的数字劳动力。其主要运用三大平台:DAAS (数字孪生应用平台)、MAAS(沉浸式元宇宙体验平台)、DUIX(数字人交互平台),包含 语音识别、人像驱动、视频通信、语音交互等算法技术,从而实现了数字人的“能听、能 说、可互动”,并覆盖微信、短视频、大屏等应用场景。

中科深智:自研多模态驱动技术,全方位实现降本增效

公司定位于生成式 AI 虚拟人和 3D AIGC 技术领导者。公司认为在元宇宙中,不同场景需 要不同的驱动技术,很难有某种单一动作和表情驱动技术能满足所有虚拟人动作和表情驱 动问题。因此,中科深智打造了 Motionverse 多模态动作生成驱动引擎,该引擎融合了 XR 和 AI 技术,可以用传感器、语音、视频等多种方式让虚拟人动起来,随时与用户互动。 据公司公众号,截至 2023 年 2 月,中科深智在我国电商虚拟人领域市占率超过 70%。中 科深智基于自研的 CLAP 大模型算法和 Motionverse 业务中台,打造了能够满足众多电商 卖家需求的虚拟直播工具百宝箱——自动播,可支持电商平台 3D 虚拟人主播、虚拟直播间、 虚拟人客服、虚拟人直播助理等可视化 RPA 功能。同时,在生成式 AI 这波浪潮中,中科 深智汇集超写实虚拟人生成系统 AnyHuman、自研 3D AIGC 系列产品 AI 快速动画生成系 统-自动画、高效的虚拟人实时交互和应答系统-云小七等,并将打造不同场景下的 AI 工具 集,为包括电商场景在内的行业场景提供一站式的解决方案,全方位实现降本增效。

相芯科技:深耕消费级赛道,自研“虚拟数字人引擎”和“超写实数字物平台”

相芯科技是一家提供虚拟数字人建模、动画、交互、渲染全栈能力,高效打造全品类虚拟 数字人的公司。自 2016 年成立以来,相芯科技自研了弱输入智能建模、全要素角色动画、 轻量化实时渲染、多模态自然交互四大算法模块,同时,进一步结合 AI 技术,满足虚拟数 字人精细化、智能化和多样化的趋势,既有强调人格特质的虚拟化身、虚拟偶像,也有强 调功能属性的数字员工、虚拟客服、虚拟主播等,提升虚拟数字人生产力。 相芯科技自主研发“虚拟数字人引擎”和“超写实数字物平台”,专注于计算机图形学和人 工智能技术的深度融合。公司推动 XR 技术创新和产业应用,持续实现技术突破,截止目 前,基于两大技术平台,相芯科技已服务汽车、手机、金融、互娱、电商、政务等各个领 域逾千家国内外企业,获得了客户的一致好评。公司的虚拟数字人技术已被应用到多个行 业,延伸出了 AvatarX 智能虚拟数字人平台、智能汽车行业解决方案、金融行业解决方案 等一系列架构,可提供全栈式虚拟数字人解决方案,助力不同企业完成转型升级。

相芯科技持续深耕消费级虚拟数字人,结合 AI 技术全领域赋能。公司研发的“碰爪”是一 款主打虚拟化身和多人视频聊天的话题社交应用,为用户打造一个以自己为模型的虚拟化 身,互相连线聊天的 APP,能会实时同步用户的表情。在虚拟人创建与互动的场景上,相 芯科技以自主研发的 AvatarX 平台,通过虚拟形象生成、虚拟形象 DIY、虚拟形象驱动等 在内的一整套数字人技术,帮助碰爪搭建起与 Z 时代沟通的第一座桥梁。“江南 01 号数字 员工”是公司研发的交互式远程虚拟柜员,不仅可以完成咨询、播报、迎宾这类基础工作, 也可以帮助客户完成密码挂失、重置、签约等复杂业务办理,是行业首个可办理银行业务 的“虚拟数字人”。“江南 01 号数字员工”可以提供随时随地,无感且无处不在的 7*24 小 时全天候“一对一”服务,突破“营业时间”与“营业网点”的限制,提高服务的准确性 和稳定性。

(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)

关键词: