您需要 登录 才可以下载或查看,没有账号?注册
x
来源 CG世界
“ 感知技术 · 感触CG · 感受艺术 · 感悟心灵 ”中国很有影响力影视特效CG动画领域自媒体
文/编辑:木木
最近,“数字人”再次掀起讨论热潮,多家互联网大厂纷纷推出“数字人”产品。 “数字人”是什么?是虚拟偶像吗,像“初音未来”一样的存在?
11月29日,百度App 上线“数字人”,不过百度这次推出的不是单纯的娱乐性质的虚拟偶像,而是将现实“搬进”元宇宙,推出“龚俊数字人”。
百度App“龚俊数字人”可以与用户进行语音交互并提供搜索服务,用户在对数字人说出需求后,数字人即可快速识别并自动语音播报第一条搜索结果。
可以看到,数字人不仅存在于虚拟世界,他们正在影响着现实,并为用户提供多样化的生活服务。
在用户可以随时与龚俊数字人语音交互、获得搜索服务的背后,百度将4D扫描、语音识别、TTS(Text To Speech)等AI技术进行了多方面的应用。
这种“AI技术+明星+搜索服务”的行业创新组合模式,与其他数字人最大的区别是什么,百度“龚俊数字人”在经过多种AI技术的优化与整合后,与本尊又有哪些相似、有何不同?
国内首个可交互超写实明星数字人,
到底是什么?
在数字人争相“破壳而出”的今天,现在不少互联网公司推出的数字人IP,基本偏向娱乐性质,更倾向于为品牌营销服务,通过积累粉丝群体从而产生更多的商业价值。
“龚俊数字人”与其他企业打造的数字人相比,却有两个创新的差异化标签,一个是自带“明星”属性,另一个是技术与应用层面的“端内可交互超写实”。
谈到“明星龚俊”本身,自带话题热度,相比其他家必须经历数字人IP养成阶段,百度龚俊数字人基本可以省略,目前龚俊在微博有一千九百多万的粉丝群体,本身具有一定商业价值,且已形成稳定的IP生态圈,龚俊数字人IP已经建立,可以节省一定的IP打造费用。
在服务应用方面,与以往的娱乐性质数字人不同,百度龚俊数字人的核心能力不再是唱歌、跳舞等表演性质,而是可以成为用户生活的智能伙伴,为用户提供搜索服务,并分享专业的知识内容,以及通过技术创新、声音拟人化,用龚俊本人的声音,为用户带来温情陪伴服务,成为具有关怀感和真实感的AI服务助手。
现在,当你想搜索某一个问题时,除了在搜索框主动输入文字,还可以打开百度App并且点击页面底栏的话筒图标,点击右上角的“设置”按钮,在“语音设置”界面中选择“龚俊数字人” 为语音搜索助理,之后用户进行语音搜索时,即可与龚俊数字人进行面对面的实时对话,用AI的方式开启更便捷的生活。
此次,百度App打造的龚俊数字人也是一种人机交互的服务升级,以及AI技术在CG产业提供具体服务的一次落地。如今,AI技术的创新与应用,在数字人写实、交互、效率提升等方面,已经开始用了深入的应用。
从手绘到AI,数字人实现“超写实”
数字人从最早的手工绘制,到如今的CG、AI等创新技术合成,期间从外貌、神态、肢体动作、服务能力等方面,已经发生了天翻地覆的变化。
最早的数字人诞生在1982年的英国,制作数字人的技术以手工绘制为主,最终效果是基于对真实演员的特效化妆和手绘来实现。
如今,传统手绘逐渐被CG和动作捕捉等技术取代,但在动作捕捉方面,会消耗大量的人力和时间成本,需要演员一直身穿动捕服装进行表演,对表情、动作数据进行采集。在呈现状态上,早期的数字人主要利用CG技术合成,人物声音采用雅马哈的VOCALOID系列语音合成,这一时期数字人的呈现形式也相对粗糙。
随着AI技术在CG制作上应用的不断深入,数字人在写实方面有了大幅度的提升。例如,百度通过4D扫描、智能绑定等AI技术,捕捉龚俊说话及日常表情面部细微变化、口型面部肌肉动作等,让龚俊数字人的表情神态更加逼真,做到对龚俊真人的超写实还原,让粉丝在虚拟世界看到现实中的偶像龚俊。
如果你仔细看龚俊数字人,不难发现,这次百度智能云的数字人技术团队在眼部真实度上花费了一些心思,不仅眼球和眼睑的过渡平滑,“根根分明”的睫毛与龚俊本人“睫毛精”的形象也非常契合,形成一个极具真实的状态。
现在,市场上很多的数字人是一个全新角色,从无到有,与这些脱离现实的这些数字人相比,龚俊数字人要实现“超写实”,仅有外貌形态的相似是远远不够的,还需要实现龚俊数字人语音定制,百度使用TTS(Text To Speech)技术,让龚俊数字人借由AI合成的声音可以无限接近于原声,让数字人更“有人气”、“有人味”。
AI不仅让龚俊数字人更拟人化,还让他们有了新职责。承载了搜索服务需求的龚俊数字人,仅有好看的“皮囊”远远不够,他还要满足百度App海量用户的语音交互需求,识别来自天南海北的各地方言,应对偶尔出现的生僻字,如果遇到中文不太流利的外国友人,识别中英文混杂的对话也是数字人龚俊必须要面临的挑战。
不过百度App的语音搜索的识别准确率已经达到98%,看来在语音识别技术方面,数字人龚俊在上线前,似乎已经练就了“一身武艺”。目前,百度已经拥有数十项数字人领域核心专利。
无论是超写实外形、语音交互还是搜索服务,百度通过AI技术,将虚拟世界与现实生活有了进一步的连接,让数字人不再只是虚拟的娱乐偶像,而是赋予了数字人更多的产品价值和想象空间,也让人们看到了数字人与CG产业的更多可能。
缩短流程周期,
AI让数字人制作更高效
近几年,AI技术水平一直加速增长,对于计算机动画制作行业来说,AI就像是“一副有趣的灵魂”,脱离了灵魂,动画或许只是好看的“皮囊”。
那么AI到底能为CG行业带来什么?最直观的可能就是“效率问题”、“费用成本”。
谈到现在的CG制作,其中很多流程都会耗费很多的人工成本和时间,比如K动画、绑定、渲染等等,其中的反复迭代时间更是惊人,但如果有效的引入AI技术,则可以大幅提高制作效率,比如基于AI的降噪,至少在保证同作品效果的前提下,能节省更多的成本和时间。
其实从我们上面解析百度龚俊数字人背后的AI技术,不难看出AI在制作数字人、写实数字角色上的巨大优势,要是普通流程制作这样的角色,从模型雕刻,到绑定、动画和渲染,至少需要2-3个月的时间实现,百度智能云的数字人团队,则通过AI的介入则大大缩短了制作周期。
据了解,百度龚俊数字人从扫描演员外形、动作、神态等,一直到打造成真假难分的“数字人”,从无到有花费的时间大幅度缩短。
放在未来看,AI技术的加持对整个CG行业更是带来了无限的可能,通过不断的技术积累,很多CG画面或者是中间流程都可以用AI进行自动生成,这不仅是科技领域,对于整个CG范围内而言都是一个重大的突破和技术行业的全新改革。
这几年,百度一直在推动互联网产品的人文关怀。百度App数字人高度拟人化,也为用户带来的亲切感、关怀感和沉浸感,这是在明星龚俊本身的商业价值以外,延展出来的产品规划、运作方式,可以让数字人的价值得到全面的释放,并通过搜索服务,赋予数字人更多的应用场景和商业潜力。
另外,从百度App这次数字人的落地可以畅想,用户综合化的需求正在进一步的激发,“数字人”在移动互联网产品的应用场景和使用路径也得以拓宽,有望成为未来互联网产业发展的一个重要角色。
总而言之,在互联网发展迅猛的现在,数字人不会再是普通上的视觉与听觉之间的交流,他将会更广泛的在情感、爱好、习惯等方面有更多的互动性。在互联网企业的协同下逐步积累、探索,让AI技术与多学科综合,这些在未来都将成为整个行业数字化水平的重大突破。
现实与元宇宙之间的墙壁终会被打破,科技的力量会像潮水般向我们涌来,未来,我们或许都能成为“数字人”。
全文完
|