智东西


(资料图片)

作者 | 周炎

编辑 | 云鹏

大模型爆火以后,在元宇宙中“失意”的数字人再次成为行业关注的生意。

今年以来,科技企业,电商平台都推出数字人生成平台。从东方证券发布的虚拟数字人行业报告来看,2030年,我国虚拟数字人的市场规模有望达到2700亿元。

然而,目前无论是直播领域还是创投领域,依然没有出现爆款的数字人平台,数字人在商用落地方面仍然面临着难题。不仅如此,高额的成本依旧是数字人大规模落地前的“绊脚石”。

就在上月,新壹科技使用了董事长韩坤的数字人形象主持了一场国内首个视频大模型的发布会。会上,新壹科技发布了基于大模型的AIGC视频生成平台“秒创平台”、商用数字人平台“新壹数字人平台”。

▲新壹科技董事长韩坤数字人形象主持发布会

据新壹科技CEO雷涛介绍,未来一年里,中国将至少新增100万个数字人,未来将实现数字人“人人可拥有”。随着私域经济的进一步发展,数字人将在视频领域破圈。

在数字人竞赛升温的当下,智东西对话新壹科技CEO雷涛,新壹科技副总裁、AIGC业务负责人陈鹏,来探究一个注册刚一年多的公司是如何打造出中国版的“Midjourney”、“Runway”、“Character.ai”的“集大成者”?在数字人打造成本依旧较为高昂的当下,是什么让雷涛认为,今年,中国将至少新增100万个数字人?下一步,数字人平台比拼的焦点到底是什么?

▲新壹科技CEO雷涛演示数字人平台

一番交流下来,我们看到了这个在视频领域摸爬滚打20年团队,如何抓住AIGC时代机遇再度崛起,以及未来在数字人赛道发展的野心。

一、科幻电影不再需要“群演”了,AIGC释放视频领域生产力

在ChatGPT推出后半年多时间里,AI大模型“井喷”,百度、华为、360等互联网企业接连推出接入大模型的数字人平台,然而大模型究竟如何为数字人赋能?数字人如何真正应用到千行百业中去?仍然是入局者的痛点问题。

今年以来,由RunwayML参与制作的《瞬息全宇宙》斩获奥斯卡最佳女主角,AI生成视频就引起了行业的广泛关注,IR、Ten24等公司也将静态重建技术完全商业化,服务于好莱坞大型数字人制作。可以看到,国外这种AI数字人参与视频制作的模式已经趋近成熟化,同时为数字人落地提供了一个可实施的方向。

在国内的AIGC创业公司中,新壹科技算是可以与前者对标的公司。上月,新壹科技在视频大模型发布上演示了基于自家大模型打造的AIGC视频平台“秒创”、商用数字人平台“新壹数字人平台”的能力。

简单而言,有一天像《三体》《流浪地球》这样的科幻电影的预告片,很多镜头将不再需要拍摄,只要这个对着“秒创”平台输入一段话或一张图片,即可实现图文转视频。如果需要人物,那么还可以通过“新壹数字人平台”完成相关数字人的训练。

▲新壹科技推出的视频大模型生成的内容

据雷涛介绍,未来,中国电影预告片将会在很大程度上被“AI”所接管,数字人将在很大程度上代替目前的群演。而更加颠覆性的事情可能是,每一个用户都能成为自己影片的“导演”。

为了探究AICG时代视频领域生产力将如何释放?数字人在视频领域应用又将擦出怎么的火花?我们与新壹科技CEO雷涛,新壹科技副总裁、AIGC业务负责人陈鹏进行了深入交流。

据雷涛介绍,目前大部分通用大模型没有从实用场景出发,从而导致其实用性不强,难以真正重塑生成。而新壹科技推出的视频大模型,在使用通用大模型的基础上,还利用曾经在秒拍、微博等平台积累的数据集进行训练,其中文本数据可以达到百亿级、图片视频数据量可以达到20亿左右。

▲新壹科技CEO雷涛演示秒创平台

据陈鹏介绍,相较于ChatGPT等通用大模型使用的数据集而言,该公司积累的数据集经过了“安全合规”的审核。同时,此前运行的过程中还进行了数据标注、结构化等工作,在打造视频大模型的过程中,还对数据进行了清洗,这都进一步保证了AIGC视频生成平台“秒创”、商用数字人平台“新壹数字人平台”中数据的质量。

▲新壹科技数字人平台训练出来的数字人“伊人”

此外,为了保证图文转视频的精准度,新壹科技持续优化视频大模型中素材的匹配度,目前精准匹配可以达到千万级,泛匹配可以达到20亿的规模,这将进一步推动视频领域生产力的提高。

当视频能用“大模型”生产了,那真人出镜的部分如何解决呢?还要一段段去录、一段段去剪来完成吗?

新壹科技的数字人平台就是这样的实际需求从而落地的。目前,新壹科技的数字人通过多模态AI合成技术,可以将真人录制的视频和音频素材生产写实数字人,该平台目前可以在24小时完成一个数字人的训练。开篇所提到的董事长韩坤的数字人形象就是这样训练出来。

二、视频领域20年“老兵”,抓住AIGC时代机遇,满足垂直场景需求

能够在如此短的时间就推出国内首个视频大模型,并推动多款应用落地的的企业背后又有着怎样的人才、技术以及行业优势?

公开信息显示,新壹科技注册于2022年1月,算是一家非常年轻的创业公司。能够推出国产首个视频大模型以及推出数字人平台落地,与他们的团队有很大的关系。

▲公开信息显示,新壹科技成立于2022年

他们曾是在视频领域摸爬滚打20多年的老玩家,移动互联网时代火爆全网的应用秒拍、小咖秀都是该团队推出的产品。这些年来,新壹科技培养出了一支代码过硬的工程师队伍。

而更早之前,这个团队则亲手打造了中国首个上市的视频公司酷6网,CEO此前还担任过搜狐娱乐互动中心主编。

目前新壹科技AIGC团队共有100人左右,这个“很懂视频”的团队在2年前意识到当下“万物皆可视频化”的趋势,然而制作视频过程中设计到人力的工序。于是,团队就开始思考:如何使用AI的方式生成视频,既满足用户图文转视频的需求,又提高视频的生产力?

陈鹏称,当时2021年12月份开始启动项目的时候,甚至没有AIGC这个概念,“直到去年,随着stable Diffusion和Midjourney的爆火,我们才知道原来行业给我们一直做的事情其实下了定义。”

据雷涛称,基于新壹科技视频大模型,目前公司打造数字人的成本大大降低,同时数字人的表情等也更加真实自然。相较于未接入大模型的平台、新壹科技的数字人还拥有文本理解能力和多轮对话能力。

▲训练数字人时的工作场景

据陈鹏回忆,在过去的几年里为了让数字人实时无延迟地回答问题都花费了团队大量的心血。不过可喜的是,目前,相较于接入ChatGPT的数字人而言,新壹科技打造的数字人接入自家公司的视频大模型,一方面无需考虑到数字出境、数据审查的问题,另一方面,垂直大模型的参数量也较小,因此推理的速度将会大大加快。

雷涛认为,AIGC时代下光有技术是不够的,还有能提供直接使用的场景,这样技术才能被更高频率、更大范围地应用起来,而在这方面,垂直领域的玩家具有先天的自身优势,因为它本身就更懂市场。

在雷涛看来,目前私域经济成为趋势,行业专家、律师、理财顾问等群体有私域运营的需求。但这里就会面临一种情况:他们想要对一件事情发表观点,但是他可能自身在视频面前的表现力不强,或者没有足够的时间出境,这时,有一个数字人帮他出镜,这样就会很好满足这部分人的需求。

▲新壹科技数字人平台的2D写实数字人可代替真人出镜

雷涛预计,在未来一年里,新壹科技将打造100万个数字人。目前,新壹科技的数字人平台同时面向To B端和To C端,To B端主要面向一些大客户的定制化需求,例如目前该公司正在与蔚海灿娱合作,专攻“明星数字人”市场。此外,To C端也正开放给具有打造个人IP需求的视频创作者们。

未来,新壹科技还计划进军影视领域。在雷涛看来,以目前技术发展阶段来看,数字人还只能承担边缘性的人物角色,同时数字人在影视领域大规模落地还有很长的路要走。

对于目前数字人在电商直播、养老等领域落地,雷涛还指出,数字人目前还不能完成真人在直播间中销售的全流程工作,同时真正起到对老人的陪伴作用仍需技术上的攻克,“目前行业设想的许多场景,离真正实现仍有一段距离。”

结语:数字人不再是“吉祥物”,新壹科技推动数字人在“视频创作”领域落地

事实上,在过去几年,数字人虽然作为“资本的宠儿”,但一直都是“吉祥物”般的存在,在具体行业落地方面一直存在瓶颈。

新壹科技基于自身20年视频领域经验,打造出的视频大模型进一步推动了视频生产力的提升,同时基于大模型的数字人平台不仅可以节省数字人生产成本,而且还使数字人进一步拥有了“灵魂”。在私域经济不断发展的当下,普通人打造个人IP的需求更加强烈,这将进一步推动数字人在视频领域的落地。

推荐内容