(资料图)
经济观察网 记者 沈怡然 8月17日,阿里大文娱CTO郑勇在媒体交流会上首次公开了团队使用生成式AI技术的过程。郑勇认为,相比工业、医疗、科学,生成式AI在文娱行业率先落地并融入了生产,可以大幅提升影视、游戏的制作效率,缩短生产周期,但在帮助精良制作、提升品质方面用处还不大,公司正关注相关技术的发展。
阿里大文娱是阿里拆分后的六大板块之一,集团实行董事会领导下的CEO负责制,并用AIGC将技术维度划分成C端和B端两部分,C端是通过投资和自研,产出妙鸭相机等应用;B端是用外部AI通用大模型赋能集团的影视、视频生产。
郑勇曾早期参与阿里云基础建设,包括第一代ECS系统的研发。他表示在2022年12月,团队开始尝试海外一系列AI工具,ChatGPT、Midjourney、Stable Diffusion等,并应用到多个业务场景中。“最初是员工自发地研究、使用新工具,去解决工作中的实际问题,包括用ChatGPT搭脚本框架”。郑勇认为,生成式AI率先渗透在文娱行业,是因为目前市面上成熟的工具仍然以大语言模型、文生图模型为主,而图文创作是文娱行业艺术表达的核心。
郑勇举例,动漫行业从原画制作、设计、到建模环节,都在尝试用Midjourney、Stable Diffusion来提效,缩短生产时间,公司相关业务也在实践,目前宣发环节,很多图片素材都用AI直接生成。
郑勇表示,不论游戏、影视还是短视频的生产,美工都是文娱行业中占比较大的部分,一些文生图工具提升了美工的效率,“AI能在几秒钟生成一幅画、一张海报,人类以往需要以周和月为单位来创作,过程中还需要大量的沟通、修改,现在大大缩短了我们的生产周期”。
但是,郑勇发现品质把控、提升质量方面的问题仍需要专业的人来解决,目前没发现比较好的视频生成和3D生成工具,而且市面上的生成式AI都是通用的大模型,在各领域都有一定积累,但是无法在某个领域生成十分极致的内容。在郑勇看来,目前生成式AI无法替代专业人士,只是革新了专业人士手中的工具,因为AI创作的水平和个人的审美、鉴赏力高度相关。郑勇曾对比理科生和美术生同样用Midjourney生成的图画,认为两者有很大差距。
阿里大文娱方面表示,集团正在为创新产品提供组织保障,已于今年6月成立了神力视界(深圳)文化科技有限公司,注资1亿元,经营范围包含人工智能应用软件开发、文艺创作、广播电视节目制作经营等,由阿里巴巴文化娱乐有限公司全资控股,法定代表人为郑勇。
郑勇表示,此前爆火的妙鸭相机就是依托神力视界的技术能力孵化出来的,接下来为了便于管理,妙鸭相机的公司主体也将并入神力视界。