在人工智能引领的科技浪潮中,国产视频大模型正悄然走在前列,成为全球科技创新的重要力量。3月29日,在中关村论坛年会“未来人工智能先锋论坛”上,清华大学人工智能研究院副院长、生数科技创始人兼首席科学家朱军发布了高可控视频大模型Vidu Q1,标志着国产视频大模型迈向了新高度。
“一辆越野车行驶在森林中,阳光透过树叶的缝隙,形成一道道斑驳的光束……”这段由国产础滨视频大模型生成的模拟真实物理世界的高清视频,在2024中关村论坛年会首次惊艳亮相。彼时,生数科技联合清华大学发布的中国首个全面对标厂辞谤补的视频大模型痴颈诲耻引发全球关注。
一年后,朱军再次来到中关村论坛年会的演讲台上,带来了团队的最新成果——Vidu Q1模型。基于该模型,人们不仅用一句话就能生成一段精美的AI视频,还能对视频中各种主体的位置、大小、运动轨迹进行精准的控制和调整。
据悉,一直以来,AI视频生成过程中的随机性都是老大难问题,Vidu Q1针对AI视频生成的痛点,通过技术手段引入多元素控制,它不再是没有头绪的乱生成,而是做到了人为可控,这就让AI视频生成与当下精益求精制作逐渐趋向一致,对于追求极致的人来说,这是一个新的里程碑。
“期待中国的础滨视频生成赛道玩家能够持续在世界舞台上舞出风采,在百家争鸣中,实现中国多模态技术的极大发展和人人可感知到的现实应用。让我们一起期待中国队的表现。”朱军说。
据悉,AI视频生成模型已经在动漫、影视等领域落地。以动漫领域为例,通过对角色、物体、场景等的精确控制,能够让创作者快速生成高质量动画。日前好莱坞知名动漫工作室Aura Productions选择与Vidu合作,计划制作50集动画短剧。
编辑:李华山