人工智能生成视频,边生成边实时播放,不用再等了!
人工智能生成视频,人工边生成边实时播放,智能再不用再等了!生成视频实 Adobe和MIT联合推出自回归实时视频生成技术——CausVid。边生播放不用 思路就像从下载整部电影到直接观看流媒体一样,成边模型生成第一帧后,人工视频可以立即播放,智能再后续内容可以动态生成,生成视频实无缝连接。边生播放不用 如果你使用过视频生成模型,成边你必须对漫长的人工等待时间有深刻的记忆。生成一个10秒的智能再视频通常需要几分钟才能开始观看。 研究小组表示,生成视频实这种延迟的边生播放不用根本原因是:双向注意力机制广泛应用于传统视频生成模型,每帧都需要参考前后帧的成边信息。 这就像在写故事之前,你必须构思整个情节的所有细节。在完整的视频生成之前,你看不到任何图片。 为此,他们通过全新的解决方案提出了一个新的解决方案蒸馏预训练的双向扩散模型(DiT),构建自回归生成模型。 在实验中,基于自回归生成的特点,Causvid可以在没有额外训练的情况下支持多种应用,生成速度和质量明显超过现有方法。 研究小组还表示,基于开源模型的实现代码将很快开源。 双向教师监督单向自回归学生模型 如前所述,研究小组通过蒸馏预训练的双向扩散模型(DiT),构建自回归生成模型。 为了进一步加快实时视频的生成,作者通过蒸馏分布匹配(DMD)将生成步骤从50步减少到仅4步。 DMD是一种将多步扩散模型转换为快速单步生成器的扩散模型蒸馏技术。DMD此前在图像生成方面取得了成功,Adobe 基于此技术,Firefly文生图的快速模式。 研究团队创新地将其应用于视频扩散模型,实现了显著的加速。 然而,自回归模型有一个核心问题——误差累积。 每一帧视频都是基于之前的帧生成的,早期生成的任何细微缺陷都会被放大,导致生成的视频逐渐偏离预期轨迹。 为了解决这个问题,团队提出了不对称蒸馏策略。具体来说: 引入具有未来信息的双向教师模型,在蒸馏培训阶段指导自回归的单向学生模型。这种教师-学生结构允许模型在生成未来帧时具有更强的精度。 单向学生模型采用双向教师模型产生的噪声-数据配对进行预训练,提高后续蒸馏训练过程的稳定性。 在训练过程中,对不同时间点的视频帧施加不同强度的噪声,使模型能够在测试过程中基于干净的生成帧去除当前帧的噪声。 CausVid通过这种创新的非对称蒸馏方法,显著减少了自回归模型的误差积累,生成了更高质量的视频内容。 在这种不对称蒸馏形式中,学生模型和教师模型采用不同的结构,只能在DMD风格的蒸馏中使用。其他方法,如渐进蒸馏(Progressive Distillation)或一致性模型(Consistency Distillation),学生模型和教师模型都需要使用相同的架构。 以下是自回归扩散视频模型误差累积示例(左图)以及CausVid结果(右图)对比: 实验效果如何? CausVid在实验中表现惊人: 第一帧生成延迟从3.5分钟减少到1.3秒,加速170倍 生成速度从0.6帧/秒提高到9.4帧/秒,提高16倍 VBench和用户调查验证生成质量优于MetaMovieGen、智谱CogvideoX等主流模型 由于单向注意机制,Causvid完全支持广泛应用于大语言模型中KV缓存推理从而显著提高了生成效率。结合滑动窗口机制,Causvid突破了传统模型的长度限制。 尽管CausVid在训练阶段只接触了10秒的视频,但CausVid仍然可以生成30秒甚至更长的视频,其生成速度和质量明显超过了现有的方法。 Causvid基于自回归生成的特点,可以支持多种应用程序,无需额外的训练: 图片动画化:将静态图片自然转化为流畅的视频,赋予图片活力。 实时视频风格转换:如果将Minecraft游戏图片立即转换为真实场景。该技术为游戏渲染带来了新的想法:在未来,人工智能可能只需要渲染基本的3D几何信息来实时补充纹理和光影 生成交互式情节:通过调整提示词,用户可以实时引导视频情节的发展,带来全新的创作体验。
上一篇 下一篇






- 最近发表
-
- 一加 13发布会定档:产品力大升级,样样超 Pro
- 华为新品登场,一文看懂Mate70与Mate X6创新点_Pro_镜头_续航能力
- 三星Galaxy S25系列全球新品发布会定档1月23日,安卓顶级机皇即将震撼登场_Ultra_手机_Slim
- 华为领先苹果,iPhone18要用单挖孔、可变光圈镜头,你信吗?_技术_系列_孔屏
- 一加手机微博粉丝破千万,豪气庆祝活动回馈粉丝
- 华为Mate 70系列正式发布:整机性能暴增40%,搭载原生鸿蒙系统_用户_余承东
- 华为手机计划重返全球市场,将进军60个国家和地区_Mate_中国香港_占全国
- 去年中国折叠屏手机出货量占全球一半以上,但增长率正在放缓_市场_翻盖式_Mix
- 救命啊!太粉嫩了吧,美到让人心脏骤停的仙女裙太养眼了!!!
- 你为什么不买iPhone了!苹果手机国内激活量份额环比大涨:但比2年前差远_市场_中国_黄线
- 随机阅读
-
- 小米15系列手机新设计曝光:火山口过渡设计搭配外置闪光灯
- 7999元起!荣耀Magic7 RSR保时捷设计值得买吗?看看有哪些升级_手机_模组_摄像头
- 华为mate70销量300万?首月销量而已!产能决定销量根本抢不到!_Mate_系列_Pro
- 一加Ace 5 Pro最新爆料:2024年底或2025年初推出_手机_的开发_的设备
- 性能狂飙!曝骁龙8 Gen4跑分超越苹果A18 Pro
- 从457KB到600MB!微信安装包13年竟然膨胀1500多倍_App_功能_内存
- 2024年高性价比手机推荐:这3款公认好口碑,高配低价,用5年不卡_配置_金属中_性能
- 2024年底换机潮来袭!这三款旗舰手机值
- OPPO重击恶意售后行为,消费者权益应由多方维护
- 一加 Ace 5性能实测:媲美骁龙8至尊版旗舰,远超同级别性能机_原神_游戏_小时
- DXOMARK研讨会:以本地化测试与洞察,与中国用户打造手机影像未来_基准_调研_Herv
- vivo、OPPO、荣耀霸榜旗舰,真我登顶次旗舰11月手机性能排行出炉_Pro_机型_Redmi
- 都 2022 年了,「蝴蝶元素」怎么还那么火?
- 小米15 Ultra定了,发布时间大幅“提前”,配置有点刺激!_旗舰机_新品_相机
- LG向vivo出售46项美国标准专利 已退出手机业务多年_电子_相关_许可
- 2024年国内智能手机厂商排名基本锁定:
- vivo T3 Pro 中端新机曝光:骁龙7 Gen 3 + 5500毫安大电池
- 去年中国折叠屏手机出货量占全球一半以上,但增长率正在放缓_市场_翻盖式_Mix
- 从3699元跌至2985元,5000mAh+100W+鸿蒙系统,华为售价更加亲民了_nova_Pro_手机
- 三星折叠手机将采用自家处理器,Exynos2600能带来哪些惊喜?_技术_nm_工艺
- 搜索
-
- 友情链接
-
- 猫走路发现什么原因?揭秘猫咪步态的秘密
- 猫舔嘴什么原因:揭秘猫咪的这一神秘行为
- 猫脱皮什么原因——揭秘猫咪皮肤健康的秘密
- 领养猫咪需要钱吗
- 领养猫咪正规平台湖南:打开爱心之门,共创温馨家园
- 让猫咪对你有信任——打造亲密的宠物护理关系
- 猫舔煤球是什么原因?揭秘猫咪的这一怪异行为
- 猫身体沉重是什么原因?揭秘猫咪健康隐患
- 蓝猫不吃饭什么原因:揭秘背后的真相
- 银渐短猫咪价格:揭秘这一贵族宠物的市场行情
- 猫钻被窝什么原因?揭开宠物小秘密
- 猫脑袋正常吗?揭秘猫咪行为背后的科学
- 猫追鸟——揭秘猫咪的神秘冲动
- 猫缺钙是什么原因引起
- 猫虱子咬到什么原因?揭秘猫咪身上的不速之客
- 闪亮可以给猫咪用吗?揭开宠物护理的秘密
- 黑龙江哪里收猫咪:探寻爱心之家的秘密
- 猫身上尾巴出油什么原因