FIFO-Diffusion 是一款可以生成无限长的连续视频的AI视频生成开源项目,是一种无需训练的基于预训练扩散模型的新型推理技术,可以从文本生成无限长的视频。
虽然它能够生成无限时长的长视频,但还是会存在一定的跳帧情况。不过网上也有大佬们提供有解决方式,就是推荐使用AI插帧来补充画面跳帧弊端。
特点:
• 通过迭代进行对角去噪处理,无需训练即可生成无限长的视频。
• 通过前向参考机制使帧之间的去噪效果更好,同时引入潜在分区和前瞻去噪以减少训练-推理差距。
• 支持生成高质量、长时间的视频,已在多种文本到视频生成基线模型上展示了其有效性。
• FIFO-Diffusion 在TextVQA、DocVQA等基准测试中表现优异,超过了一些非开源模型。
Star:146
数据统计
相关导航
暂无评论...