生成模型归档 | 高效码农

3个月前高效码农

InfinityStar：统一时空自回归模型在视觉生成中的应用引言：InfinityStar 是什么，它如何解决视觉生成中的挑战？本篇文章欲回答的核心问题：InfinityStar 模型是什么，它 …

3个月前高效码农

ViBT：大规模视觉桥接变换器，重新定义条件生成本文要回答的核心问题：ViBT 到底是什么？它为什么能在图像编辑、视频风格迁移、视频上色、帧插值等任务上，既保持高质量，又比传统扩散模型快 4 倍？ …

3个月前高效码农

STARFlow 家族全景拆解：从 3B 图像到 7B 视频，一套可执行的开源方案核心问题：苹果最新开源的 STARFlow 与 STARFlow-V 到底能做什么？值不值得立刻上手？一句话回答： …

4个月前高效码农

探索生成模型的强大之道：从自回归到扩散，再到更进一步你有没有想过，为什么像GPT这样的语言模型总是在一步步“预测下一个词”？这听起来简单，却支撑了从聊天机器人到代码生成的整个AI世界。但当我们面对更 …

7个月前高效码农

MixGRPO：用“混合采样+滑动窗口”让 AI 绘图模型训练快 71% 一句话总结在 FLUX.1-dev 之上，MixGRPO 用“ODE+SDE 混合采样”只优化最关键的 4 步，训练时间比 …

7个月前高效码农

让图像与文字像聊天一样流畅：X-Omni 带来的统一式生成体验 “能不能像写句子一样把一张图‘写’出来，而且一次就能写对？” 过去，答案是“做不到”。今天，X-Omni 正在把它变成日常。在这篇文章 …

11个月前高效码农

MAGI-1：自回归视频生成模型的技术解析与实战指南一、MAGI-1的核心技术架构 1.1 自回归分块处理机制 MAGI-1创新性地将视频分割为24帧的独立单元（Chunk），采用分块生成策略：流 …

11个月前高效码农

引言：视频生成领域的革新者近年来，随着深度学习技术的飞速发展，视频生成模型逐渐从实验室走向实际应用。在这一领域，Wan2.1 作为一套开源视频生成模型套件，凭借其先进的功能和高效的性能，迅速成为行业 …