图像生成技术归档

6个月前高效码农

“ 800亿参数、64专家MoE架构、自回归框架——这不仅仅是技术参数的堆砌，更是多模态理解与生成的一次彻底融合。还记得第一次使用文生图模型时的期待与落差吗？输入“一只在田野奔跑的小狗”，得到的可能 …

6个月前高效码农

一、引言：AI绘画优化的新突破近年来，扩散模型（Diffusion Models）在图像生成领域取得显著进展，但存在两大核心瓶颈：传统方法依赖多步去噪计算导致训练效率低下，以及离线调整奖励模型难以实 …

9个月前高效码农

Qwen VLo：首个统一图文理解与生成的大模型，如何让AI既懂世界又能创作？突破性技术预告：上传一张猫图说“加顶帽子”，AI就能实时生成戴帽子的猫——这不是科幻电影，而是Qwen VLo带来的真实 …

9个月前高效码农

Align Your Flow：流图蒸馏技术的突破与应用生成模型图像引言在人工智能的世界里，生成模型正以前所未有的速度改变着我们的生活。从栩栩如生的图像到根据文字生成的画面，这些技术让我们仿佛置 …

10个月前高效码农

深入解析BLIP3-o多模态模型：统一架构实现图像理解与生成新突破引言：多模态AI的进化之路在人工智能领域，多模态模型正以前所未有的速度推动着技术边界。从早期独立的视觉和语言模型，到如今能够协同处 …

1年前高效码农

一、什么是InfiniteYou？ InfiniteYou（InfU）是由字节跳动智能创作团队开发的一项突破性技术，旨在解决身份保留图像生成中的三大核心挑战：身份相似度不足、文本-图像对齐效果差，以及 …