用一张照片秒变动态表情!阿里巴巴新算法FantasyPortrait刷新行业认知

1个月前 高效码农

FantasyPortrait:基于表情增强扩散变换器的多角色肖像动画生成新突破 用一张照片和一段视频,就能让单人或多人的肖像动起来,而且细节丰富、情绪自然、跨身份依然精准。 1. 背景与挑战 在电影 …

用500美元跑通视频生成革命:Pusa V1.0极简指南

2个月前 高效码农

用 500 美元就能跑通的视频生成新范式:Pusa V1.0 通俗全指南 读完本文,你将知道: Pusa 是什么,为什么它能用 4 000 条样例、500 美元预算,就打败需要 1 000 万条样例、 …

视频虚拟试衣抖動大?MagicTryOn如何用扩散Transformer破解行业难题?

3个月前 高效码农

全流程解析:MagicTryOn——基于扩散 Transformer 的视频虚拟试衣方案 随着线上购物和社交视频内容的爆炸式增长,用户对试穿体验的真实感和流畅度提出了更高要求。传统的基于图像的虚拟试衣 …

MAGI-1模型如何突破视频生成边界?深度解析24B参数自回归架构

5个月前 高效码农

MAGI-1:自回归视频生成模型的技术解析与实战指南 一、MAGI-1的核心技术架构 1.1 自回归分块处理机制 MAGI-1创新性地将视频分割为24帧的独立单元(Chunk),采用分块生成策略: 流 …