Google Veo 3 实测:那些 Keynote 中没展示的真相

在 2025 年的 I/O 大会上,Google 推出了 Veo 3,声称它能够从简单的文本提示生成无瑕疵、带有同步音频的视频。这引起了大众的广泛关注,也让很多人担心人类创意工作者是否会被取代。然而,如果我们回顾过往类似技术的发展轨迹,就会发现事实可能并非看起来那么简单。

回顾过往:AI 视频生成的 “幻灭”

2024 年,OpenAI 的 Sora 被誉为视频生成领域的 “革命性” 产品。但后来人们发现,这些视频需要大量人工来修复连贯性问题、平滑错误,并且把多个 AI 生成片段拼接成连贯的叙事,大多只是 glorified montages( glorified montages 意为华丽的混剪,在视频编辑中指的是通过添加大量特效和剪辑技巧,使视频看起来华丽但实际内容拼凑痕迹明显)。当时,Sora 的原始输出暴露了常见的 AI 视频问题,如时间上的不连贯、物理法则违反、变形物体以及早期系统中存在的 “AI 手” 问题。

如今,Google 的 Veo 3 似乎又在重蹈覆辙。它让人们对自动化创意工作的美好未来充满期待,但现实可能远比演示中所展示的复杂。

Veo 3 实测:光鲜演示背后的真相

Google 的演示展示了 Veo 3 生成的高质量视频,人物形象完整,没有多余肢体,音频同步,画面质量媲美电影。然而,作者在 2025 年 5 月 27 日亲自测试了 Veo 3。

测试中,作者使用了一个详细的电影化提示,灵感来源于斯皮尔伯格的风格:一个士兵与年幼儿子充满情感的团聚场景,包括对黄金时段照明、亲密的镜头移动和台词的具体要求。结果却令人大失所望。仅在免费尝试一次后,Veo 3 只生成了一个简短、低质量的片段,与作者的电影化愿景相去甚远。音频是随机的感叹词(如 “Oh!”“La!”),而非请求的对话。视频质量差,缺乏指定的照明、构图和情感深度。

当作者想再次尝试免费试用时,却发现没有足够的积分。从这里可以看出,即使是免费试用,也可能受到积分限制,而要继续使用就需要付费。

而这一单次测试生成的内容,想要达到可用程度,需要进行大量的后期处理,这正是 Google 在 Keynote 中所隐藏的人工劳动。

隐藏的人工劳动:AI 视频背后的真相

Google 所展示的视频很可能需要大量人工干预,以下是这些 “轻松” 结果背后隐藏的人工劳动:


  • 色彩校正和视觉一致性 :AI 生成的片段常存在不一致的照明、色温变化和视觉伪影,需要专业调色师和在线编辑进行修正。看似无缝的输出实际上是逐帧调整的结果。

  • 音频后期制作 :尽管 Veo 3 可以生成同步声音,但根据作者的测试,音质显然需要增强。没有人类的帮助,AI 不太可能为视频创建声音设计。

  • 复合剪辑 :最令人印象深刻的演示很可能结合了多次 AI 生成。编辑必须从数十次尝试中选择最佳片段,将它们拼接在一起,以隐藏 AI 的缺陷并放大其优势。

  • 提示工程 :要获得专业结果,需要对提示、参数和生成种子进行大量实验。团队通常会生成数百种变体,才能获得可用的素材。

所谓的 “无懈可击的 AI 生成” 实际上代表了一种混合工作流程,其中人类专业知识仍然是必不可少的,但却被系统地低估并隐藏在公众视野之外。如果希望制作一部完整长度的电影,每个镜头都不会让人出戏,那么色彩、声音和剪辑时机都需要无缝衔接,否则就会影响观看体验。在这种情况下,与其寄希望于 AI 生成,不如直接用真实的人类来拍摄这个场景,以达到预期效果。

被忽视的环境代价:AI 视频生成的隐性成本

除了隐藏的人工劳动,还有一个鲜有人提及的问题——环境危机:失败的 AI 生成尝试的巨大能源消耗。


  • Veo 3 生成的能源成本


    • 每次 Veo 3 生成都需要大量的 GPU 处理能力。

    • 大多数失败的尝试都浪费了能源,且没有产生可用的输出。

    • 专业项目可能需要 100 多次尝试才能完成几个镜头。

    • 训练这些模型所消耗的能源相当于数千户家庭的年能源消耗。

Google 精致的演示没有提到每个 “成功” 片段背后被丢弃的数百次尝试。当成千上万的用户生成数百万个片段时,其碳足迹将变得巨大——所有这些都是为了生产仍需要人类专业知识才能变得有用的内容。传统的视频制作虽然资源密集型,但能产生可预测的结果。而 AI 生成则通过计算上的低效创造环境浪费,生成无用的输出却被丢弃,同时消耗与成功尝试相同的能源。

从 Sora 到 Veo 3:可预测的 AI 炒作周期

OpenAI 的 Sora 在 2024 年初推出时,也遵循了类似的炒作剧本。最初的演示展示了令人惊叹的视频,如雪地中的猛犸象、熙熙攘攘的东京街头场景和超现实的艺术愿景,这些似乎都是 AI 难以创造的。

Sora 的发布引发了关于 AI 在电影制作中角色的广泛猜测。媒体报道往往强调其降低成本的潜力,而在线论坛则讨论人类创造力是否可能变得过时。电影制作人泰勒・佩里在测试了 Sora 等 AI 工具后,暂停了工作室的扩建,声称 “工作岗位将会流失——这是一个真正的危险”,这听起来像是一个很好的借口来摆脱交易。

尽管没有主要工作室宣布立即裁员,但自由职业编辑和视觉特效艺术家在 Reddit 的 r/Filmmakers 等在线社区报告了对工作安全性的日益担忧。

追踪资金流向:AI 公司为何过度宣传自动化

要理解 AI 炒作周期,就需要追踪资金流向。科技公司不仅向消费者过度宣传 AI 的能力,还利用这些说法来推动投资轮次、IPO 估值和股价。


  • 风险投资的压力锅 :投资者要求指数级增长潜力。“帮助人类创造力” 的工具无法像 “取代整个创意产业” 的工具那样证明数十亿美元的估值。

  • 公开市场表现 :AI 公司基于自动化承诺进行大规模交易。承认对人类劳动的依赖会在一夜之间使估值崩溃。

  • 企业销售 :企业买家不想听到有关混合人类 – AI 工作流程的事情。他们想要削减人力成本。销售团队学会强调工作替代潜力,同时淡化实施的复杂性。

这造成了一个循环:公司必须过度宣传 AI 能力,以维持其估值,即使内部团队知道该技术尚未准备好进行自主操作。结果是 AI 系统的过早部署,这些系统需要大量人工支持——而这种支持被隐藏起来,以维持自动化叙事。

传统公司的执行团队通常缺乏技术专业知识,他们相信这些承诺并开始计划裁员,却在了解技术实际要求之前就行动了。

员工的流失不是因为 AI 可以做他们的工作,而是因为高管基于误导性的营销相信它可以。

AI 炒作的人类代价

AI 过度宣传的人类代价远远超出了硅谷。当公司承诺工作替代却未能兑现时,提前自动化尝试的真正工作者将为此付出代价。


  • 创意行业基于虚假承诺的裁员 :创意公司开始基于 AI 承诺削减人力职位,却意识到项目仍需要大量人类专业知识。结果将是更少的稳定工作、更多的零工工作,以及对剩余工作者的更大压力,以与 AI 辅助工作流程竞争。


  • 技能贬值 :通过将人类专业知识呈现为可轻松替代的,AI 营销系统地降低了创意和技术技能的价值。那些花费多年培养手艺的工作者发现,他们的贡献被重新定义为要被自动化的低效环节。


  • 经济焦虑 :即使工作仍然安全,工作者也面临着对 AI 替代的持续不确定性。这种焦虑抑制了工资和工作条件,因为雇主通过威胁获得了自动化杠杆。


  • 社区影响 :当主要雇主采用提前自动化时,整个社区都会受到影响。依赖稳定就业的本地企业将面临衰退,因为工作者面临工作不安全感和消费能力下降。

也许最具破坏性的是,AI 炒作周期创造了一种自我实现的预言。通过说服高管认为人类工作已过时,公司创造了这样的条件:工作者被视为未来 AI 系统的临时占位符——无论这些系统是否真的能够交付。

构建真正帮助人类的 AI

当前 AI 开发的悲剧不在于技术缺乏潜力,而在于这种潜力被浪费在短期利润而非长期人类繁荣上。

Veo 3 和类似工具可以真正协助人类创造力,减少繁琐工作,并使创意制作民主化。但要实现这一愿景,需要从根本上改变 AI 的开发、营销和部署方式。


  • 诚实 AI 开发的外观


    • 营销中的透明度要求 :公司应披露 AI 演示背后的人工劳动。如果一段视频需要 50 小时的后期制作,应予以说明。如果系统需要人工监督,应承认这一点。

    • 以工人为核心进行开发 :AI 工具应与受影响的工人共同设计。专注于减少重复性任务,同时保留人类的自主权和创造力,而不是消除工作岗位。

    • 补偿培训数据来源 :艺术家、作家和创作者的作品被用于训练 AI 模型,他们应获得公平的报酬和同意。培训数据应透明地获取,并有明确的归属。

    • 选择进化而非革命 :专注于帮助人类更高效工作的工具,而不是承诺全面替代创意工作者。

  • 我们现在需要的监管解决方案


    • 建立 AI 能力标准 :政府必须防止公司将依赖隐藏人工劳动的系统宣传为自主系统。

    • 在 AI 过渡期间保护工人 :为被 AI 实施扰乱行业的工人创建再培训计划和过渡支持。

    • 环境影响披露 :要求公司报告 AI 训练和生成过程的能源消耗和碳足迹。

从承诺到现实检查:模式的重复

Google 的 Veo 3 遵循了我们之前在 Sora、Amazon 的 “Just Walk Out” 以及无数其他 AI “突破” 中看到的相同可预测脚本。

令人惊叹的 keynote 演示隐藏了大量人工工作者在修复机器无法处理的问题。营销团队出售颠覆性产品,而工程团队则悄悄构建依赖人工的工作流程。高管们基于仅存在于编辑亮点中的功能计划裁员。

科技公司发现,他们可以通过承诺消除人类工作者来提高估值并证明巨额投资的合理性,即使他们自己的系统比传统工作流程需要更多的人工干预。

其成本不仅体现在令投资者失望或技术被过度炒作上——它还体现在因提前自动化尝试而被摧毁的真实职业生涯和因经济焦虑而不稳定的社区上。

一条不同的前进道路

以下是诚实的 AI 开发可能的样子:公司承认其工具增强而非替代人类能力。营销可以强调协作而非消除。开发团队可以与创意专业人士合作,构建减少繁琐工作同时保留人类自主权和艺术愿景的工具。

这种协作方法不会产生同样的病毒式头条新闻或风险投资兴奋,但它将创造真正有用的技术,改善工作条件而非消除工作岗位。

更重要的是,它将在技术人员和使 AI 成为可能的创意社区之间建立信任。

关键问题

下次你看到令人惊叹的 AI 演示时,问问自己:这花了多少次尝试?生成后发生了什么人工工作?谁从炒作中受益,谁在现实未达到承诺时付出了代价?

这些问题不仅是技术性的——它们还是道德性的。在一个从自动化人类工作中获利的行业中,我们需要对这些工具实际需要的内容以及它们对真实人们生计的影响的透明度和诚实提出要求。

Veo 3 和其他 AI 视频软件可以成为强大的创意工具。但首先,我们需要停止接受硅谷的自动化戏剧,并开始构建服务于人类创造力而非替代它的技术。

选择不是在拥抱 AI 或拒绝进步之间——而是在包括工作者的诚实开发或继续欺骗,从使这些突破成为可能的人们那里提取价值之间。

我们所需的革命不是从文本提示生成完美视频,而是创造一个珍视人类专业知识与技术能力并重的行业。这一未来仍然是可能的,但前提是停止假装当前路径通向任何好的结果。

以上内容是基于输入文件改写而成,旨在提供真实、有深度且实用的信息,希望对你有所帮助。如果你对这篇文章有任何疑问,或者想进一步探讨 AI 视频生成技术的相关话题,欢迎随时提问。

常见问题解答:

Q1:Google Veo 3 真的能完全替代人类创意工作者吗?

A1:从目前的实际测试来看,Google Veo 3 还无法完全替代人类创意工作者。虽然在 Keynote 中展示了高质量的视频生成效果,但在实际测试中,生成的视频存在诸多问题,如音频不符合要求、画面质量差、缺乏情感深度等。而且,其所谓的 “无懈可击的 AI 生成” 实际上依赖于大量隐藏的人工劳动,包括色彩校正、音频后期制作、复合剪辑和提示工程等。因此,目前 Veo 3 还不能完全替代人类创意工作者。

Q2:AI 视频生成技术的环境成本高吗?

A2:是的,AI 视频生成技术的环境成本相当高。每次生成都需要大量的 GPU 处理能力,而大多数失败的尝试都浪费了能源且没有产生可用的输出。专业项目可能需要 100 多次尝试才能完成几个镜头,训练这些模型所消耗的能源相当于数千户家庭的年能源消耗。与传统的视频制作相比,AI 生成通过计算上的低效创造环境浪费,生成无用的输出却被丢弃,同时消耗与成功尝试相同的能源。

Q3:过往的 AI 视频生成技术,如 OpenAI 的 Sora,发展情况如何?

A3:OpenAI 的 Sora 在 2024 年初推出时,被认为具有革命性。但后来发现,其视频需要大量人工来修复连贯性问题、平滑错误,并且把多个 AI 生成片段拼接成连贯的叙事,大多只是华丽的混剪。而且,Sora 的原始输出暴露了常见的 AI 视频问题,如时间上的不连贯、物理法则违反、变形物体以及 “AI 手” 问题。这表明过往的 AI 视频生成技术也存在诸多问题,与 Google Veo 3 的情况类似。

Q4:AI 公司为何要过度宣传自动化?

A4:AI 公司过度宣传自动化主要是为了满足经济激励。投资者要求指数级增长潜力,而 “帮助人类创造力” 的工具无法像 “取代整个创意产业” 的工具那样证明数十亿美元的估值。此外,AI 公司基于自动化承诺进行大规模交易,承认对人类劳动的依赖会在一夜之间使估值崩溃。同时,企业买家想要削减人力成本,销售团队学会强调工作替代潜力,而淡化实施的复杂性。这些因素共同促使 AI 公司过度宣传自动化。

Q5:如何构建真正帮助人类的 AI?

A5:构建真正帮助人类的 AI 需要从多个方面入手。首先,营销中应披露 AI 演示背后的人工劳动,承认系统对人工监督的依赖。其次,AI 工具应与受影响的工人共同设计,专注于减少重复性任务,同时保留人类的自主权和创造力。此外,艺术家、作家和创作者的作品被用于训练 AI 模型,他们应获得公平的报酬和同意。最后,政府应建立 AI 能力标准,防止公司将依赖隐藏人工劳动的系统宣传为自主系统,并要求公司报告 AI 训练和生成过程的能源消耗和碳足迹。

希望以上内容能帮助你更好地理解 Google Veo 3 及 AI 视频生成技术的现状和问题。如果你还有其他问题,欢迎继续提问。