科技前沿归档 | 高效码农

企业流程真相曝光：为什么80%的工作，你老板和你都说不清？

2个月前高效码农

上下文图：理解企业真实流程，开启智能体自动化的下一代数据平台 Context is the next data platform 如果我问你：“你们公司签一份新合同的流程到底是什么样的？”你可能会回答 …

TimesFM-ICF震撼发布：解锁时间序列预测的少样本学习革命

5个月前高效码农

解锁时间序列预测的未来：TimesFM-ICF 如何让基础模型成为“即插即用”的少样本学习者嘿，朋友们！想象一下，你是一家电商公司的数据分析师，正盯着成堆的销售数据发愁。明天的新品上架，你需要预测库 …

将科研论文转化为交互式AI智能体：Paper2Agent 如何重塑科学发现

5个月前高效码农

“ 想象一下，不是你在费力地阅读论文，而是论文变成了一个专家助手，主动为你演示方法、分析数据、甚至挑战原有结论。这不再是科幻，而是 Paper2Agent 带来的现实。你是否曾面对一篇充满潜力的科研 …

大模型推理效率提升40%？Meta最新《Metacognitive Reuse》技术全面解读

5个月前高效码农

带你读懂 2025 年 9 月最新论文《Metacognitive Reuse》的核心思想与落地价值。一、先抛 3 个你可能关心的问题问题一句话答案这篇研究到底解决了什么？让大模型不再“逢题 …

谷歌新突破！TTD-DR深度研究代理如何刷新行业纪录？

6个月前高效码农

近期，大型语言模型（LLMs）的快速发展推动了深度研究（DR）代理的兴起。这些代理展现出令人惊叹的能力，包括生成新颖的想法、高效检索信息、执行实验以及撰写综合报告和学术论文。目前，大多数公开的 DR …

Hermes 4 14B震撼发布！开源大语言模型推理能力再升级，如何引领AI助手新革命？

6个月前高效码农

Hermes 4 14B：更强大、更易用的开源大语言模型在人工智能迅猛发展的今天，大语言模型（LLM）已成为推动技术进步的核心力量。无论是进行复杂的逻辑推理，还是辅助日常的创意写作，一个能力强、易操 …

VoxCPM：无分词器的 TTS 模型，用于高级语音合成

6个月前高效码农

作者 / 团队 / 机构作者：Yixuan Zhou、Guoyang Zeng、Xin Liu、Xiang Li、Renjie Yu、Ziyang Wang、Runchuan Ye、Weiyue S …

当AI成为伴侣：Reddit社区中人类与人工智能的情感联系研究

6个月前高效码农

引言想象一下这样的场景：你打开聊天界面，原本只是为了寻求一些工作上的帮助或娱乐，却在不知不觉中与对话另一端的人工智能建立了深厚的情感联系。这不是科幻电影《她》（Her）中的情节，而是正在全球范围内发 …

Tongyi DeepResearch重磅发布：300亿参数智能代理模型如何颠覆深度信息搜索？

6个月前高效码农

在人工智能快速发展的今天，大型语言模型（LLM）正在逐步改变我们获取和处理信息的方式。然而，面对复杂、开放且需要多步推理的深度信息搜索任务时，传统模型往往显得力不从心。针对这一挑战，Tongyi La …

REFRAG技术突破：AI生成内容提速30倍，长上下文处理效率飙升

6个月前高效码农

★REFRAG：让AI生成内容更快更高效的新方法★ 你是否遇到过这样的情况：向AI提问时，如果问题需要结合大量背景知识，回答速度就会变慢，甚至卡顿？就像在图书馆里找资料，如果管理员每次都要翻遍所有书架 …

快手重磅发布Kwai Keye-VL 1.5：80亿参数如何颠覆视频理解？

6个月前高效码农

Kwai Keye-VL 1.5：重新定义视频理解的多模态大模型概述：为什么视频理解如此困难？视频理解一直是人工智能领域最具挑战性的任务之一。与静态图像不同，视频不仅包含丰富的空间信息，还具有复杂 …

Biomni-R0人工智能模型：强化学习引领生物医学基因分析新纪元

6个月前高效码农

Biomni-R0：借助多轮强化学习的智能体大模型，推动生物医学研究迈向专家级水平本文欲回答的核心问题： Biomni-R0 作为一款新型智能体大模型，如何通过创新的训练方法突破传统技术局限，在生物 …

EmbeddingGemma模型发布！设备端AI嵌入技术颠覆行业，308M参数如何实现隐私保护与高效检索？

6个月前高效码农

EmbeddingGemma：重新定义设备端嵌入模型的高效与隐私 EmbeddingGemma_Banner 在人工智能快速发展的今天，如何在资源有限的设备上实现高效、低延迟的文本嵌入，同时保障用户数 …

Gemini 2.5 Flash 图像生成完整提示词指南：如何写出最佳 AI 绘图效果

6个月前高效码农

发布时间：2025年8月28日来源：Google 开发者博客 TL;DR Gemini 2.5 Flash 是谷歌最新的多模态图像生成模型。要获得最佳效果，需要写出描述性提示词，而不是简单堆砌关键词 …

腾讯Yan框架重新定义视频生成：1080P/60FPS实时交互技术突破

7个月前高效码农

Yan 框架：重新定义实时交互式视频生成的未来一、什么是 Yan 框架？ Yan 是由腾讯团队开发的交互式视频生成基础框架，它突破了传统视频生成技术的局限，将 AAA 级游戏画质、实时物理模拟与多模 …

谷歌DeepMind发布Perch 2.0：跨物种声学识别突破无需微调

7个月前高效码农

Perch 2.0：生物声学领域的新突破，无需微调即可实现跨物种识别生物声学作为连接生态保护与人工智能的桥梁，近年来在物种监测、栖息地评估等领域展现出巨大潜力。谷歌DeepMind团队最新发布的Pe …

3万台AI居民复刻北京24小时！AgentSociety框架黑科技揭秘

7个月前高效码农

用 3 万台 AI 居民复刻北京一天：AgentSociety 如何让大模型真正“生活”在城里？ ❝ 关键词：大规模 LLM 智能体、社会模拟、并行计算、真实环境、城市行为、AgentSociety …

RaR框架突破AI训练瓶颈：医疗科学领域准确率提升4.7%的秘密

7个月前高效码农

Rubrics as Rewards (RaR)：用评分表教AI更懂人类偏好引言：为什么需要新的奖励机制？在强化学习领域，模型需要通过奖励信号来判断自己的输出质量。传统方法依赖偏好排序（如人类对多 …

Genie 3震撼发布！Google DeepMind如何用实时生成技术重构虚拟世界？

7个月前高效码农

Genie 3：世界模型的新边疆——实时交互式生成世界的突破本文深入解析Google DeepMind的Genie 3如何通过实时生成技术创造动态虚拟世界，探讨其六大核心能力、技术突破与行业影响，并 …

ControlNet Wan2.2深度控制视频生成指南：轻松解决棋盘纹伪影

7个月前高效码农

ControlNet for Wan2.2：深度控制视频生成的实用指南什么是 ControlNet 与 Wan2.2 的结合？在人工智能视频生成领域，Wan2.2 作为一款先进的视频生成模型，已经 …