人工智能归档 | 第35页共65页

美团LongCat-Flash-Chat：动态计算如何让大模型节省90%算力？

6个月前高效码农

美团 LongCat-Flash-Chat：重新定义高效大语言模型本文基于美团官方在 Hugging Face 发布的模型文档，对 LongCat-Flash-Chat 进行系统梳理与通俗解读，帮助 …

VedDarpan开源AI研究助手：Llama 4 Scout+Groq API重塑知识获取革命

6个月前高效码农

VedDarpan：开源AI研究助手，让专业知识获取变得简单高效在人工智能技术快速发展的今天，获取准确、可靠的信息变得前所未有的重要，但也面临着信息过载和质量参差不齐的挑战。对于学生、研究人员和专业 …

Step-Audio 2彻底解析：音频理解和语音对话的终极革命

6个月前高效码农

探索Step-Audio 2：一个专注于音频理解和语音对话的多模态模型你好！如果你对音频处理和语音技术感兴趣，或许你已经在寻找一个能处理复杂音频任务的工具。今天，我想和你聊聊Step-Audio 2 …

LLM自动生成高质量问题全攻略：零基础玩转多模型API实操

6个月前高效码农

从文本生成高质量问题：项目实操指南 “ 说明：本文旨在把复杂的技术说明变成面向专科及以上读者、通俗易懂且可操作的博客式指南。若需要直接复制命令或配置片段，请按文中示例执行。概览：这个工具做什么？这 …

微软AI实验室震撼发布！MAI-Voice-1与MAI-1-preview引领语音与语言新革命

6个月前高效码农

微软AI实验室发布MAI-Voice-1与MAI-1-preview：语音生成与语言理解的新突破在人工智能技术飞速发展的今天，各大科技公司纷纷投入巨资研发自己的AI模型。微软AI实验室(MAI)近期 …

2025终极AI工程师工具箱：100+神器高效构建LLM应用

6个月前高效码农

AI 工程师工具箱全解：打造高效、可靠的大语言模型应用在大语言模型（LLM）快速发展的今天，工程师们面临着前所未有的挑战：如何高效地构建、测试和优化基于 LLM 的应用？如果你正在探索这个问题，那 …

本地语音转写革命：IntraScribe如何让会议纪要秒级生成？

6个月前高效码农

本地优先的语音转写与协作平台：IntraScribe 完整指南 “ “开会两小时，整理纪要一整天？” 如果你在企业、学校或政府机关的内网里工作，又对数据隐私格外敏感，这句话可能戳中了痛点。 Intra …

DeepConf黑科技：让AI推理效率飙升85%的置信度革命

6个月前高效码农

DeepConf：让大语言模型推理更高效的新方法图1：DeepConf 在 AIME 2025 竞赛题目上的测试结果一、背景：语言模型的”思考困境” 大语言模型（LLM）近 …

Gemini 2.5 Flash 图像生成完整提示词指南：如何写出最佳 AI 绘图效果

6个月前高效码农

发布时间：2025年8月28日来源：Google 开发者博客 TL;DR Gemini 2.5 Flash 是谷歌最新的多模态图像生成模型。要获得最佳效果，需要写出描述性提示词，而不是简单堆砌关键词 …

AI-Researcher如何用24小时自动生成顶会论文？揭秘一键科研系统

6个月前高效码农

当 AI 开始自己写论文：AI-Researcher 如何把整个实验室装进一台电脑 “ “如果一位本科生就能在 24 小时内完成一次顶会级别的实验、从 0 到成稿，会发生什么？” AI-Researc …

2025生成式AI消费级应用全球格局突变：谷歌Gemini逆袭，中国军团称霸榜单！

6个月前高效码农

2025年生成式AI消费级应用排行榜：生态稳定与全球竞争格局分析在生成式AI技术快速发展的浪潮中，a16z最新发布的第五版”全球百大生成式AI消费级应用排行榜”为我们提供了观 …

突破性AI模型rStar2-Agent如何用代理强化学习征服数学难题？

6个月前高效码农

rStar2-Agent: 探索代理推理在数学问题解决中的应用大家好，我是这篇博客的作者。今天，我想和大家聊聊 rStar2-Agent 这个项目。它是一个专注于代理强化学习（agentic rei …

Coro Code：用Rust打造的高性能AI编码助手，解锁极速编程新体验

6个月前高效码农

Coro Code：用 Rust 构建的高性能 AI 编码助手 demo 你是否曾经在编码时希望有一个得力的助手，能够理解你的需求，帮你编写、修改甚至优化代码？今天，我们要介绍的就是这样一个工具——C …

OpenAI Realtime API实战指南：用WebRTC构建实时语音交互系统

6个月前高效码农

深入理解OpenAI Realtime API：使用WebRTC构建实时语音交互应用实时语音交互概念图开启实时语音交互新时代在人工智能技术飞速发展的今天，语音交互正逐渐成为人机沟通的主要方式之一 …

OLMoASR模型开源！语音识别技术迎来新突破？

6个月前高效码农

完全开源语音识别新标杆：OLMoASR模型训练与应用指南为什么需要开源的语音识别模型？在人工智能领域，语音识别技术正深刻改变人机交互方式。然而大多数先进模型仍是闭源的”黑箱&#8221 …

震惊！10秒声音克隆+实时流式合成，Marvis语音模型引爆AI交互革命

6个月前高效码农

Marvis：开启实时语音克隆与流式合成的新纪元 Marvis语音合成模型引言在人工智能蓬勃发展的今天，语音合成技术正以前所未有的速度改变着我们与机器交互的方式。无论是智能助手、内容创作还是无障碍 …

Claude Code伴侣：一站式AI代理工具深度解析与使用指南

6个月前高效码农

Claude Code 伴侣：一站式AI代理工具使用指南与深度解析引言在人工智能技术飞速发展的今天，高效、稳定地使用大语言模型已成为许多开发者和研究者的核心需求。今天我要向大家介绍一款名为&#82 …

COMPUTERRL框架震撼发布！AI桌面自动化迈入新纪元，突破三大核心技术瓶颈

6个月前高效码农

COMPUTERRL框架：提升AI桌面自动化能力的革新方案在人工智能快速发展的今天，能够像人类一样操作电脑的智能体逐渐成为现实。今天我们来深入解读一篇来自清华大学的最新研究——COMPUTERRL框 …

Hermes-4 模型突破：是什么？对国内大模型意味着什么？

6个月前高效码农

探索Hermes 4：一个结合推理和指令跟随的混合模型家族你好！如果你对大型语言模型（LLM）感兴趣，尤其是那些能处理复杂推理任务的同时又保持通用能力的模型，那么Hermes 4可能会让你眼前一亮。 …

混元视频 Foley：AI 音效生成工具实测与教程

6个月前高效码农

把无声视频变成大片：HunyuanVideo-Foley 入门与实践指南 “ “我的视频画质很好，可就是没有声音，怎么办？” “想让 AI 给滑板片段自动生成逼真的摩擦声，可行吗？” “有没有一键批量 …