人工智能归档 | 第38页共65页

7步精通Mobile-Agent-v3与GUI-Owl：跨平台自动化终极指南

7个月前高效码农

从第一次点击到跨应用流程：Mobile-Agent-v3 与 GUI-Owl 的完整入门指南 “ 作者：高效码农更新日期：2025-08-21 这篇文章能帮你解决什么问题？刚听说「Mobile-A …

震惊！0.6MB轻量神器竟让YouTube视频秒变文字精华（附自建教程）

7个月前高效码农

自建YouTube视频摘要工具：轻量高效的AI解决方案 ![YouTubeTLDR界面展示](https://github.com/Milkshiift/YouTubeTLDR/raw/master/ …

AI代理配置文件大揭秘：一文看懂AGENTS.md、CLAUDE.md与GEMINI.md的异同及最佳实践

7个月前高效码农

深入解析三大AI代理配置文件：AGENTS.md、CLAUDE.md与GEMINI.md的异同与最佳实践随着OpenAI正式推出AGENTS.md标准，AI编程助手之间的协作规范首次迎来了统一的可能 …

震惊！字节跳动开源360亿参数模型：长文本无敌，数学题吊打Qwen3？

7个月前高效码农

一口气看懂 ByteDance Seed-OSS 36B：为什么大家都在聊它？如果你刚打开这篇博客，可能正在搜索“Seed-OSS 36B 是什么”“怎么在本地跑起来”“值不值得用”——这篇文章一次 …

ASearcher突破大模型搜索极限：异步强化学习实现40+轮深度检索

7个月前高效码农

把搜索做得更深：ASearcher 如何用异步强化学习让大模型“查资料”超过 40 轮如果让一位普通人去网上查一篇冷门论文里提到的实验动物，他可能会在两三次搜索后放弃；而今天的开源大模型，通常被限制 …

颠覆传统！LEANN如何用6GB存储6000万文档？

7个月前高效码农

LEANN：全球最小的向量数据库如何革新个人AI搜索？引言：当6000万份文档装进6GB硬盘在这个数据爆炸的时代，个人电脑里往往沉淀着海量的文档、邮件、浏览器历史和聊天记录。但传统的向量数据库在处 …

PromptHelper油猴脚本：10大AI平台效率提升秘籍！

7个月前高效码农

让AI对话更高效：PromptHelper油猴脚本全面指南在当今AI工具普及的时代，你是否经常遇到这样的情况：向AI提问后，得到的回答不够精准、缺乏深度，或者需要反复调整提示词才能获得满意结果？你不 …

XBai o4开源模型引爆AI界：普通服务器实现超越OpenAI的深度思考能力

7个月前高效码农

XBai o4 开源第四代大模型：把“深度思考”装进一台普通服务器一句话看懂 XBai o4 如果你只想知道一件事： XBai o4 是一套用“反思型生成”技术训练的大模型，能在普通 GPU 上跑出 …

ComoRAG突破长文本问答极限：AI首次实现人类级小说理解能力

7个月前高效码农

让长故事不再难懂：ComoRAG 如何让 AI 像人一样“读小说” 读完一本几十万字的小说后，让你回答“为什么斯内普要杀邓布利多？”——你会怎么做？翻回前几百页找线索，把碎片串成完整故事。这正是 C …

如何零代码搭建AI工作流？Pixelle MCP让ComfyUI与LLM强强联手！

7个月前高效码农

Pixelle MCP：让AI工作流变得简单而强大你是否曾经想过，如何让复杂的AI模型和工作流变得像搭积木一样简单？在AI快速发展的今天，很多开发者和创作者都被各种复杂的工具链所困扰。今天，我想和你 …

LlamaPen：无需安装的Ollama图形界面，解锁本地大模型的终极体验

7个月前高效码农

LlamaPen：无需安装的Ollama图形界面，让本地大模型体验更友好你是否曾经对命令行感到不适应，却渴望体验本地运行大语言模型的乐趣？你是否希望有一个简单直观的界面，能让你专注于与AI对话而非技 …

Qwen-Image-Edit重磅发布！20B大模型秒变修图神器，中文指令全支持

7个月前高效码农

Qwen-Image-Edit 深度体验：人人都能上手的 AI 图像精修利器把 20B 大模型的能力装进你的电脑，无需设计基础也能改图、加字、换背景开场白：为什么你需要一款“听得懂人话”的修图工具 …

AI工程化实战：四大实用项目揭秘企业效率跃升秘诀

7个月前高效码农

探索四大实用AI项目：从宣传册生成到代码转换的工程实践你是否曾经好奇，当我们在谈论”AI工程化”时，真正意味着什么？不是那些浮于表面的概念炒作，而是实实在在能解决业务问题、提 …

OpenCUA如何革新AI代理技术？揭秘开源计算机使用代理的四大突破

7个月前高效码农

探索 OpenCUA：为计算机使用代理构建开放基础你有没有想过，AI 代理如何像人类一样与计算机互动——点击按钮、输入文字，或者在应用间切换？这就是计算机使用代理（CUA）的领域。今天，我来深入聊聊 …

Embedding Atlas：Apple开源的高维嵌入可视化神器，百万级数据交互新体验

7个月前高效码农

深入解析 Embedding Atlas：可视化高维嵌入的强大工具在人工智能和机器学习领域，高维数据可视化一直是核心挑战之一。Embedding Atlas 作为 Apple 推出的开源工具，提供了 …

SynthID文本水印技术：Google DeepMind破解AI虚假信息新武器

7个月前高效码农

SynthID是由Google DeepMind开发的一种工具，用于为大型语言模型（LLM）生成的文本添加不可见水印并检测其存在。该技术旨在应对生成式AI可能引发的虚假信息风险，帮助识别AI生成内容以 …

突破传统！Voost双向模型如何革新虚拟试衣技术？

7个月前高效码农

Voost：一种统一可扩展的双向虚拟试衣扩散模型解析服装电商的虚拟试衣技术近年来发展迅速，但如何让AI准确理解服装与人体的空间关系仍是行业难题。本文将深入解析2025年最新提出的Voost模型，探讨 …

MGM-Omni震撼发布：开源全模态聊天机器人引领AI交互革命，支持10分钟语音生成+零样本声音克隆

7个月前高效码农

MGM-Omni: 探索开源全模态聊天机器人你好！如果你对人工智能聊天机器人感兴趣，尤其是那些能处理多种类型输入和输出的模型，我今天想和你聊聊MGM-Omni。这是一个开源的全模态聊天机器人，能处理 …

FitSnake健身游戏：摄像头控制贪吃蛇，TensorFlow.js实现AI姿态识别燃脂黑科技

7个月前高效码农

FitSnake：用身体控制贪吃蛇，边玩边燃脂的健身游戏在这个数字化健身与游戏融合的时代，FitSnake项目为我们带来了一个创新性的解决方案——通过摄像头捕捉身体动作来控制经典贪吃蛇游戏，让运动变 …

电脑自己干活了？Bytebot AI桌面代理彻底解放你的双手

7个月前高效码农

把 AI 请进办公室：Bytebot 桌面代理让电脑自己动起来 “ “如果 AI 不仅能回答问题，还能像实习生一样坐在电脑前帮你完成一整天的工作，会发生什么？” 本文带你认识 Bytebot——一个自 …