自然语言处理归档 | 第3页共10页

EmbeddingGemma模型发布！设备端AI嵌入技术颠覆行业，308M参数如何实现隐私保护与高效检索？

6个月前高效码农

EmbeddingGemma：重新定义设备端嵌入模型的高效与隐私 EmbeddingGemma_Banner 在人工智能快速发展的今天，如何在资源有限的设备上实现高效、低延迟的文本嵌入，同时保障用户数 …

视觉故事写作革新创作体验：GPT-4o如何重塑AI时代叙事艺术？

6个月前高效码农

Visual Story-Writing：用视觉化叙事，重新定义写作体验一句话回答：Visual Story-Writing 是一个通过自动可视化故事元素（角色、事件、时间线、位置），并允许用户通过 …

大模型幻觉终结者：证据式文本生成技术如何让AI回答可信度飙升？

6个月前高效码农

让大模型“有据可查”：一篇关于证据式文本生成的全景指南 ——写给对 LLM 真实性心存疑虑的你 “AI 说西班牙人口将在 2025 年达到 4,800 万，是真的吗？” 如果你也曾这样追问，本文可以给 …

RegressLM如何革新文本到文本回归？解密谷歌高效预测技术

6个月前高效码农

探索 RegressLM：文本到文本回归的实用指南你有没有想过，如何从杂乱无章的非结构化文本数据中预测数值结果，而不必陷入复杂的特征工程？这就是 RegressLM 的用武之地。这个库 …

大语言模型如何实现可信输出？134篇论文揭示证据关联核心技术

6个月前高效码农

基于证据的大语言模型文本生成：引用、归因与引用的系统性研究在数字化时代，大语言模型（LLMs）的应用日益广泛，从智能客服到内容创作，它们正深刻改变着人类处理文本的方式。然而，随着其普及，模型输出的可 …

震惊！10秒声音克隆+实时流式合成，Marvis语音模型引爆AI交互革命

6个月前高效码农

Marvis：开启实时语音克隆与流式合成的新纪元 Marvis语音合成模型引言在人工智能蓬勃发展的今天，语音合成技术正以前所未有的速度改变着我们与机器交互的方式。无论是智能助手、内容创作还是无障碍 …

Hermes-4 模型突破：是什么？对国内大模型意味着什么？

6个月前高效码农

探索Hermes 4：一个结合推理和指令跟随的混合模型家族你好！如果你对大型语言模型（LLM）感兴趣，尤其是那些能处理复杂推理任务的同时又保持通用能力的模型，那么Hermes 4可能会让你眼前一亮。 …

SQLBot：如何用自然语言秒变SQL查询？

6个月前高效码农

SQLBot —— 基于大模型的智能自然语言转SQL系统项目概述 SQLBot 是由飞致云（FIT2CLOUD）推出的开源智能问数系统，结合大模型与RAG（检索增强生成）技术，实现高效的自然语言转S …

手机端性能猛兽！MiniCPM-V 4.5如何实现GPT-4o级视觉语言处理？

6个月前高效码农

MiniCPM-V 4.5：手机可运行的GPT-4o级多模态模型——全面解析与实用指南如果你正在寻找一款既能在手机上流畅运行，又具备GPT-4o级别视觉语言能力的多模态模型，那么面壁最新推出的Min …

Deca 3 Alpha Ultra震撼发布：4.6万亿参数如何颠覆AI行业？

7个月前高效码农

Deca 3 Alpha Ultra：重新定义大型语言模型的未来在人工智能飞速发展的今天，大型语言模型（LLM）已经成为推动技术边界的重要力量。它们不仅在研究和工业应用中表现卓越，也逐步融入我们的日 …

震惊！字节跳动开源360亿参数模型：长文本无敌，数学题吊打Qwen3？

7个月前高效码农

一口气看懂 ByteDance Seed-OSS 36B：为什么大家都在聊它？如果你刚打开这篇博客，可能正在搜索“Seed-OSS 36B 是什么”“怎么在本地跑起来”“值不值得用”——这篇文章一次 …

ComoRAG突破长文本问答极限：AI首次实现人类级小说理解能力

7个月前高效码农

让长故事不再难懂：ComoRAG 如何让 AI 像人一样“读小说” 读完一本几十万字的小说后，让你回答“为什么斯内普要杀邓布利多？”——你会怎么做？翻回前几百页找线索，把碎片串成完整故事。这正是 C …

M3-Agent实战指南：让AI记住视频内容，听懂语音并长期推理

7个月前高效码农

# 让大模型记住看过的视频、听懂你说的话：M3-Agent 长记忆多模态智能体实战指南 > 本文基于 ByteDance Seed 团队开源的 M3-Agent 项目撰写，确保真实可靠。如果你 …

SOTOPIA-RL如何颠覆大模型社交智慧？解锁AI情商新高度

7个月前高效码农

让 AI 像“人”一样对话：SOTOPIA-RL 如何让大模型学会真正的社交智慧？ “机器能算题，能写诗，但能不能像朋友一样陪你商量‘今晚要不要加班’？” ——本文将带你拆解 SOTOPIA-RL，一 …

如何用普通电脑训练AI模型？Tipus Micro-LLM纯PyTorch实现指南

7个月前高效码农

Tipus Micro-LLM：一个纯PyTorch实现的轻量级语言模型你好！今天我想和你聊聊一个有趣的开源项目——Tipus Micro-LLM。这可不是什么高不可攀的AI神器，而是一个用纯PyT …

AA-LCR基准测试：大模型长文本推理能力突破性评估（最新数据）

7个月前高效码农

深入解析AA-LCR：评估大模型长文本推理能力的关键基准在人工智能快速发展的今天，大语言模型处理和理解长文本的能力越来越受关注。无论是分析多份公司报告、梳理法律文件中的复杂关系，还是从政府政策文档中 …

RynnVLA-001视觉-语言-动作模型解析：机器人操作的未来已来

7个月前高效码农

RynnVLA-001：基于生成先验增强的视觉-语言-动作模型解析本文详细解析了阿里达摩院最新开源的视觉-语言-动作模型RynnVLA-001的技术原理、训练方法和使用指南，无需机器人领域专业知识即 …

GPT-5震撼发布：性能飙升80%！如何颠覆AI应用？

7个月前高效码农

全面解析 GPT-5：性能、功能与应用场景深度解读 GPT-5 正式亮相，它不仅是迄今为止最强大的人工智能系统，也是一次跨越式的技术升级。无论是编程、数学推理、健康咨询、写作，还是视觉感 …

GEPA方法揭秘：用自然语言反思优化，让大模型训练提速35倍

7个月前高效码农

用自然语言反思，而不是暴力调参：GEPA 如何让大模型少跑 35 倍数据就学得更好如果你只想知道结论：把每一次实验轨迹变成一段“读后感”，再让模型像遗传算法一样交叉、变异，就能在 4 个任务上平均提 …

Qwen-Image突破极限：20B参数多模态模型如何颠覆中文文本渲染与图像编辑？

7个月前高效码农

Qwen-Image：突破文本渲染极限的20B多模态图像大模型阿里巴巴通义千问团队最新发布的20B参数图像基础模型，在复杂文本渲染和精准图像编辑领域实现重大突破为什么Qwen-Image引起广泛关 …