DeepSeek-R1:通过强化学习激励大语言模型推理能力

6小时前 高效码农

摘要 DeepSeek-R1 是 DeepSeek-AI 团队提出的一种基于强化学习(Reinforcement Learning, RL)的大语言模型(LLM),其核心目标是通过 RL 框架激励模型 …

微软AI实验室震撼发布!MAI-Voice-1与MAI-1-preview引领语音与语言新革命

19天前 高效码农

微软AI实验室发布MAI-Voice-1与MAI-1-preview:语音生成与语言理解的新突破 在人工智能技术飞速发展的今天,各大科技公司纷纷投入巨资研发自己的AI模型。微软AI实验室(MAI)近期 …

AA-LCR基准测试:大模型长文本推理能力突破性评估(最新数据)

1个月前 高效码农

深入解析AA-LCR:评估大模型长文本推理能力的关键基准 在人工智能快速发展的今天,大语言模型处理和理解长文本的能力越来越受关注。无论是分析多份公司报告、梳理法律文件中的复杂关系,还是从政府政策文档中 …

MIT团队新突破!MEM1框架让AI思考效率提升197%,内存占用暴降70%

2个月前 高效码农

MEM1:让AI在复杂任务中更高效思考的突破性方法 什么是长周期AI代理? 在日常使用智能助手时,你可能经历过这样的场景:先问”最新显卡参数”,接着追问”哪个型号适 …