AI工程归档 | 高效码农

18天前高效码农

摘要：Latitude 是一个开源 AI 工程平台，优先实现观测性和评估，通过捕获生产流量中的提示、输入/输出、工具调用、延迟、令牌使用量和成本数据，建立评估驱动的可靠性循环，帮助团队从现有 LLM …

2个月前高效码农

最近，我在尝试把 Moonshot AI 的 Kimi K2 模型部署到 vLLM 上运行官方的 K2-Vendor-Verifier 基准测试时，遇到了一个让人头疼的问题：工具调用成功 …

3个月前高效码农

从黑盒到玻璃盒：AI Agent 质量评估的“四梁八柱”与飞轮 “ 核心问题：当 AI Agent 的输出不再唯一、路径不再确定，我们拿什么说服自己“它可以上线”？本文欲回答的核心问题为什么传统 …