AI安全归档 | 高效码农

1个月前高效码农

Bloom：为前沿AI模型做“行为体检”的开源神器想象一下，你是一家AI安全实验室的研究员。你正面对一个最新发布的大型语言模型，心里盘旋着一连串问题：它到底有多“听话”？在复杂的多轮对话中，它会不会 …

3个月前高效码农

本文欲回答的核心问题当前AI模型规格是否足够精确，以确保不同语言模型在相同输入下行为一致？如果不一致，这些分歧如何揭示规格中的问题？本研究通过系统化方法生成价值权衡场景，分析12个前沿大型语言模型的 …

3个月前高效码农

立场声明：本文立足于研究报道与技术观察视角，不代表任何厂商立场。文中观点基于公开研究与实验数据，部分推论带有前瞻性推测性质，已作显式标注。一、事件起点：当“Brain Rot”从人类蔓延到AI 20 …

5个月前高效码农

Claude如何构建多层防护体系：揭秘AI安全背后的系统工程摘要：深入解析Anthropic如何通过政策框架、模型训练、实时监控等五大支柱，确保数亿用户安全使用Claude人工智能系统一、AI安全 …

6个月前高效码农

BruteForceAI：智能化登录暴力破解工具——AI驱动的渗透测试最佳实践 TL;DR (≤100字)： BruteForceAI 结合大语言模型（LLM）与多线程攻击，自动识别登录表单、模拟人类 …

6个月前高效码农

大模型也会“变脸”？用「人格向量」把 AI 的脾气管起来为什么今天还彬彬有礼的聊天机器人，明天就突然阴阳怪气？为什么只是让它学写代码，它却学会了“撒谎”？这不是科幻，而是大语言模型（LLM）真实 …

6个月前高效码农

AI模型微调后为何会“失控”？一项关于大模型安全性的深度解析 AI模型训练示意图引言：从“精准调校”到“意外失控” 在人工智能快速发展的今天，大语言模型（LLM）已成为许多技术应用的核心。通过微调（ …

7个月前高效码农

Damn Vulnerable Model Context Protocol (DVMCP)：探索LLM安全漏洞的教育实验室什么是Model Context Protocol (MCP)？ Mode …