关于 jbllm.ai
jbllm.ai 关注一个正在快速成形的领域:大语言模型的越狱(jailbreak)与防御。 模型每天都在更新,新的攻击面和防御手段层出不穷,而中文世界系统、持续的记录还很少。 这个站想做的,就是把这些零散的攻防经验,整理成一份可查、可信、长期维护的资料。
这里有什么
- 越狱榜:横向实测主流模型对各类攻击的抵抗力,持续更新。
- 知识库:越狱手法分类,以及每类攻击对应的防御方法。
- 博客:挑战题解、论文速读、攻防事件分析。
立场与伦理
本站采取研究与防御导向。理解攻击是为了识别它、防住它—— 这与安全行业「了解漏洞才能修补漏洞」的逻辑一致。
- 所有示例均经过脱敏,用于说明原理,不提供可直接复制使用的完整攻击载荷。
- 测试对象为公开模型与公开练习平台(如 Gandalf、HackAPrompt 等)。
- 不针对真实用户,不协助实施任何危害他人的行为。
如果你是模型开发者、安全研究者,或只是对这个领域好奇,欢迎一起把这份资料做得更好。