发现者网手机网站站内搜索

洞察行业动向，赋能未来市场！发现者网，商业视角的探索之旅！

发现商业评论旗下

洞察商业启迪未来

滚动资讯

当前位置：发现者网 > 科技业界 > 正文内容

Meta发布LlamaFirewall，为AI智能体筑起系统级安全防线

时间：2025-05-09 15:35 来源：ITBEAR作者：朱天宇

meta AI公司近期揭晓了一项创新技术——LlamaFirewall，专为应对AI智能体面临的日益复杂的安全威胁而生，旨在为生产环境中的AI智能体筑起一道系统级的安全防线。

随着大型语言模型（LLMs）在AI智能体中的深度嵌入，并在诸多高权限场景中广泛应用，安全问题日益凸显。这些智能体具备读取邮件、编写代码、调用API等强大功能，一旦被恶意利用，后果将不堪设想。

然而，传统的安全机制，如聊天机器人内容审核或硬编码模型限制，在面对功能广泛的AI智能体时显得力不从心。meta AI针对提示注入攻击、智能体行为偏离用户目标、不安全代码生成等核心挑战，精心打造了LlamaFirewall。

LlamaFirewall采用分层架构设计，内含三大专业防护模块。其中，PromptGuard 2基于BERT架构，是一款强大的分类器，能够实时检测越狱行为和提示注入，支持多语言输入。其86M参数模型性能卓越，而22M轻量版本则更适合低延迟部署场景。

AlignmentCheck则是一种创新的审计工具，通过深入分析智能体内部推理轨迹，确保其行为始终与用户目标保持一致。该工具在检测间接提示注入方面表现出色。

CodeShield作为一个静态分析引擎，专注于检查LLM生成的代码中的不安全模式。它支持多种编程语言，能够在代码提交或执行前准确捕获SQL注入等常见漏洞，确保代码的安全性。

为了验证LlamaFirewall的有效性，meta在AgentDojo基准测试中对其进行了全面评估。测试中模拟了来自97个任务领域的提示注入攻击。结果显示，PromptGuard 2（86M）成功将攻击成功率（ASR）从17.6%降低到7.5%，且对任务实用性的影响微乎其微。而AlignmentCheck的加入进一步将ASR降至2.9%。整个LlamaFirewall系统将ASR降低了90%，降至1.75%，尽管实用性略有下降至42.7%，但仍保持在可接受范围内。同时，CodeShield在不安全代码数据集上的表现同样亮眼，精准度高达96%，召回率达到79%，响应时间也完全满足生产环境的实时使用需求。

更多>同类内容

游走星系内的“太空巨兽”：超大质量黑洞偏居一隅，吞噬恒星引关注

05-09

神谷英树：期待用现代技术重塑鬼泣与红侠乔伊经典

05-09

谷歌安卓密码管理器将支持一键升级Passkey，无密码登录时代来临？

05-09

中科融合ALP技术突破，国产微显示芯片能否改写DLP垄断格局？

05-09

vivo X200s：跨生态互联与AI赋能，重塑“好用”手机新体验

05-09

荣耀400系列全球预热，AI影像升级能否再次引领潮流？

05-09

铁三角联手Wind and Sea，限量版复古黑胶唱机来袭！

05-09

台积电4月销售额大涨近五成，累计营收稳步攀升

05-09

2024下半年中国视频云市场回暖，规模增至50.8亿美元，增长动力何在？

05-09

Nothing耳机电量不均，用户直呼续航体验大打折扣！

05-09

九号Q系列智能电动车新品发布，为女性用户开启多彩出行新篇章！

05-09

深圳电机展盛况：唯样携手泰科，以高效免焊方案引领电机产业升级

05-09

微软工程师打造AnduinOS 1.3走红：Ubuntu版“Windows 11”

05-09

Win10/Win11新版Outlook六月升级：离线日历功能即将上线

05-09

宇树科技GO1机器狗遭远程劫持？公司回应：漏洞已修复，服务已关闭

05-09

点击查看更多 +

全站最新

ZALMAN扎曼P40 DS中塔机箱亮相：长条副屏设计引关注

ZALMAN扎曼P40 DS中塔机箱亮相：长条副屏设计引关注

百度萝卜快跑香港自动驾驶测试：区域扩大，车辆翻倍，进展如何？

百度萝卜快跑香港自动驾驶测试：区域扩大，车辆翻倍，进展如何？

支付宝“碰一下”功能升级：支付、取快递、开门全搞定！

支付宝“碰一下”功能升级：支付、取快递、开门全搞定！

游荡“太空鲨鱼”黑洞：6亿光年外，为何偏离星系中心？

游荡“太空鲨鱼”黑洞：6亿光年外，为何偏离星系中心？

比尔·盖茨：25年内捐出全部财富，提前终结基金会运营？

比尔·盖茨：25年内捐出全部财富，提前终结基金会运营？

游走星系内的“太空巨兽”：超大质量黑洞偏居一隅，吞噬恒星引关注

游走星系内的“太空巨兽”：超大质量黑洞偏居一隅，吞噬恒星引关注

热门内容

本栏最新

Meta发布LlamaFirewall，为AI智能体筑起系统级安全防线

Meta发布LlamaFirewall，为AI智能体筑起系统级安全防线

游走星系内的“太空巨兽”：超大质量黑洞偏居一隅，吞噬恒星引关注

游走星系内的“太空巨兽”：超大质量黑洞偏居一隅，吞噬恒星引关注

神谷英树：期待用现代技术重塑鬼泣与红侠乔伊经典

神谷英树：期待用现代技术重塑鬼泣与红侠乔伊经典

谷歌安卓密码管理器将支持一键升级Passkey，无密码登录时代来临？

谷歌安卓密码管理器将支持一键升级Passkey，无密码登录时代来临？

中科融合ALP技术突破，国产微显示芯片能否改写DLP垄断格局？

中科融合ALP技术突破，国产微显示芯片能否改写DLP垄断格局？

vivo X200s：跨生态互联与AI赋能，重塑“好用”手机新体验

vivo X200s：跨生态互联与AI赋能，重塑“好用”手机新体验

发现者网 - 深度洞察行业动态引领市场先锋平台 - 发现商业评论旗下网站北京·通州天津·滨海山东·济南
发现者网（www.fxw.com.cn）所有稿件免费开放转载，转载请务必保留版权。
合作微信：netspread（注明:发现者网）
Copyright © FXW 2012-2023 www.fxw.com.cn All rights reserved. 鲁ICP备2022032383号-3