大语言模型对抗性攻击与防御综述-计算机研究与发展2025年03期-手机知网

手机知网 App

24小时专家级知识服务

计算机软件及计算机应...

大语言模型对抗性攻击与防御综述

安徽大学互联网学院;中国科学院信息工程研究所 | 台建玮杨双宁王佳佳李亚凯刘奇旭贾晓启

开通知网号

随着自然语言处理与深度学习技术的快速发展，大语言模型在文本处理、语言理解、图像生成和代码审计等领域中的应用不断深入，成为了当前学术界与工业界共同关注的研究热点.然而，攻击者可以通过对抗性攻击手段引导大语言模型输出错误的、不合伦理的或虚假的内容，使得大...

机　构:

安徽大学互联网学院；中国科学院信息工程研究所；

领　域:

计算机软件及计算机应用；自动化技术；

关键词:

大语言模型；对抗性攻击；防御策略；网络空间安全；生成式人工智能；

格　式:

PDF原版；EPUB自适应版(需下载客户端)

开通会员更优惠，尊享更多权益

手机阅读本文

下载APP 手机查看本文

计算机研究与发展

相似文献

期刊硕士博士会议报纸

图书推荐

相关工具书