AI & Security Reading Notes

微笑，点头，记笔记 🌻🌻🌻🌻🌻🌻

Introduction

如果你有文章希望我看一下的，或者有文章想和我交流的，都可以写在 Issues 中.

有非常就的时间没有更新啦，大概的原因是，第一年的工作让我有点吃力，找不到正确的节奏，还非常的迷茫。现在我决定来改变一下这个状况。

这些工作可能包括 大模型 & 大模型安全、 语音的对抗攻击与防御、图像的对抗攻击与防御、自然语言处理的对抗攻击与防御、后门攻击与防御、模型鲁棒性的验证 、模型可解释性等。由于个人研究方向和时间的限制，我会重点关注 大模型 & 大模型安全 这个方向进行更新。

OK~ 我现在是Typora的付费用户了，大家也可以支持下这个产品~

文档使用 Typora （这个软件bug有点多）编辑，无法保证在 Github 上完全正常显示，建议 clone 后在编辑器中阅读最佳，或者阅读 pdf 文件夹下的 PDF 文件；由于 Typora 开始收费，并且我的文档都特别大，使用 Typora 编辑会出现卡顿的现象，现在改用 Mark Text 继续编辑，这可能会在文档上留下一些错误。

标题前带有 * 的文章可以简略阅读；

文字中带有 下划线 的部分是我个人的观点，请谨慎参考;

文档可能来不及二次检查，带有一些错误的拼写和观点，希望大家能够指正！

Others' Work

attack-and-defense-methods：作者根据时间线列出了每年的 Attack & Defense 相关的工作；
Awesome AI Security：作者列出了 AI 安全方向 相关的一些可用的学习资源；
Awesome Real-world Adversarial Examples：作者总结了图像领域的物理对抗攻击相关的工作；
Adversarial ML Threat Matrix - Table of Contents：微软总结的 AI安全方向 的威胁矩阵；
AI Security Paper

老板(们)的尊尊教诲

陈老师：不要一门心思只盯着自己的领域，多看看其他领域的东西，有时候你觉得和你毫无关系的东西，可能就是最能启发你的东西；
陈老师：不要怕错，要敢于去试错，等你硕士三年毕业了，你尝试过的东西越多，和别人相比你的经验就越多，但是你要去思考怎样去减少试错的成本，比如说你就拿一个晚上、两个晚上去试错，那错了就错了，就当这两个晚上看剧了，要多动手，敢于动手；
陈老师：你写的东西，一定不能被别人找出毛病，比如说”我们发现啥啥啥“，这样不行，你要写的有理有据，不能让别人有反驳你的机会；
陈老师（几句话总结出来的）：你不用看特别多的论文，但你看的时候一定要去思考”这篇论文解决了一个什么问题？在它这个研究领域的贡献是什么“，只有提高到这个层次你才会对这个领域通透。另外，我们做的工作，也应该是在这个高层次上面去发挥，而不是就一个很细分的问题再去修修补补，这样没有意义；
晓峰老师：“Attack” 永远是问题的起点，而 “Defense” 才是问题的终点，起点和终点之间有很长的路要走；
陈老师：做事要多一点认真劲，尽量把每个细节、每个点都做好；你要看重自己的工作，要思考如何去展示自己的工作；
陈老师：你这手机（iphone 12）行不行，咱要不要换个专业点的相机；
陈老师：你们要去多投稿、多尝试啊，你就把你们投稿的过程比作黑盒探测，探测的次数越多，你对后面 Reviewer 的品味了解的越清楚，虽然啊，这后端的模型（Review）一直在变，但是他们的平均水平你还是可以了解到的；
陈老师：不要说“有时间再做”，而应该是你想做，然后花时间去做。另外啊，我觉得你底子还是非常好的，做的工作都很好，我希望你能有自己的成果，不要让这块金子埋没了；
陈老师：我们要培养一种能力，如何在有限时间内，做完一件事情；
陈老师：你们在rebuttal的时候，不是为了交作业一样地去写这个回复，而是要想“如何在你写了这个回复的情况下，reviewer会改变他们的意见”；
陈老师：你汇报的时候，要把你的亮点讲出来，不要说你修复了XXX Bug，别人以为这就是你应该要做到的，你要从另一个方面来突出你的有点；

前辈/大佬的指导

不管怎样，都要学习新的知识；（By weifengchiu）
你先不要只在这里想想法，去实现看看，很可能比你想象中的难实现多了，而且过程中你会有更多的想法；（By 锦雯大佬）
我们做防御工作，不能说一下子就把全部的攻击都给干掉了，那是不可能。我们只能说，我们提出的这个防御方法，针对怎样的攻击，能够取得不错的效果，这就达到我们的目的了；（By jifengzhu）
感想：看了 jifengzhu（我的 Mentor）调研的 AI 安全报告，顿时眼前一亮，是一份能够直接给上层决策建议的好报告，看来我还有很多东西需要去学；
承担过多的工程，容易陷入连轴转的怪圈，满负荷工作绝对不是最好的一个状态；（By viking）
对朱雀要有一个认识，我们是一个实验室，就是要去不断尝试、试错的，我们要解决的是公司其他部门暂时没法去着手的方向；（By viking）
仔细思考下，你自己想要的是什么，然后我们再来谈谈；（By Stephen）

个人经历

高中毕业，在 京东物流仓 跑腿一个月，获得人生的第一桶金（被中介克扣部分工资），明白赚钱实属不易，也看到618期间电商的订单之多；
哈尔滨工业大学（威海），软件工程，本科（2015 ~ 2019），校志愿者组织-海川社副会长，校威软俱乐部主席，从事 WEB 前端开发（熟练使用 Webpack 打包，React 组件化开发）；
**科学院大学-信息工程研究所，计算机技术，硕士研究生（2019 ~ 2022），师从陈恺老师、王晓峰老师、孟国柱老师，研究 AI 安全问题（主要研究语音对抗攻击，了解后门、神经网络可解释性）；
腾讯-TEG-安全平台部，安全工程师，实习生（2021.6 ~ 2022.7），从事 AI 安全相关工作（对对抗攻击、后门攻击、隐私泄露、耗能攻击以及 AI 赋能安全等领域十分感兴趣）；
腾讯-TEG-安全平台部，安全工程师（2022.7 ~ 至今），从事AI安全相关工作（对大模型垂直领域应用、模型自身安全等领域十分感兴趣）；

目标

比赛：想多参加一些比赛，我一比较菜，二没有经验，只有一腔热血，希望不要嫌弃我，希望你们能带带我一起打打比赛；
AI赋能安全：最近在看一些AI赋能安全的相关知识，还望这方面有经验的大佬给我一些思路和启发，让我对这个方向有更全面、深刻的认识；

lewis2222 / record_what_i_read

AI & Security Reading Notes

Introduction

Others' Work

老板(们)的尊尊教诲

前辈/大佬的指导

个人经历

目标

About