0%

前言

本篇做的是一个非常有趣的工作,也是攻击语音设备的论文。本篇的攻击方式是使用调制后的光波来进行语音的注入,具体的 Demo 非常的炫酷,可以参见下面的链接:https://lightcommands.com/ , 注意 Demo 视频托管在了油管。

本篇将攻击距离大大延长,对于部分较为敏感的设备,可以将攻击距离延伸到 110m+,这么来看 Inaudible Voice Commands: The Long-Range Attack and Defense 中将 1.52m 延伸到 7.62m 的工作还是不够用。并且后者使用的超声波在遇到墙壁、关掉的窗户等攻击距离会大大减小,而这篇文章中的方法则可以穿过 Clear Window 对窗台上的语音设备进行攻击,效果还是蛮酷的。

阅读全文 »

前言

最近要开始进入科研状态了,所以会经常更论文阅读笔记了哈哈,尽量每一篇精读的文章都能出阅读笔记。

这一篇和前面刷的 2 篇关系还是比较紧密的,这篇文章给出了一个轻量级的语音活体检测系统(防止重放攻击等):Void。而我之前所读的两篇,包括海豚攻击以及 RSHC18,其实都是 Inaudible Commands 这一攻击大类的,是把语音命令以隐秘的形式发送给语音设备。但本质上,还是要将 Victim 的语音通过重放或合成的方式组合起来(如果有声纹识别),都是机器重放的,所以要想破解,从活体检测这个角度做也是非常有效的。在本文的摘要末尾也提到,该系统对于hidden voice command, inaudible voice command, voice synthesis, equalization manipulation attacks, and combining replay attacks 等可以达到 99.7%, 100%, 90.2%, 86.3%, and 98.2% 的检测率。

当然,回归本篇论文的初心,其实做活体检测最大的用处还是防止重放攻击。而 Void 在检测的准确率上其实并不是最高,作者给出了 17 年的一个检测大赛的成果, Void 的准确度可以排在第二的位置。但是第一所使用的是一个非常重的 DNN 模型,并且用到了很多计算代价较高的特征,模型参数也非常多。 Void 使用了其 153 分之一的内存,并且可以达到 8 倍的检测速度。具体来说,Void 的 EER(equal error rate)在比赛数据集上达到了 11.6%,在使用 MFCC 的基础上可以提高到 7.4 %。也就是说,Void 在保持了较为优秀的检测率的同时,大大优化了效率。

在具体的分类方法方面, Void 通过扬声器重放人声与天然人声之间在频谱上的 2 大天然区别进行分类。具体特征提取方法在下文再做描述。

这里说一些文中提到的概念(一些数学概念已经在原文的 Appendix 中进行解释):

EER:Equal Error Rate,当 FPR 与 FNR 相等时,二者的值。

Correlation Coefficients:相关系数,这里一般指 Pearson 相关系数,用于衡量变量之间线性相关的量。相关系数ρ定义为两个变量X、Y之间的协方差和两者标准差乘积的比值。https://blog.csdn.net/chao2016/article/details/80917579。

quadratic curve fitting coefficients:二次曲线拟合系数,将数据用二次曲线拟合后的系数。关于使用 MATLAB 做多项式曲线的拟合,可以参照链接。

https://ww2.mathworks.cn/help/matlab/ref/polyfit.html

Levinson-durbin algorithm:Levinson recursion or Levinson–Durbin recursion is a procedure in linear algebra to recursively calculate the solution to an equation involving a Toeplitz matrix. 下面是 MATLAB 的相关 API。

https://ww2.mathworks.cn/help/signal/ref/levinson.html

Toeplitz matrix:托普利兹矩阵的主对角线上的元素相等,平行于主对角线的线上的元素也相等;矩阵中的各元素关于次对角线对称,即T型矩阵为次对称矩阵。

Toeplitz matrix - Wikipedia

阅读全文 »

前言

新学期开始,继续之前的项目研究,同时阅读一些与项目相关的paper。

本篇可以看作之前 Dolphin Attack 工作的延续。解决了之前 Dolphin attack 的问题:要想 inaudible 就只能近距离(5 ft max = 1.52m),要想远距离就要加大功率,进一步就会导致 audible。这一篇的主要思路是通过将命令的频谱进行分割,使用多个 speaker 分别将对应的频段进行调制播放,使得可以进一步加大功率而避免攻击的音频被人耳察觉,而实验证明这样的攻击是可行的并且将攻击距离延伸到了 25 feet = 7.62 m。这使得攻击更具有现实意义。此外,作者提出了一种基于软件的防御方案,不需要训练即可达到较高的准确度(Dolphin Attack 的作者给出的解决方案是基于 SVM 的软件解决方案)。

对了,作者给系统起名叫做 LipRead

另外从本篇开始调整一下阅读笔记的格式。

阅读全文 »

前言

匆匆忙忙搬家后,近十日没有更新博客了,因为实验室工作还没有开始所以最近还算比较清闲。有时间的话基本在看机器学习相关。越学越觉得自己数学基础好差哈哈哈。

因为 CS224n 和 CS229 是同时在看(其实后者应该是前者的前置课程),所以就同时把进度更新在博客了。

Lecture 1 看的非常早,大三下学期上课的过程中就刷完了,Lecture 2 被拖延症拖到现在没看完。于是!神奇的博主啊,他选择看 Lecture 3!(病入膏肓

所以之后回头刷完 Lecture 2 会补在前面吧lol

参考资源:

阅读全文 »

前言

最近临近开学,继续开始焦虑…… 看了点 paper ,但是感觉没有看到自己特别感兴趣特别想做的东西(太菜了),回头学了点 web,但是意识到我以后恐怕不会去当前后端工程师,所以三剑客似乎也不急着精通……看来看去似乎只有机器学习现在几乎成了计算机的事实必修课,而我还没有入门,所以又想学了(前不久刚刚因为想法太多被训……)

上个学期因为信息内容安全有很多机器学习交叉的内容其实也还算有一丝丝基础,把 吴恩达 在网易云课堂上的机器学习课程看完了。课程链接见下。内容与 Coursera 上的一样,但是网易有人工审校的中英双字幕。151个课时,虽然有很多访问不了的课件。看完之后感觉吴恩达讲课真的好强,基本上大部分的内容都在当堂理解了。不过课后看到有说法 Coursera 上的机器学习属于科普性质,最好还是应该过一遍 CS229,于是就又来看了。

参考链接

参考书目

《精通数据科学:从线性回归到深度学习》 唐亘

阅读全文 »

前言

已经时隔半年没有发阅读笔记的博客了,上一篇还是 https://haulyn5.cn/2020/02/06/paper-Som19/

要读研究生的话就要天天接触 paper 了,还是应该多看一些积累一下视野,提高英语的读写能力。

这一篇依旧是 2019 S&P 上 Web 的paper。题目是 Measuring and Analyzing Search Engine Poisoning of Linguistic Collisions

简单过了一下摘要、简介和部分的背景,感觉不大想继续往后看了,主题是做搜索引擎的Poisoning,通俗理解就是一些打错字的搜索关键词能让 Cybercriminals (原文使用的词,莫名的Cool) 得以利用,并且展示出非法的或者是假冒的网站。Google 和 Baidu 对于这种打错的关键词通常都会提醒用户,根据不同的 Confidence Level,会给出不同的 Auto Correction(这个我会在正文展开)。但是作者发现一种情况可以一定程度上绕开 Auto Correction: **Linguistic Collisions **。作者举的例子是:Adobe 可能被拼成 idobe,而这个单词并不是一个不合法单词,尽管英语没有这个单词,但是 idobe 是 Nigerian 语的掉下的意思。也就是说某个单词尽管错拼了,但是恰好又撞在其他语言的合法单词,这样搜索引擎就不会有较大的Confidence去认为用户拼错了,就会展示部分或全部的错拼单词的搜索结果(上例中就是 idobe 的搜索结果)。除此之外,作者用了 RNN 来提前预估某个单词有没有可能会被 Auto Correction,加速了研究进程。(万物都可深度学习)至于错拼单词的生成,作者利用了 edit distance operations and linguistic properties 。

阅读全文 »

前言

近日因为晚上睡前工作较多懒得一个个收尾,所以习惯了睡前只是“睡眠”,而不是关机。这样第二日重启时所有的程序运行状态都会得到保存。根据之前做可信计算课程的论文分享学到的知识,睡眠状态下其实机器是断电的,内存状态会被送入磁盘保存。但是这几日半睡半醒间机器总会自己启动,虽然屏幕不亮,但是键盘灯和电源灯全部点亮,还能听到游戏本专属的风扇呼呼声。作为安全专业学生,第一反应是电脑中毒了,但是想了想自己一直对这个电脑比较谨慎,尽可能都装了正版,后来再思考,觉得多半是系统自动升级的原因。今日一看C盘空间饱满,想必是下了新的系统数据。于是为了验证的确是系统升级所致,也恰好是前些天做的项目发现可以在我的电脑的管理界面看到事件记录,所以今天就看了看事件记录。

不看不要紧,结果发现了两万多条 Error 和 Warning ……

阅读全文 »

前言

要通过 MDN 系统学习 Web 了。通过本文记录一些学习 HTML 时的一些有意思的点,方便之后回顾。因为之前有简单学过HTML,所以这次学习就单单过过练习,对于熟悉的部分就快点过了。

参考链接:

https://developer.mozilla.org/zh-CN/docs/learn/Front-end_web_developer

https://developer.mozilla.org/zh-CN/docs/Learn/HTML/Introduction_to_HTML/Getting_started

阅读全文 »