Alexa科学家声称音频水印技术具有接近100％的检测精度

2023-02-04 11:33:01 来源：用户：

有没有听过(没有双关语意)的音频水印?这是为PC添加可识别的独特声音模式的过程，它是网络视频主机，机顶盒和媒体播放器发布受版权保护的曲目的主要方式。但是水印方案在嘈杂的环境中并不是特别可靠，例如当通过扬声器广播所讨论的音频时。由此产生的噪声和干扰 - 在学术文献中被称为“第二屏”问题 - 严重扭曲了水印，并引入了探测器经常难以协调的延迟。

不过，亚马逊的研究人员认为，他们已经开创了一种新颖的解决方法，他们在预印本服务器Arxiv上发表的一篇论文(“ 带调制自相关的空中音频水印 ”)和随附的博客文章中进行了描述。该团队声称他们的方法 - 他们将在5月的声学，语音和信号处理国际会议上详细说明 - 可以检测到水印增加到大约两秒的音频，“几乎完美的准确度”，即使扬声器之间的距离和探测器大于20英尺。

更好的是?与传统的声学指纹识别方法不同，传统的声学指纹识别方法需要为每个实例存储单独的指纹并且具有与指纹数据库成比例的计算复杂度，研究人员的方法具有恒定的复杂性，他们认为这使得它非常适合蓝牙等低功耗设备。耳机。

“我们的算法可以补充声学指纹技术，这种技术目前可以防止Alexa在听到媒体提到她的名字时错误地醒来，”亚马逊Alexa Speech组的研究科学家，该论文的共同作者袁元泰写道。“我们还设想音频水印可以提高Alexa自动语音识别系统的性能。Alexa播放的音频内容 - 音乐，有声读物，播客，无线电广播，电影 - 可以动态加水印，因此支持Alexa的设备可以更好地衡量房间混响并滤除回声。

那怎么样呢?正如泰解释的那样，该模型采用了“扩频”技术，其中水印能量在时间和频率上传播，使人耳听不见，同时使其不受后处理(如压缩)的影响。并且它从固定持续时间的噪声块产生水印，每个噪声块将其自己的不同模式引入主机音频信号中的所选频率分量。

常规检测器将所得到的噪声块序列(解码密钥)与参考拷贝进行比较。但Tai及其同事采用了不同的方法：他们的算法将噪声模式多次嵌入音频信号中并将其与自身进行比较。Tai解释说，因为所述信号通过相同的声学环境，所以模式的实例以类似的方式扭曲，使它们能够直接进行比较。

“探测器利用了声道引起的失真，而不是对抗它，”他补充道。

这不是一个完美的解决方案 - 它需要更短的噪声模式，这与较低的检测精度相关，并且当目标音频包括音乐时，节奏有时过于模仿重复的噪声模式。但该团队表示，这些都可以通过重复噪声阻塞模式得到很大程度的缓解 - 它们随机地反转一些块，减小块通常会增加的幅度，反之亦然。

然后，解码密钥变为二进制值序列而不是噪声块(浮点值序列)，指示给定的噪声块是否被反转。(它们在探测器阶段翻转，此时它们与噪声阻挡模式进行比较。)在实验中，该团队表示他们的算法性能几乎达到了100%的检测精度，水印长度为1.6秒。

　　免责声明：本文由用户上传，与本网站立场无关。财经信息仅供读者参考，并不构成投资建议。投资者据此操作，风险自担。如有侵权请联系删除！