首页 >> 生活 >

一种更快的在线保护隐私的方法

2022-12-08 15:42:26 来源: 用户: 

搜索互联网可以揭示用户宁愿保密的信息。例如,当有人在网上查找医疗症状时,他们可以向谷歌、WebMD等在线医疗数据库以及这些公司的数百个广告商和业务合作伙伴透露他们的健康状况。

几十年来,研究人员一直在精心设计技术,使用户能够私下从数据库中搜索和检索信息,但这些方法仍然太慢,无法在实践中有效使用。

麻省理工学院的研究人员现已开发出一种私人信息检索方案,该方案比其他同类方法快约30倍。他们的技术使用户能够在不向服务器透露他们的查询的情况下搜索在线数据库。此外,它由一个简单的算法驱动,该算法比以前工作中更复杂的方法更容易实现。

他们的技术可以通过阻止消息传递应用程序知道用户在说什么或他们在与谁交谈来实现私人通信。它还可以用于在广告服务器不了解用户兴趣的情况下获取相关的在线广告。

“这项工作实际上是为了让用户重新控制自己的数据。从长远来看,我们希望浏览网页就像浏览图书馆一样私密。这项工作尚未实现,但它开始构建让我们在实践中快速有效地完成这类事情的工具,”计算机科学研究生和介绍该技术的论文的主要作者亚历山德拉亨辛格说。

保护隐私

第一个私人信息检索方案是在1990年代开发的,部分由麻省理工学院的研究人员开发。这些技术使用户能够与拥有数据库的远程服务器通信,并在服务器不知道用户正在阅读什么的情况下从该数据库读取记录。

为了保护隐私,这些技术迫使服务器接触数据库中的每一项,因此它无法判断用户正在搜索的条目。如果一个区域未被触及,服务器将了解到客户端对该项目不感兴趣。但是,当可能有数百万个数据库条目时接触每个项目会减慢查询过程。

为了加快速度,麻省理工学院的研究人员开发了一种称为SimplePIR的协议,在该协议中,服务器甚至在客户端发送查询之前就提前执行大部分底层加密工作。此预处理步骤生成一个数据结构,其中包含有关数据库内容的压缩信息,客户端在发送查询之前下载该数据结构。

从某种意义上说,这种数据结构就像是向客户提示数据库中有什么。

“一旦客户端有了这个提示,它就可以进行无限数量的查询,并且这些查询在您发送的消息的大小和您需要服务器完成的工作方面都会小得多。这就是使SimplePIR变得更快,”Henzinger解释道。

但是提示的大小可能相对较大。例如,要查询1GB的数据库,客户端需要下载124MB的提示。这增加了通信成本,这可能使该技术难以在现实世界的设备上实施。

为了减小提示的大小,研究人员开发了第二种技术,称为DoublePIR,基本上涉及运行SimplePIR方案两次。这会产生一个更紧凑的提示,它的大小对于任何数据库都是固定的。

使用DoublePIR,1GB数据库的提示仅为16MB。

“我们的双PIR方案运行速度稍慢,但通信成本会低得多。对于某些应用程序,这将是一个理想的折衷方案,”Henzinger说。

达到限速

他们通过将SimplePIR和DoublePIR方案应用于客户寻求审核有关网站的特定信息以确保该网站可以安全访问的任务来测试它们。为了保护隐私,客户不能透露正在审核的网站。

研究人员最快的技术能够在以每秒约10GB的速度运行时成功地保护隐私。以前的方案只能达到每秒约300兆字节的吞吐量。

Corrigan-Gibbs补充说,他们表明他们的方法接近私人信息检索的理论速度限制——这几乎是人们可以构建的最快的方案,在该方案中,服务器会接触数据库中的每条记录。

此外,他们的方法只需要一台服务器,这比许多需要两台具有相同数据库的独立服务器的高性能技术要简单得多。他们的方法优于这些更复杂的协议。

“一段时间以来,我一直在考虑这些方案,但我从没想过以这种速度这是可能的。民间传说是任何单服务器方案都会非常慢。这项工作颠覆了整个概念”,科里根-吉布斯说。

Henzinger说,虽然研究人员已经证明他们可以更快地制定PIR方案,但在他们能够将他们的技术部署到现实场景之前,还有很多工作要做。他们希望降低方案的通信成本,同时仍能实现高速。此外,他们希望调整他们的技术来处理更复杂的查询,例如一般的SQL查询,以及要求更高的应用程序,例如一般的维基百科搜索。从长远来看,他们希望开发更好的技术来保护隐私,而无需服务器接触每个数据库项目。

“我听到人们断言PIR永远不会实用。但我永远不会打赌技术。这是从这项工作中吸取的乐观教训。总有创新的方法,”资深作者、EECS教授VinodVaikuntanathan和CSAIL的首席研究员,说。

“这项工作对私人信息检索的实际成本进行了重大改进。虽然众所周知,低带宽PIR方案意味着公钥加密,这通常比私钥加密慢几个数量级,但这项工作开发了一种巧妙的方法弥合差距的方法。这是通过巧妙地利用公钥加密方案的特殊属性来完成的,因为Regev将绝大多数计算工作推到预计算步骤,其中服务器计算一个简短的“提示”’关于数据库,”未参与该研究的Technion(以色列理工学院)计算机科学教授YuvalIshai说。

“让他们的方法特别吸引人的是,相同的提示可以被任意数量的客户端使用无限次。这使得在多次访问同一数据库的典型场景中计算提示的(适度)成本微不足道次。”

  免责声明:本文由用户上传,与本网站立场无关。财经信息仅供读者参考,并不构成投资建议。投资者据此操作,风险自担。 如有侵权请联系删除!

 
分享:
最新文章