【123】云辅助移动众包的隐私保护可验证数据聚合与分析

0x00 摘要

众包是一种基于人群的外包,请求者(任务所有者)可以将任务外包给工人(公共人群)。最近,可以利用智能手机中的工人数据进行数据聚合和分析的移动众包备受关注。然而,当数据量越来越大时,请求者对传入的数据进行聚合和分析就成了一个难题,尤其是当请求者是普通的智能手机用户或存储和计算资源有限的初创公司时。此外,工人还担心他们的身份和数据隐私。为了解决这些问题,我们为移动众包引入了三方架构,其中在工作人员和请求者之间实现了云,以减轻资源有限的请求者的存储和计算负担。还实现了身份隐私和数据隐私。通过我们的方案,请求者能够验证来自云端的计算结果的正确性。我们还在工作中提供了几个汇总统计数据,以及有效的数据更新方法。广泛的模拟显示了我们提出的解决方案的可行性和效率。

索引词——移动众包、云计算、安全和隐私、可验证计算。

0x01 INTRODUCTION

智能手机的普及彻底改变了传统的众包到移动众包,工作人员可以通过使用他们的智能手机更自由地为请求者执行任务[1]-[7]。如今,智能手机通常配备丰富的嵌入式传感器,例如 GPS、加速器、陀螺仪、数字罗盘、光、音频和视频传感器。越来越多的测量温度、湿度、气压计、化学和生物医学的廉价传感器也有望集成到智能手机中。这表明智能手机越来越有能力感知周围环境并提供请求者所需的各种数据。例如,一家医疗保健公司可能希望使用生物医学传感器收集用户的健康相关信息,例如体重、血糖水平、心率以用于医疗用途。交通机构可以利用收集到的传感数据来管理、调度和维护城市交通系统。数据可能不仅是智能手机传感器产生的感应数据,如 [1]-[6],它还可能来自其他来源,例如工人的个人知识。通过智能手机众包数据给请求者和工人带来了很多好处。首先,智能手机无处不在地渗透到日常生活中,意味着足够的地理覆盖和数据多样性,这使得数据聚合结果更准确。其次,请求者的时间和费用要少得多,因为请求者不需要派遣数据收集器走经过精心规划的路线。此外,互联网和蜂窝网络的普遍接入实现了近乎实时的数据收集。此外,工人还可以通过参与获得许多奖励(例如收入和声誉)。

不管移动众包有多么有前途,除非以下问题得到很好的解决,否则它不会被广泛接受。首先,请求者经常需要聚合和分析来自工作人员的大量数据样本,这涉及密集的存储、通信和计算成本[8]。如果请求者是普通智能手机用户或初创公司,当涉及的数据量越来越大时,该成本是无法承受的[6],[9]。其次,工人的数据可能包含身份、年龄、体重、位置等私人信息。向请求者或其他工作人员透露这些信息可能会导致严重的隐私泄露甚至物理攻击 [2]、[5]、[10]-[13]。结果,工人可能会因为隐私问题而不愿参与。

 面对这些挑战,我们建议利用云来帮助请求者对收集到的数据进行聚合、存储和处理,而请求者只需要向云端发送请求并检索相应的结果。在这里,我们通过一个简单的例子来展示使用云带来的好处。给定计算大型整数数据集(均以明文形式)的均值、方差和相关系数的任务,我们在图 1 中展示了云相对于普通资源有限请求者的优势。从图1可以看出,随着数据量的增加,云的优势越来越大,这对于大数据的聚合和处理尤其有意义。

此外,云的参与减少了请求者和工人之间的直接数据通信。通过适当的加密方案,可以很好地保护工作人员的数据隐私不受请求者的影响。然而,云的引入带来了新的挑战。首先,当前的云计算平台不能很好地保护用户的数据隐私[10]、[14]、[15]。其次,云可能会遇到硬件/软件错误和内部/外部攻击,这可能导致计算不正确。因此,如何验证计算结果的正确性是一个问题。为了解决上述问题,我们提出了一种用于云辅助移动众包的隐私保护可验证数据聚合和分析。在我们的方案中,请求者能够将数据聚合和分析委托给云端,并验证检索结果的正确性。同时,不会透露工人的身份和数据。

相关作品:隐私保护数据聚合:隐私保护数据聚合在许多领域都很有用,例如移动传感 [3]-[6]、[16]、电子健康 [9] 和智能电网 [17]。在[3]-[5]、[16]、[17]中,使用不同的加密方案来实现数据隐私,但所有的数据聚合方案都是由请求者完成的。 [3]-[5]中使用加法同态加密方案来实现时间序列数据的 Sum 聚合和 Min 聚合。请求者需要存储用户的所有密文并自己计算Sum和Min,这在请求者存储和计算能力受限的情况下显然不适用。石等人。 [16] 提出了一种保护隐私的总和聚合,其中他们方案中的解密需要蛮力来解决 DLP,这给请求者带来了很大的计算负担。 [17] 中的收集器只能获得数据的总和,这在我们提出的场景中是不够的。网络内的数据聚合将导致移动众包的大量延迟,因为一个工人的数据需要由其他一些工人路由。在[6]、[9]中,聚合是由云端完成的。 [6]中提出了一种基于点对点的隐私保护数据聚合方案,用于以人为中心的城市感知。但是,请求者没有机制来验证从服务提供者检索到的结果的正确性。周等人。 [9] 提出了电子健康系统中的同态数据聚合方案。在该方案中,可以很好地保护用户的数据隐私,并将聚合统计的计算委托给云端。不幸的是,在 [9] 中,它们无法实现我们场景中所需的可验证计算。我们提出的解决方案不仅可以保护数据隐私,还可以实现委托计算和存储。表中给出了我们的解决方案与其他三个典型解决方案之间的比较。表1。

可验证计算:Gennaro 等人。 [18] 引入并形式化了可验证计算的概念,它使资源受限的客户端能够将函数的计算外包给一个或多个工作人员。客户端应该能够有效地验证结果的正确性。在[19]-[21]中,实现了明文空间上的可验证计算。在[19]中,提出了第一个实用的可验证的高次多项式函数计算方案。达里奥等人。 [20] 提出了一种可公开验证的大型多项式计算和矩阵计算,任何人都可以验证结果的正确性。帕帕曼苏等人。 [21] 提出了一种可验证的集合操作的委托计算,例如集合并集、集合交集和集合差。然而,所有这些可验证的计算都是在明文空间上进行的,这不适合我们的方案。密文空间中的可验证计算在[22]-[24]中实现。郭等人。 [22] 为 mHealh 系统设计了一种可验证的密文空间计算,患者可以要求云计算对其加密的个人健康记录的多项式。在[23]中,积累树被新颖地用于验证接近度测试的结果。菲奥雷等人。 [24] 在加密数据上实现有效的可验证计算。所有这些解决方案只能使工作人员能够验证无法直接用于我们方案的结果。基于[24],我们将他们的架构从两方模型(用户和云)扩展到三方模型(工作者、云和请求者),以便我们可以实现云辅助移动设备的隐私保护可验证数据聚合和分析众包。

我们的贡献:我们将我们的贡献列出如下。

  • 所提出的架构实现了移动众包的隐私保护可验证数据聚合和分析。
  • 通过我们的方案,每个工人的身份隐私和数据隐私都得到了很好的保护。云端不会获知worker的确切身份或聚合结果的内容,请求者只能获知最终的聚合结果。
  • 请求者能够验证从云端检索到的计算结果的正确性。
  • 使用我们的方案计算各种统计数据,即总和、均值、方差和非中心相关系数,并提供有效的数据更新方法。

本文的其余部分安排如下。第二部分介绍了初步、假设和问题表述。第三节介绍了系统模型、安全模型和设计目标。所提出的方案在第四节中详细描述,然后是第五节中的协议评估。最后,第六节总结了论文。

二、初步准备和问题表述

三、系统模式

A. 系统模型

我们的模型主要由四个实体组成,移动工作者(MW)、请求者(R)、云(C)和可信授权(TA),如图2所示。

  • Trust Authority(TA):TA负责初始化整个系统,包括注册worker、requester和云,生成公共参数,分发密钥和维护系统。除非出现争议,否则 TA 将处于离线状态。
  • 请求者:请求者想要获取工人数据的聚合统计信息。但是,由于他/她对存储和计算能力的限制,请求者会将大部分计算委托给云端。
  • 云:云接收请求者的委托请求和移动工作人员的加密数据,然后为请求者计算结果。云与一些接入点 (AP) 相关联,这些接入点充当云与工作人员或请求者之间的中继。
  • 移动工作者:移动工作者是指拥有智能手机并愿意为请求者的任务贡献数据的人员。 MW可以随机移动,并将传感数据加密后发送到云端。

B. 安全模型

在我们的安全模型中,TA 是完全可信的,不会被任何对手破坏。我们假设工人、请求者和云是诚实但好奇的,这意味着他们将严格遵循预定义的协议,但也可能根据可用信息挖掘其他人的隐私。

  • 移动工作人员:在我们的方案中,工作人员的数据应保密。
  • 请求者:请求者应该能够验证从云端接收到的计算结果的正确性。但是,请求者无法学习任何单个工人的明文数据。
  • 云:云将诚实地根据请求者的要求计算聚合,并提供计算结果的正确性证明以满足安全要求。此外,云应该只从工人那里获得加密数据和加密聚合结果。

此外,任何实体之间的共谋攻击都超出了我们的论文范围。

C. 设计目标

对于云辅助移动众包的隐私保护可验证数据聚合和分析,我们有三个主要目标。首先,请求者可以安全地将聚合统计的计算委托给云端,从而减轻存储和计算的负担。其次,工人可以参与移动众包任务,而不会将身份和数据隐私泄露给其他任何人。最后,请求者可以有效地验证来自云端的计算结果的正确性。

四。我们提出的方案

在本节中,我们将详细介绍我们针对云辅助移动众包的隐私保护可验证数据聚合和分析。它主要由以下小节组成:系统初始化、基本方案和扩展。在深入探讨细节之前,我们简要概述我们提出的方案。

A. 概述

在系统初始化期间,TA 为​​请求者、云和所有工作人员分配一个公钥/私钥对。当请求者想要获取特定类型数据的统计信息时,他将他的请求和他的同态加密密钥 pk 发送到云端并等待结果。云将请求​​者的任务和同态加密密钥 pk 广播给所有选择的工人,要求他们提供数据。选定的工作人员从嵌入式智能手机传感器或其他数据源准备所需的数据 m,然后使用请求者的加密密钥 pk 对 m 进行加密。工作人员在将数据发送到云端之前对其进行签名。在所有选定的工作人员通过 AP 将他们的加密数据 Encpk(m) 和签名发送到云端之后。云验证每个数据的真实性,然后对密文进行统计,并将结果和相应的证明信息返回给请求者。最后,如果请求者成功验证结果的正确性,他/她将继续解密结果。否则,请求者拒绝结果。

B. 系统初始化

C. 基本方案

在本小节中,我们介绍了我们的基本方案,该方案可以以保护隐私和可验证的方式计算工人数据的总和。有五个步骤。

五、协议评估

六、结论

在本文中,我们提出了一种用于云辅助移动众包的隐私保护和可验证数据聚合方案。所提出的方案使请求者能够将数据聚合和分析任务委托给云。在这个过程中,工人的身份和数据隐私得到了很好的保护。同时,请求者可以验证检索结果的正确性。仿真结果表明了我们方案的有效性和可行性。

猜你喜欢

转载自blog.csdn.net/weixin_40889839/article/details/124628781