每当我们在线阅读新闻或在某个地方吃饭时,大型科技公司都会收集大量的行为数据。以Google和Facebook为例,他们表示这样做是为了改善服务质量,并使我们的在线体验更加个性化。

他们的人工智能(AI)过滤出他们认为您会更感兴趣的文章的新闻,提供与您之前看过的视频类似的视频,或者帮助您根据以前喜欢的视频找到餐厅中国机械网okmao.com。另一方面,这些数据还用于针对您的广告,并且可以与第三方共享,这是数字隐私问题如此突出的关键原因。
现在,EPFL计算机与通信科学学院(IC)和法国国家数字科学技术研究院(INRIA)的一部分的分布式计算实验室和可扩展计算系统实验室的最新研究首次表明:可以在我们的移动设备上进行机器学习(通过经验自动改进的计算机算法的运行)上实时,而不会影响其功能,也无需共享我们的数据。
这项工作是在EPFL / INRIA联合实验室的背景下进行的,它介绍了FLeet,这是所谓的联合学习的革命,这是一种在移动设备上计算更新并保持用户数据本地的全球模型。联合学习因其隐私优势而非常吸引人,但由于它的设计对移动设备没有任何能量或性能影响,因此不适合需要频繁更新的应用程序,例如新闻推荐。
FLeet借助两个核心组件将标准联合学习的私密性与在线学习的精确度结合在一起:I-Prof(一种新型的轻量级探查器,用于预测和控制学习任务对移动设备的影响)以及AdaSGD(一种新的自适应学习算法),能够抵抗延迟的更新。
正如论文的作者之一,EPFL教授Rachid Guerraoui解释说,事实证明,如今,我们的智能手机具有数据和电池电量,可以进行分布式机器学习。
“使用FLeet可以在使用手机时将其一些备用动力用于机器学习任务,而不必担心您的通话或互联网搜索会被打断。这很重要的原因之一,我们不想仅在您睡着并且手机在充电时才进行机器学习,因为有时我们需要并且需要实时信息。”
Anne-Marie Kermarrec教授也是该论文的作者,“我们展示的是,如果我们将所有手机放在一起,它们便开始构成强大的计算能力以与Google之类的产品相匹敌,这为人们提供了替代方案,让他们可以依靠集中,强大的功能计算机场。这是真正的协作学习,其中汇总了本地模型并为全局模型做出了贡献,但是您不共享原始数据,并且可以保护您的隐私,这是开发这种体系结构的巨大动力。”
目前,FLeet是一个展示可能的原型。Guerraoui和Kermarrec表示,下一步是继续开发可用的最终产品,并研究FLeet设计的其他方面,包括如何使系统免受可能的攻击。
“如今,有一种巨大的趋势试图将机器学习活动带回用户,因为毕竟数据来自我们,我们应该能够决定我们自己的设备和我们自己的数据会发生什么。像FLeet这样的模型如果有需要,他们将为大型技术公司提供替代方案,从而为人们提供选择。” Kermarrec总结道。