23 11 月, 2024

Eddiba Sports

从亚洲的Eddiba获取最新的亚洲新闻:重大新闻,专题报道,分析和特别报道以及来自亚洲大陆的音频和视频。

既然机器可以学习了,那么它们还能摆脱学习吗?

既然机器可以学习了,那么它们还能摆脱学习吗?

安德烈·奥诺弗连科 | 盖蒂图片社

各类公司使用 机器学习 分析人们的欲望、厌恶或面孔。 一些研究人员现在提出了一个不同的问题:我们如何让机器忘记?

计算机科学的一个新兴领域被称为机器 健忘症 寻找诱导选择性遗忘症的方法 人工智能 软件。 目标是从机器学习系统中删除特定人员或数据点的每一条痕迹,而不影响其性能。

如果这个概念变得实用,它可以让人们更好地控制他们的数据和从中获得的价值。 虽然用户实际上可以要求一些公司删除个人数据,但他们通常不知道他们的信息帮助调整或训练了哪些算法。 去学习可以让一个人拿走他们的数据和公司利用它的能力。

正如任何人都推断出他们在网上分享的内容一样不言而喻,人工健忘症的想法需要计算机科学中的一些新想法。 公司花费数百万美元训练机器学习算法来识别面孔或对社交帖子进行排名,因为算法通常比单独的人类程序员可以更快地解决问题。 但是一旦经过训练,机器学习系统就不能轻易改变, 甚至明白. 消除特定数据点影响的传统方法是从头开始重建系统,这个过程可能成本很高。 “这项研究旨在找到一个中间立场,”宾夕法尼亚大学教授 Aaron Roth 说,他一直致力于消除机器学习。 “我们能否在某人请求删除数据时消除他们的全部影响,但从一开始就避免重新培训的全部成本?”

人们对人工智能侵蚀隐私的方式越来越感兴趣,这在一定程度上推动了废弃机器学习的工作。 长期以来,世界各地的数据监管机构都有权强制公司删除非法信息。 某些地区的公民,例如 并且 加利福尼亚州相反,如果公司改变了其披露内容的立场,它有权要求公司删除其数据。 最近,美国和欧洲的监管机构表示,人工智能系统的所有者有时不得不向前迈出一步:删除一个经过敏感数据训练的系统。

去年,英国数据监管机构 警告公司 某些机器学习软件可能会受到数据删除等 GDPR 权利的约束,因为 AI 系统可以包含个人数据。 安全研究人员已经证明 算法有时会被迫泄露用于创建它们的敏感数据。 今年年初,美国联邦贸易委员会 强制启动 Paravision 的面部识别 删除一组错误获取的面部图像和对其进行训练的机器学习算法。 联邦贸易委员会专员 Rohit Chopra 称赞新的执法策略是一种迫使该公司破坏数据库以“抓住其欺骗成果”的方式。

机器遗忘研究的小领域正在努力解决这些组织转变带来的一些实际和数学问题。 研究人员已经表明,他们可以让机器学习算法在某些条件下忘记,但该技术尚未准备就绪。 “正如在青年领域常见的那样,这个领域渴望做的事情与我们现在知道如何做的事情之间存在差距,”罗斯说。

已经提出了一种有前途的方法 2019年 多伦多大学和威斯康星大学麦迪逊分校的研究人员将新机器学习项目的源数据分成多个部分。 然后将每个结果单独处理,然后将结果组合到最终的机器学习模型中。 如果以后需要忘记某个数据点,则只需重新处理原始输入数据的一小部分。 方法已被证明适用于在线采购数据和 超过一百万张照片的集合.

Ruth 和来自宾夕法尼亚大学、哈佛大学和斯坦福大学的合作者 新的 他证明了这种方法的一个缺陷,说明如果删除请求以特定顺序出现,无论是偶然还是来自恶意行为者,去学习系统都会崩溃。 他们还展示了如何缓解这个问题。

滑铁卢大学教授 Gautam Kamath 也致力于去学习,他说该项目发现并解决的问题是许多悬而未决的问题的一个例子,即如何让机器学习,而不仅仅是在实验室中的好奇心. 这是他自己的研究小组 探索 通过删除连续多个数据点的学习来降低系统准确性的程度。

Kamath 还想找到公司可以证明——或者监管机构可以验证——系统真的忘记了它不应该学习的东西的方法。 “这似乎有点牵强,但也许他们最终会为这种事情配备审计员,”他说。

随着 FTC 和其他机构仔细研究算法的力量,调查机器学习去学习可能性的监管理由可能会增加。 牛津大学研究数据保护的教授罗宾·宾斯 (Robin Binns) 表示,个人应该对其数据的命运和成果拥有发言权的想法近年来在美国和欧洲都有所增长。

在科技公司真正实施去学习之前,需要创造性的技术工作,让人们更好地控制其数据的计算命运。 在此之前,技术在人工智能时代的隐私风险方面可能不会发生太大变化。

差异隐私,这是一种巧妙的技术,可以对系统可以从人身上泄漏的内容设置数学限制,并提供有用的比较。 这项技术被苹果、谷歌和微软超越,但使用相对较少,隐私风险仍然很大。

贝恩斯说,虽然它真的很有帮助,但“在其他情况下,它更多的是公司所做的事情来表明它正在创新。” 他怀疑机器学习的弃用可能是相同的,这更多地证明了技术敏锐度,而不是数据保护的重大转变。 即使机器学会忘记,用户也必须记住要小心与谁共享数据。

这个故事最初出现 有线网.

READ  Reggie 谈 NoA 问题:“这不是我遗漏的任天堂”