文章主题:关键词:OpenAI,微软,隐私保护,AI产品
整理 | 郑丽媛
出品 | CSDN(ID:CSDNnews)
在2016年10月19日,英国著名理论物理学家、剑桥大学教授Stephen Hawking曾做出一个引人深思的预言:“AI的强大崛起,或许将成为人类所面临的最大挑战,也有可能是最大的威胁。”
在接下来的七年时间里,Stephen Hawking教授的理论似乎已经得到了验证:随着ChatGPT热潮的持续升温,人们对其强大的能力和优势有了深刻的认识。然而,与此同时,越来越多的人开始关注人工智能时代下个人隐私的保护问题。因此,近期在ChatGPT和GPT-4的推动下声名鹊起OpenAI和微软,突然面临着被诉状的威胁。
上周,16名神秘的原告决定向微软和OpenAI提起诉讼,指控这两家公司在未经同意或提供充足通知的情况下,利用基于ChatGPT的AI产品收集并泄露了他们的个人信息。原告要求赔偿30亿美元。
” 盗窃 ” 而来的 3000 亿单词?
在一份由16人提交的、共计157页的诉讼书中,OpenAI和微软被指控违反了《电子通讯隐私法》。据指控,这两家公司无视获取AI模型数据的合法途径,却选择在不付费的情况下收集用户数据。
虽然存在一套既定的机制来购买和使用个人信息,但OpenAI和微软却各自采用了独特的方法:窃取。
在ChatGPT初受欢迎时,OpenAI便展示了其卓越的能力——基于大规模预训练,拥有3000亿单词的语料库。然而,原告指出,OpenAI所获取的3000万字来自网络书籍、文章和帖子,已经超越了其合法授权的范围。
具体来说,这 16 人指控 OpenAI 和微软通过其 AI 产品 ” 收集、存储、跟踪、共享和披露 ” 数百万人的个人信息,并且获得的信息范围很广,包括产品细节、账户信息、姓名、联系方式、登录凭证、电子邮件、支付信息、交易记录、浏览器数据、社交媒体信息、聊天日志、Cookie、搜索记录和其他在线活动等等。
原告坚称,在 ” 从全球数百万毫无戒心的消费者那里非法收集个人资料 ” 后,微软和 OpenAI 将其嵌入至他们的 AI 模型中,这才创造出了现在的 ChatGPT 等 AI 产品:
▶ “OpenAI 大规模使用窃取并盗用个人信息,以此创造了强大且利润丰厚的 AI 产品,并不顾风险地将其对外发布。”
▶ “OpenAl 的技术价值已高达到数百亿美元,而且其进入每一个公共和私营行业的范围还在继续迅速扩大。由于对被盗、盗用数据的培训,这些产品才达到了如今的复杂程度。”
除了指控 OpenAI ” 盗窃 ” 数百万互联网用户的个人隐私,诉讼书中还强调了 OpenAI 和微软之间的密切合作关系:” 微软对 OpenAl 持续投资,并在其多个平台上都引入了 ChatGPT,强调其与 OpenAl 合作的深度。通过这些投资,微软还获得了独家使用整个 OpenAI 代码库的权利。”
很少提到 AI 的具体伤害案例
整整 157 页诉讼书中,引用了大量媒体报道和学术论文,反复强调了原告对 AI 模型发展下道德规范的担忧。不过据了解,其中并没有提到多少 AI 对人类的具体伤害案例。
例如,在提到 2019 年 OpenAI 重组为一家 ” 有限营利企业 ” 时,诉讼书表示 “OpenAI 放弃了最初的目标和原则,选择以牺牲隐私安全和道德为代价来追求利润 “,并由此推断 OpenAI 加大了从互联网上 ” 秘密获取 ” 大量个人数据的力度,而不通知这些数据的所有者或用户。
此外,在指控 OpenAI 无视隐私法的同时,文件引用了 OpenAI 首席执行官 Sam Altman 的一句发言:”AI 很可能会导致世界末日,但与此同时,也会出现伟大的公司。” 而基于这句话,诉讼书表示:” 被告对隐私法的漠视,与他们对人类潜在灾难性风险的漠视不相上下。”
总体而言,在这份 157 页的诉讼书中,微软和 OpenAI 被指控违反了《电子隐私通信法》,即在没有获得授权的情况下使用私人信息以求牟利。同时,因为插件拦截互动数据,微软和 OpenAI 也违反了《计算机欺诈和滥用法》。
基于以上,考虑到被 ” 盗取 ” 数据的群体应该有数百万人,原告向微软和 OpenAI 提出了 30 亿美元的索赔。
微软和 OpenAI 并未回应
截至目前,微软和 OpenAI 都没有对这份指控作出回应,而网友对于这起诉讼的讨论早已泛滥。
部分人对于 OpenAI 如何 ” 窃取 ” 并利用个人数据的方式感到好奇,外媒 Firstpost 解释道:” 如果你在最近几十年里一直在网上活跃,你的数据就很可能被纳入 OpenAI 的数据集。因此,OpenAI 语言模型产生的任何输出,如果用于盈利,其中就可能包含通过无声搜刮而获得的你的数据片段。”
对此,起诉 OpenAI 的律师事务所方面也进行了补充:用户的个人数据 ” 最初并不是打算给大型语言模型使用的 “,所有信息都是 OpenAI 自己去大规模获取的。
至于这场诉讼的最终结果,目前来看应该并不确定。互联网的基础设施很复杂,在线平台与用户有自己的条款和协议,即使用户向这些平台贡献内容,数据所有权也通常属于平台本身而非用户。
对于这个说法,知识产权律师 Katherine Gardner 也是认同的:当用户将内容上传到社交媒体或任何其他网站时,他们通常会授予平台以各种方式使用其内容,因此普通用户可能很难要求因在训练模型中使用其数据而获得相应的补偿。
除此之外,也有不少网友打趣起了这 30 亿美元的索赔金额:
▶ “30 亿不够,怎么也得 80 亿美元,这样我们每个人都能拿到 1 美元!”
▶ ” 不行,我在网上写了 3 篇东西呢,得给我 3 美元才行!”
参考链接:
https://storage.courtlistener.com/recap/gov.uscourts.cand.414754/gov.uscourts.cand.414754.1.0.pdf
https://www.firstpost.com/world/chatgpt-openai-sued-for-stealing-everything-anyones-ever-written-on-the-internet-12809472.html
AI时代,拥有个人微信机器人AI助手!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!