竊取數(shù)億北美用戶數(shù)據(jù)訓練 AI,谷歌被公訴
據(jù)業(yè)內(nèi)消息,因涉嫌在北美用戶不知情的情況下竊取其上網(wǎng)隱私數(shù)據(jù)來訓練其 AI 產(chǎn)品(包括但不限于 Bard),谷歌上周被提起集體公訴,指控其“秘密地竊取了數(shù)億美國人在互聯(lián)網(wǎng)上創(chuàng)作和分享的一切”。
據(jù)悉,這項集體訴訟由克拉克森律師事務所(Clarkson Law Firm)在加利福尼亞北區(qū)聯(lián)邦法院提起,指控谷歌及其 AI 子公司 DeepMind 和母公司 Alphabet 非法竊取了用戶數(shù)據(jù)。這家律所前不久曾對 ChatGPT 開發(fā)商 OpenAI 提起類似訴訟,指控該公司竊取了大量個人數(shù)據(jù)用它來訓練 ChatGPT,包括醫(yī)療記錄和關于兒童的信息。
本次訴訟聲稱“谷歌拿走了我們所有的個人和專業(yè)信息、我們的創(chuàng)意和版權作品、我們的照片,甚至我們的電子郵件 —— 幾乎是我們數(shù)字足跡的全部”用來構建其 AI 產(chǎn)品。“多年來,谷歌秘密地收集了這些數(shù)據(jù),沒有向任何人通知或征得同意。”
此外,谷歌從基于訂閱的網(wǎng)站和以盜版書籍和創(chuàng)意作品而聞名的網(wǎng)站竊取了數(shù)據(jù),谷歌 7 月 1 日對其隱私政策的更新,新隱私政策稱谷歌可能會收集公開在線可用的信息用來訓練其 AI 模型,并構建谷歌翻譯(Google Translate)、Bard 和云端 AI(Cloud AI)等產(chǎn)品。
訴訟稱:“谷歌必須明白它并不擁有互聯(lián)網(wǎng),它也不擁有我們的創(chuàng)意作品、我們的個性表達、我們的家庭和孩子的照片,或者任何其他因為我們在網(wǎng)上分享而屬于我們的東西?!_可用’從來不意味著可以為任何目的免費使用。”
谷歌這起訴訟中的一名原告是一名住在得克薩斯州的《紐約時報》暢銷書作者和調(diào)查記者,她聲稱谷歌使用了她的書的盜版 PDF 來訓練 Bard。訴訟稱,她的作品現(xiàn)在在 Bard 上廣泛免費提供,該機器人給出了書的章節(jié)摘要,甚至逐字分享了書中的片段。
然而谷歌在一份聲明中稱,訴訟中的指控毫無根據(jù)。谷歌總法律顧問 Halimah DeLaine Prado在一份聲明中聲稱該公司多年來一直明確表示,使用來自公共來源的數(shù)據(jù),如發(fā)布到開放網(wǎng)絡和公共數(shù)據(jù)集上的數(shù)據(jù),來訓練谷歌翻譯等服務背后的人工智能模型符合我們的 AI 原則,美國法律支持使用公開信息來創(chuàng)造新的有益用途,我們期待駁回這些毫無根據(jù)的指控。