k8凯发天生赢家

新闻中心 新闻中心

爱思唯尔把Meta告了:拿Sci-Hub盗版论文训练大模型

西风 发自 凹非寺量子位 | 公家号 Q

作者:谢泰平
颁布功夫:2026-05-31 18:45:02
阅读量:1

爱思唯尔把Meta告了:拿Sci-Hub盗版论文训练大模型

西风 发自 凹非寺量子位 | 公家号 QbitAI

AI版权大战 ,再度升级了。

手握《柳叶刀》《细胞》等顶刊 ,掌控全球海量主题科研成就的学术出版巨头爱思唯尔(Elsevier)正式入局 ,参与集体诉讼团硬刚Meta——

控诉Meta犯法爬取、复造受版权;さ目蒲新畚 ,用于训练自家大模型Llama。

在此之前 ,站出来告状AI侵权的多是作者、媒体机构。

此番是头一回 ,顶级学术出版商下场打响版权维权之战。美国出版商协会也在申明中给定调:

这是主流出版集团初次提议针对AI企业的诉讼 ,Meta明目张胆加害版权 ,出版商们将还原全数事实。

有意思的是 ,这场官司明面上锋芒对准Meta ,可证据一放开 ,与爱思唯尔纠缠十多年的两大盗版学术库——LibGen、Sci-Hub ,再度被摆上台面。

只能说Meta树大钱多 ,比追责盗版平台靠谱多了(手动狗头)。

多方原告组团上阵 ,指控Meta侵权

这场诉讼于5月5日在纽约南区法院正式提交 ,被告直指Meta及其CEO扎克伯格。

而原告 ,不止爱思唯尔一家 ,还蕴含法国第一大出版集团阿歇特、源自英国的百年全球综合性出版集团麦克米伦 ,以及美国幼说家、执业律师Scott Turow等。

出版商方主题指控极度明确:Meta为训练Llama大说话模型 ,未经任何授权 ,大量获取、复造、盗用受版权;さ难趼畚挠氤霭嫖锬谌。

具体来看 ,诉状里指出Meta训练Llama重要靠两大“不清白”的数据起源:

第一 ,Common Crawl通用爬虫数据集。

这份数据集通过全网抓取天生 ,席卷数十亿网页内容。原告方称 ,里面或许率混进了未经授权的版权内容 ,好比付费期刊的提要和全文。

第二 ,两大驰名盗版学术平台LibGen、Sci-Hub。

这两个网站终年免费传布海量付费论文、教材与学术著述 ,持久深陷全球版权诉讼。出版商指控 ,Meta通过磁力下载、文件共享等方式 ,从这些网站盗用学术资源。

值得一提的是 ,本案好多证据 ,还是从去年那桩“作者告Meta”(Kadrey v. Meta)案里流出来的内部员工邮件。

面对诉讼 ,Meta讲话人暗示:将全力积极应诉。

Meta这边抗辩逻辑也极度清澈 ,打出了一张王牌:合理使用(Fair Use)。

据相识 ,凭据美国版权法 ,“合理使用”属于版权豁免情景 ,允许在特定前提下无需授权使用版权内容。

Meta讲话人称:“AI正为幼我与企业带来颠覆性创新、提升出产效能与创作活力 ,已有法院判例认定 ,使用版权内容训练AI可组成合理使用。”

不得不说 ,这几年AI圈的版权官司的确不少。像《纽约时报》、一堆驰名作者都告状过AI公司 ,有些案子已经和解了。

但整体而言 ,利用版权文章训练大说话模型是否合法 ,目前仍未形成明确司法判例。

至于这次后续怎么发展……咱们先搬好幼板凳 ,再蹲一波。

One More Thing

“合理使用」剽张牌之前的确被成功使用过。

去年 ,美王法院裁决:允许Claude背后公司Anthropic在未经作者许可的情况下 ,使用合法采办的已出版书籍训练AI。

法院参考了美国版权法中的“合理使用”(Fair Use)准则 ,以为AI训练属于“转化性使用”(Transformative Use) ,即对原文章的新用处未取代原作市场 ,且有利于技术创新和公共利益。

这也是美王法院初次认可AI公司对书籍的使用权。

就在最近 ,有网友称Anthropic在大批量购入古籍 ,扫描收录内容后就直接销毁原书。这一说法也引发了不少网友关注。

参考链接:[1]https://www.nature.com/articles/d41586-026-01481-0[2]https://x.com/sivori/status/2052567312088047754

 

文章点评

未查问到任何数据!

颁发评论

◎迎接参加会商 ,请在这里颁发您的见解、互换您的概想。

最新文章

热点文章

随机推荐

【网站地图】