2025-05-18 13:59来源:本站
阿姆斯特丹(路透社)-总部位于荷兰的版权保护组织BREIN周二表示,该组织已经删除了一个用于训练人工智能模型的大型语言数据集。
BREIN在一份声明中表示,该数据集包括未经许可从数万本书、新闻网站和“无数”电影和电视剧中收集的荷兰语字幕中收集的信息。
主任巴斯蒂安·范·拉姆肖特告诉路透社,目前尚不清楚人工智能公司是否已经使用了该数据集,或者使用范围有多广。
“这很难知道,但我们正努力准时”,以避免未来的诉讼,他说。
他说,欧盟的人工智能法案将要求人工智能公司披露他们用来训练模型的数据集。
在美国,微软支持的OpenAI受到了几起诉讼的打击,其中包括《纽约时报》涉嫌在未经许可的情况下使用版权材料训练其模型。
在丹麦,一个名为丹麦权利联盟(Danish Rights Alliance)的版权保护组织去年强迫删除了一个名为“Books3”的庞大数据集。
BREIN表示,提供荷兰数据集的人同意了停止和终止令的条款,并从一个可供下载的网站上删除了该数据集。该组织以荷兰隐私规定为由,没有透露此人的身份。
(托比·斯特林报道;Jonathan Oatis编辑)
×