文本挖掘和机器学习的新法律格局-研究论文

时间:2024-06-29 06:17:36
【文件属性】:

文件名称:文本挖掘和机器学习的新法律格局-研究论文

文件大小:1017KB

文件格式:PDF

更新时间:2024-06-29 06:17:36

Copyright Fair Use

无论是个人还是集体,受版权保护的作品都有可能产生远远超出其个人作者表达或意图的信息。 文本的各种计算和统计分析方法——通常称为文本数据挖掘 (“TDM”) 或仅文本挖掘——可以解锁该信息。 然而,由于几乎每次使用 TDM 都涉及复制要挖掘的文本,因此复制的合法性已成为美国和世界各地版权法中的一个令人担忧的问题。 互联网时代版权法最基本的问题之一是,对作者原始表达的保护是否应该成为产生有关该表达的见解的障碍。 如何回答这个问题将对科学和人文学科的未来研究以及下一代信息技术:机器学习和人工智能的发展产生深远的影响。 这篇文章巩固了我在过去十年中在一系列文章和法庭之友摘要中提出的版权法理论。 它解释了为什么在新技术的背景下应用版权的基本原则必然意味着出于非表达目的复制表达性作品不应被视为侵权,而必须被视为合理使用。 这篇文章展示了该理论是如何在最近备受瞩目的测试案例 Authors Guild v. HathiTrust 和 Authors Guild v. Google 中被采用和应用的,并评估了美国 TDM 研究的法律背景。决定。 文章对版权理论做出了重要贡献,但也将该理论与实际评估相结合,文本挖掘研究人员及其支持机构如果要充分发挥这些技术的潜力,就必须面对各种相互关联的法律问题。 这些问题包括网站服务条款的可执行性、禁止计算机黑客攻击和规避技术保护措施(即加密和其他数字锁)的法律的影响,以及跨境版权问题。


网友评论