Implicaciones legales del web scraping en el entrenamiento de modelos de inteligencia artificial generativa-Reference-Cited by-同舟云学术

Implicaciones legales del web scraping en el entrenamiento de modelos de inteligencia artificial generativa

Published:2024-08-02 Issue:38 Volume: Page:167-189
ISSN:2346-2116
Container-title:Revista La Propiedad Inmaterial
language:
Short-container-title:propin

Author:

Pacheco Chaparro Juan Manuel,Barrero Ramírez Laura

Abstract

El web scraping es una técnica que se usa para recopilar datos en Internet y almacenarlos en una base de datos. Ese proceso se usa, entre otras cosas, para entrenar modelos de inteligencia artificial generativa y ha generado controversia alrededor del mundo debido a sus riesgos legales. En este artículo se analizará la viabilidad legal del uso de técnicas de web scraping y se abordarán tensiones relacionadas con asuntos contractuales de los términos de servicio de las páginas web, los riesgos legales que se desprenden de estas técnicas y, en particular, del uso de obras protegidas en el entrenamiento de modelos de inteligencia artificial generativa, de protección de datos personales y de implicaciones penales; las licencias open source, open access y de Creative Commons, así como también los datos de dominio público y en cabeza del Estado colombiano. Este artículo pretende ser un marco teórico inicial para la discusión del web scraping en modelos de inteligencia artificial generativa, dado que, a la fecha de elaboración de este artículo, el desarrollo normativo y jurisprudencial sobre este tema es aún incipiente.

Publisher

Universidad Externado de Colombia

Reference56 articles.

1. Andersen v. Stability AI Ltd, U.S. District Court for the Northern District of California, n.° 3:23-cv-00201.

2. Associated Press. “AP, OpenAI agree to share select news content and technology in new collaboration”. Comunicado de prensa. 2023.

3. Bale, Ajay, Naveen Ghorpade, S. S. Rohith Kamalesh, R. Rohith y S. Rohan. “Web Scraping Approaches and their Performance on Modern Websites”. Coimbatore, India: Proceedings of the Third International Conference on Electronics and Sustainable Communication Systems, 2022.

4. Brittain, Blake. “Lawsuits accuse AI content creators of misusing copyrighted work”. Reuters, 2023.

5. Brittain, Blake. “OpenAI hit with new lawsuits from news outlets over AI training”. 2024.