Reddit Demanda a Anthropic por Usar Datos de Usuarios para Entrenar su IA

Reddit Demanda a Anthropic por Usar Datos de Usuarios para Entrenar su IA - Imagen ilustrativa del artículo Reddit Demanda a Anthropic por Usar Datos de Usuarios para Entrenar su IA

Reddit ha presentado una demanda contra la empresa de inteligencia artificial Anthropic, acusándola de obtener datos de usuarios de manera ilícita para entrenar su chatbot Claude. La plataforma social afirma que Anthropic utilizó bots automatizados para acceder al contenido de Reddit, a pesar de habérsele solicitado que no lo hiciera, y que “entrenó intencionalmente con los datos personales de los usuarios de Reddit sin solicitar jamás su consentimiento”.

La Demanda y las Alegaciones de Reddit

Según Reddit, Anthropic accedió a su plataforma más de 100,000 veces desde julio de 2024, incluso después de que Anthropic supuestamente afirmara haber bloqueado a sus bots. Reddit describe a Anthropic como una empresa de IA de “floración tardía” que se presenta como el “caballero blanco” de la industria de la IA, pero alega que “es todo lo contrario”.

Ben Lee, director legal de Reddit, declaró que la “explotación comercial” del contenido de Reddit por parte de Anthropic podría valer miles de millones de dólares. Lee argumentó que las conversaciones humanas auténticas son cada vez más valiosas en un mundo afectado por la IA, y que Reddit alberga casi 20 años de ricas discusiones humanas sobre prácticamente todos los temas imaginables.

Anthropic, por su parte, ha manifestado su desacuerdo con las acusaciones de Reddit y ha prometido defenderse “vigorosamente”. La empresa fue fundada por ex ejecutivos de OpenAI en 2021 y su chatbot estrella es Claude.

El Modelo de Licencias de Reddit

Reddit ha firmado acuerdos de licencia con Google, OpenAI y otras empresas que pagan para poder entrenar sus sistemas de IA con los comentarios públicos de los más de 100 millones de usuarios diarios de Reddit. Estos acuerdos permiten a Reddit aplicar protecciones significativas para sus usuarios, incluyendo el derecho a eliminar su contenido, protecciones de privacidad y la prevención del spam.

Estos acuerdos de licencia también ayudaron a la plataforma en línea de 20 años a recaudar dinero antes de su debut en Wall Street como empresa que cotiza en bolsa el año pasado.

Esta disputa legal destaca la creciente tensión entre las plataformas de redes sociales y las empresas de IA en relación con el uso de datos para el entrenamiento de modelos de lenguaje. La demanda de Reddit podría tener implicaciones significativas para el futuro del acceso y uso de datos en la industria de la IA.