Reddit limita la capacidad de entrenar modelos generativos de IA en el contenido compartido en el sitio. La nueva política de Reddit limita el acceso solo a los socios que tienen un contrato y cumplen con los términos de la política de privacidad.
Reddit está actualizando su política para protegerse contra los robots de IA que podrían entrenar con el contenido disponible en la plataforma, informa TechCrunch.
La actualización del Protocolo de exclusión de robots (robots.txt) informa a los robots automatizados si pueden rastrear la página. La nueva política del sitio web tiene como objetivo desalentar a los proveedores de inteligencia artificial. para entrenar modelos de lenguaje en el contenido de Reddit o lograr que celebren un contrato.
Todo tiene un precio: si quieres entrenar IA, paga
Los bots y rastreadores tendrán velocidad limitada o serán bloqueados, si no cumplen con la Política de contenido público de Reddit y no tienen un contrato con la plataforma. Los que tienen contrato – por ejemplo Google – pueden utilizar el contenido para entrenar sus modelos de IA. Otros interesados también pueden firme un contrato, pague y entrene su IA en el contenido de Reddit.
Reddit dice que la actualización no afectará a la mayoría de los usuarios y entidades auténticas, como organizaciones como Archivo de Internet.
Internet Archive agradece que Reddit reconozca la importancia de ayudar a garantizar que los registros digitales de nuestros tiempos se archiven y conserven para que las generaciones futuras los disfruten y aprendan. Al trabajar con Reddit, continuaremos capturando y compartiendo los archivos de Reddit, junto con los cientos de millones de URL de otros sitios que archivamos todos los días.
Mark Graham, director de Wayback Machine, Internet Archive