Perplexitygate: Perplexity no respeta el bloqueo a la IA en robots.txt

Perplexity usa y cita a CMS MAG sin nuestro consentimiento
Perplexity usa y cita a CMS MAG sin nuestro consentimiento

Si se ignora Robots.txt, entonces los creadores de contenidos estamos absolutamente indefensos ante un robo masivo de contenidos…

Sucedió lo que los temíamos los creadores de contenido. A pesar de dejar bien claro en el archivo robots.txt que no queremos regalar nuestros contenidos a las empresas de IA generativa para que se forren con él, hay quien ha decidido ignorar esto y utilizar el contenido para su propio beneficio. Una investigación de Forbes apunta hacia Perplexity, quien estaría realizando estas prácticas abiertamente deshonestas para potenciar su buscador basado en IA.

Asesoramiento experto gratuito en cambio de CMS

¡Cambia a un nuevo CMS, con inteligencia artificial, e incluso ahorra!

Para el que no lo conozca, Perplexity es un buscador gratuito de nueva generación al que se puede hacer preguntas y responde con respuestas, no con los típicos enlaces azules de Google. Eso sí, atribuye bien las fuentes y enlaza bien, con lo que intenta que el usuario siga navegando hacia las fuentes. En resumen, se trata de lo que Google quiere ser con AI Overviews.

La empresa tiene pocos empleados, pero ya estima que vale en torno a 1.000 millones de euros. Su versión gratuita usa chatGPT 3 como base y le añade una capa de lenguaje natural propio. A pesar de su valoración, no parece dispuesto a pagar por los contenidos, por lo que parece que lo está cogiendo por las bravas. Habría intentado conseguir dichos contenidos por medio de acuerdos de revenue share, pero no habría encontrado grandes grupos dispuestos a llegar a este tipo de acuerdos.

Comentamos el caso de Perplexity en el programa de TV La hora de CMS MAG 6. Disfruta del programa y suscríbete.

Cuestionado el creador de Perplexity, asegura que no han sido ellos, sino un proveedor, un tercero, el que les ha provisto estos datos. Como excusa es, como mínimo, muy pobre. Lo peor de todo es que no es la única empresa que lo está haciendo, de acuerdo con Reuters.

En cualquier caso, si se ignora Robots.txt, entonces los creadores de contenidos estamos absolutamente indefensos ante un robo masivo de contenidos que afecta directamente a nuestro negocio y forma de vivir. La única formad de defenderse será por la vía judicial, si bien se antoja algo complicado demandar a empresas ubicadas en países como India, sobre todo para editores pequeños.

A todo esto, hay que añadir que el sistema por el que supuestamente Google posibilitaba que nuestro contenido no fuera utilizado en Google Search en forma de AI Overviews ya no funciona y, por tanto, tampoco nadie es capaz de detener el uso de contenido para que Google responda preguntas con lenguaje natural sin reenviar tráfico a la fuente de la noticia.

Para bloquear a Perplexity en Robots.txt solo hay que añadir este comando, aunque ya sabemos que no es una obligación:

User-agent: PerplexityBot

Disallow: /

En el archivo robots.txt de CMS MAG tenéis una buena lista para cortar y pegar en vuestro archivo y dejar claro que no deseáis que se use vuestro contenido sin una contraprestación.

Autor: Jorge Mediavilla Martínez es licenciado en Periodismo por la Universidad Complutense de Madrid y lleva ejerciendo más de 20 años como editor de noticias, primero, y posteriormente como Product / Project Manager en empresas tan prestigiosas como ya.com, Yahoo!, acierto.com, Wunderman Thompson (grupo WPP) o grupo PRISA, entre otros. Además colabora con la URJC. Síguele en LinkedIN o Twitter. Contacto

Consigue el libro de CMS MAG

Todo sobre migración, taxonomías, analítica, roles y permisos y, en general, todo lo que debes saber para trabajar con gestores de contenidos para gran tráfico.

Por solo 29,95€ en Amazon o gratis con tu suscripción a CMS MAG

🔥Popular ahora:

Comentarios: ¿Tienes algo que aportar?

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Nota: Todos los comentarios son estrictamente moderados antes de su publicación. Si el tuyo no aparece, puede que sea irrespetuoso, contenga insultos, algo ilegal, parezca spam o sea poco constructivo.