Los bots, el tráfico de Internet realizado por máquinas y no por humanos, es hoy en día un problema enorme, en gran medida como fruto del aumento del web scrapping o rascado de contenidos, que es una técnica dirigida a extraer información de páginas web de manera automatizada. En los últimos tiempos ha aumentado considerablemente por obra y gracia de las empresas de inteligencia artificial (AI) generativa. ¿Qué hacer al respecto? Vamos a arrojar algo de luz sobre el asunto.
(más…)robots.txt
Cloudflare denuncia que Perplexity sigue jugando sucio
Las grandes empresas tecnológicas se encuentran en este momento en una lucha descarnada y sin ley (literalmente) por conseguir los mejores datos, datos que rastrean y registran incluso cuando existen directivas de los autores en contra de que su contenido sea utilizado por empresas de inteligencia artificial (IA). Todos han jugado sucio en algún punto, pero parece que Perplexity se lleva la palma, por lo que los medios de comunicación y empresas que ya cuentan con acuerdos con esta empresa deberían plantearse si su asociación con una organización sin el más mínimo atisbo de ética es recomendable.
(más…)Archivado en chatGPT, Cloudflare, IA, Inteligencia artificial en los CMS, Perplexity, robots.txt, Sam AltmanGoogle y la IA: entre la vergüenza y la ignominia
Artículo de opinión del director de CMS MAG, Jorge Mediavilla
Con el modo IA, Google entierra Internet tal y como lo conocemos, el de los enlaces azules de Search, dada su condición de monopolio de facto. A partir de ahora cogerá el contenido que desee, lo rehará un poco para que no se note y responderá directamente en su plataforma a las preguntas de los usuarios. Los creadores de contenidos ya tal, os doy un ejemplo.
(más…)Archivado en Google Search, IA, Inteligencia artificial en los CMS, Modo IA, robots.txt, Search Console CMSLa lista más completa para bloquear la IA en robots.txt o htaccess
Artículo de opinión del director de CMS MAG, Jorge Mediavilla
Llevo tiempo bloqueando a los bots de inteligencia artificial (IA) para intentar que no me roben mis contenidos ya que muchos de ellos son originiales y de calidad. Hasta ahora el proceso ha sido bastante manual e incompleto, pero recientemente he encontrado una web en la que ofrece la lista definitiva, la más completa para bloquear los bots de IA tanto en el archivo robots.txt, como en el artchivo htaccess del servidor Apache.
(más…)Archivado en Bots, Evergreen content, Google, Google Overviews, Google Search, htaccess, IA, Inteligencia artificial en los CMS, robots.txt, Servidor CMSAI Audit: nueva y potente herramienta para gestionar los derechos de tus contenidos
Hace un tiempo os informamos de una funcionalidad de Cloudflare que ayudaba a proteger los contenidos de los bots de las voraces empresas de inteligencia artificial, algo interesante sobre todo tras descubrir que algunas no respetan las directivas de robots.txt. A dichas funcionalidades se le añade una nueva ahora, en beta, llamada AI Audit.
(más…)Nueva herramienta para impedir que las empresas de IA te roben el contenido
En esta publicación hemos hablado largo y tendido de la necesidad de no volver a caer en las trampas de las grandes tecnológicas, en no ceder -tal y como hicimos con Google en los albores de Internet- nuestro contenido para entrenar a la inteligencia artificial (IA) si no obtenemos nada a cambio. Pues bien, ahora además de declarar que no queremos que se aprovechen de nuestro contenido para forrarse en robots.txt, ahora contamos con una herramienta más para defendernos del mayor robo de contenidos a escala planetaria de la historia.
(más…)Archivado en Claude 3, Cloudflare, Google, IA, Inteligencia artificial en los CMS, OpenAI, robots.txtPerplexitygate: Perplexity no respeta el bloqueo a la IA en robots.txt
Sucedió lo que los temíamos los creadores de contenido. A pesar de dejar bien claro en el archivo robots.txt que no queremos regalar nuestros contenidos a las empresas de IA generativa para que se forren con él, hay quien ha decidido ignorar esto y utilizar el contenido para su propio beneficio. Una investigación de Forbes apunta hacia Perplexity, quien estaría realizando estas prácticas abiertamente deshonestas para potenciar su buscador basado en IA.
(más…)Archivado en chatGPT, Forbes, Google Overviews, Google Search, IA, Inteligencia artificial en los CMS, Perplexity, robots.txt3 útiles herramientas sobre IA que todo periodista o creador de contenidos debe conocer
No se habla de otra cosa en las redacciones y en el mundo de la creación de contenidos en general. La inteligencia artificial (IA), cómo aplicarla y lo que piensan los lectores de ello es tema habitual de conversación. Por ello es importante informarse bien y mantenerse muy al día; aquí te presentamos 3 cosas o herramientas que seguramente no conoces y que te pueden resultar muy útiles.
(más…)Si usas Squarespace, tus datos se usan para entrenamiento de la IA y puedes hacer poco para evitarlo
Hace un tiempo escribimos sobre la posibilidad de que Tumblr y WordPress estuvieran facilitando a Midjourney y OpenAI el contenido de sus usuarios para los entrenamientos de sus modelos de inteligencia artificial generativa. Ahora podemos sumar los sitios de Squarespace, que tiene la friolera de unos 3 millones de sites activos. Y el problema es que los usuarios pueden hacer muy poco para evitarlo.
(más…)Bloquea a la inteligencia artificial ahora, piensa después
Ese es el consejo que Denis Haman, CEO de Glide Publishing Platform (GPP), ofrece a las más grandes webs de Internet y los grandes medios de comunicación. Bloquea ahora como han hecho el New York Times, The Washington Post o la CNN o Hellomagazine, cliente de GPP, y así impedirás que la inteligencia artificial (IA) se entrene con tu contenido y más adelante ya se dispondrán las reglas con las que cualquier IA (no solo la de chatGPT) está autorizado a leer y usar en su beneficio toda esa información. Cuantos más medios bloqueen, más eficaz será la acción.
(más…)