¿Eres un periódico digital o creador de contenido y no deseas que la inteligencia artificial (IA) raspe o use tu contenido para entrenarse (y forrarse) con ello? Haces muy bien. Si los periodistas y creadores de contenidos no vemos un claro beneficio en ceder nuestro contenido para entrenamiento de IA, simple y llanamente no debemos hacerlo, porque de hecho va en contra de nuestros intereses y amenaza directamente nuestro futuro.
Cambia de CMS gratis con expertos
Cambia a un nuevo CMS más rápido y seguro, con inteligencia artificial (IA) integrada e incluso consigue ahorro. ¡Es posible!

Ya está habiendo cierre de medios de comunicación (como Genbeta), reestructuraciones en grandes grupos mediáticos y despidos debido, supuestamente, a la influencia de la IA. Es importante actuar y bloquear a la IA.
ÍNDICE
- La plataforma o CMS importa y mucho
- ¿Debo ceder mi contenido?
- El papel de Cloudflare
- Otras formas de bloquear el raspado de IA
- Formas más profesionales de bloquear la IA
- Nuestra recomendación sobre los bots de IA
Si no tienes tiempo, acude directamente al resumen del artículo
La plataforma o CMS importa y mucho
En primer lugar, revisa bien la plataforma a la que subes el contenido. Si usas Youtube o algunos CMS populares en la nube, seguramente ya estés cediendo tu contenido y quizás no te hayas enterado. Muchos los ceden ya por defecto, reciben ingresos y tú puedes no haberte enterado.
Algunos pueden haber colocado un interruptor para denegar el acceso, lo cual es todo un detalle, pero por defecto habitualmente está encendido. Por esto y muchas cosas más recomendamos, si no hay mucho presupuesto, comenzar con código libre autoalojado o elegir un CMS que no venda tu contenido sin tu consentimiento expreso.
Es absolutamente imprescindible controlar la plataforma en la que se publica por razones obvias.
¿Debo ceder mi contenido?
Hoy por hoy, si el objetivo de tu proyecto es conseguir tráfico, entonces con urgencia deberías impedir el acceso de robots de IA si no lo has hecho ya, puesto que los datos indican claramente que estas plataformas que apenas envían tráfico. Tienen mucho margen para mejorar estos resultados, según ellos mismos confiesan.
Si con menciones e impresiones puedes pagar tus factures, entonces sí que lo podrías considerar ceder tu contenido, si bien sabes que entras en un entorno, los chatbots de IA, que pertenecen a una gran tecnológica con mucho tráfico, pero también con sus propias reglas, reglas que variarán según sus intereses y no los tuyos.
Por ello, si entras en su juego, asegúrate que no pones todos los huevos en la misma cesta, como ha ocurrido con la prensa digital y Google. Es decir, procura que la mayoría de tu tráfico o ventas no viene de un solo sitio e intentar mantener un mix saludable.
El papel de Cloudflare
Quizás la forma más sencilla de tener a los bots de IA a raya es usar Cloudflare, una plataforma de proxy inverso y CDN, que está muy comprometida en la protección del contenido en este sentido, si bien por otro lado en su infraestructura alberga clientes que emiten deporte pirateado y en algunas ocasiones, principalmente cuando juega el Real Madrid, tu web puede dejar de estar accesible si comparte IP con los supuestos piratas.
Cloudflare cuenta, además, con una versión gratuita muy útil y apta para pequeños blogs y medios de comunicación y es muy frecuente su uso. Esta versión cuenta con una herramienta muy útil para decidir qué bots de IA bloquear y cuáles no que es una delicia.
Pero si no quieres implicar a Cloudflare en tu proyecto, por supuesto que aún cuentas con opciones.
Otras formas de bloquear el raspado de IA
En Perishable Press cuentan con una entrada o artículo que puede ser enormemente útil y que, de hecho, en CMS MAG usamos. Provee una gran lista de código para añadir a nuestro archivo robots.txt y automáticamente indicamos a los bots de IA si deseamos que accedan a nuestro contenido o no. En este punto hay que aclarar que esta lista actúa como una recomendación que las empresas de IA pueden o no aceptar, no supone un bloqueo.
Pero tranquilos, porque en la misma página se provee también código para añadir al archivo .htaccess (si usas Apache) que sí que bloquea efectivamente a los bots. También lo provee para Nginx. Obviamente hay que tener cuidado y saber bien lo que se está bloqueando para no sufrir bajadas de audiencia indeseadas.
Formas más profesionales de bloquear la IA
A medida que la IA generativa mejora y evoluciona (aunque jamás se va a librar de las famosas alucinaciones con la tecnología actual) las empresas que basan su negocio en el contenido y el respecto a los derechos de autor, necesitan más y más soluciones tecnológicas sofisticadas para mantener a raya a los bots de IA.
Éstos no solo pueden apropiarse de nuestro contenido, rehacerlo y resolver las consultas de los usuarios sin acudir a la fuente. Además, pueden perjudicar el rendimiento y velocidad del sitio web, porque ocupan ancho de banda, y favorecen los sesgos y la desinformación debido a las alucinaciones.
Pero no todos los bots son malos y por ello en el mercado se están popularizando soluciones de software comerciales que monitorizan el tráfico en tiempo real e impiden que los bots malos degraden la experiencia de los usuarios legítimos y dejan actuar a los que se consideran beneficiosos.
Nuestra recomendación sobre los bots de IA
En CMS MAG tenemos las cosas muy claras: no se debe ceder gratuitamente el contenido a las empresas de IA para entrenar sus modelos. Consideramos que el “entrenamiento” masivo con contenidos ajenos, sin permiso ni compensación, equivale a un expolio, por lo que la le mejor es bloquear los rastreadores de IA (al menos vía robots.txt, y mejor aún con reglas en htaccess para forzar el bloqueo) y defender acuerdos con licencia y remuneración cuando proceda .
La postura más beligerante hay que tenerla frente a Google. Google pudo decidir una aproximación a los contenidos más amable y respetuosa con los creadores de contenidos, pero eligió coger el contenido sin consentimiento, sobre todo para hacer funcionar las AI Overviews, y privar así a las fuentes de un valioso tráfico. El gigante es ya toda una amenaza para la web abierta y, si gana la carrera de la IA, podemos despedirnos de Internet como lo conocíamos…
El marco deseable sería el apoyo a los editores y el pago por los contenidos para que éstos mejoren a su vez la calidad de sus informaciones, algo que redunda en la salud de la democracia. Si bien no se paga expresamente por el raspado de contenidos, sí sería bueno que se llegar a acuerdos de otro tipo, algo que parece haberse ralentizado mucho, tras un gran inicio por parte de OpenAI.
¿Estás de acuerdo con nuestra postura? ¿En desacuerdo? Exprésate en los comentarios.
El artículo advierte a periódicos y creadores: si no hay un beneficio claro, no cedas tu contenido para entrenar IA. La pérdida de tráfico y los efectos en empleo y sostenibilidad editorial ya se notan, así que conviene actuar. Lo primero es controlar la plataforma: algunos CMS en la nube y servicios como YouTube pueden ceder el contenido por defecto. Mejor optar por software libre autoalojado o, en su defecto, revisar y desactivar cualquier cesión automática. Además, diversifica tus fuentes de tráfico para no depender de un único intermediario.
Para proteger el contenido, la vía más sencilla es usar Cloudflare, que ofrece (incluso en su plan gratuito) controles para decidir qué bots de IA bloquear. Si no quieres usarlo, hay opciones manuales: listas de user agents en robots.txt (que solo indican preferencia y pueden ignorarse) y bloqueo efectivo mediante reglas en .htaccess (Apache) o configuración en Nginx, aplicadas con cautela para no afectar el SEO ni el rendimiento. En escenarios más exigentes, existen soluciones profesionales de gestión de bots que monitorizan en tiempo real, bloquean tráfico abusivo y preservan la experiencia de usuarios legítimos.
La posición de CMS MAG es tajante: no ceder gratuitamente el contenido para entrenamiento; bloquear rastreadores de IA por defecto y solo permitir accesos bajo licencias remuneradas. Se enfatiza una postura especialmente firme frente a Google por prácticas como AI Overviews, que usan contenido sin consentimiento y desvían tráfico, amenazando la web abierta. El marco deseable pasa por acuerdos que compensen a los editores y fortalezcan la calidad informativa; aunque hubo un arranque prometedor de pactos (p. ej., con OpenAI), el impulso se ha frenado y toca protegerse activamente.







Deja una respuesta