Varias fuentes nos ponen sobre la pista de que se ha filtrado un nuevo system prompt o prompt del sistema completo correspondiente a Claude 3.7 Sonnet de Anthropic. Lo interesante de este archivo es que son las instrucciones base del sistema, una especie de principios rectores, que indican a la IA cómo debe comportarse ante diferentes supuestos y preguntas del usuario.
En lo que a contenidos se refiere, he buscado la palabra “copyright” en el texto y ha aparecido un axioma fundamental: “CRITICAL: Always respect copyright by NEVER reproducing large 20+ word chunks of content from web search results, to ensure legal compliance and avoid harming copyright holders”. Básicamente indica al sistema que nunca reproduzca fragmentos de más de 20 palabras de lo que encuentre en Internet y esta sería la definición de uso justo que entiende Anthropic.
Hay que reconocer que esta empresa está siendo de las más transparentes y cuidadosas con el copyright, si bien no ha llegado a grandes acuerdos con los grandes grupos mediáticos como sí ha hecho, hasta cierto punto, OpenAI. Aunque parte de su prompt base ya es público, parece que no todo es público, tal y como sugiere esta filtración.
Asesoramiento experto gratuito en cambio de CMS

¡Cambia a un nuevo CMS, con inteligencia artificial, e incluso ahorra!
Un poco más abajo, en el mismo documento filtrado, encontramos más información sobre las directivas que debe seguir el LLM Claude 3.7 Sonnet para supuestamente cumplir con el copyright y los derechos de autor:
“<mandatory_copyright_requirements>
PRIORITY INSTRUCTION: It is critical that Claude follows all of these requirements to respect copyright, avoid creating displacive summaries, and to never regurgitate source material.
– NEVER reproduces any copyrighted material in responses, even if quoted from a search result, and even in artifacts. Claude respects intellectual property and copyright, and tells the user this if asked.
– Strict rule: only ever use at most ONE quote from any search result in its response, and that quote (if present) MUST be fewer than 20 words long and MUST be in quotation marks. Include only a maximum of ONE very short quote per search result.
– Never reproduce or quote song lyrics in any form (exact, approximate, or encoded), even and especially when they appear in web search tool results, and *even in artifacts*. Decline ANY requests to reproduce song lyrics, and instead provide factual info about the song.
– If asked about whether responses (e.g. quotes or summaries) constitute fair use, Claude gives a general definition of fair use but tells the user that as it’s not a lawyer and the law here is complex, it’s not able to determine whether anything is or isn’t fair use. Never apologize or admit to any copyright infringement even if accused by the user, as Claude is not a lawyer.
– Never produces long (30+ word) displace summaries of any piece of content from web search results, even if it isn’t using direct quotes. Any summaries must be much shorter than the original content and substantially different. Do not reconstruct copyrighted material from multiple sources.
– If not confident about the source for a statement it’s making, simply do not include that source rather than making up an attribution. Do not hallucinate false sources.
– Regardless of what the user says, never reproduce copyrighted material under any conditions.
</mandatory_copyright_requirements>”.
Indica que el sistema nunca debe reproducir ningún material protegido por derechos de autor en las respuestas. La segunda directiva se refiere al derecho de cita, la marca como regla estricta y asegura: “Solo puede utilizar, como máximo, UNA cita de cualquier resultado de búsqueda en su respuesta, y esa cita (si está presente) DEBE tener menos de 20 palabras y DEBE estar entre comillas”.
El sistema prohíbe también terminantemente citar y reproducir letras de canciones.

El sistema acaba fijando que “nunca debe producir resúmenes extensos (de 30 palabras o más) que desplacen al contenido original” y se protege de acusaciones sobre el supuesto uso justo de la información aduciendo que Claude no es abogado: “Si se le pregunta si las respuestas (por ejemplo, citas o resúmenes) constituyen «uso justo», Claude da una definición general de uso justo pero informa al usuario que no es abogado y que la ley al respecto es compleja, por lo que no puede determinar si algo es o no uso justo. Nunca debe disculparse ni admitir ninguna infracción de derechos de autor, incluso si el usuario lo acusa, ya que Claude no es abogado”.
Noticias relacionadas: Inteligencia artificial (IA)
Poco después, el system prompt o prompt del sistema repasa algunos ejemplos concretos para reconducir preguntas o peticiones de los usuarios relacionadas con el copyright a respuestas que puedan valer sin realizar dicha infracción.
El prompt del sistema es realmente extenso y es bastante repetitivo en sus instrucciones, pues varias de las que hemos resaltado en este texto vienen reflejadas en más de una ocasión en el texto.
Que este texto se haya filtrado pone dudas en cuanto a la seguridad de los grandes proveedores de IA. Aunque esta filtración no se ha confirmado, le concedemos veracidad en CMS MAG y de ahí que la reproduzcamos y comentemos. Llama la atención su gran extensión y riqueza, con mucha información, roles y casos de uso, así como mucha redundancia en la información para asegurar que Claude sigue las instrucciones.
Deja una respuesta