Anunciando un regreso esperado, Anthropic informó que su modelo Claude Fable 5 estará accesible nuevamente a nivel global a partir de este jueves. Esta decisión se da tras mantener diálogos con el Gobierno de Estados Unidos y reforzar las medidas de seguridad para prevenir que el modelo sea utilizado en actividades de ciberseguridad ofensiva.
La empresa detalló que el relanzamiento incluirá un nuevo conjunto de clasificadores, los cuales han sido diseñados para detectar y bloquear un mayor número de solicitudes que puedan estar asociadas a actividades potencialmente dañinas.
Gracias a estas modificaciones, algunas tareas que son comunes, como la programación y la depuración de código, serán temporalmente redirigidas al modelo Claude Opus 4.8. Esto ocurrirá mientras Anthropic realiza ajustes en los nuevos filtros, con el fin de minimizar los falsos positivos y mejorar la diferenciación entre solicitudes legítimas y posibles abusos.
Ampliando la colaboración con el Gobierno de EE.UU., Anthropic también anunció que intensificará su trabajo conjunto en la evaluación y seguridad de modelos de inteligencia artificial. Este acuerdo permitirá que las autoridades tengan acceso anticipado a futuros modelos y a sus mecanismos de protección para realizar pruebas antes de su lanzamiento, además de facilitar el intercambio de información sobre vulnerabilidades, técnicas para eludir restricciones, conocidas como «jailbreaks», y posibles usos indebidos.
La empresa destinará recursos específicos a investigaciones colaborativas sobre seguridad en inteligencia artificial.
En cuanto a la elaboración de un marco común, Anthropic indicó que inició el trabajo en conjunto con Amazon, Microsoft, Google y otros miembros de la alianza Glasswing, con el objetivo de establecer criterios uniformes que permitan evaluar la gravedad de los intentos de vulnerar las restricciones de los modelos de IA. La meta es definir estándares compartidos sobre cómo deben responder las empresas desarrolladoras ante este tipo de incidentes.
Finalmente, Anthropic extendió un agradecimiento a los usuarios por su paciencia durante la suspensión temporal de Claude Fable 5, destacando el esfuerzo conjunto realizado con el Gobierno de Estados Unidos, empresas tecnológicas y la comunidad de investigación para reincorporar el modelo al acceso público.
Con información de Montevideo Portal


