El lunes, Anthropic lanzó un nuevo modelo Frontier denominado Claude Sonnet 4.5, que afirma ofrecer un rendimiento de vanguardia en los puntos de referencia de codificación. La compañía sostiene que Claude Sonnet 4.5 es capaz de construir aplicaciones “listas para producción”, en lugar de meros prototipos, lo que supone un salto cualitativo en la fiabilidad con respecto a modelos de IA anteriores.
Claude Sonnet 4.5 estará disponible a través de la API de Claude y en el chatbot Claude.ai. El precio para los desarrolladores se mantiene igual que el de Claude Sonnet 4: 3 dólares por millón de *tokens* de entrada (aproximadamente 750.000 palabras, más que toda la saga de *El Señor de los Anillos*) y 15 dólares por millón de *tokens* de salida.
En el último año, los modelos de IA de Anthropic se han erigido como una opción preferente entre desarrolladores y empresas, debido en gran medida a su sólido rendimiento en tareas de ingeniería de software. Según los informes, Apple y Meta utilizan los modelos Claude AI internamente, y Anthropic ha generado un negocio significativo vendiendo acceso API a aplicaciones de codificación de IA como Cursor, Windsurf y Replicate. Recientemente, GPT-5 de OpenAI ha desafiado el dominio de Anthropic en este ámbito, superando a los modelos Claude en una variedad de puntos de referencia de codificación.
Anthropic afirma que Claude Sonnet 4.5 ofrece un rendimiento líder en la industria en varios puntos de referencia de codificación, incluido SWE-Bench Verificado. Sin embargo, el investigador de IA de Anthropic, David Hershey, comenta a TechCrunch que es difícil capturar el verdadero rendimiento de Claude Sonnet 4.5 únicamente mediante puntos de referencia.
Hershey señala que Claude Sonnet 4.5 ha ejecutado código de forma autónoma durante hasta 30 horas en las pruebas iniciales con algunos clientes empresariales. Durante ese tiempo, observó que el modelo de IA no solo construía una aplicación, sino que también implementaba servicios de base de datos, compraba nombres de dominio y realizaba una auditoría SOC 2 para verificar la seguridad del producto.
En un comunicado compartido con TechCrunch, el CEO de Cursor, Michael Truell, afirmó que Claude Sonnet 4.5 representa el máximo rendimiento en codificación, especialmente en tareas de larga duración. Por su parte, el CEO de Windsurf, Jeff Wang, declaró que Claude Sonnet 4.5 representa una “nueva generación de modelos de codificación”.
Anthropic también afirma que Claude Sonnet 4.5 es su modelo de IA más alineado hasta la fecha, con tasas más bajas de alucinación y simulación que sus predecesores. La compañía afirma haber mejorado la resistencia de Claude frente a ataques de inyección de prompts.
Evento de TechCrunch
San Francisco
|
27-29 de octubre de 2025
Junto con el lanzamiento de Claude Sonnet 4.5, Anthropic también presenta el Claude Agent SDK. La empresa indica que esta es la misma infraestructura que impulsa el agente de código Claude, y puede emplearse para ayudar a los desarrolladores a construir sus propios agentes.
Anthropic también lanza una vista previa de investigación para una función llamada “Imagine with Claude” destinada a los suscriptores de Pro, que muestra la capacidad de generación del modelo de IA en tiempo real. La compañía afirma que el modelo responde a las solicitudes de los usuarios en tiempo real, sin funcionalidad predefinida ni código preescrito.
