La IA de Anthropic da un gran salto adelante con Claude 3

2024/03/05

En la carrera de la IA, Anthropic, una empresa fundada por ex empleados de OpenAI, no tiene planes de quedarse atrás. Los creadores de Claude AI tienen una nueva oferta para el público, la nueva familia de modelos Claude 3, que cuenta con importantes mejoras en rendimiento y capacidades.

La familia consta de tres nuevos modelos de lenguaje grande (LLM): Claude 3 Haiku, Claude 3 Sonnet y Claude 3 Opus, y cada modelo figura en orden creciente de capacidades, inteligencia y costo. Los modelos se entrenaron en conjuntos de datos hasta agosto de 2023.

Los modelos Claude 3 están elevando considerablemente el nivel de rendimiento, con Opus superando las capacidades de sus pares, como GPT-4 y Gemini 1.0 Ultra, en la mayoría de las pruebas de referencia, como conocimientos, razonamiento, matemáticas, codificación, etc.

Comparación de los modelos Claude 3 con los modelos GPT y Gemini en pruebas de Benchmark. Fuente: Antrópico

Los modelos Claude 3 incluso tuvieron un desempeño admirable en la evaluación Needle In A Haystack (NIAH) y aparentemente, el modelo incluso tenía conciencia de que estaba siendo probado. El rápido ingeniero lo recuerda como una historia divertida , pero ¿es divertido o aterrador? Anthropic llama a sus nuevos modelos «liderando la frontera de la inteligencia general».

Los modelos también muestran grandes mejoras con respecto a sus predecesores. Sonnet ha demostrado ser dos veces más rápido que Claude 2 y Claude 2.1 y, al mismo tiempo, ofrece mayores niveles de inteligencia.

Por otro lado, Opus supera con creces a estos modelos en inteligencia (demuestra niveles mucho más altos) sin sacrificar la velocidad; todavía está a la par con Claude 2 y Claude 2.1.

El haiku también tiene algunas plumas en el gorro. En comparación con otros modelos del mercado en la misma categoría de inteligencia, Anthropic afirma que Haiku es el más rápido y rentable. Incluso puede leer artículos con mucha información en menos de tres segundos, como artículos de investigación (~10.000 tokens) con cuadros y gráficos.

Las empresas pueden utilizar todos los modelos para tareas de autocompletado, chats con clientes y extracción de datos, según las necesidades.

Los nuevos modelos también muestran una mejor comprensión contextual en comparación con sus predecesores. Es menos probable que rechacen respuestas a preguntas inofensivas, algo con lo que luchan Claude 2 y Claude 2.1.

Tras el lanzamiento, estos modelos tendrán una ventana contextual de 200.000 tokens, pero son capaces de aceptar más de 1 millón de tokens. Anthropic dice que podrían poner la ventana de contexto superior a disposición de clientes empresariales seleccionados si necesitan una potencia de procesamiento mejorada.

¿Cómo se puede acceder a los modelos Claude 3? Claude 3 Sonnet y Claude 3 Opus están disponibles hoy en claude.ai y a través de su API. En claude.ai, Claude 3 Sonnet ahora impulsará la experiencia para los usuarios gratuitos, mientras que Claude 3 Opus estará disponible para los suscriptores de Claude Pro.

Sonnet ahora también está disponible en Amazon Bedrock y Vertex AI de Google Cloud (ambas compañías son inversionistas en Anthropic), y Haiku y Opus pronto harán lo mismo.

Deja una respuesta Cancelar la respuesta