Google presenta los modelos avanzados de la serie Gemini 1.5 y reduce el precio de la API en un 50%

2024/09/24

Hoy, Google presentó dos modelos mejorados de Gemini 1.5 listos para producción: Gemini-1.5-Pro-002 y Gemini-1.5-Flash-002. Estos últimos modelos ofrecen mejoras incrementales en comparación con los modelos originales de Gemini 1.5 lanzados en mayo.

Los modelos revisados de la serie Gemini 1.5 logran un aumento aproximado del 7 % en MMLU-Pro, una mejora de alrededor del 20 % en los puntos de referencia MATH y HiddenMath, y mejoras que van del 2 % al 7 % en los escenarios de visión y codificación. Además, Google ha perfeccionado la utilidad general de las respuestas del modelo. Estos modelos ahora generan respuestas en un formato más conciso, con una longitud de salida predeterminada aproximadamente entre un 5 % y un 20 % más corta que sus predecesores.

Además de las mejoras en la funcionalidad del modelo, Google también está implementando un cambio notable en los precios: están reduciendo el costo de las API del modelo de la serie Gemini 1.5.

Una reducción del 64% en los tokens de entrada.
Una reducción del 52% en los tokens de salida.
Una disminución del 64 % en los tokens almacenados en caché incrementales para Gemini 1.5 Pro, a partir del 1 de octubre de 2024, para solicitudes inferiores a 128 000 tokens.

Google también está elevando los límites de velocidad, lo que permite a los desarrolladores crear aplicaciones de IA sofisticadas. Los límites de velocidad de nivel de pago para el modelo Gemini 1.5 Flash ahora son de 2000 RPM, mientras que para el modelo Pro, han aumentado a 1000 RPM, en comparación con 1000 y 360, respectivamente. Además, hay una reducción en la latencia con estos nuevos modelos, lo que ofrece a los desarrolladores el resultado esperado que es el doble de rápido y tres veces menos latencia.

Con el lanzamiento de la versión actualizada de Gemini 1.5 (modelos -002), Google ha mejorado la capacidad del modelo para cumplir con las instrucciones del usuario y, al mismo tiempo, mantener los protocolos de seguridad. De forma predeterminada, Google no aplicará filtros de seguridad de contenido de IA en estos últimos modelos; en su lugar, los desarrolladores pueden aplicar los filtros en función de sus necesidades específicas.

Por último, Google ha lanzado una versión mejorada del modelo Gemini 1.5, conocida como “Gemini-1.5-Flash-8B-Exp-0924”. Esta versión experimental presenta mejoras significativas en el rendimiento tanto en aplicaciones textuales como multimodales. Todos estos modelos Gemini 1.5 actualizados ahora están disponibles para los desarrolladores a través de Google AI Studio y la API de Gemini. Para las empresas más grandes y los clientes de Google Cloud, estos modelos Gemini 1.5 recientemente actualizados están disponibles en Vertex AI.

Fuente

Deja una respuesta Cancelar la respuesta