Google presenta Gemini 1.5 Pro, su modelo con capacidades de comprensión mejoradas

Google ha compartido un liberar firmado conjuntamente por Sundar Pichai, director ejecutivo de Alfabeto y Google, y Demiss Hassabis, director ejecutivo de Google Deep Mind, en el que ha presentado el nuevo modelo Gemini 1.5.

Este anuncio llega apenas una semana después del lanzamiento del gigante tecnológico. Géminis Avanzado y rebautizado como Bard Gemini. Está claro que Google no sólo está haciendo una gran apuesta por sus modelos de IA, sino que también está dando grandes pasos en una carrera en la que mantenerse a la vanguardia es clave. De acuerdo con Sundar Pichai«Géminis 1.5. metronuestro Mejoras dramáticas en varias dimensiones y 1.5 Pro logra una calidad comparable a la de 1.0 Ultramientras usa menos computación».

Asimismo, esta nueva generación introduce una Avances notables en la comprensión de contextos largos.. Este aumento de la capacidad de procesamiento abre la puerta a capacidades completamente nuevas, impulsando el desarrollo de modelos y aplicaciones mucho más útiles.

Gemini 1.5 Pro: eficiencia y rendimiento mejorados

Demis Hassabis destaca que «Géminis 1.5 ofrece una rendimiento dramáticamente mejorado. Representa un cambio radical en nuestro enfoque, basándose en innovaciones de investigación e ingeniería en casi todas las partes de nuestra infraestructura y desarrollo de modelos centrales. Esto incluye hacer Gemini 1.5 será más eficiente para formar y prestar servicioscon una nueva arquitectura Expert Mix (MoE)».

La arquitectura altamente eficiente de Gemini 1.5, basada en la investigación de Google sobre Arquitectura de transformador y MoEpermite que el modelo aprenda tareas complejas más rápidamente y mantenga la calidad, al tiempo que es más eficiente en términos de formación y servicio. Estas eficiencias están ayudando a los equipos de Google a iterar, entrenar y ofrecer versiones más avanzadas de Gemini a un ritmo sin precedentes.

El primer modelo que lanzarán para realizar pruebas iniciales Será el Gemini 1.5 Pro. Se describe como un modelo multimodal de tamaño mediano, diseñado para escalar en una amplia gama de tareas y ofrecer un rendimiento similar al 1.0 Ultra.

Mayores y mejores capacidades de comprensión de Gemini 1.5 Pro

El Gemini 1.5 Pro permitirá una ventana de contexto estándar de 128.000 tokenspero se ha anunciado que un grupo limitado de desarrolladores y clientes empresariales podrán experimentar con una ventana contextual hasta 1 millón de tokens. «A medida que implementamos la ventana de contexto de 1 millón de tokens, estamos trabajando activamente en optimizaciones para mejorar la latencia, reducir los requisitos computacionales y mejorar la experiencia del usuario.», explicó Hassabis.

Imagen que compara las capacidades de la ventana contextual de token Gemini 1.5 Pro 1M con modelos anteriores

El La capacidad de Gemini 1.5 Pro para procesar grandes cantidades de información En una sola instancia es enorme, y más si hablamos de la versión, actualmente de acceso limitado, que presenta ventanas de contexto de hasta 1 millón de tokens. Esto puede conducir desde una hora de vídeo, 11 horas de audio, bases de código con más de 30.000 líneas, hasta más de 700.000 palabras. Esta capacidad de razonar sobre enormes cantidades de información de diferentes modalidades abre nuevas posibilidades para el análisis, clasificación y resumen del contenido dentro de un tema determinado.

Asimismo, Google ha explicado que esta IA podrá ejecutar razonamientos complejos sobre estas grandes cantidades de información: «1.5 Pro puede analizar, clasificar y resumir sin problemas grandes cantidades de contenido dentro de un mensaje determinado. Por ejemplo, cuando se le presenten las transcripciones de 402 páginas de la misión Apolo 11 a la luna, podrá razonar sobre las conversaciones, los eventos y los detalles que se encuentran en el documento.».

Amplias pruebas de seguridad para garantizar un funcionamiento adecuado

En línea con Principios de la IA de Google y sus políticas de seguridad, Gemini 1.5 ha pasado por exhaustivas pruebas de ética y seguridad. Estas pruebas se integran en los procesos de gobernanza, desarrollo de modelos y evaluación para mejorar continuamente los sistemas de inteligencia artificial de Google.

Antes del lanzamiento de 1.5 Pro, se llevaron a cabo evaluaciones exhaustivas en áreas como la seguridad del contenido y los daños a la representación, y Estas pruebas seguirán ampliándose para incluir las capacidades de contexto largo de 1.5 Pro..

Google seguirá construyendo y experimentando con modelos Gemini

Google se compromete a «llevar cada nueva generación de modelos Gemini a miles de millones de personas, desarrolladores y empresas de todo el mundo de manera responsable». A partir de hoyofrece un Vista previa gratuita limitada de 1.5 Pro para desarrolladores y clientes empresariales a través de AI Studio y Vertex AI. Si eres desarrollador y estás interesado en probar este modelo, puedes regístrate en este enlace.

Respecto a los planes de Google al futuro, explican que cuando el modelo esté listo para un lanzamiento más amplio, lo presentarán al público en general con una ventana de contexto estándar de 128.000 tokens. Detras de esto, Lanzarán diferentes planes de pago que van desde el modelo de 128.000 tokens hasta el modelo de 1 millón.

Foto: Google

Mantente informado de las noticias más relevantes en nuestro canal Telegrama

Post navigation

Apple confirma el fin de las Progessive Web Apps en iOS en Europa, estos son los motivos
ONCE, El Corte Inglés y Mutua Madrileña, las marcas que más invierten en publicidad en España