Google ha revelado "Gemini", su proyecto de inteligencia artificial (AI) más grande y ambicioso hasta la fecha. Según Sundar Pichai, CEO de Google y Alphabet, Gemini representa un gran avance en el campo de la inteligencia artificial y promete transformar la forma en que interactuamos con la tecnología.

Un proyecto de colaboración masiva

Gemini es el resultado de un esfuerzo colaborativo a gran escala entre equipos de Google, incluyendo Google Research. Diseñado para ser multimodal, Gemini puede procesar y razonar a través de diferentes tipos de información, incluyendo texto, código, audio, imagen y video. Esta capacidad multimodal permite a Gemini comprender y operar de manera más fluida y eficiente que los modelos anteriores.

Rendimiento excepcional

Gemini ha demostrado un rendimiento excepcional en una variedad de tareas. En pruebas académicas utilizadas en la investigación y el desarrollo de modelos de lenguaje a gran escala, Gemini Ultra ha superado los resultados actuales del estado del arte en 30 de 32 puntos de referencia. Además, Gemini Ultra ha sido el primer modelo en superar a los expertos humanos en MMLU (Massive Multitask Language Understanding), que evalúa tanto el conocimiento del mundo como las habilidades de resolución de problemas.

Capacidades de próxima generación

A diferencia de los modelos anteriores que requerían la formación de componentes separados para diferentes modalidades, Gemini ha sido diseñado para ser natively multimodal desde el principio. Esto le permite a Gemini una comprensión y razonamiento más fluido y efectivo en todas las modalidades.

Aplicaciones prácticas

Gemini 1.0, la primera versión de este modelo, tiene capacidades de razonamiento multimodal sofisticadas, lo que le permite analizar información escrita y visual compleja. Esto lo hace particularmente hábil para descubrir conocimientos que pueden ser difíciles de discernir entre grandes cantidades de datos. Además, su capacidad para entender y generar código de alta calidad en los lenguajes de programación más populares lo posiciona como uno de los modelos de fundación líderes para la codificación en el mundo.

Disponibilidad y expansión futura

Gemini se lanzará en Bard en más de 170 países, aunque inicialmente no estará disponible en el Reino Unido. Pichai mencionó que este es el mayor avance en Bard hasta la fecha. Gemini también se integrará en los teléfonos Pixel 8 Pro de Google, impulsando nuevas características como "resumen" en su aplicación de grabadora, así como "respuesta inteligente" en el teclado de Google, comenzando con los mensajes de WhatsApp.

Enfoque en la seguridad y la colaboración

Google ha enfatizado la importancia de construir salvaguardas y trabajar colaborativamente con gobiernos y expertos para abordar los riesgos a medida que la IA se vuelve más capaz. Gemini se está desarrollando con un enfoque en la responsabilidad y la seguridad, asegurando que su implementación y uso sean éticos y seguros.