Google ha lanzado Gemini, su modelo de inteligencia artificial más avanzado, fruto de la colaboración entre diversos equipos, incluyendo Google DeepMind y Google Research. Este esfuerzo conjunto representa el proyecto científico e investigativo más grande de la compañía hasta la fecha.
Gemini: Un vistazo a sus dimensiones optimizadas
Gemini 1.0, la primera versión, se ha optimizado en tres dimensiones clave:
Gemini Ultra: Este es el modelo de mayor capacidad, diseñado para abordar tareas complejas que involucran texto, código, audio, imagen y video.
Gemini Pro: Destinado a escalar una amplia gama de tareas, este modelo se posiciona como la opción más versátil.
Gemini Nano: Con un enfoque en eficiencia, este modelo está diseñado para tareas en dispositivos móviles, como el Pixel 8 Pro.
¿Qué Hace Especial a Gemini?
Gemini es un modelo de inteligencia artificial multimodal, lo que significa que puede manejar diferentes tipos de información, como texto, imágenes, audio, video y código. Su flexibilidad le permite ejecutarse eficientemente en cualquier dispositivo, desde móviles hasta centros de datos, marcando un avance significativo en la construcción y escalabilidad de la inteligencia artificial.
A diferencia de los modelos multimodales convencionales, Gemini fue diseñado nativamente como un modelo de IA multimodal desde el principio. Esto implica que fue previamente entrenado en diversas modalidades, mejorando su capacidad para comprender y razonar sin problemas desde el principio.
Gemini Ultra ha sido sometido a pruebas exhaustivas en diversas tareas, desde comprensión de imágenes y audio hasta codificación y razonamiento matemático. Su rendimiento supera a 30 de los 32 puntos de referencia académicos ampliamente utilizados en la investigación de modelos lingüísticos.
Disponibilidad de Gemini para Usuarios y Desarrolladores
A partir de ahora, Bard con Gemini Pro está disponible en inglés en más de 170 países y territorios. Esta herramienta mejorará la capacidad de Bard en comprensión, resumen, razonamiento, generación de ideas, escritura y planificación.
Pixel 8 Pro será el primer dispositivo en ejecutar Gemini Nano, brindando nuevas funciones como resumir en la aplicación de Grabadora e implementar Redacción Inteligente en Gboard, con más aplicaciones de mensajería en el horizonte.
Para desarrolladores y clientes, Gemini Pro estará disponible a través de la API de Gemini en Google AI Studio y Vertex AI de Google Cloud. Esto permitirá la personalización de Gemini con control total sobre los datos, combinando la facilidad de uso de AI Studio con los beneficios de seguridad y privacidad de Google Cloud.
Gemini Pro vs. ChatGPT: La Batalla de los Modelos Gratuitos
Aunque su nombre sugiere lo contrario, la versión Gemini Pro para Bard es totalmente gratuita. En comparación, acceder a los modelos más recientes de ChatGPT, como el GPT-4, implica una suscripción mensual. Google también ha insinuado el lanzamiento de Gemini Ultra en 2024, prometiendo un rendimiento superior.

Comentarios