Jueves, 02 de Mayo de 2024
Pulsa ENTER para buscar
autoridad Portuaria de Valencia

¿Qué es Gemini? La nueva IA con la que Google quiere competir con ChatGPT

¿Qué es Gemini? La nueva IA con la que Google quiere competir con ChatGPT

Google se lanza a la competición con una nueva herramienta de Inteligencia Artificial (IA) llamada Gemini, que ha presentado como más potente que cualquier otra actualmente en el mercado, incluyendo el popular ChatGPT, creado por OpenAI, hoy aliada con Microsoft.

La compañía subraya la «multimodalidad» de Gemini, al ser capaz de «razonar con fluidez mediante textos, imágenes, vídeo, audio y códigos», a través de lo que se conoce como el modelo MMLU, siglas en inglés para la «comprensión masiva de lenguaje multitareas».

Según la presentación general ofrecida hoy por la compañía, Gemini se presentará en tres formatos: Nano (la más sencilla, en forma de aplicación para teléfonos celulares), Pro y Ultra, esta última «la más potente para tareas de gran complejidad».

¿Qué es la MMLU?

En el contexto del procesamiento del lenguaje natural y la inteligencia artificial, la comprensión se refiere a la capacidad de entender o interpretar información en un formato determinado. Puede implicar la comprensión del lenguaje natural, imágenes, datos estructurados, etc.

El hecho de que sea «masiva» se asocia con grandes cantidades o volúmenes de datos y a la capacidad de manejar y comprender grandes cantidades de información.

Aplicado a los grandes modelos de lenguaje, que son capaces de entender y generar texto,  estos sistemas ofrecen la capacidad de realizar múltiples tareas simultáneamente en diferentes dominios o áreas.

¿Cómo lo hace?

Gemini puede recibir información visual o auditiva (notas de música, imágenes, palabras) y desde ahí generar contenido propio, que a su vez puede ser en versión texto, audio o imágenes.

En la presentación, Gemini es capaz de detectar errores en un problema matemático complejo, dar la respuesta correcta y explicar los pasos hasta llegar a ella; o de dar abundante información sobre un animal (un pato) a través de un simple dibujo, incluyendo la traducción de «pato» a cinco lenguas.

Igualmente, es capaz de «jugar» con el usuario en retos tan populares como «piedra, papel o tijera» o el de los tres cubiletes.

En breve saldrá al mercado

Gemini trabaja con los lenguajes de código más habituales, como Java, Python, C++ y Go, según sus creadores, y aunque incurre en algunos errores, Google dic que los sabe resolver cuando así se le comunica en el 90 % de los casos.

El potencial de Gemini se va a aplicar a su sistema actual de chat, conocido como Bard y que funciona ya en varias lenguas, incluido el español.

La compañía no ha aclarado cómo piensa monetizar la nueva herramienta, y por el momento se ha limitado a anunciar que estará disponible a partir del 13 de diciembre.

campanya renda Generalitat
campanya renda Generalitat
Perfils UJI
masteres UMH

Dejar una respuesta