Por revistaeyn.com
Google está utilizando su conferencia anual de desarrolladores para mostrar lo que la compañía llama sus modelos de inteligencia artificial más ligeros y eficientes.
En Google I/O, la compañía anunció Gemini 1.5 Flash, la última incorporación a la serie de modelos Gemini.
"Escuchamos de los desarrolladores que querían algo más rápido e incluso más rentable", dijo Demis Hassabis, CEO de Google DeepMind, en una conferencia de prensa.
Google también anunció un modelo mejorado de Gemini 1.5 Pro, que tiene la capacidad de dar sentido a múltiples documentos grandes (1.500 páginas en total) o resumir 100 correos electrónicos, según un vicepresidente que trabaja en Gemini.
Gemini 1.5 Pro pronto será capaz de manejar una hora de contenido de video, o bases de código con más de 30.000 líneas, dijo Hsiao.
"Puede obtener rápidamente respuestas e información sobre documentos densos, como averiguar los detalles de la política de mascotas en su contrato de alquiler o comparar los argumentos clave de varios trabajos de investigación largos", dijo Hsiao.
La presentación se produce en un momento en que las empresas tecnológicas reorientan cada vez más el desarrollo y los lanzamientos de sus productos en torno a la IA generativa, que es de particular importancia para Google porque las nuevas herramientas ofrecen a los consumidores formas más avanzadas y creativas de acceder a la información en línea en comparación con la búsqueda web tradicional.
OpenAI lanzó recientemente un nuevo modelo de IA y una versión de escritorio de ChatGPT, junto con una nueva interfaz de usuario. El nuevo modelo, GPT-4o, es dos veces más rápido que GPT-4 Turbo y la mitad del costo, dijo la compañía.
La última actualización de OpenAI, anunciada esta semana, trae consigo una mejora de la calidad y la velocidad de ChatGPT para 50 idiomas diferentes. También estará disponible a través de la interfaz de programación de aplicaciones (API) de OpenAI, lo que permitirá a los desarrolladores comenzar a crear aplicaciones utilizando el nuevo modelo de inmediato, dijeron los ejecutivos.
Con 35 idiomas, Google dice que Gemini 1.5 Pro tiene una ventana de 2 millones de tokens, que mide el contexto e indica cuánta información puede procesar el modelo a la vez. El nuevo modelo ha mejorado el razonamiento local, la planificación y la comprensión de la imagen, dijeron los ejecutivos de la compañía.
"Ofrece la ventana de contexto más larga de cualquier modelo fundacional hasta ahora", dijo el CEO de Alphabet, Sundar Pichai, en la conferencia de prensa. En el evento, dio un ejemplo de un padre que le pidió a Gemini que resumiera todos los correos electrónicos recientes de la escuela de su hijo.
Gemini 1.5 Pro estará disponible inicialmente para pruebas en Workspace Labs. Gemini 1.5 Flash estará disponible para pruebas y en Vertex AI, que es la plataforma de aprendizaje automático de Google que permite a los desarrolladores entrenar e implementar aplicaciones de IA.
Con información de CNBC