• Sáb. Jul 27th, 2024

GPT-4o: La nueva era de la IA conversacional y multimodal de OpenAI

GPT-4o es el nombre de la nueva actualización del modelo de lenguaje GPT-4, el cual ofrece capacidades sin precedentes en la interacción con computadoras.

OpenAI sigue apostando por una inteligencia artificial eficiente y capaz de ofrecer una experiencia interactiva única a sus usuarios, y sin duda, lo ha logrado con esta nueva actualización.

Y es que ahora, esta IA es un modelo multimodal que entiende y genera lenguaje, audio y video en tiempo real.

GPT-4o: Una IA que te entiende

GPT-4o convierte a ChatGPT en un asistente personal digital capaz de entablar conversaciones habladas en tiempo real, interactuar mediante texto y «visión» (procesando capturas de pantalla, fotos, documentos o gráficos), y aprender de conversaciones anteriores con los usuarios.

«Es la primera vez que damos un gran paso adelante en lo que respecta a la facilidad de uso», manifestó Mira Murati, directora de Tecnología de OpenAI, durante la demostración en directo. «Esta interacción se vuelve mucho más natural y mucho, mucho más fácil».

Esta nueva versión llega en un momento en que OpenAI busca mantenerse a la vanguardia en la competencia por desarrollar la IA más avanzada.

Puesto que, rivales como Google y Meta también están en la ruta por desarrollar modelos lingüísticos cada vez más potentes, y se espera que Google anuncie actualizaciones de su modelo Gemini en su conferencia anual de desarrolladores I/O.

Características más destacadas de GPT-4o

Aquellos usuarios que accedan a este nuevo modelo de lenguaje multimodal podrán disfrutar de:

  • Conversación hablada en tiempo real: Esta nueva actualización permite interactuar con ChatGPT mediante voz natural, similar a la de un humano, e incluso cantar.
  • Interacción multimodal: La herramienta puede procesar y responder a texto, imágenes y audio, permitiendo conversaciones más ricas y naturales.
  • Memoria y traducción: GPT-4o aprende de conversaciones anteriores y puede traducir en tiempo real.
  • Detección de emociones: El modelo puede detectar las emociones de los usuarios y adaptarse a ellas.
  • Soporte para varios idiomas: ChatGPT ahora admite más de 50 idiomas.
  • Acceso para desarrolladores: GPT-4o estará disponible para desarrolladores que deseen crear sus propios chatbots personalizados.

Además, de las comodidades que ofrece a los usuarios, esta última versión de GPT podría suponer una gran ayuda para Microsoft, que ha invertido miles de millones de dólares en OpenAI para integrar su tecnología de IA en sus propios productos.

Disponibilidad y acceso

La tecnología y las funciones actualizadas de ChatGPT estarán disponibles en los próximos meses y serán los usuarios premium quienes tendrán un acceso más amplio de mensajes con el último modelo.

Mientras que, los usuarios sin suscripción pagada tendrán un número limitado de interacciones con GPT-4o antes de volver al modelo GPT-3.5. Así mismo, OpenAI lanzará una aplicación de escritorio ChatGPT con las capacidades de GPT-4o.

Más de 100 millones de personas ya utilizan ChatGPT, y con las nuevas capacidades de GPT-4o, se espera que esta cifra aumente aún más.

OpenAI se posiciona como líder en la innovación de IA conversacional, ofreciendo una herramienta que acerca la tecnología a las personas de manera más natural e intuitiva.

Para más información sobre avances en IA, haz clic en el enlace.