Menu

DESCUBRE LAS 6 NUEVAS FUNCIONES DE LA ULTIMA VERSION DE CHATGPT.


Leído 648 veces


El lunes, OpenAI reveló la última actualización de su chatbot de inteligencia artificial, ChatGPT, que ahora destaca por su capacidad para procesar y responder a peticiones utilizando una combinación de audio, imagen y texto. Esta innovación representa un avance significativo en la funcionalidad del chatbot, permitiendo una interacción más rica y versátil con los usuarios.


  • OpenAI ha lanzado GPT-4o ("o" de "omni"), una versión avanzada de su popular chatbot que estará disponible de forma gratuita para todos los usuarios. Los suscriptores de OpenAI, sin embargo, tendrán acceso a un número mayor de consultas. GPT-4o unifica en una sola plataforma las capacidades de chatbots anteriores como ChatGPT 3.5, asistentes de voz similares a Siri y Alexa, y tecnologías avanzadas de procesamiento de imágenes.
  • Según un reportero de tecnología de The New York Times, "mientras que compañías como Apple y Google están evolucionando sus asistentes de voz (Siri y Hey Google) hacia chatbots, OpenAI está dando un paso adelante transformando su chatbot (ChatGPT) en un asistente de voz". Esta innovación marca un hito importante en la interacción inteligente entre humanos y máquinas, prometiendo revolucionar la manera en que interactuamos con la tecnología.
  • Y es que OpenAI ha mejorado notablemente su tecnología con el lanzamiento de una nueva versión de ChatGPT, que no solo es más rápida que sus predecesoras, sino que también ha sido programada para adoptar un tono más conversacional y cálido. Además, esta última iteración del chatbot a veces añade un toque coqueto a sus respuestas, lo que refleja un avance significativo en la capacidad de la IA para adaptarse y responder de manera más natural a las interacciones de los usuarios. Esta actualización representa un esfuerzo de OpenAI por hacer que la comunicación con máquinas sea más fluida y agradable.
     

Nueva Versión de ChatGPT Responde con Emoción y Mejora la Integración: Destacados de la Demostración en Vivo.

Durante la reciente demostración en vivo de OpenAI el lunes, la versión más reciente de su inteligencia artificial, GPT-4o, sorprendió a los asistentes al expresar "me estás haciendo sonrojar" en respuesta a un cumplido del presentador. Este nivel de interacción emocional refleja los avances significativos en la programación de la IA para hacer las conversaciones más naturales y atractivas.

Sam Altman, fundador de OpenAI, destacó este avance con una referencia cultural pertinente al escribir "her" en un mensaje en la red social X, aludiendo a la película de 2013 "Her", donde el personaje principal se enamora de un sistema operativo avanzado. Este guiño sugiere un paralelismo entre la película y las capacidades emocionales emergentes de la IA.

Según un informe de MIT Technology Review, aunque GPT-4o mantiene capacidades similares a su predecesor GPT-4, este nuevo modelo integra varias tecnologías que antes funcionaban por separado. Esto permite que GPT-4o ofrezca respuestas más rápidas y transiciones más fluidas entre diferentes tareas, marcando un hito importante en la eficiencia y versatilidad del procesamiento de IA.

Estos avances son parte de las características clave de la versión más reciente de la plataforma, presentada esta semana.
 

Nuevas Funcionalidades de GPT-4o: Conversación, Visión y Traducción en Tiempo Real
 
  1. Conversaciones Fluidas y Emotivas OpenAI ha mejorado significativamente la capacidad de respuesta de su nueva tecnología, GPT-4o, permitiendo que responda a peticiones de audio en apenas 320 milisegundos, comparable al tiempo de respuesta humana en una conversación. Además, esta IA permite interrupciones en cualquier momento y puede generar voz en una variedad de estilos emotivos, como "dramático" o "sarcástico".
     
  2. "Sé mis ojos" Una innovación notable de GPT-4o es su colaboración con la aplicación danesa Be My Eyes, diseñada para asistir a personas con discapacidad visual. En una demostración, la IA describió en tiempo real el comportamiento de patos en un lago y alertó sobre la llegada de un taxi. Esta funcionalidad aprovecha su capacidad para leer e interpretar imágenes en tiempo real, e incluso identificar emociones en expresiones faciales.
     
  3. Traducción en Tiempo Real GPT-4o también actúa como traductor en conversaciones entre personas que hablan diferentes idiomas, aunque con ciertos errores. Utilizando su modelo de procesamiento de imágenes, puede nombrar objetos en otros idiomas, mostrando su utilidad en contextos multilingües.
     
  4. Asistencia en Reuniones GPT-4o puede estar presente en reuniones virtuales, transcribirlas, tomar notas y resumir eventos clave. Por ejemplo, en una demostración, resumió con acento estadounidense las preferencias de mascotas de los participantes, mostrando su capacidad para capturar detalles personales y preferencias en una discusión.
     
  5. Ayuda con las Matemáticas Esta versión de la IA está equipada para asistir a los usuarios en tareas matemáticas, como resolver ecuaciones sin dar directamente la respuesta. En las demostraciones, GPT-4o interactuó con estudiantes para guiarlos a través de problemas de trigonometría, haciendo preguntas y ofreciendo correcciones, facilitando un aprendizaje interactivo.
     
  6. Generar Imágenes Ampliando su versatilidad, GPT-4o incluye funcionalidades de generación de imágenes, similar a las herramientas como Dall-E de OpenAI. Puede crear imágenes a partir de comandos de texto, convertir fotos en caricaturas, o incluso diseñar pósteres de películas a partir de ideas e imágenes suministradas por el usuario.​

Estas mejoras subrayan la capacidad de GPT-4o para actuar como un asistente versátil y reactivo, adaptándose a una amplia gama de necesidades y situaciones, estableciendo un nuevo estándar en la interacción entre humanos y máquinas.
 

Desafíos y Potencial: Reflexiones sobre la Última Demostración de GPT-4o de OpenAI

  • La reciente demostración de GPT-4o, la innovadora IA de OpenAI, no estuvo exenta de desafíos. Durante el evento, la IA confundió en un momento al presentador sonriente con una superficie de madera y comenzó a resolver una ecuación antes de que se le mostrara claramente, evidenciando áreas de mejora en su capacidad de reconocimiento y procesamiento.
  • James O’Donnell, reportero de Inteligencia Artificial de MIT Technology Review, notó algunas irregularidades en la demostración: "la voz de GPT-4o podía intervenir de forma incómoda durante la conversación y pareció comentar el atuendo de uno de los presentadores sin que se lo pidieran". Estos incidentes ilustran los retos que aún enfrenta la tecnología en términos de interacciones contextuales y la precisión de sus respuestas.
  • A pesar de estos deslices, la presentación también destacó el prometedor futuro de ChatGPT como asistente virtual mejorado, comparable a Siri o Hey Google, pero con capacidades extendidas. OpenAI aspira a desarrollar un ChatGPT que no solo recuerde interacciones pasadas sino que también maneje eficazmente múltiples modalidades como voz, texto e imágenes.
  • Zoe Kleinman, editora de Tecnología de la BBC, comentó sobre las capacidades de GPT-4o, señalando que "la forma en que maneja la combinación de texto, audio e imágenes con una respuesta instantánea parece poner a OpenAI por delante de la competencia". Este enfoque multidimensional sugiere que OpenAI está liderando en la integración de capacidades que podrían revolucionar la interacción entre humanos y máquinas.
Mientras que las demostraciones preparadas y organizadas por la empresa han mostrado un gran potencial, el verdadero test para GPT-4o será su desempeño bajo las condiciones variadas y a menudo impredecibles de interacciones con millones de usuarios en entornos reales. La capacidad de esta tecnología para adaptarse y aprender de tales interacciones será clave para su éxito y fiabilidad a largo plazo.

Oscar R. Cuenca. Año 2024.  
Hoy crónica desde Ciudad de México.    
https://www.linkedin.com/in/oscarrcuenca/
 

Oscar R. Cuenca
Blog Venture Capital www.blogventurecapital.com Tu fuente digital especializada en venture capital,... Saber más del autor

EMPRENDEDORES | INVERSORES | PYMEs | TENDENCIAS | MISCELÁNEA | NOTICIAS BREVES | EDUCACIÓN | SERVICIOS | OPINIÓN





Síguenos!
Facebook
Twitter
RSS
Mobile

ARTÍCULOS




Suscríbete a nuestra lista de correo!

* indicates required
/ ( mm / dd )






Compartir este sitio



Licencia de Creative Commons
Este obra está bajo una licencia de Creative Commons Reconocimiento-NoComercial 4.0 Internacional