Nuevas actualizaciones de OpenAI mejoran la IA

Nuevas actualizaciones de OpenAI mejoran la IA

OpenAI lanzó una serie de nuevas actualizaciones que mejoran sus modelos de IA con funciones avanzadas de voz y visión.

Para conversaciones en tiempo real y un mejor reconocimiento de imágenes.

Así, el desarrollador de inteligencia artificial OpenAI entró en octubre con varias nuevas actualizaciones.

El 1 de octubre, OpenAI presentó cuatro actualizaciones que introducen nuevas herramientas para facilitar a los desarrolladores la creación de sus modelos de IA.

Una de las principales actualizaciones es la Realtime API.

Que permite a los desarrolladores crear aplicaciones de voz generadas por IA con una sola instrucción. 

La herramienta, disponible para pruebas, admite experiencias multimodales de baja latencia.

Mediante la transmisión de entradas y salidas de audio.

Lo que permite conversaciones naturales similares al Modo de Voz Avanzado de ChatGPT.

Antes, los desarrolladores tenían que «coser» varios modelos para crear estas experiencias.

Normalmente, las entradas de audio debían cargarse y procesarse por completo antes de recibir una respuesta.

Lo que suponía una latencia mayor para aplicaciones en tiempo real como las conversaciones de voz a voz.

Gracias a la capacidad de transmisión en tiempo real de Realtime API, los desarrolladores ahora pueden permitir interacciones inmediatas y naturales.

Muy parecidas a las de los asistentes de voz.

La API se ejecuta en GPT-4, que se lanzó en mayo de este año, que puede razonar a través de audio, visión y texto en tiempo real.

Otra actualización incluye una herramienta de ajuste para desarrolladores que les permite mejorar las respuestas de la IA a partir de imágenes y texto.

Como indicó el desarrollador, los ajustes basados en imágenes permiten a la inteligencia artificial comprender mejor las imágenes.

Lo que a su vez mejora las capacidades de búsqueda visual y detección de objetos.

El proceso incluye la retroalimentación de humanos que proporcionan ejemplos de respuestas buenas y malas.

Además de sus actualizaciones de voz y visión, OpenAI también puso en marcha la «destilación de modelos» (o model distillation) y el «prompt caching».

Q ue permiten a los modelos más pequeños aprender de los más grandes.

Y reducir los costos y el tiempo de desarrollo reutilizando textos ya procesados.

Fuente: Cointelegraph