El gigante de la tecnología Microsoft ha anunciado la próxima llegada del nuevo modelo de lenguaje GPT-4, que será multimodal. El lanzamiento del modelo es inminente, según Andreas Braun, CTO de Microsoft Alemania, quien mencionó la noticia en un evento de inicio de IA el 9 de marzo de 2023. Durante el evento, se presentó la serie de modelos de lenguaje grande (LLM), incluyendo la serie GPT, como una fuerza disruptiva para las empresas y la oferta de Azure-OpenAI en detalle. El evento se realizó en alemán y contó con la presencia de medios de comunicación como Heise. Braun anunció casualmente que GPT-4 se presentaría la próxima semana.
Braun explicó que los LLM son un cambio de juego porque permiten que las máquinas comprendan el lenguaje natural estadísticamente, lo que antes solo era posible para los humanos. Además, la tecnología ha avanzado tanto que los modelos pueden comprender y responder en cualquier idioma. Con la multimodalidad, Microsoft-OpenAI permitirá que los modelos sean más comprensivos.
En el evento, la CEO de Microsoft Alemania, Marianne Janik, también habló sobre la disrupción que la inteligencia artificial puede generar en las empresas. Janik enfatizó el potencial de creación de valor de la IA y habló sobre un punto de inflexión en el tiempo en el desarrollo de la IA y ChatGPT, que se asemeja al lanzamiento del iPhone. Según Janik, la IA no reemplazará trabajos, sino que mejorará la forma en que se hacen tareas repetitivas. Las descripciones de trabajo tradicionales cambiarán, y surgirán nuevas profesiones emocionantes gracias a las nuevas posibilidades. Janik recomendó que las empresas creen “centros de competencia” internos que capaciten a los empleados en el uso de la IA y agrupen ideas para proyectos. La CEO enfatizó que Microsoft no utiliza los datos de los clientes para entrenar modelos.
Clemens Sieber y Holger Kenn, ambos de Microsoft Alemania, presentaron casos de uso práctico de la IA y casos de uso concretos en los que sus equipos están trabajando actualmente, así como detalles técnicos. Kenn explicó qué es la IA multimodal, que puede traducir texto no solo en imágenes, sino también en música y video. Según Kenn, la IA responsable ya está integrada en los productos de Microsoft y “millones de consultas se pueden mapear en las API” a través de la nube. La mayoría del público estuvo de acuerdo en que ahora es el momento de empezar.
Sieber ilustró con casos de uso lo que ya es posible hoy en día. Por ejemplo, las llamadas telefónicas de voz a texto podrían ser grabadas y los agentes de un centro de llamadas ya no tendrían que resumir manualmente y escribir el contenido. Sieber también destacó que el ChatGPT de Microsoft ha sido entrenado en una variedad de dominios y que ha sido afinado para producir resultados precisos y efectivos.
En general, el lanzamiento de GPT-4 y la presentación de casos de uso reales de la IA fueron muy bien recibidos en el evento. Los asistentes se mostraron emocionados por las nuevas posibilidades que la IA ofrecerá en el futuro cercano.