Microsoft abre el modelo de lenguaje GODEL de código fuente para conversaciones realistas

Crear mejores modelos de lenguaje para ayudar a las personas en diversos aspectos de la vida sigue siendo un área importante de actividad para las grandes empresas de tecnología. De hecho, ha habido tantos avances en esta área que incluso los ingenieros de Google han comenzado a creer que la inteligencia artificial de la empresa se ha vuelto sensible. Mientras tanto, Amazon intenta que Alexa imite la voz de su familiar fallecido.

Ahora , Microsoft ha anunciado que está abriendo el código fuente de su Modelo de Lenguaje de Diálogo Abierto a Tierra (GODEL) para que lo use una audiencia más amplia.

GODEL combina dos características importantes en un modelo de lenguaje. En primer lugar, concéntrese en la tarea y, en segundo lugar, haga que la conversación sea realista y social. Por lo general, los chatbots intentan tener un propósito como los asistentes de la mesa de ayuda o simplemente intentan comunicarse sin un propósito.

GODEL es una clase de modelos preentrenados que básicamente permite que un agente conversacional, como un chatbot, brinde respuestas basadas en la conversación actual y también genere información externa y relacionada para que su interacción sea más realista e informada. El ejemplo proporcionado por Microsoft es una charla de recomendaciones de restaurantes que analiza recetas, métodos de cocina y más.

Microsoft quiere que GODEL no tenga restricciones en cuanto a las consultas que puede responder y ampliar, pero al mismo tiempo hacer que la conversación general sea útil.

De hecho, GODEL es una evolución de DialoGPT que Microsoft Research lanzó en 2019 . Las pruebas humanas automatizadas de Microsoft han demostrado que su última IA conversacional es muy superior a DialoGPT, por lo que la empresa cree que está lista para un uso más amplio en una variedad de entornos. A continuación puedes ver un ejemplo de una conversación con GODEL en la que responde una pregunta sobre un hecho de actualidad que no formaba parte de su set de entrenamiento:

GODEL ahora está disponible como un repositorio GitHub de código abierto aquí, y también puede consultar el artículo de investigación relacionado aquí . Viene en tres sabores, junto con el código que necesitará para volver a entrenar a GODEL en un conjunto específico de información.