Investigación: IA Generativa de texto
La IA generativa de textos
utiliza un tipo de RNA conocido como transformador de propósito general, y un
tipo de transformador de propósito general llamado modelo de lenguaje de gran
tamaño. Por eso, los sistemas de IAGen de texto suelen denominarse modelos de
lenguaje de gran tamaño, o LLM. El tipo de LLM utilizado por la IAGen se conoce
como transformador generativo preentrenado o GPT, por sus siglas en inglés (de
ahí el “GPT” en “ChatGPT”)
Además de los avances en la
optimización de las arquitecturas de IA y de los métodos de entrenamiento, la rápida
evolución de IA generativa también ha sido posible gracias a las ingentes
cantidades de datos y a las mejoras en las capacidades informáticas disponibles
para las grandes empresas. Desde 2012, las capacidades informáticas utilizadas
para entrenar modelos de IAGen se han duplicado cada 3-4 meses.
No hay comentarios:
Publicar un comentario