La generación aumentada por recuperación (RAG, por sus siglas en inglés) es una técnica en inteligencia artificial que mejora la precisión y relevancia de las respuestas generadas por modelos de lenguaje grandes (LLMs). En lugar de depender únicamente de su entrenamiento, RAG permite a los LLMs acceder a fuentes de datos externas y relevantes para complementar su conocimiento y generar respuestas más informadas y contextualizadas.
En qué consiste la generación aumentada de recuperación
Tomemos el ejemplo de una liga deportiva que desea que los aficionados y medios de comunicación puedan usar el chat para consultar datos y obtener respuesta a sus preguntas sobre los jugadores, los equipos, la historia y las reglas del deporte, así como las estadísticas y clasificaciones actuales. Un LLM general podría responder a preguntas sobre la historia y las reglas o tal vez describir el estadio de un equipo en particular. Sin embargo, no podría comentar el partido de ayer por la noche ni proporcionar información actualizada sobre la lesión de un deportista en particular porque no dispondría de esa información y, dado que se necesita una potencia de computación significativa para volver a entrenar un LLM, no es factible mantener el modelo al día.
Además del LLM, grande y bastante estático, la liga deportiva posee o puede acceder a muchas otras fuentes de información, como bases de datos, almacenes de datos, documentos con biografías de los jugadores y fuentes de noticias que analizan cada partido en profundidad. La RAG permite a la IA generativa usar esta información. Ahora, el chat puede proporcionar información más oportuna, más adecuada al contexto y más precisa.
En pocas palabras, la RAG ayuda a los LLM a proporcionar respuestas más idóneas