Consideración de RAG al evaluar herramientas de IA generativa

 

No todas las herramientas de IA son iguales para la investigación



Todo fue más fácil en noviembre de 2022 cuando ChatGPT entró en escena. Había un modelo de lenguaje grande (LLM) popular. Si bien no sabíamos exactamente qué hacer con él, fue realmente genial jugar con él. Pero un año y medio después, la novedad de la IA se ha agotado.

Una encuesta del seminario web ACRL  Choice de abril de 2024 reveló que el 68% de las bibliotecas universitarias “todavía están averiguando” lo que se refiere a la IA. Con una mayor presión para resolverlo, a los bibliotecarios académicos se les presenta una cantidad abrumadora de herramientas de inteligencia artificial , algunas de las cuales son increíblemente caras. ¿Cómo se puede empezar a crear una rúbrica para evaluar estos productos?

Categorización de aplicaciones de IA

A estas alturas, la mayoría de nosotros sabemos que existen diferentes tipos de aplicaciones de IA para el consumidor:

  • La IA conversacional se ha colado en nuestras vidas en forma de asistentes digitales. Si bien Siri y Alexa están ansiosas por configurar un cronómetro y contarnos chistes sobre gatos , tienden a ceñirse a un guión básico. Son como el droide gonk de la IA.

  • La IA predictiva se utiliza actualmente en los negocios y en la atención médica para pronosticar tendencias. Su banco utiliza una IA predictiva para observar las transacciones y detectar cargos fraudulentos. Los especialistas en marketing lo utilizan para analizar las tendencias de compra de los clientes y ofrecerle anuncios en línea. La IA predictiva analiza datos pero no crea nuevos conocimientos.

  • La IA generativa es mucho más poderosa y, de hecho, puede crear información, como historias y comunicados de prensa falsos. Los científicos entrenan algoritmos LLM con cantidades masivas de datos (por ejemplo, millones de artículos del New York Times , supuestamente). Cuando el usuario entabla una conversación con el LLM, el algoritmo crea una respuesta basada no en las reglas de la gramática inglesa, sino en la probabilidad de cuál debería ser la siguiente palabra según su entrenamiento.

La mayoría de las herramientas desarrolladas para bibliotecas son aplicaciones de IA generativa. Estas son herramientas legítimas que ayudan con la gestión de referencias . Son herramientas de investigación que automatizan la revisión de la literatura y el análisis de documentos . Estas herramientas han sido creadas por algunos de los nombres líderes en tecnología bibliotecaria: Clarivate, Elsevier, JSTOR y SirsiDynix, solo por nombrar algunos. Pero, ¿cómo cuadran estas herramientas con el pánico moral de los estudiantes que usan ChatGPT para hacer trampa en sus tareas? ¿Cómo puede una herramienta de IA ser virtuosa y la otra mala?

Por qué necesitas conocer RAG

Todo se reduce a la Generación Aumentada de Recuperación (RAG). RAG es un marco que crea una aplicación para LLM de IA generativa. Si bien es divertido jugar con ChatGPT y Chatbot Arena , no son particularmente útiles para los académicos.

Las limitaciones de la IA generativa son innumerables:

  • No proporcionan citas.
  • Son propensos a sufrir alucinaciones.
  • No hay forma de reproducir los resultados.
  • Existen problemas importantes con los derechos de autor y la privacidad del usuario.

Si bien RAG no resuelve todos estos problemas, comienza a abordar las preocupaciones de la comunidad académica. Es el primer paso hacia la creación de una herramienta LLM que sea realmente útil para la educación superior. En esencia, RAG es la diferencia entre la IA generativa por diversión y la IA generativa como herramienta de investigación legítima.

RAG mejora la red neuronal LLM al incorporar nueva información (por ejemplo, un conjunto de datos específico) y optimizar la salida para que los usuarios sepan cómo se generó esa salida (por ejemplo, citas). Digamos que le pido a Claude que me cuente las consecuencias sociales de los casos de la Corte Suprema decididos en abril de 2024. El algoritmo de Claude LLM debería poder rastrear el sitio web de la Corte Suprema para casos recientes. Pero resulta que la versión gratuita, que no es RAG, de Claude fue entrenado por última vez en agosto de 2023. El chatbot admite libremente que no sabe nada sobre lo que pasó la semana pasada. Esto es decepcionante, pero al menos admite no saberlo. Después de todo, otros LLM simplemente inventan cosas.


La diferencia RAG

Perplexity, que utiliza RAG, agrega valor al LLM subyacente al ayudar a los usuarios a perfeccionar sus indicaciones. También permite a los usuarios elegir un conjunto de datos y proporciona citas y enlaces para resultados de búsqueda. Claude tiene limitaciones, pero Perplexity proporciona a los usuarios herramientas que crean una experiencia mucho más útil y confiable.

Le hice a Perplexity mi pregunta sobre las últimas decisiones de la Corte Suprema y tuve una experiencia completamente diferente. Primero, me impulsó a ser específico sobre las consecuencias sociales que me interesaban: derechos civiles, medio ambiente o inmigración. Esa es una buena pregunta, Perplejidad.


Todavía puedo usar Claude como mi LLM, pero RAG me permite elegir mi conjunto de datos (Semantic Scholar, Reddit o web completa). También me proporciona citas para que pueda verificar y asegurarme de que la información que he recibido no sea una alucinación.


RAG es algo bastante poderoso y es por eso que las herramientas de suscripción como Scopus AI, Scite, Power Notes y otras agregan tanto valor a los LLM. Los chatbots pueden ser juguetes geniales, pero no son herramientas para académicos. La tecnología RAG aún es nueva, pero mejora con cada lanzamiento de producto. Comprender RAG y su papel en la mejora de los LLM es clave para los bibliotecarios que evalúan y hacen recomendaciones de compra de herramientas de IA generativa en sus instituciones. Los estudiantes y profesores también deben comprender RAG al considerar qué producto de IA utilizar para su propia investigación. La IA ha cambiado permanentemente la forma en que investigamos, y un buen RAG es imprescindible en el conjunto de herramientas de cualquier académico.

No hay comentarios:

Publicar un comentario

Feria de Proyectos 2018 II

Feria de Proyectos 2018 II Desarrollando la creatividad y la innovación para la solución de problemas y necesidades del país a tr...

Follow Us @soratemplates