Una persona que usa ChatGPT en una computadora portátil.

Una nueva herramienta de detección de IA puede identificar con precisión artículos de química escritos por ChatGPT. Crédito: Frank Rumpenhorst/dpa vía Alamy

Una herramienta de aprendizaje automático puede detectar fácilmente cuándo se escriben artículos de química utilizando el chatbot ChatGPT, según un estudio publicado el 6 de noviembre en Cell Reports Physical Science 1 . El clasificador especializado, que superó a dos detectores de inteligencia artificial (IA) existentes, podría ayudar a los editores académicos a identificar artículos creados por generadores de texto de IA.

"La mayor parte del campo del análisis de texto quiere un detector realmente general que funcione con cualquier cosa", dice la coautora Heather Desaire, química de la Universidad de Kansas en Lawrence. Pero al crear una herramienta que se centra en un tipo particular de papel, “realmente buscábamos la precisión”.

Los hallazgos sugieren que los esfuerzos para desarrollar detectores de IA podrían impulsarse adaptando el software a tipos específicos de escritura, afirma Desaire. "Si puedes crear algo rápida y fácilmente, entonces no es tan difícil crear algo para diferentes dominios".

Los elementos del estilo.

Desaire y sus colegas describieron por primera vez su detector ChatGPT en junio, cuando lo aplicaron a artículos de Perspective de la revista Science 2 . Utilizando el aprendizaje automático, el detector examina 20 características del estilo de escritura, incluida la variación en la longitud de las oraciones y la frecuencia de ciertas palabras y signos de puntuación, para determinar si un científico académico o ChatGPT escribió un fragmento de texto. Los hallazgos muestran que "se podría utilizar un pequeño conjunto de funciones para obtener un alto nivel de precisión", afirma Desaire.

En el último estudio, el detector fue entrenado en las secciones introductorias de artículos de diez revistas de química publicadas por la Sociedad Química Estadounidense (ACS). El equipo eligió la introducción porque esta sección de un artículo es bastante fácil de escribir para ChatGPT si tiene acceso a literatura de referencia, dice Desaire. Los investigadores entrenaron su herramienta en 100 introducciones publicadas para que sirviera como texto escrito por humanos y luego pidieron a ChatGPT-3.5 que escribiera 200 introducciones en el estilo de una revista ACS. Para 100 de ellos, la herramienta recibió los títulos de los artículos y para los otros 100, sus resúmenes.

Cuando se probó con introducciones escritas por personas y aquellas generadas por IA de las mismas revistas, la herramienta identificó secciones escritas en ChatGPT-3.5 basadas en títulos con 100% de precisión. Para las introducciones generadas por ChatGPT basadas en resúmenes, la precisión fue ligeramente menor, del 98%. La herramienta funcionó igual de bien con texto escrito por ChatGPT-4, la última versión del chatbot. Por el contrario, el detector de IA ZeroGPT identificó introducciones escritas por IA con una precisión de solo entre el 35% y el 65%, dependiendo de la versión de ChatGPT utilizada y de si la introducción se había generado a partir del título o del resumen del artículo. Una herramienta de clasificación de texto producida por OpenAI, el creador de ChatGPT, también tuvo un desempeño deficiente: pudo detectar introducciones escritas por IA con una precisión de alrededor del 10 al 55%.

El nuevo receptor ChatGPT incluso funcionó bien con introducciones de revistas en las que no estaba capacitado y captó texto de IA creado a partir de una variedad de indicaciones, incluida una destinada a confundir a los detectores de IA. Sin embargo, el sistema está altamente especializado para artículos de revistas científicas. Cuando se le presentaron artículos reales de periódicos universitarios, no pudo reconocer que estaban escritos por humanos.

Cuestiones más amplias

Lo que hacen los autores es "algo fascinante", afirma Debora Weber-Wulff, científica informática que estudia el plagio académico en la Universidad de Ciencias Aplicadas HTW de Berlín. Muchas herramientas existentes intentan determinar la autoría buscando los patrones de texto predictivos de la escritura generada por IA en lugar de observar las características del estilo de escritura, dice. "Nunca había pensado en usar estilometría en ChatGPT".

Pero Weber-Wulff señala que hay otros problemas que impulsan el uso de ChatGPT en el mundo académico. Muchos investigadores están bajo presión para producir artículos rápidamente, señala, o podrían no ver el proceso de redacción de un artículo como una parte importante de la ciencia. Las herramientas de detección de IA no abordarán estos problemas y no deben verse como “una solución de software mágica para un problema social”.