Ciencia y tecnología

Investigador politécnico revela 5 claves esenciales para detectar el uso de Chat GPT en la creación de textos

Chat GPT, o Generative Pre-trained Transformer, es una tecnología de inteligencia artificial que se basa en modelos de lenguaje generativo entrenados con grandes cantidades de datos textuales para poder dar respuestas coherentes y contextualmente relevantes a partir de una pregunta o una instrucción específica.

La herramienta ha demostrado que puede sostener conversaciones de manera natural y generar textos con cierto nivel de complejidad y coherencia, lo cual permite su utilización en gran cantidad de aplicaciones. 

A través de un análisis de los productos de esta herramienta, el doctor Rodrigo Florencio Da Silva, profesor investigador de la Escuela Superior de Ingeniería y Arquitectura del Instituto Politécnico Nacional, encontró rasgos específicos que permiten sospechar si un texto fue redactado por una inteligencia artificial, y que pueden ser de gran utilidad para las personas al frente de redacciones y docentes frente al aula.

Tras haber analizado un volumen importante de escritos creados con herramientas como Chat GPT de la empresa OpenAI, o Bard de Google, y haber experimentado constantemente por sí mismo, pudo identificar «vicios» o «muletillas» muy específicas utilizadas por estos programas al redactar. Gracias a estas estructuras, es posible sospechar que el texto que se está leyendo fue creado por una máquina.

El interés del investigador politécnico es poder brindar a las personas docentes, editoras y redactoras, una herramienta similar a las que existen actualmente para detectar el plagio en los textos académicos. 

Su investigación también plantea la necesidad de generar códigos éticos y reglamentos específicos para poder convivir con estas tecnologías que «llegaron para quedarse» y cuentan ya con más de 200 mil millones de usuarios en el mundo y más de diez millones de consultas diarias.

Debido a que la explosión de los textos «sintéticos» apenas comienza hace ocho meses, se ha convertido en una necesidad creciente para ciertos usuarios identificar este tipo de textos, sobre todo en ambientes académicos.

Entre otras, algunas de las claves que el doctor Da Silva puntualiza son las siguientes:

1.      Los textos tienden a ser repetitivos, ya que el programa toma palabras esenciales y las utiliza constantemente para construir párrafos coherentes. Esto hace que las repita o parafrasee ideas constantemente.

2.      Normalmente el último y penúltimo párrafo comienzan con frases como «En resumen», «Para concluir» o «En conclusión».

3.      Las citas sólo incluyen información hasta el 2021, ya que la IA que utiliza Chat GPT solo fue entrenada con fuentes hasta septiembre de dicho año.

4.      Es importante verificar las referencias a autores o citas en fuentes como Google Scholar, Emerald o Springer, ya que el robot las genera de manera muy coherente, en concordancia con varios estilos de los autores mencionados, pero son inexistentes.

5.      Además de pasar los textos por Turnitin para detectar plagio, el investigador compartió varias herramientas gratuitas y de pago para la identificación de trabajos generados de manera automática, como:

https://platform.openai.com/ai-text-class

https://app.gptzero.me/app/welcome

https://app.originality.ai/login

https://writer.com/ai-content-detector

https://copyleaks.com/ai-content-detector

Para demostrar la importancia de hacer un análisis concienzudo de la escritura académica y periodística, el investigador mostró al público una tesis de grado de licenciatura que él mismo creó utilizando Chat GPT en tan solo 6 horas y cuya falsedad no pudo ser detectada por el programa más utilizado en la academia para identificar plagio.

También mostró artículos en proceso de arbitraje en importantes revistas científicas que incluían la frase «regenerate response» en lugares aleatorios, la cual se encuentra en uno de los botones de la interfaz de la herramienta de lenguaje generativo, lo cual indica un grave descuido, no solo por parte de los autores, sino también de editores y revisores.

Da Silva hizo énfasis en que lo fundamental es fomentar la responsabilidad y la ética en la escritura, tanto para estudiantes como para docentes y en medios o redacciones. 

Estas herramientas seguramente potenciarán nuestra capacidad de generar conocimiento, pero se debe aprender a usarlas responsablemente y con reglas claras sobre cómo dar crédito y referencia a su uso.

El ejercicio ocurrió en el Museo Tezozómoc de la Dirección de Divulgación de la Ciencia y la Tecnología, organizada por la Dirección de Investigación, ambas dentro de la Secretaría de Investigación y Posgrado del Instituto Politécnico Nacional (IPN).

Fotos: IPN

Arriba