Andalucia Buenas Noticias

Desarrollan una aplicación para verificar ‘fake news’

Desarrollan una aplicación para verificar 'fake news'

Un equipo de investigación de las universidades de Jaén y Alicante ha creado una aplicación que analiza las noticias automáticamente y determina la veracidad de éstas con una alta precisión. Aunque el modelo está aún en fase de testeo, se plantea como una herramienta útil para filtrar la cantidad de información que llega cada día a periodistas y lectores.

Basado en técnicas de inteligencia artificial, el sistema testa la noticia en dos niveles detectando si existen incongruencias en el contenido y si la estructura coincide con la que cualquier publicación con rigor periodístico debe tener.

Con la meta de ofrecer una mayor confianza al lector y dotar a los periodistas de nuevas herramientas que le permitan distinguir entre diversas informaciones, los estudiosos han publicado en la revista Expert Systems with Applications un artículo titulado ‘Exploiting discourse structure of traditional digital media to enhance automatic fake news detection’ en el que presentan el prototipo de un detector de ‘fake news’ para webs.

El sistema, según se ha informado desde la Fundación Descubre, analiza la estructura de la noticia publicada atendiendo a las reglas de periodismo clásicas: la regla de las 5W+H, conocida de esta manera por las iniciales de las cuestiones en inglés, y la pirámide invertida.

Estas guías se sustentan en que la nueva estricta debe contener información que responda a las seis preguntas básicas (¿qué?, ¿cuándo?, ¿dónde?, ¿quién?, ¿por qué razón? y ¿de qué manera?) y que se presente en gradación desde lo más esencial hasta los detalles.

«La estructura de una publicación nos da pistas de si hay base periodística o bien si, al contrario, imita a una nueva real», ha indicado el investigador de la Universidad de Jaén (UJA) Miguel Ángel García, autor del artículo.

A partir del análisis del lenguaje natural, los especialistas desarrollan un algoritmo que detecta las informaciones que no responden a esta estructura. Estos cálculos se fundamentan en técnicas de aprendizaje automático, asimismo conocido como ‘machine learning’, de forma que el sistema va aprendiendo conforme va amontonando datos.

Además, la máquina puede procesar en segundos miles y miles de datos simultáneos, algo que una persona no podría hacer. La estudiosa de la Universidad de Alicante Estela Saquete, asimismo autora del artículo, ha apuntado que con este sistema, los periodistas pueden contrastar fuentes, detectar estructuras incorrectas, viralizadas, o que tengan incongruencias entre el titular y el cuerpo de forma inmediata y automática. Asimismo el usuario final puede tener patentizas de si la nueva que lee cumple con unos estándares o no.

Los equipos ‘Sistemas Inteligentes de Acceso a la información’ (Sinai), de la Universidad de Jaén, y ‘Grupo de Procesamiento del Lenguaje Natural y Sistemas de Información’ (Gplsi), de la Universidad de, Alicante, realizaron las pruebas sobre un conjunto de datos en español con más de doscientos artículos centrados en temas sanitarios, de especial relevancia hoy en día debido a las numerosas noticias falsas que circulan sobre covid-diecinueve.

El sistema toma como base el aprendizaje profundo, con el que se crean modelos computacionales compuestos por múltiples capas de procesamiento de datos. En concreto en este trabajo, los especialistas definen dos capas. Por una parte la estructura de la nueva y por otro el razonamiento. De esta manera, la máquina predice no sólo la verosimilitud de la manera, sino más bien también del contenido.

Además de esto, los investigadores han aplicado un nuevo esquema en el tratamiento de los datos, conocido como anotación de grano fino, consistente en establecer etiquetas a las noticias. Estas marcas se aplican a todas las posibilidades, aunque las diferencias sean pequeñas. De esta manera se consigue una descripción detallada en los dos niveles para cada texto.

Cada etiqueta tiene un conjunto de atributos que proporcionan información más allá de lo lingüístico incluyendo la verificación de hechos, relaciones semánticas entre componentes o bien características contextuales. Aun, referencia aspectos relacionados con la carga emocional que pueda contener un escrito y que lo distancian de la objetividad que debe tener una noticia real.

El objetivo de los especialistas es conseguir una aplicación que marque de forma automática el texto de una nueva mientras se lee y que alerte a través de una señal de partes de la nueva que puedan ser falsas, señalando la referencia con otros textos similares en los que se pueda contrastar su veracidad.

Esta investigación se ha desarrollado a través de los proyectos ‘Living-LANG: Modelado del comportamiento de entidades digitales mediante Tecnologías del Lenguaje Humano’, del Ministerio de Ciencia e Innovación y ‘SIIA: Tecnologías del lenguaje humano para una sociedad inclusiva, igualitaria, y accesible’ de la Comunidad Valenciana.

Fuente: Europa Press.