View on GitHub

IDORS-web

Aplicación para anotación de tweets con discurso de odio

Odio el odio: Clasificación de tweets con discurso de odio

Como parte del proyecto IDORS (Identificación de Discurso de Odio en Redes Sociales), llevado a cabo en el marco del curso Proyecto de Grado de la carrera de Ingeniería en Computación de la Facultad de Ingeniería - UdelaR por Lucas Kunc y Manuel Saravia, surge la aplicación Odio el odio, adaptada de la aplicación de clasificación de tweets humorísticos Clasifica humor. La misma tiene como finalidad la generación de un corpus anotado de tweets, donde las etiquetas para cada tweet se corresponden con los criterios presentados a continuación:

En particular nos parece interesante el caso del DDO ideológico, ya que ha cobrado un protagonismo grande en Twitter hoy en día y notamos que no es muy tenido en cuenta en la literatura que hemos explorado hasta el momento.

Los tweets que se muestran en pantalla se obtuvieron con el script twitterscraper, desarrollado por el Físico y Data Scientist Ahmet Taspinar. Dicho script interactúa con la API standard de Twitter para obtener los tweets dado un término de búsqueda. Para construir los términos, se utilizaron los operadores OR (el cual busca tweets donde ocurre el subtérmino de la izquierda o el de la derecha o ambos) y AND (el cual busca tweets donde ocurren tanto el subtérmino de la izquierda como el de la derecha), combinando palabras relacionadas con los tipos de odio mencionados anteriormente, las cuales se colocaron en las siguientes listas:

Además se mantuvo una lista de insultos de uso general.

A partir de estas listas de palabras, se generaron los términos con las siguientes combinaciones:

Los tweets fueron recolectados durante un período de un año, desde el 14 de Julio de 2018 hasta el 14 de Julio de 2019.

El corpus construido será destinado a la generación de un modelo que logre, en un principio, identificar si un Tweet aleatorio en español profesa DDO.