Escudo de la República de Colombia
A- A A+
La aplicación de minería de texto a casos sociales representa un reto para el investigador. Foto: Mauricio Alvarado Lozada – El Espectador. Tomada de bit.ly/44oTKaF.

Una tesis de maestría optó por partir de herramientas técnicas para generar un potencial aporte social. El trabajo académico se abordó desde el campo de la analítica de datos para identificar y categorizar constantes en los casos para conocerlos mejor. De esa manera estudios que empleen la metodología pueden convertirse en insumos para la prevención de esta expresión máxima de violencia contra la mujer.

“El hecho de que alguien asesine a una mujer por el hecho de serlo me parece que es un problema gravísimo, y uno que se puede estudiar mucho para buscar las causas y ver cómo se puede enfrentar, porque es triste que en Colombia se presenten tantos casos y no se cuente con una visibilización adecuada, ya que, lo primero para abordar una problemática de este índole es reconocer su existencia”, dice Daniel García de Alzate, ingeniero mecánico y electricista, especialista en Inteligencia Artificial y magíster en Ingeniería - Analítica de la Facultad de Minas de la UNAL Medellín.

Para contribuir al propósito que menciona, él, a partir de su tesis de maestría, empleó la minería de texto, un tema emergente con el que se analiza información tipo texto que permite identificar señales a fin de mejorar procesos y darles valor agregado. Es un campo del análisis de datos que, en este caso, se hace a través del registro de patrones de palabras, lo cual es útil para conocer la forma en que se dan flagelos como el feminicidio o también, por ejemplo, para indagar por las opiniones de personas con respecto a distintos temas.

En la última década la analítica tomó un importante auge, refiere Daniel: “En el mundo actual hay mucha información, al punto de que la gente empieza a catalogarla como spam o como basura, y hay organizaciones que no saben qué hacer con tantos datos, que realmente podrían ser de gran utilidad para el crecimiento de las organizaciones”.


¿Cómo se hizo?

Daniel partió del concepto de feminicidio de Naciones Unidas que lo define como la expresión máxima de violencia contra la mujer, y las estimaciones de la Organización Mundial de la Salud, que indica que una de cada tres mujeres ha sufrido algún tipo de violencia de género y que en el 38% de los casos esta es generada por las parejas. Asimismo, tuvo en cuenta la información del Instituto Nacional de Medicina Legal que a 2014 registró 1007 mujeres asesinadas y 37881 sometidas a hechos de violencia.

La minería de texto fue el medio que él usó para dar un paso adelante en ese proceso y para aportar a que se cuente con más recursos de información en las etapas tempranas de implementación de estrategias sociales, como explica. Si bien el enfoque de la maestría que cursó fue en profundización, se interesó en sentar precedentes en torno a la literatura, pues dice que la técnica de minería de texto ha sido poco utilizada para fenómenos de este tipo.

En el caso específico de su tesis, la aplicación de la minería de texto, explica, comenzó con la búsqueda de información sobre violencias contra la mujer en bases de datos o en fuentes oficiales como la Fiscalía General de la Nación, el Observatorio Colombiano de Feminicidios y en noticias de medios de comunicación nacional en las que se identificaron palabras clave relacionadas con la violencia feminicida.

La extracción de datos se realizó gracias a una herramienta denominada scraping, comenta Fernán Villa Garzón, profesor del Departamento de Ciencias de la Computación y la Decisión de la Facultad de Minas de la UNAL Medellín y asesor de la tesis de Daniel.

El investigador explica también que, en la extracción de información, se aplican herramientas de preprocesamiento para “poner a punto” la información, de manera que se puedan emplear técnicas de minería de texto sobre ella.

Daniel aplicó un método estadístico con el cual modeló un algoritmo para extraer datos de las fuentes de información y registrarla en tablas de Excel con los sitios web de donde se extrajo. Hubo dificultades, dijo, porque para algunos casos no se entregaban detalles de ningún tipo, y lo primero que se debe tener en cuenta, según él, es que las referencias sean certeras y confiables.

Una vez se hizo el procesamiento de la información se utilizaron varias técnicas que permitieron identificar las palabras más frecuentes con relación a los perpetradores, a las formas de violencia empleadas o a las ciudades donde sucedieron los hechos. A esta técnica se le denomina bolsa de palabras, funcional para tener una idea inicial del comportamiento global de los datos.

Después de hacer la exploración inicial, se empleó el dendrograma, el cuál es una representación gráfica en forma de árbol que indica cómo se van agrupando los casos, para dar una idea antes de usar métodos más elaborados de agrupamientos.

Con el reconocimiento de palabras se identifican entidades, que comenta, hacen parte de la clasificación con la que, a partir de oraciones gramaticales, se reconocen, por citar algunos ejemplos, las relaciones entre víctimas y victimarios o de tipos de armas con las que se perpetraron los feminicidios. Para el caso de la tesis, el análisis arrojó que el 20% de los agresores fueron parejas sentimentales de las mujeres violentadas y que las armas de fuego se usaron en el 40% de los casos, según Daniel.

El paso final, expone, es una clusterización. A partir de esta técnica se pueden agrupar los casos de violencia feminicida en los grupos que los representan. De esa manera se facilita el entendimiento del fenómeno: “esto porque es más fácil analizar cuatro grupos con casos homogéneos, que un solo grupo con casos heterogéneos entre sí”.


Aportes: de lo técnico a lo social

Si bien el de los feminicidios es un tema cuya sensibilidad e importancia trasciende las cifras, el método, de acuerdo con el autor de la tesis, es útil para la identificación de casos, de manera que las autoridades competentes puedan generar estrategias para mitigar la problemática, ya que la visibilización y caracterización, “son unos de los primeros pasos para entender la problemática, dar cuenta del impacto que está teniendo en la sociedad, hacerla más consciente y crear planes sociales para mitigarlo”, dice.

Es precisamente la promulgación implícita de valorar a las mujeres y de llamar a minimizar la violencia en contra de ellas, según el profesor Fernán, quien menciona que el análisis ofrece valor agregado con respecto al ámbito social.

En cuanto al análisis en el que se centró dice que lo más natural hubiera sido enfocar la tesis en un proceso de ingeniería. Sin embargo, quiso generar mayor impacto y exploró otros campos. En el tema social encontró un camino interesante, de modelos difíciles de desarrollar. Lo asumió como un gran reto y como una oportunidad interesante para aplicar el estudio.

En ese sentido destaca que para él lo valioso de realizar este trabajo fue evidenciar que “el mundo académico también se empieza a dar cuenta de lo importante que es aplicar cosas diferentes a lo tradicional, porque antes los problemas sociales solo se abordaban desde esa parte”. Además, destaca que el análisis puede representar un insumo en el establecimiento de estrategias gubernamentales en asuntos como la prevención de la violencia contra la mujer.

(FIN/KGG)

8 de mayo de 2023