top of page

La historia que cuentan los datos

Por: Viviana Villa, Investigadora Conflicto, paz y postconflicto-Pares


La era de los datos masivos pone en cuestión las formas como construimos narrativas o historias sobre lo que pasa. Fenómenos como Wikileaks o The Panama Papers parten en dos el modo de contarnos. Sin embargo, en Colombia la revolución digital y la implementación de herramientas similares para producir incidencia política que conduzca a la identificación y judicialización de responsables aún está en pañales. La creación de herramientas digitales de información para el análisis de sistemas de complejidad dinámica, como los crímenes de sistema ocurridos en el conflicto armado, aún suena a chino, incluso entre la comunidad más informada cuya solución más común a estos retos son las bases de datos relacionales, como las que pueden encontrarse en el Sistema de Información de Justicia Transicional (SIJT) o el sistema de Estadísticas en Justicia (SEJ), desde las que tradicionalmente se han estructurado los datos a nivel nacional.

En el libro Big data, la revolución de los datos masivos, Víktor Schönber­ger junto a Kenneth Cukier escriben.  “Los datos pueden revelar secretos a quienes tengan la humildad, el deseo y las herramientas para escuchar”. La sola idea de indagar en un archivo de Excel con más de mil filas desanimaría al gran porcentaje de la población colombiana.

Los datos y las hojas de cálculo funcionan como fichas forenses de la realidad: ofrecen detalles, pero reconstruir las verdades requiere trabajo, requiere construir sistemas de información para el análisis de contexto.  Cuando me acerqué a este tipo de investigación, me identifiqué con una especie de arqueóloga digital que se inventaba formas extrañas para rescatar y relacionar información que de otra forma seguiría sepultada en archivos inconexos.

El potencial de los datos despertó millones de preguntas: ¿Qué entendemos por verdad judicial o verdad histórica? y ¿Cómo desarrollar una metodología y un sistema para construirlas?, ¿cómo usar el periodismo de datos y el acceso a herramientas digitales para hacer hablar las tablas en el Excel y traducir su mensaje?

Por otra parte, me inquietaba ese asunto de construir “La Verdad” con mayúsculas a partir de un universo de datos estadísticos agregados que no permitían construir hipótesis explicativas o decantarme por una perspectiva que reconociera el papel de las narrativas y los relatos como múltiples versiones de los hechos y que se enfrentaría igualmente, al problema de la recopilación, análisis y contraste de los mismos para establecer patrones. Lo anterior implicó reconocer que por una parte, es imposible construir “la Verdad” con mayúsculas y por otra parte, se hace necesario aceptar que “las verdades” que buscamos emergen solo en la interconexión de estas múltiples versiones de los hechos contrastadas con información sobre los elementos objetivos que interactúan en los mismos y que pueden ser rastreadas en los millones de datos que se recogen diariamente a través de distintos sistemas de información.

En este momento la complejidad de la tarea comenzaba a desbordarme. Para esa época tuve la suerte de encontrarme con la voz de León Valencia, quien venía haciendo la tarea desde hace mucho tiempo y con la ayuda de un equipo interdisciplinario de 20 investigadores que combinaron los poderes de las ciencias humanas, las ciencias de comunicación y el periodismo de datos. Con la comunidad lista para el juego nos aliamos en la aventura de desarrollar un sistema de información.

Desarrollamos un modelo conceptual que hace posible el acceso a información pública y la construcción de bases de datos nuevas, con información recopilada de diferentes fuentes, para responder a una pregunta que urge en el postacuerdo y en el contexto de justicia transicional ¿Cómo construir análisis de contexto sobre crímenes de sistema ocurridos en el conflicto armado? Los datos permiten contar una historia en un gráfico, representar dinámicas de poblamiento, economías criminales o procesos de control territorial, pero sus formatos habituales en tablas de Excel requieren cavar, relacionar y traducir sus mensajes. Para lograr hacer que hablen los datos hay que modelar el fenómeno complejo con sus distintos elementos, o en otras palabras hay que dibujar un mapa conceptual, una red semántica que permita identificar sus relaciones. El modelo conceptual que desarrollamos conceptualizó los elementos y las relaciones como se muestra en el diagrama 1:

Diagrama 1. Modelo conceptual. Sistema de información para el análisis de contexto sobre crímenes de sistema.

Fuente: elaboración propia Fundación Paz y Reconciliación -Pares


El modelo conceptual contribuye a la construcción de verdad histórica y judicial, ya que; les posibilita a los usuarios finales reconstruir las condiciones de modo, tiempo y lugar que confluyen en la comisión de los HECHOS VICTIMIZANTES (crímenes de sistema) en los que interactúan, AGENTES (personas u organizaciones); tanto participantes directos de las hostilidades  y otros tipos como terceros o agentes del estado. Esta interacción se produce mediante la comisión de un conjunto de actividades en las que se emplean diversos medios logísticos y se despliegan diversos patrones de macro y micro criminalidad y victimización que son desarrollados en CONTEXTOS (un área geográfica, un período de tiempo y unos factores estructurales de vulnerabilidad). Con esta funcionalidad el modelo se constituye como una herramienta digital tanto para jueces, fiscales como investigadores, representantes de víctimas y comisionados podrán basarse en el análisis de casos emblemáticos o cargar en el sistema casos y hechos específicos que están por esclarecerse en procesos de verdad y judicialización.

La resistencia narrativa la hemos construido usando las estrategias y técnicas propias de la revolución digital, combinando los saberes de múltiples disciplinas para crear herramientas automatizadas y metodologías que permitan capturar, relacionar, procesar y analizar la información para reconstruir las circunstancias de modo, tiempo y lugar que operan en la comisión de los hechos victimizantes y los agentes que interactúan en los mismos.

Las herramientas con las que se cuenta en la actualidad para la Justicia Transicional (sistemas de información y bases de datos) se encuentran limitadas para construir análisis de contexto e identificar patrones; por dos razones: En primer lugar, frente a la información semiestructurada, almacenada en bases de datos, esta se encuentra fragmentada y a pesar de los esfuerzos institucionales, aún se mantienen bajos niveles de interoperabilidad. A lo sumo es posible acceder a datos agregados para establecer análisis estadísticos.  En segundo lugar, frente a la información no estructurada compuesta por declaraciones, sentencias y versiones libres, entre otros, no existen en el país sistemas de información que permitan capturar, procesar y contrastar este tipo de documentos semi automáticamente.

Con el modelo conceptual y el sistema que tenemos entre manos creemos poder solucionar estos problemas porque:

  1. El modelo permite construir cartografías sobre las dinámicas de los hechos victimizantes y georreferenciar los territorios a nivel micro territorial a partir del cruce de fuentes estructuradas como las bases de datos del IGAC y fuentes no estructuradas como los relatos compilados en el informe del Centro Nacional de Memoria Histórica. Este es uno de los mapas que produjimos para analizar el caso de la masacre de Bahía Portete, en próximas publicaciones ampliaremos la información sobre las ventajas de construir este tipo de georreferenciación:

Mapa 1. reconstrucción de la localización detallada de los Hechos Victimizantes ocurridos en el caso de la Masacre de Bahía Portete.

Fuente: elaboración propia


  1. El modelo hace posible reconstruir las redes de relaciones de los distintos agentes y organizaciones que interactúan en los hechos y esto permite identificar recurrencias, patrones, alcance e identificar las agrupaciones de distintos actores e intereses en torno a ciertas variables. Como ejemplo de esto presentamos uno de los grafos desarrollados usando las categorías de análisis del modelo conceptual para modelar un fragmento de las redes que interactuaron en la masacre de Bahía Portete solo en torno a uno de los victimarios, Arnulfo Sánchez: Paramilitar, comandante del frente de contrainsurgencia Wayuu. En compañía de 50 paramilitares y uno que otro militar “estatal” o agente del estado, que los dejo transportarse libremente por la zona y no parar en retenes, etc. Entraron a la comunidad Wayuu cuando las mujeres estaban solas y fueron casa por casa realizando lo que hemos conceptualizado como “masacre difusa”. Concepto que por lo demás no existe en el código penal. Es decir que en Colombia aún se siguen juzgando las masacres como homicidios, en el mejor de los casos agravados… pero eso sí. En la sentencia no aparece en ningún lado la referencia a que la tortura fue específicamente sobre mujeres, lideresas de la comunidad. Además, la tortura fue de tipo sexual, atacando sus órganos genitales y mutilándolas. Por otra parte, los cuerpos fueron expuestos, humillados y empalados públicamente para socavar el centro de esta comunidad: la mujer y su sagrada relación con el entierro de los muertos. ¿cómo modelar los niveles de análisis superpuestos en esta narrativa?, las redes semánticas presentan un panorama prometedor. Después de todo que es el lenguaje sino un modelo, una simulación de las distintas relaciones entre entidades, agentes y escenarios (eventos).

Red 1. Fragmento de complejidad 1 en torno al nodo (agente < (persona: “Arnulfo Sánchez”).

Caso masacre Bahía Portete.

Fuente: elaboración propia


La complejidad 1 contiene:

  1. 19 relaciones.

  2. 8 agentes: 2 organizaciones y 16 personas diferenciadas en víctimas, perpetrador grupo paramilitar, perpetradores militares de las fuerzas armadas de Colombia, colaboradores, autores intelectuales y financiadores.

A esta red se le puede superponer la capa de contexto territorial para identificar, por ejemplo; cómo estaba concentrada la tierra para ese periodo, cuáles eran las matrículas inmobiliarias, entre muchos otros atributos definidos en el modelo conceptual de datos geográficos.

En suma, a las estrategias de resistencia para reescribir la historia del conflicto armado en Colombia, se suma este modelo conceptual que diseñamos en la Fundación.

bottom of page