Lineamientos para la Anonimización de Microdatos
Gobernación de Casanare — Dirección Departamental de Planeación
Sistema de Información Estadística y Geoespacial – INFOCAS
Yopal, 2025
Introducción
La Gobernación de Casanare, en cumplimiento de los principios constitucionales de protección de la intimidad, la transparencia y la responsabilidad institucional en el manejo de datos, establece los presentes Lineamientos para la Anonimización de los Microdatos que se producen y difunden en el departamento, en el marco del Sistema de Información Estadística y Geoespacial – INFOCAS.
Estos lineamientos buscan garantizar que toda información estadística producida por las dependencias departamentales y entidades aliadas sea gestionada de manera responsable, preservando la confidencialidad de las fuentes, la integridad de los datos y la utilidad estadística de la información anonimizada.
Su aplicación permitirá dar cumplimiento a la Ley Estatutaria 1581 de 2012 (Protección de Datos Personales), la Ley 1712 de 2014 (Transparencia y Acceso a la Información Pública), la Ley 1266 de 2008 (Habeas Data), y al Código Nacional de Buenas Prácticas para las Estadísticas Oficiales del DANE, en especial su principio 5 sobre la confidencialidad estadística.
Estos lineamientos constituyen una herramienta técnica y metodológica para orientar a las secretarías, direcciones y oficinas de la Gobernación de Casanare en la correcta aplicación de los procesos de anonimización de los microdatos derivados de registros administrativos, operaciones estadísticas, censos y encuestas institucionales.
Conceptos Clave
Para la correcta implementación de estos lineamientos, es fundamental comprender los siguientes conceptos técnicos y jurídicos que sustentan el proceso de anonimización de microdatos:
Anonimización de microdatos
Proceso técnico mediante el cual los datos individuales de una unidad de observación son transformados de modo que no sea posible identificar a la persona, hogar, establecimiento o entidad de origen, preservando las propiedades estadísticas de la información.
Microdato
Dato individual sobre las características de las unidades de estudio contenidas en una base de datos (personas, hogares, empresas, predios, etc.).
Datos personales
Información asociada a una persona natural que permite su identificación directa o indirecta (nombre, número de documento, dirección, correo, teléfono, entre otros).
Datos sensibles
Aquellos que afectan la intimidad del titular o pueden generar discriminación (origen étnico, orientación sexual, creencias religiosas, salud, entre otros).
Pseudoidentificadores
Variables que, al combinarse, pueden conducir a la identificación indirecta de una persona o unidad de observación (por ejemplo, nivel educativo + grupo étnico + municipio).
Escenario de riesgo
Análisis de las variables sensibles o combinaciones de variables que podrían individualizar registros o revelar información confidencial.
Propiedades Esenciales de la Base Anonimizada
La anonimización exitosa no solo protege la identidad de las fuentes, sino que también preserva el valor estadístico y analítico de la información. Toda base de datos anonimizada debe conservar las siguientes propiedades fundamentales para garantizar su utilidad en la toma de decisiones y el análisis institucional:
01
Tendencias y comportamientos temporales
Las series históricas y evoluciones en el tiempo deben mantenerse para permitir análisis de tendencias y proyecciones estratégicas.
02
Medidas estadísticas significativas
Los promedios, proporciones, tasas y otros indicadores clave deben preservar su precisión y representatividad poblacional.
03
Coherencia territorial y temática
Los niveles de desagregación geográfica y temática permitidos deben mantener consistencia con los objetivos del estudio y las necesidades de política pública.
04
Relaciones entre variables
Las correlaciones, patrones de asociación y relaciones estadísticas relevantes entre variables deben permanecer intactas para análisis multivariado.

Principio fundamental: La anonimización debe encontrar el equilibrio óptimo entre la protección de la privacidad y la preservación de la utilidad analítica de los datos.
Técnicas de Anonimización
Existen dos grandes categorías de técnicas de anonimización que pueden aplicarse según el tipo de datos, el nivel de riesgo identificado y los objetivos estadísticos perseguidos. A continuación se detallan ambas categorías con sus respectivos métodos:
A. Técnicas basadas en la no perturbación de datos
Estas técnicas modifican la estructura de los datos sin alterar los valores reales, reduciendo el nivel de detalle de la información:
  • Eliminación de variables identificadoras: Supresión de nombres, documentos de identidad, direcciones exactas y otros datos directamente identificables.
  • Recodificación o agrupación de categorías: Consolidación de categorías detalladas en grupos más amplios (ejemplo: edades específicas a rangos etarios).
  • Supresión local o codificación de valores extremos: Ocultamiento de registros únicos o atípicos que faciliten la identificación.
  • Reducción de nivel de desagregación territorial o temática: Presentación de datos a nivel departamental en lugar de municipal cuando el riesgo lo amerite.
B. Técnicas basadas en la perturbación de datos
Estas técnicas modifican los valores originales de manera controlada para dificultar la identificación sin comprometer la validez estadística:
  • Microagregación: Sustitución de valores individuales por promedios de pequeños grupos homogéneos.
  • Adición de ruido aleatorio: Incorporación de variabilidad controlada a los valores numéricos preservando distribuciones.
  • Intercambio de datos entre registros: Permutación de valores de variables sensibles entre registros similares.
  • Redondeo de valores numéricos: Aproximación de cifras a múltiplos predefinidos para reducir precisión.
  • Reajuste de factores de expansión: Modificación de ponderadores en datos muestrales para proteger información individual.
Proceso de Anonimización: Etapas Fundamentales
La anonimización de microdatos requiere un enfoque sistemático y riguroso que garantice tanto la protección de datos personales como la preservación de la calidad estadística. El proceso se estructura en seis etapas secuenciales que deben ejecutarse con precisión metodológica:
1. Requerimientos
Conformar un equipo interdisciplinario (temático, estadístico, tecnológico y jurídico). Garantizar infraestructura tecnológica segura y herramientas estadísticas (R, SPSS, Stata, etc.). Documentar el proceso y establecer protocolos de acceso controlado.
2. Análisis de riesgos
Identificar variables sensibles, personales y pseudoidentificadoras. Evaluar combinaciones con riesgo de individualización. Definir niveles de desagregación y variables "importantes" que deben conservar su valor analítico.
3. Selección de técnicas
Escoger las técnicas adecuadas según tipo de variable, nivel de riesgo y propósito estadístico. Documentar en un Informe de Anonimización las variables afectadas, riesgos, métodos aplicados y registros involucrados.
4. Análisis de viabilidad
Verificar cumplimiento normativo y metodológico. Evaluar la utilidad de la base anonimizada para los usuarios institucionales y públicos.
5. Aplicación de técnicas
Ejecutar el proceso en una base espejo para garantizar trazabilidad. Respetar las propiedades estadísticas definidas y validar los resultados.
6. Evaluación de resultados
Verificar que los riesgos hayan sido mitigados. Confirmar que las propiedades estadísticas se mantengan. Emitir concepto técnico de aprobación para difusión pública o uso interno controlado.
Análisis de Riesgos y Selección de Técnicas
El análisis de riesgos constituye una etapa crítica del proceso de anonimización, ya que determina qué variables y combinaciones representan amenazas potenciales a la confidencialidad de los datos. Esta evaluación requiere un conocimiento profundo del contexto territorial, las características poblacionales de Casanare y las particularidades de cada operación estadística.
Identificación de variables de riesgo
Durante esta fase, el equipo técnico debe examinar exhaustivamente la base de datos para detectar:
Variables directamente identificadoras
Nombres completos, números de documento, direcciones exactas, números telefónicos, correos electrónicos y cualquier otro dato que permita la identificación inmediata de la unidad de observación.
Variables indirectamente identificadoras
Combinaciones de edad, sexo, municipio de residencia, nivel educativo, ocupación u otras características que, al cruzarse, puedan conducir a la individualización de registros, especialmente en poblaciones pequeñas.
Variables sensibles
Datos relacionados con salud, origen étnico, orientación sexual, creencias religiosas, afiliación política o cualquier información que pueda generar discriminación o afectar la intimidad del titular.
Evaluación de escenarios de riesgo en contexto territorial
En departamentos como Casanare, con municipios de poblaciones pequeñas y características sociodemográficas particulares (presencia de comunidades indígenas, zonas rurales dispersas, actividad petrolera concentrada), es fundamental considerar que la simple combinación de variables aparentemente inocuas puede facilitar la identificación. Por ejemplo, la combinación "mujer + profesional de la salud + municipio rural + pertenencia étnica" podría reducir drásticamente el universo de posibles individuos.
El análisis de riesgos debe contemplar no solo la información contenida en la base de datos, sino también el conocimiento contextual y las fuentes externas que podrían cruzarse para intentar una reidentificación.
Roles y Responsabilidades Institucionales
La implementación exitosa de estos lineamientos requiere la participación coordinada de diferentes actores institucionales, cada uno con responsabilidades claramente definidas dentro del ecosistema de gestión de datos del departamento de Casanare:
Gobernación de Casanare – Dirección de Planeación
Como entidad rectora del proceso estadístico departamental, tiene las siguientes responsabilidades:
  • Coordinar la implementación y actualización de los lineamientos de anonimización
  • Diseñar y ejecutar programas de capacitación para funcionarios
  • Supervisar técnicamente los procesos de anonimización
  • Emitir conceptos técnicos sobre la viabilidad de difusión de bases de datos
  • Garantizar la armonización con el Plan Estadístico Departamental
Dependencias productoras de información
Las secretarías, direcciones y oficinas que generan información estadística deben:
  • Identificar variables sensibles en sus operaciones estadísticas
  • Aplicar los protocolos de anonimización bajo supervisión técnica
  • Entregar bases de datos verificadas con su respectiva documentación metodológica
  • Garantizar la trazabilidad del proceso desde la captura hasta la anonimización
  • Participar en los procesos de capacitación y actualización normativa
Sistema INFOCAS
Como plataforma central de información estadística y geoespacial, debe:
  • Centralizar y almacenar las bases de datos anonimizadas
  • Disponer la información con las respectivas notas metodológicas
  • Establecer restricciones de uso y niveles de acceso diferenciados
  • Documentar los metadatos de cada operación estadística
  • Facilitar el acceso controlado a investigadores y usuarios autorizados

Trabajo colaborativo: La anonimización efectiva requiere un diálogo permanente entre los equipos temáticos (conocedores del contenido), estadísticos (garantes de la calidad), tecnológicos (ejecutores técnicos) y jurídicos (vigilantes del cumplimiento normativo).
Marco Normativo y Disposiciones Finales
Fundamento constitucional y legal
Los presentes lineamientos se enmarcan en un sólido conjunto normativo que garantiza tanto el derecho fundamental a la intimidad y protección de datos personales, como el principio de transparencia y acceso a la información pública:
  • Constitución Política de Colombia (Artículo 15): Consagra el derecho fundamental a la intimidad personal y familiar y al buen nombre
  • Ley 1266 de 2008: Regula el manejo de la información contenida en bases de datos personales (Habeas Data)
  • Ley 1581 de 2012: Estatutaria de Protección de Datos Personales
  • Ley 1712 de 2014: Ley de Transparencia y Acceso a la Información Pública
  • Decreto 1743 de 2016: Reglamenta aspectos relacionados con los registros administrativos y las estadísticas derivadas
Integración al Plan Estadístico Departamental
Los lineamientos aquí establecidos deberán integrarse plenamente a los manuales de procedimientos del Plan Estadístico Departamental 2024–2027 "Oportunidades para Casanare" y ser de obligatorio cumplimiento para toda producción, difusión o reutilización de microdatos en el marco del Sistema Estadístico y Geoespacial INFOCAS.
Todas las dependencias productoras de información deberán incorporar estos lineamientos en sus procedimientos operativos estándar, garantizando que cada operación estadística contemple desde su diseño los requisitos de anonimización y protección de datos personales.
1
2025
Adopción oficial de lineamientos
2
2025-2026
Capacitación y socialización institucional
3
2026-2027
Implementación plena y seguimiento
El cumplimiento de estos lineamientos no solo es una obligación legal, sino un compromiso ético con la ciudadanía casanareña, que confía sus datos a las instituciones departamentales para la construcción de política pública basada en evidencia.
Referencias Bibliográficas
Los presentes lineamientos se fundamentan en un marco técnico, normativo y metodológico ampliamente reconocido a nivel nacional e institucional. A continuación se presentan las fuentes documentales consultadas:
Normatividad nacional
  • Constitución Política de Colombia (Artículo 15 – Derecho a la intimidad)
  • Ley 1266 de 2008 – Ley de Habeas Data
  • Ley 1581 de 2012 – Ley Estatutaria de Protección de Datos Personales
  • Ley 1712 de 2014 – Ley de Transparencia y Acceso a la Información Pública
  • Decreto 1743 de 2016 – Registros administrativos y gestión estadística
Documentos técnicos DANE
  • DANE (2016). Código Nacional de Buenas Prácticas para las Estadísticas Oficiales – Principio 5: Confidencialidad estadística
  • DANE (2018). Guía para la anonimización de bases de datos en el Sistema Estadístico Nacional (SEN)
Documentos institucionales Casanare
  • Gobernación de Casanare (2025). Plan Estadístico Departamental 2024–2027 "Oportunidades para Casanare"
  • Sistema INFOCAS (2025). Lineamientos Técnicos de Gestión de Datos

Compromiso con Casanare
Estos lineamientos representan un paso fundamental en la consolidación de un sistema estadístico departamental robusto, transparente y respetuoso de los derechos fundamentales. La correcta implementación de estos protocolos permitirá a la Gobernación de Casanare posicionarse como referente regional en la gestión responsable de datos, contribuyendo a la toma de decisiones informadas y a la construcción de políticas públicas basadas en evidencia que beneficien a toda la ciudadanía casanareña.
Dirección Departamental de Planeación
Sistema de Información Estadística y Geoespacial – INFOCAS
Yopal, Casanare – 2025