¿Por qué Leonardo Da Vinci?

Algunas reflexiones sobre el Censo 2005 en Colombia
Ernesto Rojas Morales

El Censo General 2005: Un proyecto con enfoque sistémico
Luis Hernando Páez Carrero

La Nueva Estadística
Pedro José Fernández

Proyecto Certificación de Calidad de la Información Básica
Jorge E. Tarazona

Datos dependientes del tiempo
Nicolás Dib

Las caras de la moneda

La Encuesta COCENSAL en el Censo General 2005
Angela Luna Hernández

Afrocolombianos y el Censo 2005
Juan Pablo Estupiñán

Pueblos indígenas de Colombia y su inmersión en el proceso censal
Rafael A. Montero

Estrategia de producción de cartografía básica como contribución a la plataforma de información geográfica de Colombia
Iván Darío Gómez

Racionalización Normativa
Juan Carlos Malagón.

Los sistemas estadísticos en España y la Unión Europea
Pilar Martín-Guzmán

El Modelo EFQM mas allá del ISO 9.000 Andrés Carrión
Fundamentos, programas y retos de la sociedad de la información en Colombia
Santiago Montenegro Trujillo

Estadísticas para los Objetivos del Milenio
José Luis Cervera Ferrri

Prensa - Libros
Jorge Eduardo Estrada

Cine Controversial. Antecedentes siglo XX y filmes polémicos de hoy
Yolima Andrea Díaz

Sudoku
Separata

*Angela Luna Hernández
Muestrista Censo General 2005
Estadística, Universidad Nacional de Colombia
alunah@dane.gov.co
*La autora del artículo participa en el diseño e implementación de la Muestra Cocensal del Censo General 2005, bajo la dirección del Dr. Luis Carlos Gómez, consultor responsable de este componente.

Resumen

En este artículo se presenta la implementación de una encuesta por muestreo, integrada al proyecto Censo General 2005, llevado a cabo por el Departamento Administrativo Nacional de Estadística DANE en Colombia, con el fin de ampliar el temario demográfico incluido en el Censo de Población.

Inicialmente, se hace un resumen de la planeación de una Encuesta de este tipo, que enfatiza en las particularidades del proceso, con base en la documentación y experiencia acumulada, respecto a este tema, por algunos de los institutos oficiales de Estadística. Posteriormente, se detallan los procesos efectuados por el DANE para la exitosa implementación de esta metodología en el año 2005.

Palabras clave

Censo de población, encuesta por muestreo.

Abstract

This article presents the implementation of a survey sampling, integrated to the project “Censo General 2005”, carried out by the National Administrative Department of Statistics DANE by his acronym in Spanish, in Colombia. This survey is used to extend the demographic topic included in the Population Census.

At the beginning, a summary of the planning of this sort of study is presented, emphasizing on the particularities of the process, based on the documentation and experience accumulated on this topic by some of the Official Statistics Offices around the world. Later on, the procedures carried out by DANE for the successful implementation of this methodology in 2005, are detailed.

Keywords

Population census, survey sampling.

1. Introducción

Dentro del proyecto Censo General 2005 llevado a cabo por el DANE en Colombia durante los años 2005 y 2006, se articularon la recolección de información de población y vivienda para todos los residentes en el territorio nacional y la recolección de información correspondiente a los establecimientos económicos y unidades agropecuarias en las zonas rurales del país.

En lo concerniente a la temática de población y vivienda, se llevó a cabo, además de la metodología censal estándar, una encuesta cocensal aplicada a una muestra de viviendas, hogares y personas en cada uno de los 1.120 municipios colombianos.

En este artículo, se hace una breve reseña a los antecedentes nacionales e internacionales de aplicación de esta metodología, y se describen los procedimientos de diseño, implementación y tratamiento de información, en el caso particular del Censo General 2005 en Colombia.

2. Uso de las encuestas cocensales en los censos de población

2.1 Antecedentes

Las encuestas cocensales son una metodología utilizada para averiguar, en forma simultánea con el censo, algunas características adicionales de la población bajo estudio. Para su ejecución, lo usual es desarrollar dos cuestionarios: uno corto que contiene las características básicas que serán indagadas a todos los elementos del universo, y otro más largo que incluye, además, las preguntas adicionales o de ampliación, que se recolectarán solamente para los elementos incluidos en una muestra probabilística1 de viviendas, hogares o personas.

Es frecuente encontrar la aplicación de encuestas cocensales como parte de los censos de población llevados a cabo por los distintos países; esta metodología fue utilizada por Estados Unidos en su censo del año 2000, México en ese mismo año, Brasil en 1991 y en 2000. En particular, se destaca la experiencia acumulada por Statistics Canada, el Instituto de estadísticas oficiales de Canadá, que ha llevado a cabo encuestas cocensales en forma ininterrumpida desde el censo de 1941. Colombia, por su parte, tiene como experiencia más reciente la del censo de 1985.

2.2 Planeación de una encuesta cocensal

Cuando se decide aplicar una encuesta cocensal como parte integral de un censo de población, es necesario responder varias preguntas entre las que se encuentran:

· ¿Cuáles son las variables que es viable medir a través de la encuesta?

¿Qué tipo de parámetros2 se desea estimar?

· ¿Cuáles son los niveles de desagregación temáticos y geográficos para los que se requieren estimaciones precisas?

· ¿Cuál es el diseño de muestreo y la metodología de estimación más apropiadas para este caso?

· ¿Cuáles deben ser los tamaños de muestra o fracciones de muestreo que se apliquen?

Si bien este es el tipo de preguntas que debe hacerse siempre dentro de la planeación de una encuesta por muestreo, es posible que las respuestas para una encuesta corriente y una cocensal sean distintas. Lo particular de las necesidades que una encuesta cocensal debe satisfacer en términos de desagregación temática y geográfica, así como las importantes diferencias en la magnitud y capacidad del operativo de recolección de información y de los procesos de grabación, depuración y manejo de la información que se aplican, hace necesario el diseño de estrategias específicas para cada caso.

A continuación, se abordará la respuesta a cada una de estas preguntas en más detalle, conforme a lo observado en los distintos países que aplican esta metodología.

· Elección de las variables que se incluyen en el cuestionario largo: usualmente se utiliza el cuestionario largo para recolectar ampliaciones de la temática demográfica y no la temática demográfica básica, que se indaga a partir del cuestionario corto. Variables como edad, sexo y parentesco con el jefe del hogar se incluyen en el cuestionario corto, mientras que variables como tenencia de la vivienda, tipo de transporte utilizado para ir al trabajo y a la escuela y equipamiento del hogar se incluyen en el cuestionario largo. Otras variables que pueden ser verificadas y validadas a partir de registros administrativos tales como las relacionadas con migración, nivel educativo, mortalidad y fecundidad, se incluyen en uno u otro cuestionario, dependiendo fundamentalmente del nivel de cobertura y actualización de los registros administrativos disponibles.

· Tipo de parámetros que han de ser estimados: en el caso de una encuesta cocensal, la mayor parte de los parámetros que se van a estimar se expresan en términos de totales o porcentajes. En algunos casos, como en el Censo de Estados Unidos de 2000, se encuentran también algunos promedios, medianas y percentiles.

· Determinación de los niveles de desagregación temáticos y geográficos: un censo es, en muchos casos, la única oportunidad con que cuentan los países para tener información a niveles bajos de agregación geográfica, para zonas que normalmente no son incluidas en los estudios intercensales, o en las cuales los operativos de recolección de información son sumamente costosos. En este sentido, lo corriente es desear estimaciones precisas a niveles de ciudad, municipio o región. Desde el punto de vista temático, es posible también requerir indicadores para dominios de estudio muy pequeños, resultado de combinaciones de edades simples, sexo y otras variables como nivel educativo u ocupación.

· Elección del diseño de muestreo que ha de ser utilizado: debido, en parte, al gran número de dominios de población para los que se desean estimaciones en este caso, lo más corriente es utilizar muestreos estratificados de elementos o de conglomerados de elementos, que pueden ser viviendas, hogares o personas, y donde los estratos están constituidos por las distintas zonas geográficas para las que se requieren estimaciones precisas. Los diseños más frecuentemente empleados en esta práctica pertenecen a la clase denominada Real Time Sampling, o Muestreo en Tiempo Real, donde el más utilizado es el diseño sistemático con una o más réplicas3. Adicionalmente, en algunos países la mayor parte del censo se efectúa por autodiligenciamiento4, mientras que en otros, es recolectada por un gran grupode entrevistadores calificados que recorren todo el territorio nacional visitando una por una las unidades de vivienda. En el primer caso, la selección de la muestra para la encuesta cocensal se hace en oficina, previamente al envío de cuestionarios censales; en el segundo, el entrevistador es capacitado para llevar a cabo la selección de muestra directamente en campo.

· Escogimiento de los procedimientos de estimación: dentro de estos procedimientos utilizados en la práctica se prefieren, por brindar mayor precisión a menor costo, a los estimadores que involucran información auxiliar. En este sentido, las encuestas cocensales cuentan con toda la información recolectada en el cuestionario corto para hacer más precisos los estimadores empleados. Adicionalmente, para efectos de análisis, es deseable que los totales de población y otras variables estimadas a partir de la encuesta cocensal, coincidan con los que pueden obtenerse a partir del cuestionario corto. Al tomar en consideración este par de ítemes, puede verse que los procedimientos de estimación más apropiados para las encuestas cocensales, emplean información auxiliar. Hasta hace algunos años, se usaba la postestratificación completa o los estimadores de regresión; hoy en día, se emplean metodologías de calibración. Como ejemplos concretos, pueden observarse los censos de Canadá y Brasil que han desarrollado estimadores de calibración a la medida de sus necesidades, y el de los Estados Unidos que utiliza calibración con el método Iterative Proportional Fitting (IPF), por su sigla en inglés.

·Cálculo de los tamaños de muestra: al partir del diseño y metodología de estimación escogidos, y de los niveles de precisión mínimos deseables, se pasa al cálculo de los tamaños de muestra o fracciones de muestreo que se van a utilizar. En la mayoría de los casos, se utilizan fórmulas de tamaño de muestra correspondientes a muestreo aleatorio simple, con o sin reemplazamiento y estimadores estándar para proporciones, esto es, sin el uso de información auxiliar para aproximarse a los tamaños de muestra mínimos requeridos. Algunos países utilizan una fracción de muestreo igual para todo el país, tal y como lo hizo Colombia en 1985, en tanto que otros calculan varias fracciones de muestreo, en función del total de población esperado en cada municipio, ciudad o región.

Cuando se contrastan las prácticas utilizadas por cada uno de los países que ha llevado a cabo una encuesta cocensal, pueden observarse similitudes y diferencias. La aplicación de esta metodología responde siempre al mismo tipo de necesidades, lo que introduce similitudes entre los distintos países; en tanto que las principales diferencias se encuentran en: la calidad de los registros administrativos y de estadísticas vitales, que hace necesaria o innecesaria la inclusión de algunas variables; los niveles de cultura estadística del público en general, que hacen viable o inviable la aplicación de un cuestionario autodiligenciado, y la experiencia acumulada a través de sucesivas aplicaciones de la metodología, que va introduciendo mejoras considerables en los procedimientos para el tratamiento de información, especialmente en lo concerniente a la estimación de indicadores a partir de la muestra.

3. Implementación de una muestra cocensal como parte del Censo General 2005

En el caso del Censo General 2005, se decidió ampliar el temario contenido en el componente demográfico, mediante la recolección de información adicional en una muestra cocensal de hogares que se selecciona directamente en campo.

A continuación, se presentan las generalidades de la metodología implementada, en un esquema similar al de la sección 2.2.

3.1 Cuestionarios aplicados

Se diseñaron dos cuestionarios denominados Básico y Ampliado. El primero, aplicado al 100% de las viviendas, hogares y personas residentes en el territorio nacional, contiene, entre otras, las preguntas correspondientes a:

· Tipología de vivienda

· Disponibilidad de servicios públicos

· Emigración internacional

· Defunciones de los últimos doce meses, por edad y sexo

· Edad

· Sexo

· Parentesco con el jefe del hogar

· Pertenencia étnica y lengua

· Migración

· Alfabetismo

· Limitaciones permanentes

· Nivel educativo y asistencia escolar

· Actividad la semana anterior al censo

· Fecundidad y mortalidad infantil y juvenil

· Estado conyugal

· No consumo de alimentos por falta de dinero

El segundo cuestionario, aplicado a una muestra de aproximadamente el 15% de los hogares existentes, contiene preguntas concernientes a:

· Caracterización de la vivienda: material de paredes y pisos, eliminación de basuras, tenencia de sanitario, cantidad de baños con regadera, tenencia de un lugar en la vivienda destinado exclusivamente para la cocina.

· Tipo de tenencia de la vivienda

· Disponibilidad de cuartos y exclusividad de los servicios sanitarios

· Fuente del agua para consumo humano y tipo de combustible usado para cocinar

· Equipamiento del hogar

· Pobreza subjetiva

· Mayor aportante en dinero para el sostenimiento del hogar

· Tenencia de seguridad social y afiliaciones al Sistema de Pensiones

· Cantidad de libros leídos en los últimos doce meses, causales de inasistencia escolar

· Tiempos de ida a la institución educativa y al trabajo

· Alfabetismo informático

· Posición ocupacional

· Realización de actividades económicas secundarias

· Idiomas que habla

3.2 Parámetros que han de ser estimados

La encuesta cocensal del Censo General 2005 estima, en su mayoría, totales o porcentajes para las categorías de las variables en estudio. No obstante, puede ser utilizada para la estimación de indicadores más complejos como el Índice de Necesidades Básicas Insatisfechas (NBI) u otros indicadores socioeconómicos.

3.3 Niveles mínimos de desagregación requeridos para las estimaciones

Como se menciona en la sección 2.2, existen muchos casos en los que un censo representa la única oportunidad con que se cuenta para obtener información de todas y cada una de las unidades políticas y administrativas en que está dividida una nación. En este sentido, si bien Colombia cuenta con un sistema medianamente organizado y completo de estadísticas vitales y administrativas, hay zonas del país que no se incluyen frecuentemente como parte de los estudios intercensales. Frente a este panorama, el Censo General 2005 se presenta como la herramienta para llenar vacíos de información diagnóstica y brindarle a las unidades administrativas y de planeación locales y nacionales, información estratégica para la planeación de su desarrollo y definición de líneas de base para la formulación de política pública.

A la luz de este planteamiento, se determina que la encuesta cocensal debe estar en capacidad de brindar estimaciones confiables y precisas a los niveles nacional, departamental, municipal y, para algunas variables de especial interés, de cabecera y resto dentro de un municipio dado. De igual manera, para las grandes ciudades que tienen subdivisiones en localidades o comunas, como es el caso de Bogotá, Medellín, Cali o Barranquilla, debe ser posible la desagregación de estimaciones a los niveles de comuna o grupo de comunas con 150.000 habitantes o más.

3.4 Elección del diseño de muestreo que ha de ser utilizado

Para la elección del diseño de muestreo que se debe implementar en la encuesta cocensal, se revisó la bibliografía y la experiencia nacional e internacional existente, en cuanto a la aplicación de esta metodología. Como se señala en la sección 2.2, el esquema probabilístico más frecuentemente utilizado en las encuestas cocensales es el estratificado, sistemático de elementos, con fracciones de muestreo que pueden variar de estrato a estrato, conforme a la cantidad de habitantes esperada.

Como resultado de la revisión, se encontró que la selección de un diseño sistemático es bastante simple, eficiente en términos de precisión y costos y tiene procedimientos de estimación relativamente sencillos; sin embargo, el proceso de selección de muestra efectuada en campo por el entrevistador es susceptible de sesgos de selección. Estos sesgos se producen cuando un entrevistador, en forma deliberada, decide modificar la rutina de “salto” que le ha sido asignada para, por ejemplo, incluir hogares con un menor número de miembros o que parecen más receptivos a la aplicación del cuestionario largo. Si este evento se presenta con una cierta frecuencia, es posible que las características de la población que se está captando a través de la encuesta, difieran en forma importante de las que tiene la población general, lo que conduce a estimaciones sesgadas, con poca validez y utilidad práctica5.

En el caso colombiano, se decidió mantener la estratificación a los niveles de cabecera y resto para cada uno de los 1.098 municipios del país y aprovechar el uso de computadores de mano o Dispositivos Móviles de Captura (DMC) de información para implementar una selección de muestra automática que no sea responsabilidad del entrevistador. En virtud de esta nueva tecnología fue posible llevar a cabo la selección de una muestra de hogares utilizando el diseño Bernoulli6, en cada una de las cabeceras y restos municipales, con fracciones de muestreo determinadas en función del total de población esperado en cada cabecera o resto, para los municipios pequeños o medianos, así como a nivel de comuna en las grandes ciudades. Estas fracciones son diferenciales entre municipios y optimizan la inversión de recursos en términos de precisión, así como los costos asociados a la recolección de información.

En la práctica, la aplicación del cuestionario ampliado es un evento aleatorio que se produce con mayor frecuencia en las cabeceras, restos municipales o comunas de baja población y las cuales no están bajo control del entrevistador, y así disminuir en forma sustancial, el riesgo de incurrir en sesgos de selección. El proceso de muestreo es manejado única y exclusivamente por el DMC, que cuando se introduce la información de un nuevo hogar, lleva a cabo la rutina requerida y suministra al entrevistador un cuestionario largo o corto, según sea el caso.

Para hacer operativo este esquema, se programó y probó la rutina como parte del cuestionario digital instalado en cada uno de los dispositivos de captura. Se garantizó que las fracciones de muestreo aplicadas fuesen las correspondientes, añadiendo este valor como un atributo más de cada una de las áreas geográficas cargadas en la cartografía digital del municipio.

Si bien la unidad de selección empleada es el hogar, se conformaron las muestras de viviendas y personas necesarias para la aplicación del cuestionario largo, como sigue: se determina que una vivienda es seleccionada si al menos uno de los hogares que la habitan lo es y que todos los miembros de un hogar seleccionado, también lo son.

La aplicación de este diseño simplifica en forma importante las rutinas de trabajo operativo por cuanto no se requiere un enlistamiento previo de los hogares, lo que garantiza la oportunidad en la entrevista, y porque una gran manzana en la zona urbana o un área densamente poblada en la zona rural, pueden ser entrevistadas por uno o más encuestadores sin que se requiera ninguna modificación en los procedimientos de muestreo y estimación. De igual manera, la estructura de probabilidad introducida por este diseño significa una disminución en el nivel de complejidad necesario para la estimación de indicadores y sus errores de muestreo asociados a distintos niveles de agregación, con respecto a lo requerido para un diseño sistemático.

Adicionalmente, la realización del censo en más de un día, conjuntamente con la metodología implementada, permite fácilmente la corrección de las fracciones de muestreo cuando una cabecera o zona rural resulta ostensiblemente menor o mayormente poblada de lo previsto. En este caso, sólo se requiere enviar al municipio una actualización de la cartografía digital correspondiente, modificando las fracciones de muestreo para las áreas que aún no han sido censadas, sin que esto comprometa la validez de las estimaciones, siempre y cuando se identifique claramente cuál fue la fracción de muestreo utilizada con cada hogar y se utilice ésta, como parte de los procedimientos de estimación. Si bien dentro del operativo censal no fue necesario llevar a cabo este tipo de correcciones, la fracción de muestreo empleada hace parte de las variables de control que acompañan a cada registro almacenado en el dispositivo.

Cabe resaltar que, en las zonas más apartadas del país, en donde por razones de seguridad, dificultades para el desplazamiento o inconvenientes con la conexión a energía eléctrica, se llevó a cabo el censo utilizando cuestionarios de papel, y se aplicó el cuestionario largo.

3.5 Cálculo de tamaños de muestra y precisión esperada

Para el cálculo de tamaños de muestra se utilizó, como es usual en estos casos, la fórmula clásica del Muestreo Aleatorio Simple de elementos sin reemplazamiento a nivel de cada municipio, previendo la estimación de características con el 10% o más de presencia en la población, con un error de muestreo del 7% o menos y un 95% de confianza.

En la ecuación (1), n corresponde al tamaño de muestra de hogares mínimo calculado para el municipio, N es la cantidad de hogares prevista en ese municipio, P equivale a 0,1, Q a 0,9, y eem, el error estándar de muestreo, a 0,035.

Ahora bien, a partir de la ecuación (1) puede verse que, para un diseño de elementos, un mismo parámetro a estimar y bajo el esquema de estimación supuesto, las fracciones de muestreo que se requieren para obtener un cierto nivel de precisión, tienden a reducirse rápidamente en la medida en que se incrementa el universo del cual se selecciona la muestra. Como ejemplo se presenta el gráfico 1 en donde se ha calculado el tamaño de muestra mínimo necesario para estimar una característica presente en el 10% de la población, con un error de muestreo del 7%, para distintos tamaños de universo.

Gráfico 1
Ejemplo de fracciones de muestreo requeridas para la estimación de P = 0,1, con un eem de 0,07 y distintos tamaños de universo

En el ejemplo, para la estimación de esta proporción, con un eem de 0,07, en un universo de 1.000 hogares, se requiere seleccionar como muestra aproximadamente el 65% de los elementos, esto es 650 hogares. Sin embargo, cuando la misma medición se lleva a cabo en un universo de mayor tamaño, 20.000 hogares por ejemplo, la fracción de muestreo se reduce a menos del 10%, con un tamaño de muestra alrededor de 1.700 hogares.

Por esta razón, fue necesario llevar los cálculos de tamaño de muestra para cada uno de los municipios, con base en su población esperada. Las fracciones de muestreo finales aplicadas oscilan entre el 100% para municipios con menos de 2.700 habitantes, y el 5% o 6%, en las grandes ciudades.

Para la distribución de este tamaño de muestra entre la cabecera y resto de cada municipio, se utilizó una rutina iterativa, buscando errores de muestreo similares para ambas divisiones. En el caso de grandes ciudades que requieren desagregaciones a nivel de comuna, se llevó a cabo un cálculo de tamaño de muestra independiente en cada comuna. De esta manera, una ciudad como Bogotá, con cerca de dos millones de hogares, que requeriría de una fracción de muestreo de menos del 2% si no se esperasen desagregaciones al nivel de localidad, obtiene una fracción de muestreo global cercana al 8%, con grandes diferencias entre localidades densamente pobladas como Usme o Suba, y localidades con baja población, como La Candelaria.

3.2 Escogimiento de los procedimientos de estimación

Se requiere que los procedimientos de estimación de indicadores a partir de la encuesta cocensal del Censo General 2005, cumplan con las siguientes condiciones:

· Proporcionen estimaciones válidas y precisas para los parámetros de interés.

· Para algunas de las variables demográficas incluidas en el cuestionario corto, como edad y sexo, ajusten las estructuras de la muestra a las observadas en el censo básico, a distintos niveles de agregación geográfica.

· Se compongan de procedimientos sencillos para que pueda ser utilizada por los distintos usuarios e implementada en aplicativos de consulta dinámica.

Con base en estos requisitos, se llevó a cabo una revisión de la documentación disponible a nivel nacional e internacional. Producto de esta revisión, considerando lo descrito en la sección 2.2 respecto a este tema y la viabilidad operativa de los procedimientos disponibles, se optó por utilizar estimadores de calibración como los propuestos por Särndal y Deville (1992). Esta metodología fue implementada en lenguaje SAS por el Institut National de la Statistique et Études Économiques INSEÉ en Francia, en la Macro denominada CALMAR, que está a disposición de los usuarios a través del portal del INSEÉ en Internet.

Los estimadores elegidos tienen amplia aplicación a nivel internacional, no sólo para las muestras cocensales, como en el último censo de Estados Unidos, Canadá o Brasil; también se utilizan para llevar a cabo el ajuste por no respuesta, para comparar encuestas a lo largo del tiempo o entre distintos países, o para estimar siempre que se disponga de información auxiliar de buena calidad, como es el caso de la mayoría de las encuestas económicas que llevan a cabo los institutos oficiales de Estadística.

Los estimadores de calibración son utilizados en las encuestas de fuerza laboral de España y otros países de la Unión Europea, son empleados por el INSEÉ en la mayoría de sus encuestas económicas y para llevar a cabo correcciones por no respuesta; también son muy aplicados en los institutos de Estadística de Bélgica y Holanda, quienes tienen sus propias versiones denominadas G-Calib y Bascula, implementadas en sintaxis SPSS y lenguaje Delphi, respectivamente.

Para su aplicación, es muy importante identificar las variables, los cruces y los niveles de agregación geográfica o temática, para los que se requiere una total concordancia entre los totales obtenidos a partir del censo básico y los que se estiman desde la muestra. Luego, debe verificarse la viabilidad de los modelos de calibración en cada uno de los casos, y llevar a cabo los ajustes que sean necesarios. Finalmente, se recomienda llevar a cabo un proceso de evaluación del mecanismo de calibración, similar a los implementados en el Censo de Canadá (2001) o Brasil (2003). En el caso del Censo General 2005, actualmente se está en el proceso de construcción y evaluación de los modelos de calibración.

Como nota final, debe resaltarse que los resultados finales que el DANE entregará para las variables estudiadas a través de la encuesta, estarán acompañadas de sus respectivas medidas de calidad, con el objetivo de familiarizar a los distintos usuarios con el uso de los errores de muestreo y brindar a los analistas las herramientas necesarias para la correcta interpretación de los datos estadísticos obtenidos.

1Por muestra probabilística se entiende la seleccionada bajo un esquema probabilístico dentro del cual todos los elementos del universo de interés tienen una probabilidad conocida y mayor que cero de ser incluidos en la muestra.

2En la literatura estadística, se le da el nombre de parámetros a los valores calculados a partir de la información de la población, que tienen algún tipo de interés analítico. Entre los más conocidos se encuentran los totales, los promedios, los porcentajes y las tasas, variaciones o razones en general. A través de una muestra probabilística, se pretende obtener estimaciones precisas y confiables de los parámetros de la población.

3En términos generales, el diseño sistemático con una réplica es aquel en el cual los elementos de la población se dividen en x grupos de tamaño n y se elige aleatoriamente y con igual probabilidad un número entre 1 y n. Si se denota p el número escogido, la muestra seleccionada está compuesta por los elementos {p, n+p, 2n+p, 3n+p, …, (x-1)n +p}; esto es, el primer elemento de la muestra es el correspondiente al número p y los subsiguientes se eligen dando un “salto” de tamaño n.

4En países como Estados Unidos y Canadá, la mayor parte de la información se recolecta enviando el cuestionario censal por correo a cada uno de los hogares para su diligenciamiento y es devuelto por vía correo certificado.

5Es importante resaltar que este problema no se presenta en los casos de cuestionarios autodiligenciados, dado que la selección se lleva a cabo en oficina, antes del envío de los cuestionarios por correo.

6El diseño Bernoulli, junto con el Poisson y el Sistemático, hace parte de los diseños conocidos como Real Time Sampling, por cuanto no requiere de marcos de muestreo previo a la selección. Para su implementación, se determina una fracción de muestreo que hay que seleccionar y se genera, para cada uno de los individuos de la población, un número aleatorio con distribución uniforme entre 0 y 1. Un individuo entra a formar parte de la muestra si el número aleatorio que le corresponde es menor o igual que la fracción de muestreo estipulada.

Bibliografía

Instituto Brasileiro de Geografia E Estatística IBGE. Censo Demográfico 2000. Famílias e domicílios. Resultados da Amostra. 2003.

Instituto Nacional de Estadística, Geografía, e Informática INEGI. Síntesis metodológica del XII Censo General de Población y Vivienda 2000. México, julio de 2003.

Särndal, C.E., Deville, J.C.. Calibration estimators in survey sampling. In: Journal of the American Statistical Association. Vol 87, Nro. 418; julio de 1992

Statistics Canada. 2001 Census Technical Report. Sampling and Weighting. Canadá.