Introducción El Censo General 2005 realizado en Colombia ha hecho importantes innovaciones que han permitido mejorar la calidad de la información recolectada, reducir los costos y lograr una mayor oportunidad en la publicación de los resultados. La actualización de la cartografía; la introducción de nuevas tecnologías para el levantamiento de la información; la implantación de nuevos modelos de gestión de personal y el desarrollo de programas automatizados de edición e imputación, han resultado en una mejora considerable de la calidad y pertinencia de la información sobre la población colombiana.
Los grandes cambios experimentados en Colombia desde la realización del último censo, especialmente la emigración de muchos colombianos, han producido una población muy diferente a la prevista tanto en sus niveles como en su estructura. A pesar de la gran precisión que se pueda lograr en la operación censal, es necesario hacer posteriormente un proceso de evaluación de los resultados, especialmente en lo que se refiere al grado de omisión de los diferentes grupos de edad para los dos sexos, tanto para el total del país como para los departamentos y municipios.
En Colombia, y en otros países de América Latina, históricamente para la evaluación y ajuste de los censos se han empleado de manera fundamental dos procesos metodológicos: la encuesta postcensal de cobertura1 y el método de conciliación demográfica.
La encuesta postcensal de cobertura es un método directo que consiste en interrogar de manera independiente una parte de la población, mediante una encuesta por muestreo, con el fin de estimar la población omitida o duplicada en el operativo censal. Aunque en principio la encuesta puede permitir estimativos de los porcentajes de omisión, en la práctica los recursos disponibles no permiten realizar una encuesta que produzca resultados significativos desde el punto de vista estadístico a nivel municipal. El análisis de diferentes experiencias en Latinoamérica ha dejado dudas sobre si los costos de las encuestas de cobertura son superiores a los beneficios alcanzados2, particularmente cuando se tiene en cuenta las necesidades de lograr estimativos confiables de la cobertura en los diferentes municipios. Esta es una de las razones por las cuales se ha descartado la utilización de la encuesta postcensal dentro del proceso de evaluación y ajuste del Censo General 2005. El método de conciliación demográfica intercensal, por su parte, es un método científico indirecto que se ha utilizado para evaluar y corregir la información censal respecto al volumen y composición de la población, como complemento de las encuestas postcensales de cobertura. Este método se fundamenta en el análisis del comportamiento de los componentes demográficos: fecundidad, mortalidad y migración, presentes en el censo e identificación de las tendencias de la dinámica demográfica.
Durante la fase de diseño se estudiaron los costos y beneficios de cada uno de estos métodos, llegándose a la conclusión que, debido a su alto costo, era más conveniente utilizar los recursos humano y financiero, requeridos para la realización de una encuesta de cobertura en un proceso de aseguramiento de la calidad de la información, y a culminar el proceso censal con una evaluación y corrección de la población por el método de la Conciliación Demográfica.
A continuación se describe la metodología y los resultados obtenidos en el Proceso de Conciliación Nacional y Departamental. Este proceso complementa el ejercicio realizado en noviembre de 2006 en el cual se hizo una compensación por difícil accesibilidad y por contingencias de transferencia.
1. El Proceso de Conciliación Demográfica
El objetivo básico que se busca con un proceso de conciliación demográfica es evaluar y corregir los niveles y estructuras de la población censada y, por lo tanto, estimar la omisión censal a nivel nacional y departamental por edad y sexo, y la omisión municipal por cabecera y resto.
En su versión más sencilla la conciliación censal consiste en obtener una coherencia entre la información de dos censos y los eventos demográficos: nacimientos, muertes y migración, de tal manera que se cumpla con la ecuación compensadora
Donde Nt es la población en el instante t, a es el tiempo transcurrido entre dos censos, Bt,t+a son los nacimientos ocurridos durante el período intercensal, Dt,t+a son las defunciones ocurridas durante el período intercensal y Mt,t+a son los migrantes netos (inmigrantes menos emigrantes), llegados al país durante el período intercensal. En términos generales, ninguna de estas magnitudes es conocida con certeza y, cuando se utilizan los valores observados para los componentes del cambio demográfico y los niveles de los dos censos que se pueden representar por las variables con una barra sobre las letras se tendrá que
Por lo anterior, puede decirse que el proceso de la conciliación demográfica consiste en obtener los valores “reales” a partir de la información existente en el país.
En los países avanzados existe una gran precisión al estimar los nacimientos y defunciones que tuvieron lugar durante el período intercensal, pues los registros de los hechos vitales tienen una cobertura alta, cercana al cien por ciento. En estos casos se puede suponer que
es decir, que los nacimientos y defunciones observados son iguales a los valores “reales”. En países como Colombia es necesario llegar a la estimación de los nacimientos y defunciones por medio de métodos indirectos, utilizando para ello algunas de las preguntas censales.
Con la excepción de países en donde es necesario registrar el lugar de residencia, la estimación del saldo neto migratorio durante el período intercensal es una de las principales tareas del proceso de conciliación demográfica. Aunque el censo mismo contiene información sobre los inmigrantes y su fecha de llegada al país, lo cual permite calcular el número total de inmigrantes, se debe tener presente que probablemente el cubrimiento censal de los inmigrantes no sea total ya que es posible que los inmigrantes ilegales no sean declarados y además, aun los inmigrantes locales son difíciles de enumerar.
La estimación del número de emigrantes es más difícil pues, aunque en teoría se puede obtener a partir de los datos de inmigrantes en los lugares de destino, en general esto no es práctico ya que los censos no se realizan en la misma fecha. En la estimación de la migración internacional se suele utilizar también información como la de viajeros internacionales.
Una vez calculados los valores “reales” de los tres componentes del cambio, es necesario definir cuáles valores se deben tomar para la población en los dos últimos censos. Existen varias posibilidades. La primera es considerar como válida la población conciliada del censo en el momento t y luego utilizar la ecuación compensadora para obtener el valor de la población en el momento t+a. Otra posibilidad es considerar un estimativo como el obtenido a partir de una encuesta post censal de cobertura en el momento t+a y obtener el valor de la población en el momento t a partir de la ecuación compensadora. Una tercera posibilidad es aprovechar la información del censo realizado en el momento t+a para hacer un nuevo estimativo de la población en el momento t y con los valores de los componentes del cambio aplicar la ecuación compensadora.
En la práctica la conciliación demográfica es mucho más compleja. La población tiene que ser desagregada por sexo, cohortes y lugar de residencia, (cabecera, resto o departamentos). También es necesario revisar varios censos anteriores cuando se requiera contar con una serie de población conciliada de más largo plazo, que sirva para poder tener estimaciones per cápita y que describa, de manera precisa, la distribución por edad y sexo de la población colombiana.
A continuación se presentan con mayor detalle las ecuaciones compensadoras por cohortes que generalizan la presentación anterior. Teniendo en cuenta que el registro de defunciones y de nacimientos es deficiente, la presentación se hace con base en las estimaciones de los parámetros demográficos realizados por métodos indirectos, tal como se explican en los documentos correspondientes. Se presentan de manera explícita las ecuaciones compensadoras por cohortes, tanto para el caso en el que se parte de la población del penúltimo censo y la población del último censo que se busca evaluar y corregir se obtiene a partir de la ecuación compensadora, como en el caso en el que se parte de la población del último censo y la población del penúltimo censo se calcula a partir de la ecuación compensadora. Por facilidad las ecuaciones se presentan para un solo sexo y se supone que se desea calcular la población para 4 períodos quinquenales (de 1985 a 2005).
La ecuación compensadora por cohortes se puede escribir así usando la notación utilizada en Demografía, en la que el subíndice de la izquierda indica la longitud del intervalo de edades y el subíndice de la derecha indica el inicio del intervalo de edades. Por ejemplo, 50Nt+5indica la población de 0 a 4 años en el momento t+5
Para la población menor de 5 años
Para la población de 5 a 75 años
Para la población mayor de 80 años.
Para el caso colombiano las ecuaciones anteriores no se pueden aplicar por cuanto el registro de defunciones no es completo. Por tanto, es necesario estimar el número de defunciones bien sea a partir de un buen conocimiento de la cobertura del registro o, mejor aún, a partir de las relaciones de supervivencia calculadas a partir de las tablas de mortalidad. Si es la probabilidad de que un miembro de la cohorte que tiene entre x y x+5 años pueda sobrevivir 5 años, es la probabilidad de supervivencia de los nacidos en el período t,t+5 y 5Pxt,t+5 es la probabilidad de que una persona mayor de 75 años sobreviva 5 años .Se tendrá entonces que las ecuaciones compensadoras por cohortes se pueden escribir así.
Para la población menor de 5 años
Para la población de 5 a 75 años
Para la población mayor de 80 años.
Más aún, para el caso en el cual la información del registro de nacimientos no es muy confiable y se desconoce el porcentaje de sub registro, se puede calcular el número de nacimientos en el período t,t+5 a partir de las mujeres en edad fértil a mitad del período y las tasas específicas de fecundidad3.
En la práctica, el cálculo de estas ecuaciones compensadoras por cohortes lo realiza un programa de proyecciones como PRODEM, de manera automática y, por lo tanto, no es necesario desarrollar un aplicativo.
Para una retroproyección la ecuación compensadora cuando no se tiene un registro confiable se puede escribir:
Para la población de 0 a 70 años
Para la población de 75 y más
Esta población de 75 y más debe ser desagregada en los dos grupos: el de 75 a 79 y el de 80 y más. Para obtener la población en los dos últimos grupos es necesario dividir el valor anterior en dos partes, para lo cual PRODEM utiliza dos opciones: la de una población estacionaria según modelos de las NN UU, o la población estable de Coale y Demeny modelo Oeste.
Adicionalmente, es posible obtener el número de nacimientos en un período quinquenal a partir de la fórmula4
Los avances en la aplicación de métodos indirectos y la posibilidad de usar el computador personal para calcular los parámetros que describen la mortalidad, la fecundidad y la migración permiten derivar de manera rápida y confiable los parámetros demográficos a partir de la información recabada en el mismo censo. En la fase de diseño del Censo General 2005 se puso especial cuidado en asegurar que la información que se fuera a utilizar en las estimaciones demográficas tuviera la precisión requerida, para asegurar una estimación confiable de los parámetros demográficos. Se establecieron los criterios de validación que debían estar incluidos en la DMC; se incluyeron las preguntas en el formulario básico para evitar los problemas surgidos en el censo de 1985 al incluir estas preguntas en el formulario ampliado y se incluyeron normas especiales de validación para la base de datos censales.
Un punto importante es que esta ecuación compensadora por cohortes muestra una característica notable. Para obtener la cohorte en una proyección hacia delante se multiplica por un número menor que 1, mientras que al hacerlo hacia atrás se multiplica por un número mayor de 1. Esto tiene la consideración que cualquier discrepancia entre el valor real y el valor de nuestra ecuación compensadora se va a reducir a medida que proyectamos hacia delante, pero se va magnificando cuando proyectamos hacia atrás.
En consecuencia, el ejercicio de retropolación, a partir del último censo para obtener una estructura por edad y sexo del penúltimo censo, hace deseable partir de una estructura con los principales ajustes que se han identificado en la práctica actuarial y demográfica.5
Realizar la conciliación demográfica para los dos sexos por grupos de edades quinquenales no representa problemas considerables. Es necesario tener un juego de ecuaciones compensadoras para cada sexo y determinar la distribución de los nacimientos por sexo. Afortunadamente, esta división de los nacimientos por sexo no presenta problemas pues la relación de masculinidad al nacer es un parámetro bastante estable para una región determinada, y puede calcularse de manera sencilla a partir de los registros de nacimientos.
Cuando se consideran los dos sexos es importante medir la relación de masculinidad para los grupos quinquenales. Esta relación de masculinidad por lo general es mayor de cien para el momento de nacer y va disminuyendo a medida que pasa el tiempo. Teniendo en cuenta que por regla general hay una sobremortalidad masculina, la relación de masculinidad tiende a disminuir con la edad. El índice de masculinidad implícito –IMI– que se obtiene a partir de las tablas de mortalidad es un buen elemento de comparación en los grupos de edad en donde no se presenta migración, El IMI se puede definir como:
Donde IMN es el índice de masculinidad al nacer, es el número de años vividos por la población masculina entre las edades n y n+x, y es el número de años vividos por la población femenina.
La migración también afecta la relación de masculinidad. Si hay una emigración feminizada la relación de masculinidad tiende a aumentar. El efecto contrario se obtiene con una inmigración feminizada.
La comparación entre la relación de masculinidad observada y la esperada permite determinar los grupos quinquenales de edad que puedan tener problemas. Sin embargo, esta discrepancia puede deberse a una sola causa, por ejemplo, enumeración diferencial por sexo, o también a una mala declaración de edad en los grupos quinquenales de un mismo sexo,
El proceso de conciliación demográfica se inició con la estimación de las tasas específicas de fecundidad; la construcción de las tablas abreviadas de mortalidad y la estimación del número de migrantes internacionales e internos. Con el fin de probar y validar los instrumentos informáticos utilizados en la conciliación, se consideró apropiado hacer una replicación de las estimaciones realizadas con los datos de los censos de 1985 y 1993 para comparar los resultados obtenidos en el proceso de conciliación con los que se habían obtenido en su momento. Una vez calculados los parámetros demográficos relativos al último censo se procedió a su evaluación y comparación con los resultados obtenidos en otras investigaciones, lo que permitió obtener estimaciones para períodos intermedios por métodos demográficos.
Para el cálculo de los parámetros y su interpolación se utilizó el programa PANDEM, desarrollado por el CELADE. Sin embargo, pronto se vio que la utilización del programa requería una trascripción manual de información que se tenía disponible en hojas de cálculo; correr el programa y, luego, incorporar los resultados en hojas de cálculo, presentaciones y documentos. Las dificultades inherentes a este proceso llevaron a que, en lugar de esto, se utilizaran plantillas en Excel como las desarrolladas en la oficina de Censos de los Estados Unidos. Muy pronto se contó con una serie de Libros Excel que cubrían los procedimientos utilizados en PANDEM
Teniendo en cuenta que en el último proceso de conciliación se introdujeron cambios importantes en la historia demográfica colombiana, se consideró prioritario extender el período de conciliación a los dos últimos censos.6 Por tanto, se escogió como período de análisis el comprendido entre el censo de 1985 y el Censo General 2005. Para facilitar el proceso de conciliación se trasladaron los censos al 30 de junio de 1985, 30 de junio de 1995 y el 30 de junio de 2005.
Por facilidad para el cálculo de la población nacional y departamental, a partir de la ecuación compensadora, se utilizó el programa PRODEM de proyecciones demográficas. Este programa no sólo produce la población cada cinco años por 17 grupos quinquenales y los dos sexos, sino indicadores que permiten contrastar los resultados del modelo con los registros administrativos correspondientes.
Si bien el Programa PRODEM desarrollado por el CELADE para realizar las proyecciones de población es muy flexible, ya que puede realizar tanto una proyección como una retroproyección o una combinación de proyección y retroproyección, requiere la introducción manual de la población base, las tasas específicas de mortalidad y de fecundidad y los saldos netos migratorios. Además, sus resultados deben ser importados a Excel y, luego, formateados para su incorporación en documentos o presentaciones. Las dificultades de comunicación entre el programa PRODEM y las aplicaciones Windows son manejables cuando se trata de una conciliación nacional, pues es de esperar que con pocas iteraciones se pueda calcular la población conciliada por edad y sexo.
Sin embargo, los inconvenientes de comunicación se magnifican cuando se está trabajando en la conciliación de alrededor de treinta departamentos, ya que por una parte, la calibración de los parámetros demográficos requiere hacer una serie de iteraciones antes de lograr calibrar los parámetros departamentales y, por otra, es necesario explorar con cuidado las limitaciones que puedan tener los niveles y estructuras de la población en los años censales.
Para agilizar el proceso de proyecciones se consideraron dos alternativas: La primera, desarrollar un programa de proyecciones en Windows preferiblemente utilizando Excel y, la segunda, desarrollar una interfase que permitiera la entrada de datos en Excel y generara los archivos de comunicación entre PRODEM y Excel. Como la primera requeriría considerables esfuerzos y tomaría tiempo más allá de los plazos fijados para la conciliación, se resolvió, más bien, desarrollar un juego de aplicativos en Excel que simularan las pantallas de entrada de PRODEM y generaran los archivos de entrada a PRODEM y, además, que a partir de los archivos de salida de PRODEM generaran hojas de trabajo en Excel que sirvieran como documentación y elemento de diagnóstico de la conciliación, permitiendo representaciones gráficas de la distribución por edad y sexo, los índices de masculinidad y demás indicadores de interés.
A partir de un prototipo básico que cumplía con estas funciones se fue perfeccionando el instrumento para facilitar su manejo, se introdujo una serie de macros que automatizaran el manejo de la información y que evitaran problemas de manejo de la información al adoptar una serie de convenciones que permitieran el trabajo simultáneo de todos los miembros del equipo de conciliación.
Este aplicativo fue evolucionando a través del ejercicio de conciliación tanto departamental como municipal, incorporando instrumentos de diagnóstico y documentación que utilizaban los miembros del equipo en el proceso de conciliación.
El desarrollo del apoyo informático estuvo acompañado de la definición de especificaciones para llevar a cabo el proceso de conciliación demográfica. En primer lugar, se decidió que para cada juego de valores de los parámetros demográficos (tasas específicas de fecundidad, tablas de mortalidad abreviada, saldos netos migratorios) debería siempre hacerse tres ejercicios de proyección.
El ejercicio 1 debería tomar como base la población conciliada del 85 y hacer una proyección hasta el 30 de junio de 2005. El ejercicio 2 debería tomar como base la población conciliada del censo del 93 proyectada al 30 de junio de 2005 y retro proyectada al 30 de junio de 1985. El ejercicio 3 tomaría la población compensada trasladada a 30 de junio de 2005 y haría una retroproyección hasta el 30 de junio de 1985.
En segundo lugar, se decidió compilar los tres resultados en un solo libro Excel lo que permitía, por una parte, analizar los resultados de las proyecciones para cada uno de los ejercicios y, por la otra, comparar y contrastar las diferencias entre los ejercicios para cada período quinquenal.
En tercer lugar se decidió establecer una serie de reglas que permitieran identificar cohortes que tuvieran inconsistencias a través del tiempo o entre ejercicios. Se utilizó como elemento de comparación el índice de precisión edad/sexo de las Naciones Unidas, el índice de masculinidad derivado de las tablas de mortalidad o índice de masculinidad implícito y contraste con la información derivada de las estadísticas vitales.
En cuarto lugar se definieron criterios para resolver las discrepancias entre los niveles para 1985 y 1995 obtenidos en los procesos de conciliación realizados con el censo del 85 y con el censo del 93. Para ello se compararon los niveles y estructuras contenidos en el ejercicio 1 y 2. Los indicadores demográficos producidos por el PRODEM se compararon con los nacimientos ajustados, las defunciones y los saldos migratorios netos.
En quinto lugar se procedió a hacer una evaluación de la estructura por edad y sexo del Censo 2005, con el fin de diagnosticar el efecto de algunos de los problemas encontrados en los censos de población7: Omisión de población menor de 5 años; omisión de población entre 5 y 9 años; omisión sistemática de población en grupos de edad adulta joven; omisión selectiva de la población masculina. En cuanto a la mala declaración de edad se trabajó en establecer la tendencia al rejuvenecimiento (declaración de una edad menor que la real), entre la población adulta, particularmente entre la femenina, y la tendencia a aumentarse la edad entre la población de más edad, especialmente después de los 55 ó 60 años.
Una manera rápida de establecer discrepancias en grupos de edad es a través del cociente de edad, definido como el cociente entre la población de un grupo dado de edad y el promedio de las poblaciones en los dos grupos de edad vecinos, multiplicado por 100. Para situaciones normales este número es cercano a 100 y, por lo tanto, desviaciones con respecto a este valor indican problemas en la declaración de edades. Otro método utilizado en demografía es el comparar la distribución por edad y sexo con un patrón apropiado. La práctica demográfica recomienda hacer las comparaciones con las distribuciones acumuladas, por ejemplo poblaciones con edad superior a x en lugar de hacerla para un grupo quinquenal pues, cuando se toman los acumulados, se elimina el efecto de malas declaraciones para personas con edad superior a x que declaran una edad mayor de la real.
El Profesor López Toro8 en su estudio de los censos del 51 y 64 utilizó el concepto de poblaciones estables y casi-estables para determinar una distribución que le permitiera evaluar la distribución por edad y sexo. En la medida en la que las condiciones de estos modelos dejaron de cumplirse, se ha utilizado como patrón las de las proyecciones de población más recientes.
Dentro de la práctica demográfica es muy frecuente superponer dos pirámides de edad, lo que permite determinar de manera rápida cuáles son las principales discrepancias. Es conveniente no sólo dibujar las pirámides en términos relativos de tal manera que todas las participaciones sumen cien, sino que también se debe hacer en términos absolutos para poder identificar la magnitud absoluta de las discrepancias.
En sexto lugar se definieron unas reglas para corregir la población compensada para cada uno de los problemas identificados en el punto anterior. Por ejemplo, para la omisión de hombres jóvenes se estableció aceptar en principio la información relativa a las mujeres y estimar el faltante de hombres a partir de la relación de masculinidad tomada como patrón. Para el ajuste de los grupos menores de cinco años se tomó el número de nacimientos corregidos multiplicados por la relación de supervivencia de los nacimientos implícitos en las tablas de mortalidad. La distribución para los grupos mayores de 60 años se obtuvo por la comparación entre las distribuciones acumuladas observadas y el patrón establecido.
2. Conciliación Nacional Censo General 2005
Siguiendo la metodología propuesta, la primera etapa consistió en hacer las estimaciones de los parámetros demográficos, tasas específicas de fecundidad, tablas abreviadas de mortalidad y saldos netos migratorios para el momento censal.9 Como elemento de comparación se utilizaron los resultados obtenidos en los dos últimos ejercicios de conciliación con los censos de 1985 y 1993,10 respectivamente, y otros estudios realizados durante el período intercensal.
Como segundo paso se procedió a realizar interpolaciones para los cuatro períodos quinquenales. Para la mortalidad se hizo una interpolación de la esperanza de vida para hombres y mujeres por medio de una curva logística. Una vez establecido el valor de la esperanza de vida se procedió a hacer una interpolación de las tablas abreviadas de mortalidad. Para facilitar el proceso de interpolación se hizo una adaptación de un libro Excel, desarrollado por la Oficina de los Censos de los Estados Unidos.11 Para la fecundidad se realiza una interpolación de las tasas globales de fecundidad, por medio de una logística, y las tasas específicas de fecundidad por edad utilizando el modelo relacional de Gompertz. Los saldos netos migratorios se interpolan teniendo en cuenta la información sobre viajeros internacionales, la población colombiana residente en el exterior calculada a partir de la pregunta de hijos residentes en el exterior de los censos de 1985 y 1993, la información del programa IMILA y de los colombianos censados en otros países.
Con base en esta información y mediante el aplicativo que genera la información se generan las entradas a PRODEM en donde se corren los tres ejercicios. Con los archivos de texto de los resultados del ejercicio se genera un libro de Excel en donde, además de la información producida por PRODEM, se incluyen un juego de varias pirámides que describen la población por edades tanto en términos absolutos como relativos y gráficos de los índices de masculinidad.
Una vez realizados los diagnósticos sobre la información producida con estos juegos de parámetros demográficos, se procede a establecer un nuevo juego de insumos para hacer el nuevo juego de ejercicios. Se ajustan tasas de fecundidad para lograr coherencia entre los nacimientos registrados y los nacimientos calculados por PRODEM. Las tasas específicas de mortalidad se ajustan para obtener una coherencia entre las defunciones registradas y las defunciones calculadas en PRODEM. Los niveles de la población para 1985 y 1995 se ajustan para lograr que los valores obtenidos en el ejercicio 1 para 1995 coincidan con los puntos de arranque de la proyección del ejercicio 2.
Este proceso iterativo se repite hasta lograr que coincidan los tres ejercicios, tanto en nivel como en estructura por edad y sexo. Se obtiene entonces una historia demográfica coherente para el período 1985-2005, sin que importe el punto de arranque, 1985, 1995 ó 2005. Este escenario sirve como punto de arranque del ejercicio de conciliación departamental y del ajuste municipal. No es el resultado final del ejercicio, por cuanto es posible que el proceso de conciliación departamental y el ajuste municipal produzca información adicional que haga revisar la estimación de los parámetros demográficos.
El proceso de conciliación sirve también para mejorar la estimación de los parámetros demográficos. Por ejemplo, la estimación de los nacimientos obtenida por retro polación puede ser menor que la obtenida por métodos indirectos. Esto estaría indicando que las tasas de fecundidad obtenidas están sobre estimadas. La selectividad de la migración puede dar lugar a relaciones de masculinidad muy diferentes a las esperadas, lo que puede indicar que sería más adecuado redefinir la selectividad de la migración para obtener unas relaciones de masculinidad más apropiadas.
En algunos casos el proceso de conciliación puede llevar a la conclusión de que es necesario hacer un ajuste a la población conciliada de censos anteriores que haga aconsejable reajustar la población conciliada en los otros censos.
Resultados nacionales
De acuerdo con los resultados de la conciliación nacional, el Censo General 2005 tuvo una no cobertura de 3,7%. De esta no cobertura el 1,4% fue controlada en campo, por lo que su proceso de estimación tuvo como fuente de información registros directos de campo. Por su parte el 2,3% restante corresponde a la no cobertura por unidades censales.
3. Conciliación Departamental Censo General 2005
El proceso de conciliación departamental, a simple vista, podría pensarse como una repetición del proceso de conciliación nacional n veces una por cada departamento. Sin embargo, hay una serie de consideraciones que deben tenerse en cuenta y que requieren de especial cuidado. En primer lugar, el DANE no ha realizado un proceso de conciliación a nivel departamental. Si bien el DANE, como parte del proceso de estudios censales ha hecho estimaciones de los parámetros a nivel departamental, nunca ha establecido una coherencia entre los niveles de los censos y las tasas de crecimiento, ni ha compatibilizado las estructuras por edad y sexo para dos censos con los parámetros demográficos. En los estudios censales correspondientes al Censo del 93 realizó unas proyecciones departamentales para el período 1990-2025 sin hacer la retropolación hasta el año 85.12 Más aún, no se han publicado estructuras evaluadas y corregidas para el censo de 1985.
En segundo lugar, las proyecciones departamentales precisan estimar las migraciones internas e internacionales a nivel departamental, Como este cálculo es complejo y es afectado por problemas de no respuesta y diferenciales de cobertura, las estimaciones confiables requieren de un esfuerzo considerable.
En tercer lugar, no todos los departamentos tienen información de la misma calidad y, por lo tanto, en algunos de ellos es necesario hacer un trabajo muy detallado en cada uno de los censos que se quieren conciliar. Además, no todos los departamentos permiten estimaciones igualmente confiables. Los departamentos pequeños con mayores tasas de omisión no permiten un cálculo confiable de los parámetros demográficos aun si la pregunta incluida en el censo se ha hecho a todas las personas. Con mayor razón si como en el censo de 1985 se han recogido en la muestra cocensal.
Finalmente, y no por ello menos importante, un juego de cifras departamentales debe mantener coherencia con las cifras nacionales. La suma de la población por edad y sexo de los departamentos debe ser igual al total nacional. La suma de los nacimientos, de las defunciones y de los saldos netos migratorios de todos los departamentos debe ser igual al obtenido en la conciliación nacional.
Si Xi es una variable de interés para la demografía, calculada para un departamento, y Xp es la variable medida a nivel nacional, entonces se debe tener que donde N es el número total de departamentos. Sin embargo, para el caso en el que se hagan unas proyecciones con crecimiento exponencial, la suma de las proyecciones departamentales es siempre mayor que la proyección nacional realizada con una tasa de crecimiento exponencial igual al promedio del país. La igualdad deseada sólo se logra en el caso en que todas las tasas de crecimiento son iguales.13
Como la suma de la población de los departamentos debe ser igual a la población del país, es necesario buscar soluciones a este problema de carácter teórico matemático. Una solución es realizar primero la conciliación departamental y, luego, realizar la conciliación nacional sumando las poblaciones conciliadas a nivel departamental. Si bien este procedimiento cumple con las restricciones de que las partes sumen un todo, es poco práctico pues el conocimiento de la evolución demográfica y de los parámetros que caracterizan este crecimiento es mucho más confiable a nivel nacional que a nivel departamental.
Una segunda solución es realizar la conciliación nacional primero y luego la conciliación departamental, ajustando los resultados de la conciliación departamental para que sumen igual a los totales nacionales mediante procedimientos conocidos en la práctica demográfica, en la contabilidad nacional y en el muestreo de ajuste proporcional multidimensional.14 Tanto el PRODEM como el aplicativo desarrollado por la Oficina de Censos de los Estados Unidos permiten hacer estos ajustes de manera automática. Sin embargo, en algunas ocasiones el procedimiento matemático puede afectar de manera importante la estructura de los departamentos pequeños, lo que va en contravía del mismo ejercicio que busca obtener resultados válidos a nivel departamental.
Una solución que cumple estas condiciones es hacer la conciliación para N -1 departamentos y obtener el restante por diferencia con el total nacional. En estos casos resulta aconsejable dejar para el final el departamento de mayor población. Para evitar concentrar toda la discrepancia en un solo departamento es posible realizar el ajuste proporcional para un conjunto de varios departamentos. Para eso se calculan por aparte los departamentos que tienen una naturaleza especial que se considera que no se deberían cambiar y se ajusta sólo el resto de departamentos. Este método que se puede llamar el de la “tabla cuadrada modificada” es fácil de programar en un libro Excel y elimina gran parte de los problemas
El proceso de conciliación departamental se inicia con la estimación de los parámetros de fecundidad, mortalidad y migración con la información recabada en el operativo del Censo General 2005.15 Se continúa con la revisión de los parámetros para los censos de 1985 y 1993. Luego se hacen las interpolaciones para los cuatro períodos quinquenales 1985-1990, 1990-1995, 1995-2000 y 2000-2005.16 Finalmente, se validan los resultados con otras estimaciones hechas por el DANE, las proyecciones departamentales hechaspor el DANE y por el Proyecto Colombia Siglo XXI.
Se hace una comparación con los parámetros estimados para todo el país por medio de un análisis relacional transversal, utilizando el modelo Logit de Brass para la mortalidad y el modelo Gompertz para la fecundidad. El modelo relacional de la mortalidad desarrollado por Brass es muy apropiado para comparar varias distribuciones con un estándar. Parte del supuesto de que una cierta transformación de la función de supervivencia lx Y(lx) se puede expresar como una función lineal de un estándar Ys(lx), o sea que se cumple En la medida en que la tabla de mortalidad se acerque al estándar se debe cumplir que Cuando se utiliza como función Y el logit17 de 1-lx un valor de negativo corresponde a una tabla de mortalidad con esperanza de vida mayor. El parámetro describe la forma de la función de supervivencia con relación al estándar. Si se supone que el estándar corresponde a la última tabla de mortalidad para el país se puede contrastar de manera fácil con sólo dos parámetros la evolución de la mortalidad por departamentos18.
Para la fecundidad se utiliza el modelo relacional de Gompertz o función de Gompertz linealizada en la que la Función Y está dada por donde F(x ) es la función acumulada hasta la edad x de las tasas especificas de fecundidad y TGF es la tasa global de fecundidad.19
Una vez calculados los parámetros demográficos para los departamentos es necesario determinar la población base para 1985. Para este efecto se toma la población ajustada de 1985 que aparece en archivos magnéticos de la Dirección de Censos y Demografía. La población base para 1995 se toma del libro de proyecciones departamentales basadas en el Censo 93 ajustada a los totales obtenidos en el Proceso de Conciliación Nacional.20
Para el proceso de conciliación departamental se encontró necesario cambiar el método de trabajo del equipo encargado de la conciliación. En el proceso de conciliación nacional el equipo trabajó en tres grupos: uno encargado de la mortalidad, otro de la fecundidad y otro de la migración. En el proceso departamental se asignó a cada miembro del equipo un grupo de departamentos y se les encargó de hacer el procesamiento de cada uno de los departamentos asignados.
Además, se vinculó a un nuevo miembro que se encargó de hacer las consolidaciones de todos los departamentos y de procesar una serie de resúmenes que permitiera ver la consistencia con el nivel nacional y con otras informaciones como las estadísticas vitales.
En esta fase, se intensificó la retroalimentación entre los resultados obtenidos con PRODEM y la estimación de los parámetros demográficos. El estudio de las cohortes menores de 20 años señalaba inconsistencias en la estimación de las tasas específicas de fecundidad; las relaciones de masculinidad de las cohortes daba indicaciones de problemas de calibración de la migración y las proyecciones mostraban incoherencias en la población base que necesitaban ser corregidas.
Por otra parte el ajuste municipal encontró algunos municipios que mostraban omisiones de importancia, que no podían ser consideradas como parte de un ajuste general. Estos ajustes que se pueden juzgar como un ajuste a la compensación por difícil accesibilidad y contingencia de transferencia se incorporaron en el ajuste final.
Para obtener unas cifras finales que coincidieran con las cifras a nivel nacional fue necesario desarrollar un ajuste por medio de una tabla cuadrada modificada, en la que se especificaba cuáles departamentos se consideraban como definitivos y que, por lo tanto, no deberían modificarse y otros que eran susceptibles de ajustarse por el método tradicional de la tabla cuadrada.
Los resultados finales del ejercicio de conciliación departamental se presentan en el siguiente cuadro:
Fuente: DANE Conciliación censal
Por esta razón cabe reflexionar en las razones que explican que la población calculada a 30 de junio del año 2005, efectuada a partir de las cifras del Censo General 2005, sean menores a la estimación efectuada mediante una proyección que se hizo casi 10 años antes que el censo.
Para analizar las diferencias entre la población conciliada a 30 de junio de 2005 y las proyecciones de población estimadas a partir de la conciliación del censo de 1993, es útil partir de la ecuación compensadora
Donde Nt es la población en el instante t, a es el tiempo transcurrido entre dos censos, Bt,t+a son los nacimientos ocurridos durante el período intercensal, Dt,t+a son las defunciones ocurridas durante el período intercensal y Mt,t+a son los migrantes netos (inmigrantes menos emigrantes) llegados al país durante el período intercensal.
Por facilidad de comparación se toma como momento del primer censo el 30 de junio de 1995 y como momento del censo el 30 de junio de 2005. En el cuadro siguiente se presenta una comparación de los resultados de las proyecciones realizadas con base en el Censo de 1993 y los resultados de la conciliación.
Se puede ver que las proyecciones de población para el 2005 superan la población conciliada en un poco más de tres millones cien mil personas, lo que equivale a un 7,35%. El gráfico siguiente muestra lo que esta diferencia que fue en 1995 de 2.74% va creciendo en la proyección hasta alcanzar una diferencia de 7,35% en el 2005.
A continuación aparece un análisis de la contribución de cada uno de los elementos que entran en una proyección: la población base, los nacimientos y el saldo neto migratorio o migrantes. Como las defunciones tienen un signo negativo en la ecuación compensadora, y como la diferencia es negativa, la contribución que aparece en el cuadro siguiente tiene signo positivo y, por lo tanto, la suma de todos los efectos debe ser igual a la diferencia entre la proyección proyectada y la población conciliada.
Como se puede ver en el cuadro, la diferencia total es de 3.150.552 personas, de las cuales casi la tercera parte (1.028. 593) se debe a la población base un sobre ajuste en la conciliación del censo del 93. Un poco más de la quinta parte (661.724 personas) se explican por la diferencia en los nacimientos que es una combinación del anterior y de sobreestimación de las tasas de fecundidad. Los cambios en las defunciones, menos de cien mil personas, contribuyen en algo más del 3 por ciento. La migración, más de un millón trescientos mil personas contribuye en un poco más del 43 por ciento.
En términos de contribución y en números absolutos la hipótesis de saldo migratorio nulo ocupa el primer lugar en la diferencia entre las proyecciones y la migración, seguido de la población base, los nacimientos y las defunciones.
Debe notarse que esta descomposición, basada en la ecuación compensadora, es un primer elemento en el análisis de las razones para las discrepancias entre las proyecciones de población y la población conciliada. En efecto, la disparidad en los nacimientos se explica en parte porque se toma una población base más alta, en parte porque las tasas de fecundidad son distintos y en parte por la selectividad por edad de los migrantes femeninos. Las diferencias en las defunciones se explican por diferencias en la población base, las tasas de mortalidad y la selectividad de los migrantes hacia edades de baja mortalidad. Un análisis más detallado requiere la construcción de distintos escenarios en los que se vayan cambiando parámetros, manteniendo todo lo demás constante. Este ejercicio está contemplado dentro del proceso de proyecciones en donde se tiene previsto hacer una evaluación de las proyecciones comparándolas con otros ejercicios, no sólo el basado en el censo del 93, sino también el del censo del 85 y de otros ejercicios realizados por otras instituciones.
1 TACLA, 2006., p. 17
2 Ibid., p. 10
3 La fórmula para calcular el número de nacimientos es donde N se refiere a la población femenina y fx es la tasa específica de fecundidad para el grupo de edades x a x+4
4 Es importante anotar que en el caso de la retro-proyección el cálculo de los nacimientos no tiene en cuenta las tasas de fecundidad y en consecuencia puede servir para estudiar la validez de la estimación de la fecundidad obtenida por métodos indirectos.
5 Los actuarios reconocieron muy pronto que para poder elaborar las tablas de mortalidad deberían ajustar las estructuras de edades tanto de la población como de las defunciones. Hicieron estudios detallados sobre los principales errores que se encontraban en los censos y desarrollaron procedimientos matemáticos para hacer las correcciones.
6 Según el ejercicio de conciliación inicial DANE (1987) la población colombiana en 1985 era 29.879.331. Según la conciliación de 1993 DANE(1999) la población colombiana en 1993 era 31.658.715, o sea un incremento de 1.779.384 personas casi el 6 por ciento de la población inicialmente calculada.
7 El tema de los problemas de declaración de edad fue objeto de estudio de los actuarios que desarrollaron elementos de diagnóstico y de ajuste matemático. Posteriormente estos métodos han sido incorporados en la práctica demográfica. Un tratamiento completo de estos temas se puede ver en Shryock y Siegel Volumen 1 páginas 158-251
8 López Toro (1968) Páginas 35-59
9 Los procedimientos se detallan en los estudios censales de mortalidad, fecundidad y migración.
10 Estos ejercicios realizados por el DANE se presentan con las proyecciones nacionales de población DANE, (1987) y DANE(1999).
11 Se utilizan los libros INTPLTM y INTPLTF.
12 Ver DANE (2000)
13 Para una demostración de este enunciado y un análisis más detallado del fenómeno ver Keyfitz (1977) páginas 14-18
14 Este procedimiento es conocido como el método de la tabla cuadrada o método de Stephen-Deming (ver Shryock y Siegel páginas 707-709) en demografía, como el método RAS en la contabilidad nacional , y el calamar en procedimientos de ajuste de una muestra al total de la población.
15 Debido a su pequeño tamaño y a la baja cobertura se trabaja de manera conjunta los departamentos de Amazonas, Guainía, Guaviare, Vichada y Vaupés.
16 Los procedimientos se detallan en los estudios censales de mortalidad, fecundidad y migración.
17 El logit de1-lx está definido por
18 Chackiel (1981) hace una exposición del modelo relacional de Brass.
19 Chackiel (1979) hace una exposición de la función de Gompertz linealizada.
20 Aunque inicialmente se realizó un proceso de ajuste por el método de la tabla cuadrada se encontró que era más aconsejable partir de información individual de cada departamento y al final realizar el ajuste. Algunos de los departamentos pequeños resultaban con estructuras distorsionadas. Bibliografía
Chackiel, Juan “Estructura de la fecundidad por edades: Ajuste y proyección mediante la función de Gompertz linealizada” Notas de población Año VII No 20 Agosto 1979, páginas 9-34
DANE, Proyecciones nacionales de población, Colombia 1950-2025. Bogotá: DANE, 1987
DANE, Colombia Proyecciones quinquenales de población por sexo y edad, 1950-2050. Bogotá: DANE, 1999.
DANE, Colombia Proyecciones Departamentales de Población por sexo y edad, 1990-2015. Bogotá: DANE, 2000.
Keyfitz, Nathan Applied Mathematical Demography. New York: John Wiley and Sons, 1977
López Toro, Álvaro. Análisis demográfico de los censos colombianos:1951 y 1964. Bogota: Universidad de los Andes, 1968.
Shryock, Henry S. y Jacob Siegel. The Methods and Materials of Demography. Vosl 1 y 2. Washington: U.S. Government Printing Office, 1975.
Tacla Odette, La omisión censal en América Latina 1950-2000. Población y Desarrollo No 65. Enero de 2006.
________. Ël Modelo de Mortalidad de Brass Notas de población Año IX No 25 Abril 1981, páginas 93-144
|