¿Por que celestino mutis?

Políticas para la Producción, Difusión y Uso de la Información Estadística Sociodemográfica
Héctor Maldonado Gómez

Brechas Educativas de la Población Colombiana Censo 2005
Victoria Kairuz Márquez, Cecilia Correa Valdés, Lucía Durán Pinilla, Jesús María Godoy Bejarano y Marisol Perilla Gómez

Heterogeneidad de las Firmas Colombianas y sus Implicaciones con los Tratados de Libre Comercio
Jan Ter Wengel, Luz Karine Ardila, Gilma Beatriz Ferreira Villegas y Luis Miguel Suárez Cruz

El Uso del Tiempo de las Personas de 6 a 24 años
Claudia González

Determinantes de la Afiliación al Sistema General de Pensiones en las Diez Areas Metropolitanas: 1996 y 2006
Álvaro Suárez Rivera, Carlos Eduardo Acosta Aponte, Carlos Arturo Meza Carvajalino y Fredy Arley Cabra

Felicidad: La Evolución Como Categoría Científica y la Relación con el Desarrollo
Julio Silva-Colmenares

La Innovación y Desarrollo Estadístico en el Indice de Precios al Consumidor de Colombia (Segundo Premio a la Innovación y Desarrollo Estadístico del Banco Mundial al IPC-98 del DANE en el año 2008).
Eduardo Efraín Freire Delgado

Base 2005 de las Cuentas Nacionales Marco Tulio Mahecha Ordóñez y Jorge Enrique Centenaro Martínez
El Sello de Calidad y la Certificación con la Nueva Norma ISO 20252. Sistemas Vigentes para Evaluar la Calidad de la Información Básica Estadística en Europa
Diego Raúl Barrios Lequerica
...¿Sabía Usted?... Dirección de Difusión, Mercadeo y Cultura Estadística del DANE

Prensa - Libros
Jorge Eduardo Estrada Villegas

Separata

Jorge Eduardo Estrada Villegas
Ingeniero Civil, Universidad Nacional
Master of Science, Massachusetts Institute of Technology; Gerente de Estrada, Caro y cía. Ltda. jestrada@cable.net.co

El uso de herramientas informáticas para la toma de decisiones

Muchos de los pioneros del desarrollo de los computadores comenzaron a jugar (literalmente) con la idea de utilizarlos en áreas que, tradicionalmente, se han considerado como características de la inteligencia humana. Una de las formas más sencillas de probar estas ideas era programarlos para juegos de estrategia, como ajedrez y damas, en los que la comparación con las habilidades de los humanos en el área de toma de decisiones era inmediata.

En las décadas de 1940 y 1950 Turing y Shannon, en forma independiente, describieron la manera de programar un computador para jugar ajedrez, con lo cual prácticamente crearon el campo de la inteligencia artificial pero, la tecnología disponible en la época, no les permitió desarrollar ejemplos concretos. El primer programa de computador que compitió exitosamente con humanos en un juego de estrategia fue el programa de damas de Arthur Samuel de IBM, que en su demostración inicial, en 1956, jugando contra aficionados, generó tanto interés mediático que la acción de IBM subió 15 puntos en la Bolsa de Nueva York.

El tipo de decisiones que se toman en estos juegos corresponde a situaciones con reglas claramente definidas, donde los adversarios tienen información completa, paso a paso, como ocurre en las damas y el ajedrez. La estrategia que sigue el computador se basa en analizar todas las jugadas disponibles y todas las posibles respuestas del adversario, para tantas jugadas en el futuro como permitan la memoria disponible y la velocidad del procesador, creando los que se denominan árboles de decisión y, al alcanzar el máximo número de jugadas en el futuro posible con los recursos disponibles, evaluar las posiciones resultantes para, devolviéndose en el árbol, determinar la más favorable de las alternativas para la próxima jugada. Cuando el computador logra construir el árbol completo, llegando hasta la terminación del juego, la jugada seleccionada no tiene ninguna incertidumbre y es la óptima, como ocurre en juegos más simples o en las finales de las partidas de los juegos de estrategia (cuando la reducción en el número de piezas ha simplificado radicalmente el análisis). Cuando, como es la situación normal, no se llega al final del árbol, hay incertidumbre sobre la calidad de la jugada seleccionada, incertidumbre que depende de lo apropiado que sea el algoritmo de evaluación utilizado al analizar las posiciones más lejanas alcanzadas.

Existe otro tipo de problemas en los cuales es necesario tomar decisiones con información incompleta, ya sea porque se desconocen muchas de las variables que afectan una situación o porque, así se conozcan y sea posible determinar sus valores, su número es tan grande que es imposible tenerlas todas en cuenta y, principalmente, porque la decisión que se toma corresponde a eventos que todavía no han ocurrido, como es el caso de las encuestas electorales y los valores de los instrumentos transados en los mercados financieros. En estos casos las herramientas informáticas también se han vuelto indispensables pero no pueden usarse a la ligera y se requiere mucho criterio para evitar resultados desastrosos. Este último es el dominio de la teoría de la probabilidad, la estadística y la minería de datos y es al que corresponden los dos libros reseñados en esta edición, los cuales muestran dos caras de la misma moneda cuando nos hacemos preguntas como: ¿Qué tan acertadas son las herramientas informáticas para la toma de decisiones? ¿Cómo se comparan sus resultados con los que produciría un humano experto en el campo en cuestión?

EL CISNE NEGRO, El impacto de lo altamente improbable. Nassim Nicholas Taleb, Editorial Paidós, Febrero de 2008.

En el número 4 de la Revista ib reseñamos ¿Existe la suerte? Engañados por el azar, del mismo autor. El libro que comentamos en esta oportunidad superó al anterior como éxito de librería y la revista ‘The Economist’ lo seleccionó como uno de los libros más importantes del año 2007.

Esta es la cara negativa de la moneda a la que nos referíamos en la introducción. En el Cisne Negro, Taleb continúa con el tema de ¿Existe la Suerte? La imposibilidad de predecir en los mercados financieros y sus conclusiones se pueden resumir en que las herramientas matemáticas más sofisticadas, utilizando los computadores más poderosos, no permiten predecir el futuro de dichos mercados y que sus aparentes éxitos no son sino resultado del azar, que nos deslumbran porque fijamos nuestra atención en ellos, ignorando los miles de fracasos que hay detrás de cada uno.

Para Taleb un Cisne Negro (antes del descubrimiento de Australia, en el mundo occidental nadie concebía un cisne que no fuera blanco) es un evento que reúne las siguientes tres características: Primera, está fuera de las expectativas razonables porque nada que haya ocurrido en el pasado puede indicar en forma convincente su posibilidad. Segunda, tiene un impacto extremo. Tercera, una vez que ocurre, la naturaleza humana nos pone a rebuscar explicaciones que lo presentan como explicable y predecible.

La crisis de las hipotecas que actualmente se vive en los Estados Unidos nos da un ejemplo perfecto de lo que constituye un Cisne Negro. Nadie la previó. Por ella están en peligro de perder sus viviendas millones de personas; ha estado a punto de provocar una recesión mundial; ha sido causa de la quiebra de Bancos importantes, no sólo en Estados Unidos sino en Europa, donde fue exportada gracias a instrumentos financieros (derivados) nada transparentes y, por último, hoy en día ha sido plenamente explicada: Parece obvia y la gente se pregunta cómo es que entidades tan importantes han podido equivocarse de esa manera. Esto hace pensar en la forma como un cínico se refirió a los economistas, víctimas preferidas de Taleb, diciendo que son incapaces de predecir algo que va a ocurrir pero, cuando ocurre, pueden explicar con lujo de detalles las razones por las que ocurrió.

El principal obstáculo para la predicción de los eventos clasificados como Cisnes Negros es la dependencia de la estadística clásica de la distribución normal, cuyo tratamiento matemático se debe a Carlos Federico Gauss, probablemente el matemático más importante de la historia, quién se suma al grupo de víctimas de los dardos de Taleb. Aquí Taleb es injusto, pues Gauss obtuvo sus resultados sobre la distribución normal a partir del análisis de los errores en sus observaciones astronómicas, donde funciona divinamente, y no estaba tratando de hacerse rico especulando en la bolsa de valores.

La distribución normal concentra más del 95% de la probabilidad de un evento en un intervalo de dos desviaciones estándar, a cada lado de la media, y más del 99,7% en un intervalo de tres desviaciones estándar. Es por esta razón que la distribución normal no sirve para representar eventos que no son imposibles pero tienen una probabilidad de ocurrencia muy baja. Cualquier modelo que emplee esta herramienta matemática va a estar prácticamente ciego a la ocurrencia de estos eventos y si, como se ilustró con el ejemplo de la crisis de la hipotecas, las consecuencias de la ocurrencia son extremas, va a conducir a decisiones muy equivocadas.

La utilización de herramientas matemáticas cada vez más sofisticadas para predecir los fenómenos económicos ha sido promovida, en forma perversa a los ojos de Taleb, por el Banco de Suecia. Taleb nos recuerda que el premio Nobel de Economía no existe. Lo que existe es un premio de economía que el Banco de Suecia creó en 1968 ‘en memoria’ de Alfred Nobel y que algunos miembros de la familia de éste quieren abolir.

Aunque el premio patrocinado por el Banco de Suecia se ha otorgado a varias personalidades de primera línea, el comité encargado de la selección de los candidatos ha demostrado una tendencia a preferir a quienes aportan ‘rigor’ a la disciplina con seudociencia y desarrollos matemáticos llenos de teoremas y pruebas elegantes que cada vez tienen que ver menos con la caótica realidad del mundo económico.

No es frecuente que quienes reciben este premio tengan una oportunidad de demostrar inmediatamente qué tan acertada fue la decisión del comité que lo otorgó. Esto ocurrió con el premio de 1997 otorgado a Robert Merton Jr. y Myron Scholes por su trabajo al mejorar una vieja fórmula matemática haciéndola compatible con las grandes teorías existentes de equilibrio financiero general, basadas en la distribución de Gauss, lo que la hizo aceptable al ‘establecimiento’ económico. Long Term Capital Management (LTCM) fue un fondo de cobertura (‘hedge fund’) establecido en 1994, del cual Merton y Scholes fueron socios fundadores. LTCM puso en práctica las ideas que los hicieron merecedores del premio del Banco de Suecia y en sus primero años fue sumamente rentable, generando utilidades anualizadas del 40% hasta qué en 1998, súbitamente, ocurrieron una serie de eventos, disparados por la crisis financiera rusa (un Cisne Negro), que estaban por fuera de las suposiciones del modelo. LTCM no aguantó y el Banco de la Reserva Federal de Nueva York tuvo que intervenir presionando algunas de las principales firmas de Wall Street para que se hicieran cargo de los despojos, evitando así una crisis financiera de inmensas proporciones. Taleb no oculta el placer que esta debacle le causó.

Como guía para establecer qué tan predecible es el problema que se está analizando, Taleb utiliza dos provincias imaginarias: Mediocristán y Extremistán.

En Mediocristán reina la distribución normal y no existen los Cisnes Negros. Como ejemplo de un establecimiento exitoso en esta provincia, Taleb nos propone un casino. La teoría de la probabilidad y la estadística clásica funcionan perfectamente en un casino y son herramientas fundamentales, no sólo para establecer los planes de premios de los distintos juegos que se ofrecen al público, sino para que la administración pueda seguir, en tiempo real, el comportamiento de todos los juegos que se llevan a cabo para detectar cualquier desviación de lo predicho por la teoría. En este caso la desviación no corresponde a un Cisne Negro sino a que alguien está tratando de hacer trampa, ha logrado sacar cartas de una baraja, cambiar los dados por otros cargados, utiliza un transmisor para obtener información de otro participante, ha interferido el mecanismo de la máquina tragamonedas, etc. Una vez detectado el transgresor, la administración envía dos gorilas que lo expulsan del casino sin miramientos y el negocio sigue produciendo con regularidad cronométrica las utilidades predichas por la teoría.

Extremistán es la provincia donde no reina la distribución normal. Es el mundo de los fenómenos denominados escalables, donde ser grande sirve para ser más grande. Google puede servir de ejemplo. Prácticamente todo el mundo lo usa como buscador. Su tamaño le da grandes ventajas y lo hace el rey de la publicidad en la Web. Más de uno pensaría que es injusto, excepto que se nos olvida que hace no muchos años nadie hablaba de Google y casi todo el mundo usaba Alta Vista como buscador. El crecimiento de Microsoft no tiene nada que ver con las ideas económicas clásicas y la ley del rendimiento decreciente. Cada nueva copia de Windows u Office que se instala es un incentivo para vender más. Pero, y de esto los directivos de Microsoft son perfectamente conscientes, en cualquier momento puede surgir un cambio de paradigma que proyecte al primer puesto a un Google, un Linux, un Apple o un completo desconocido que se idee una mejor manera de poner el poder de los computadores al alcance del gran público y se sirva de la Web para lograrlo con una mínima inversión.

Para Taleb, si Gauss es el profeta de Mediocristán, Benoît Mandelbrot, el matemático padre de la teoría de los fractales es el profeta de Extremistán y con él ha estado colaborando en una teoría general para la administración de riesgos. Aquí Taleb nos trae un mensaje positivo: en un simposio realizado sobre el tema, para sorpresa suya, los expertos del Pentágono se ganaron su respeto. Probablemente lo mismo le ocurriría si tuviera la oportunidad de reunirse con los expertos del bando contrario, lo que puede explicar por qué todavía no ha ocurrido una conflagración nuclear a escala mundial. Una cosa es tomar decisiones de las que dependen millones de vidas y otra tratar de hacerse rico especulando en los mercados financieros.

El éxito del Cisne Negro ha resultado en un anticipo de cuatro millones de dólares por los derechos de la edición en inglés de una continuación, denominada tentativamente ‘Tinkering’, cuyo tema será cómo vivir en un mundo que no entendemos.

En Estados Unidos este libro es prácticamente lectura obligada para quienes están activos en los mercados financieros y para los estudiantes de MBA. Uno puede no estar de acuerdo con todas las ideas de Taleb, pero no se puede negar que ha encontrado una veta muy rica que ha sabido explotar. Además, lleva bastante madurándolas y esto, unido a los casos en que el tiempo ha demostrado que tenía razón y a su amplísima cultura, le permite tratar el tema con un aire de superioridad intelectual que le agrega cierto encanto pero que, seguramente, otras personas encontrarán detestable. Hacía mucho tiempo que no disfrutaba tanto con la lectura de un libro.

 

SUPER CRUNCHERS, Why thinking-by-numbers is the new way to be smart. Ian Ayres, Editorial Bantam Dell, Septiembre de 2007.

En nuestro medio, el título de este libro podría traducirse como Supercomputadores, Por qué pensar numéricamente es la nueva forma de ser inteligente, pero como la traducción probablemente se hará en España, como ha ocurrido con los demás libros del mismo autor, el título será más bien algo así como Superordenadores, ...

Estos detalles del título pueden parecer irrelevantes para la mayoría de los lectores, pero no para un especialista en mercadeo. El título en inglés se escogió a partir de los resultados de publicar en Google unos anuncios que, con igual probabilidad, aparecían con uno de los dos títulos ‘Super Crunchers’ y ‘The End of Intuition’ (El fin de la intuición) que era el título escogido por el autor. Un análisis de los resultados de Google indicó que el título ‘Super Crunchers’ generó 63% más clics que el título original y así se decidió el título definitivo de la obra.

Esta es la cara positiva de la moneda, a la que nos referíamos en la introducción. Ian Ayres es un abogado y econometrista, profesor de las escuelas de derecho y administración de la Universidad de Yale. Para Ayres la enorme cantidad de información disponible en las grandes bases de datos, acompañada por la facilidad de acceso que proporciona Internet y la capacidad de cómputo de los equipos actuales, ofrece oportunidades para vencer la intuición y el talento humanos en campos en que es más fácil superarlos, aunque con resultados menos espectaculares, que cuando la victoria de Deep Blue – un computador de IBM – sobre el campeón mundial de ajedrez, Garry Kasparov, en 1997.

Las armas que propone Ayres para lograr este propósito son la regresión, el muestreo aleatorio y la minería de datos.

Para dar una idea de la diversidad de campos donde el empleo de herramientas informáticas supera en forma perfectamente comprobable las capacidades humanas, consideremos los siguientes casos descritos en el libro.

Un norteamericano amante de los vinos de Burdeos publica un boletín en donde predice los precios que alcanzarán los vinos de la cosecha de cada año, al cabo del período de añejamiento. Este es un dato importantísimo para quienes desean aprovechar la valorización que tienen las cosechas calificadas como muy buenas o excepcionales. La predicción se hace con una ecuación de regresión obtenida del análisis de años de estadísticas del clima en la región, y sin siquiera probar los vinos, pues los resultados se anuncian cuando apenas han sido colocados en los barriles y todavía no se han puesto a disposición de los catadores profesionales.

Este método ha provocado la ira de todos los expertos tradicionales, catadores, productores y comerciantes quienes consideran que alguien que no ha probado un vino no puede dar un concepto sobre él. Sin embargo, el tiempo le ha dado la razón a este norteamericano y sus predicciones superan las de los expertos más reconocidos, aunque los tradicionalistas no dan su brazo a torcer y siguen tratando de desacreditarlo y obstaculizarlo por todos los medios.

UPS, la gran compañía norteamericana de envío de paquetes utiliza una ecuación de regresión, similar a la del precio de los vinos de Burdeos, para predecir cuándo hay riesgo de que un cliente se pase a un competidor. UPS entra en acción aun antes de que el cliente esté consciente de su deseo de cambiar. Un vendedor lo llama para reestablecer la relación y resolver los posibles problemas, reduciendo dramáticamente la pérdida de cuentas.

La compañía de casinos Harrah proporciona a sus clientes especiales una tarjeta electrónica que le permite capturar información de la totalidad de los juegos en que participa el cliente en todos los casinos de la firma. Harrah sabe en tiempo real, juego por juego, cuánto está ganando o perdiendo cada uno de estos clientes. Esta información la combina con la de una bodega de datos que contiene información demográfica, patrones de consumo, ingresos por zona de residencia, etc. para determinar un punto de ‘dolor’ que corresponde al máximo que el cliente puede perder sin que la experiencia se convierta en una frustración. Cuando algún cliente está llegando a este punto aparece un empleado que le dice algo así como ‘Veo que está pasando un mal rato, por qué no suspendemos ahora y, ya que le gusta nuestro restaurante, la empresa lo invita a cenar en compañía de su esposa’. Lo que iba a ser causa de dolor se convierte en una buena experiencia.

La más admirada de las habilidades de Google es el sistema de clasificar la importancia de las páginas Web. La importancia que Google asigna a una página depende del número de páginas que tienen enlaces que llevan a la página en cuestión. Pero no todos los enlaces son iguales sino que están afectados por un peso que depende, a su vez, de la importancia de la página origen del enlace y así sucesivamente. Google ha encontrado que las páginas a las que el sistema les asigna mayor importancia satisfacen mejor las necesidades de los usuarios que han hecho la consulta y usa la clasificación para ordenarlas al presentar los resultados. No es fácil manipular artificialmente este sistema creando páginas web que tengan enlaces a la página que queremos volver importante, pues si las páginas creadas no tienen a su vez enlaces desde otras páginas, no van a sumar puntos y no es fácil lograr que otras páginas creen enlaces a las que hemos agregado. Todo esto se logra mediante un enorme sistema de minería de datos.

Este sistema de clasificar las páginas es similar a lo que los expertos en la Web llaman análisis de redes sociales. Corresponde a lo que se denomina culpabilidad por asociación y muchos organismos forenses usan la metodología para ayudar a identificar delincuentes.

El área de la salud es una de las que pueden sufrir un cambio más radical con la aplicación de las tecnologías descritas en el libro. Muchos pacientes están utilizando Internet para investigar los males que los aquejan y muchos médicos se están sorprendiendo al encontrarse con pacientes mejor informados que ellos, algunos hasta han podido diagnosticar su enfermedad al suministrar los síntomas a un buscador Web.

Sitios como Isabel Healthcare y Medline apoyan la labor de los médicos en aspectos como diagnóstico y tratamiento y son visitados por muchos pacientes, tanto que Medline ha creado Medline Plus para facilitar la consulta de los pacientes. Una de las estadísticas más dramáticas del área de la salud es que un tercio de los errores cometidos por los médicos se deben a diagnósticos errados. Cuando un médico simplemente corta y pega la historia clínica de un paciente en el área de entrada de Isabel, el sistema produce una lista de entre diez y 30 posibles diagnósticos, que el médico ha debido considerar. Verificaciones realizadas por el New England Journal of Medicine (generalmente a partir de autopsias) indican que la lista incluye el diagnóstico correcto el 75% de las veces. Si el médico es más cuidadoso y, en vez de cortar y pegar, suministra los datos manualmente, en los campos apropiados, el porcentaje de listas que incluyen el diagnóstico correcto sube a 96%.

Con la facilidad del acceso a Internet uno pensaría que todo médico que está diagnosticando a un paciente, o formulando un tratamiento, debería servirse de estas herramientas para confirmar la conclusión a que ha llegado. Desgraciadamente no es así y una causa la ilustra la siguiente anécdota del Dr. Joseph Britto, uno de los fundadores de Isabel Healthcare. Cuando el Dr. Britto tomó clases de pilotaje se maravilló por la seriedad con que los pilotos acatan las consignas de seguridad establecidas por las agencias aeronáuticas, y las recomendaciones del software de ayuda de que disponen, y le preguntó al instructor cual era la razón. La respuesta fue que, a diferencia de los pilotos, los médicos no caen con sus aviones.

El libro contiene muchísimos más ejemplos en áreas de gran impacto, como enseñar a leer, con resultados que frecuentemente son contrarios a los comúnmente aceptados por los expertos en las respectivas disciplinas.

Al observar los temas tratados en este libro es claro que a todos ellos son aplicables la teoría de la probabilidad y la estadística clásica. Podemos decir que los eventos descritos no son escalables y tienen lugar en Mediocristán, por eso no vemos Cisnes Negros y es posible predecir y decidir.