Software econométrico En un breve artículo explico cuáles son las opciones básicas que tenemos en cuanto a software (si bien en esta página se puede encontrar una relación de programas más exhaustiva). Algunos programas estadísticos o econométricos ofrecen funciones matemáticas ya programadas a las que se puede acceder mediante comandos o menús (que nos ahorran aprendernos los comandos). Esto es lo que se conoce como "cannedpackages". La gran aportación de estos programas está en que facilitan el uso de la econometría, abstrayendo al de las fórmulas, que no tienen que recordarse cada vez que se hace una operación (un solo comando puede estar activando decenas de complejos algoritmos matemáticos). Dos son las desventajas. La primera está en que facilita la aparición de aprendices de brujo, poniendo un peligroso arsenal en manos de personas que no saben qué están haciendo exactamente. La segunda es que si se desarrollan nuevos test el programa en cuestión no los incorporará, y su inclusión requerirá tiempo (aparte que el puede verse obligado a pagar por la actualización). Por esas causas los programas han buscado formas de añadir fácilmente funcionalidades, desarrolladas por la propia empresa o por los s mediante lenguajes de programación. Frente a ese modelo se ha desarrollado otro basado en lenguajes de programación matriciales. Los programas construidos en torno a esos lenguajes permiten al elaborar por sí mismo los algoritmos de cálculo. Además, con esa potente herramienta se puede incorporar cualquier nuevo avance teórico, e incluso experimentar. El problema de estos programas es que te obligan a emplear más tiempo en operaciones repetitivas o sencillas, por lo que acaban incorporando funcionalidades preprogramadas. Como se ve ambos modelos tienden a converger, y casi todos los programas ofrecen funciones ya preparadas que se pueden invocar con facilidad, más un lenguaje de programación y algún mecanismo para intercambiar esas programaciones y hacerlas fácilmente utilizables. El problema del carácter "abierto" (programable) del moderno software estadístico y econométrico es que multiplican los problemas de fiabilidad en los cálculos que ya existen. Pero incluso nuestros programas favoritos pueden dar resultados falsos simplemente porque aplican el procedimiento de cálculo equivocado para los datos de que disponemos. Decimos equivocados teniendo en cuenta que la aritmética de los ordenadores no es la de "papel y lápiz". Estos errores pueden conocerse mediante baterías de test que ofrecen resultados de validez garantizada con los que comparar. Pero hay muchas funcionalidades para las que no se han desarrollado aún test, y es fácil comprobar que distintos programas ofrecen distintos resultados, algunos muy
disímiles, por lo que no sabemos qué resultado es el correcto (o cuáles son aceptables). Es más, en muchos artículos publicados no se dice qué software (o qué algoritmos) se ha empleado, por lo que no hay forma de saber si los resultados expuestos son correctos o no, independientemente de que existan baterías de test para ese tipo de análisis. Es un problema ciertamente grave. Un articulo excelente sobre el tema, que todos deberían conocer, es McCullough, B.D. and Vinod, H.D. (1999): "The Numerical Reliability of Econometric Software", Journal of Economic Literature, vol. 27, june, pp. 633-665. Los interesados pueden descargarlo en formato .pdf aquí. Existe una interesante página web desarrollada por el Information Technology Laboratory of the Statistical and Engineering Division en el National Institute for Standards and Technology (NIST). La página contiene unos "Statistical Reference Datasets" (StRD), que son problemas cuyas soluciones se saben correctas, por lo que sirven de contraste a los resultados de los paquetes estadísticos. Es muy recomendable el articulo, en dos partes, de McCullough, titulado "Assessing The Reliability of Statistical Software", que se puede encontrar en la sección "Related Resources and Links" de la página citada. Otra página interesante, alojada en la Universidad de Stanford, contiene un enlace a la batería de test básicos de Wilkinson, conocida como "Statistics Quiz", más un gran número de test adicionales.
Programas recomendados: Yo uso Stata 12, de Stata Corporation (www.stata.com), como programa con estimaciones pre-programadas (aunque Stata incluye un potente lenguaje de programación), que supera prácticamente todos los test de fiabilidad (http://www.stata.com//cert/). Es también recomendable GAUSS 12 (www.aptech.com, para Windows, Unix y Linux, y Mac OS X) como aplicación para la programación de test mediante lenguaje de matrices. Ambas aplicaciones están disponibles para Mac OS X (www.apple.com/es/macosx/), el sistema operativo basado en FreeBSD Unix de Apple, que son las máquinas que yo uso, pero también para ordenadores con sistemas operativos Unix, Linux y Windows. Apple cuenta además con el Advanced Computation Group, dedicado a la investigación en computación científica. Es de gran utilidad como complemento el programa Stat/Transfer 11, para conversión de unos formatos de archivos de bases de datos y programas estadísticos en otros (www.stattransfer.com). Una excelente web con http://www.ats.ucla.edu/stat/stata/
recursos
para
s
de
Stata:
Un paper excelente sobre la investigación económica con Stata, de Christopher Baum ("Facilitating Applied Economic Research with Stata"): http://econpapers.hhs.se/paper/bocbocoec/531.htm Este artículo puede bajarse también desde aquí. Dos documentos excelentes de introducción a Stata pueden encontrarse en esta otra interesante página del Boston College (sección de software): http://fmwww.bc.edu/ec/res.info.php Series de datos para http://ideas.repec.org/s/boc/bocins.html
entrenarse
con
Stata:
Módulos adicionales para Stata: http://ideas.repec.org/s/boc/bocode.html Unos estupendos scripts para adaptar BBEdit 10 (o la excelente versión gratuita TextWrangler 4) a Stata: http://dataninja.wordpress.com/2006/08/18/statascripts/. BBEdit es un gran editor de textos profesional para Mac OS X. Stata no sería lo mismo sin él.
Alternativas: Las alternativas son Eviews 7 (www.eviews.com, sólo funciona en Windows; es el antiguo MicroTSP), LIMDEP 10 (www.limdep.com, sólo para Windows) o TSP 5 (www.tspintl.com, para Windows, Linux, distintos Unix y Mac OS X), y MATLAB, de Mathworks Inc. (www.mathworks.com), como alternativa al GAUSS. Una página interesante con utilidades para la versión OS X de MATLAB es esta: http://www.esm.psu.edu/~ajm138/matlab_utils/ El software gratuito, bajo licencia GNU, Octave 3.6 (http://www.gnu.org/software/octave/) tiene la gran ventaja de utilizar prácticamente el mismo lenguaje que MATLAB, por lo que los programas son fácilmente portables entre uno y otro. Una amplia comunidad de desarrollo en torno a Octave le da soporte y extiende continuamente sus posibilidades. MATLAB y GAUSS tienen otra alternativa interesante en el gratuito Ox 6 (http://www.doornik.com/index.html, para todas las plataformas). Su principal ventaja es su rapidez, que incluye una completa librería de funciones matemáticas y estadísticas y la similitud de su sintaxis con la del lenguaje de programación C (aunque toma también cosas de C++ y Java). En este artículo puede encontrarse una descripción detallada. Por su parte, R es un potente software econométrico desarrollado bajo licencia GNU (http://www.r-project.org/). Puede considerarse una implementación distinta del lenguaje de programación S, desarrollado por los Laboratorios Bell (AT&T, hoy Lucent Technologies). BUGS es una aplicación de código abierto para inferencia bayesiana (http://www.mrcbsu.cam.ac.uk/bugs/). Por otro lado, GRETL es una aplicación multiplataforma
distribuida bajo una licencia de código abierto (http://gretl.sourceforge.net/gretl_espanol.html), y que los estudiantes pueden utilizar para sus trabajos, ya que tiene una interfaz intuitiva y es suficientemente completa y potente. Por último queda mencionar otros programas que pueden ser útiles. El SAS/STAT (www.sas.com) es el más completo que existe (con él se puede hacer de todo), gracias a sus excelentes módulos, pero es muy caro y no existe versión para OS X. Un buen programa para el análisis estadístico de datos y presentación de resultados es IBM SPSS Statistics 21 (antiguo SPSS a secas, www.spss.com/), que tiene competencia en JMP 10 (de la empresa que desarrolla SAS, www.jmp.com). Programas para el análisis matemático simbólico son Mathematica 8 (www.wolfram.com) y su competidor Maple 16 (www.maplesoft.com). Por último Scientific Word 5.5 (www.mackichan.com), para la elaboración de documentos científicos empleando LaTeX, pero sin versión para OS X (aunque actualmente trabajan en una nueva versión multiplataforma del programa, la 6, que no acaba de salir al mercado). Puede usarse también MacTeX sobre OS X (http://tug.org/mactex/). No obstante, no es mala opción el uso de Microsoft Word con alguna ayuda que se adapta bien a Word, como el programa de gestión de referencias bibliográficas EndNote X6 (www.endnote.com), aunque las más recientes versiones de Office traen ya buenas herramientas para gestionar las referencias bibliográficas. Quien decida estudiar econometría para la investigación aplicada haría bien en hacerlo con uno de esos programas a mano.