Actualmente, existen muchos programas, paquetes o software estadístico en el mercado, sin embargo, existe un incremento en preferencias hacia utilizar Python o R:
- Python es un lenguaje de programación de propósito general y es favorecido principalmente por científicos de datos y programadores.
- R es utilizado principalmente por analistas de datos, estadísticos y académicos.
Sin embargo, ambos R y Python se pueden utilizar con éxito en el análisis de datos o en la ciencia de datos, así mismo existen otros de uso popular que difieren considerablemente en términos de sus fortalezas, debilidades y manejo. La decisión sobre qué paquete estadístico es el más adecuado debe tomarse con cuidado. Cambiar a un nuevo software estadístico puede resultar en tiempo y costos de licencias y reentrenamiento. A continuación, algunas referencias acerca de los software estadísticos como Python, R, STATA, SPSS, EViews, Gretl, SAS, MiniTab, Octave, Julia, Hoja de cálculo, Aremos, TSP, Shazam, Mathematica o MatLab.
Python
Python es un lenguaje de programación multipropósito, abierto e interpretado y funcional, como C ++ y Java, por tanto, requiere conocimientos en programación sin embargo es fácil de aprender que se ha convertido en una alternativa igual para los proyectos de ciencia de datos en los últimos años. Python es práctico como software de estadísticas mediante el uso de paquetes, que se pueden instalar fácilmente y ser integrado a otros paquetes como SPSS, STATA o Eviews. Python también es utilizado como lenguaje para desarrollo web. Puede ser instalada independientemente o por el distribuidor Anaconda de Python.
R
R project es un entorno de estadísticas de código abierto popular que se puede ampliar con paquetes casi a voluntad y ser integrado a SPSS. R se usa comúnmente con RStudio, un entorno de desarrollo cómodo que se puede usar localmente o en una instalación cliente-servidor a través de un navegador web. Las aplicaciones R también se pueden utilizar de forma directa e interactiva en la web a través de Shiny. R es considerado como un software más difícil de aprender y usar que los competidores sin embargo actualmente existen muchos manuales.
SPSS
El SPSS IBM es particularmente fácil de usar y es uno de los programas de estadística más utilizados sobre todo para el análisis explicativo o estadísticas descriptiva, se usa comúnmente en la academia, particularmente en ciencias sociales y sobre en la investigación de mercado donde se aplica un cuestionario para medir la percepción de las personas, así mismo no se requieren conocimientos especiales por parte del usuario solo hace falta un “hacen clic” para obtener resultados. Por ejemplo, regresiones lineales y análisis de ANOVA se pueden hacer en pocos minutos.
STATA
Stata es un software estadístico comercial que es particularmente favorecido por los econometristas, es un software maduro, muy estable y potente, su distribución, especialmente en empresas, es baja. Para los usuarios que valoran un amplio espectro de métodos, la estabilidad, un concepto operativo maduro que incluye un lenguaje de programación y un precio justo, STATA es superior a la competencia comercial más cara. Puede manejar grandes datasets.
EViews
EViews está particularmente establecido en econometría y se enfoca en trabajar con datos de series de tiempo. Se utiliza principalmente en la carrera de economía e institutos de investigación económica. Una alternativa menos poderosa para el análisis de series de tiempo es el software gratuito JMulTi, que se implementa en JAVA.
Gretl
Gretl es un software econométrico utilizado generalmente por economistas, es un paquete de libre distribución orientado al igual que Eviews al análisis de series de tiempo. Tiene una interfaz gráfica y puede interactuar con R-project. De igual manera Gretl están los paquetes como Aremos, TSP o Shazam.
JMulTi
JMulTi fue diseñado originalmente como una herramienta para ciertos procedimientos econométricos en el análisis de series temporales que son especialmente difíciles de usar y que no están disponibles en otros paquetes, como el análisis de respuesta al impulso con intervalos de confianza bootstrap para el modelado VAR/VEC. Ahora se han integrado muchas otras características para hacer posible la realización de un análisis integral. Las limitaciones de este software se pueden superar exportando conjuntos de datos o resultados de cálculos y utilizándolos con otros programas.
SAS
SAS Institute ofrece un software de estadísticas profesional que se usa comúnmente en biometría, investigación clínica y en el sector bancario, es una herramienta poderosa y muy estable que es particularmente bien utilizada por las grandes organizaciones y se ha convertido en el cuasi estándar para muchos análisis en el sector farmacéutico. El software consta de diferentes módulos, algunos de los cuales siguen conceptos operativos completamente diferentes, y la formación para SAS es compleja. En comparación con otros competidores comerciales, SAS es una de las soluciones más caras (que está parcialmente impulsada por su enfoque en empresas y organizaciones más grandes).
RATS
RATS es un programa estadístico para econometría principalmente para análisis de regresión y series de tiempo.
LIMDEP y NLOGIT
LIMDEP y NLOGIT de Econometric Software inc, son paquetes de software estadístico de última generación en los que confían expertos analíticos e instituciones de todo el mundo desde hace más de 25 años. Proporcionan soluciones estadísticas fáciles de usar, flexibles y extensas para todas sus aplicaciones de análisis de datos.
Minitab
Minitab es un programa de computadora diseñado para ejecutar funciones estadísticas básicas y avanzadas, este programa es utilizado principalmente para el análisis de control de calidad en los procesos.
Octave
GNU Octave es un lenguaje de alto nivel, diseñado principalmente para cálculos numéricos. Proporciona una interfaz de línea de comandos conveniente para resolver numéricamente problemas lineales y no lineales y para realizar otros experimentos numéricos utilizando un lenguaje que es principalmente compatible con muchos scripts de Matlab por tanto se puede utilizar sus funciones estadísticas.
Julia
Julia es un lenguaje de programación de alto nivel y alto desempeño para la computación genérica, técnica y científica, con una sintaxis similar a la de otros entornos de computación similares. Incluye varias bibliotecas matemáticas, herramientas de manipulación de datos y paquetes para computación de propósito general. Además, se pueden usar bibliotecas de Python, R, C/Fortran, C ++ y Java.
MLwiN
MLwiN es un paquete de software estadístico para ajustar modelos multinivel. Utiliza tanto la estimación de máxima verosimilitud como los métodos de Monte Carlo de cadena de Markov (MCMC). MLwiN representa modelos multinivel utilizando notación matemática que incluye letras griegas y múltiples subíndices, por lo que el usuario debe estar familiarizado con dicha notación.
Hoja de cálculo
Una hoja de cálculo es un tipo de documento que permite manipular datos numéricos, estadisticos y alfanuméricos dispuestos en forma de tablas compuestas por celdas, las cuales se suelen organizar en una matriz de filas y columnas. Las hojas de cálculos disponibles y más populares con el Microsoft Excel integrada en Microsoft Office, Calc integrada en LibreOffice, Numbers integrada en iWork de Apple, KSpread integrada en KOffice de Linux, Google Sheets integrado en las aplicaciones de Google y otros.
raXL (Risk Analysis in Excel) raXL Econometrics (VBA) y raXL Stat para estimar ACF, ARIMA o GARCH, el cual se puede descargar.
La hoja de cálculo Microsoft Excel, tiene muchos complementos para el análisis Estadístico y Econométrico desde Descriptiva, Regresión, Series de Tiempo o Simulación Monte Carlo tales como Crystal Ball, XLSTAT o el NumXL.
Estos dos programas comerciales se utilizan para problemas de orientación más numérica, son programa utilizado en áreas científicas, de ingeniería, matemática y áreas computacionales, por lo que tienen incluidos las bibliotecas estadísticas como Python o R.
El software estadístico que se elija para el análisis de datos, depende del tipo de datos. Existen muchos campos y profesiones donde se requiere el análisis de datos como físicos, químicos, biólogos ingenieros, economistas, científicos sociales, investigadores médicos, bioestadísticos, epidemiólogos, sociólogos, científicos políticos, geógrafos, psicólogos y otros profesionales.
Todo los software estadísticos tienen alguna especialidad o preferencia de uso, con sus respectivas limitaciones y ventajas según los tipos de datos que usamos, como dijimos Python tiene mucha potencialidad de desarrollo respecto a nuevo métodos estadísticos, sin embargo las mas populares académicamente son: Stata es un paquete moderno y general para un amplio análisis de métodos estadísticos impulsado por comandos, gestión de datos y gráficos; el Eviews es común para series de tiempo y análisis de panel; y el SPSS atractivo para la investigación de mercados. Y finalmente, en el ámbito laboral es casi obligatorio tener algunas destrezas en el uso de alguna hoja de cálculo para el análisis de datos básicos como MS-Excel, Hoja de cálculo google Sheets o el Calc de LibreOffice.
COMENTARIOS: