Estadística "in a nutshell"
Estadística descriptiva
La estadística descriptiva es una disciplina matemática de tratamiento de datos para entender los fenómenos que están detrás de éstos. La estadística descriptiva incluye visualizaciones y cálculos sobre conjuntos de datos como el promedio, análisis de tendencias, frecuencias y correlaciones
1) Medidas de tendencia central
Media aritmética
La media aritmética es un cálculo intuitivo probablemente derivado del concepto de centro de masa. Se trata de encontrar el valor que representa la mitad de los valores obtenidos. Como el promedio es utilizado en todos los sistemas educativos como forma de evaluación, es un cálculo muy conocido, razón por la cual, dejaremos de lado su discusión
Mediana
La mediana es el valor que divide a los datos por la mitad. Debe existir la misma cantidad de datos mayores que menores en un conjunto de datos.
Moda
La moda es el valor que más se repite en un conjunto de datos finito. En conjuntos de datos relativamente pequeños la moda puede ser un valor inexistente, mientras que, claramente, tanto la media como la mediana pueden calcularse en conjuntos de tamaño mínimo, razón por la cual son mucho más populares como instrumentos de análisis.
2) Medidas de dispersión
Mientras que las medidas de tendencia central están orientadas al manejo de un valor que represente al conjunto olvidándonos de los individuos, las medidas de dispersión están pensadas para describir que tanto los elementos del conjunto se alejan de los representantes centrales.
Rango
Si tenemos un conjunto de datos numéricos ordenados existirán dos valores extremos, el mínimo y el máximo. La diferencia entre éstos dos valores es el rango.
Varianza
La varianza es la medida del cuadrado de las distancia que existen entre los datos numéricos de un conjunto. Es el cuadrado de la distancia porqué, es de esperarse que la suma de todas las distancias sea cero al tomar distancias positivas y negativas.
Desviación estándar
La desviación estándar es la raíz cuadrada la varianza. Representa entonces la distancia entre los datos numéricos. Es un cálculo más fiel que la varianza ya que ésta se ve incrementada cuando su valor es mayor que 1 y por el contrario es atenuada en cuando su valor es menor a 1. Claramente, si la varianza es aproximadamente 1 la desviación estándar carece de trascendencia.