Little Big Data

July 20, 2016

Uno de los objetivos de la estadística es inferir el comportamiento de una población tomado en cuenta una muestra aleatoria de la misma. Es por eso que existen las encuestas, es a través de ellas que se pueden deducir información que corresponde a toda la población sin necesidad de preguntar a cada uno de los individuos. 

 

 

Pero la estadística es mucho más que una encuesta, en una encuesta es muy difícil tomar datos aleatorios sin inducir un sesgo a la muestra, principalmente por la forma en que se realiza la encuesta, si la hacemos telefónica tendremos una muestra que representa únicamente a la población que cuenta con teléfono, si nos ponemos a la salida del metro, tendremos información únicamente de las personas que viajan en metro. 

 

Por otro lado, obtener una muestra aleatoria de un conjunto de datos en una computadora es mucho más fácil. 

 

Sorprende entonces la obsesión que algunas personas tienen con las palabras Big Data. Pronunciarlas es como pertenecer a un grupo de iniciados al que las personas normales no tenemos acceso. 

 

Además estamos acostumbrados a trabajar con porcentajes, éstos forman parte de nuestra vida, tanto así que nos fascina escuchar cosas expresadas en porcentaje por que parecen mucho más serias e informadas de esa forma pero que, tal vez, no tengan ningún sentido. Por ejemplo, alguien que expresa que su equipo tiene un 80% de probabilidades de ganar. La probabilidad de los eventos solo tienen sentido cuando no se participa en ellos, para todos los participantes el evento sucede o no (y eso no quiere decir que tenga una probabilidad del 50%). 

 

Pero si una virtud tienen los porcentajes es que precisamente nos permiten darnos una idea de cuan importante es un asunto independientemente del tamaño del conjunto, es decir, sabemos que si el conjunto es pequeño el porcentaje representa un número pequeño también y de la misma forma si el conjunto es grande el porcentaje resultará en un número elevado. 

 

Al final, si tenemos un "Big Data" o un "Small Data" estos sirven par lo mismo, sacamos la media, la mediana, la moda, y todos los porcentajes que pasen por nuestra mente que son igualmente representativos en el conjunto chico y el grande. 

 

 

 

Más información: una guía de conversión de Big Data a datos manejables aquí.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

+

Tags:Análisis Científico de Datos

Please reload

.

 

Featured Posts

Gobierno de Datos (Inventario de Datos)

March 14, 2017

1/10
Please reload

Recent Posts

October 22, 2016

September 14, 2016

Please reload

Búsqueda por Tags
Síguenos
  • Wix Facebook page
  • Twitter Classic
  • Google Classic
  • LinkedIn App Icon