¿que es la estadística?
La estadística es una ciencia matemática especializada en el análisis de grandes volúmenes de información para de ella extraer conclusiones. Tras analizar los datos deduce determinadas características de dicha información.
Se puede distinguir entre:
métodos numéricos para la caracterización de variables :Estadística descriptiva: analiza un conjunto de datos y extrae conclusiones.Ejemplo: se analiza la estatura y el peso de los alumnos de una clase y se determina cual es el valor medio, cuales son los máximos y los mínimos, cual son los valores más repetidos.
Estadística inferencia: en base a un conjunto de datos permite predecir cómo se puede comportar la variable en un futuro, o bajo determinadas circunstancias.Ejemplo: se analiza una serie de variables económicas (consumo, renta, paro, etc.) y a partir de ahí se predice cual puede ser la evolución futura de la economía.
MEDIDAS DE LOCALIZACIÓN
Las medidas de localización dividen la distribución en pares iguales, sirven para clasificar a un individuo o elemento dentro de una determinada población o muestra.
Clasificación
Media: X = Σ xi
n
Mediana: Pares 12345678 → 4+5
2
Impares 1234567 → 4
Moda: Dato que mas se repite, puede ser de 3 formas:
Clasificación
Media: X = Σ xi
n
Mediana: Pares 12345678 → 4+5
2
Impares 1234567 → 4
Moda: Dato que mas se repite, puede ser de 3 formas:
- Modales: números que se repiten una sola vez → 1223456789
- Bimodales: números que se repiten dos veces → 12233456789
- Multimodales: números que se repiten mas de dos veces →1223344556789
- Amodales: Los números no tienes repeticiones → 123456789
Percentiles: Los percentiles son los 99 valores que dividen la serie de datos en 100 partes iguales.
i = P . n
100
Deciles: Deciles son los 9 valores que dividen la serie de datos en 10 partes iguales.
i = P . n
10
Cuartiles: Son los 3 valores de la variable que dividen a un conjunto de datos ordenados en cuatro partes iguales. Q1, Q2, Q3 determinan los valores correspondientes al 25%, 50% y 75% de los datos.
Q1 = 25 . n
100
En el siguiente video podemos ver un ejemplo de como se calculan las medidas de localización:
MEDIDAS DE VARIABILIDAD Y DISPERSIÓN
Nos ayudan a determinar la variación de los datos y determinan como se agrupan o se dispersan los datos alrededor de un promedio.
Para calcular la variabilidad que una distribución tiene respecto de su media, se calcula la media de las desviaciones de las puntuaciones respecto a la media aritmética. Pero la suma de las desviaciones es siempre cero, así que se adoptan dos clases de estrategias para salvar este problema. Una es tomando las desviaciones en valor absoluto (Desviación media) y otra es tomando las desviaciones al cuadrado (Varianza).
Rango intercuartil: Representa el 50% de los datos centrales
Para calcular la variabilidad que una distribución tiene respecto de su media, se calcula la media de las desviaciones de las puntuaciones respecto a la media aritmética. Pero la suma de las desviaciones es siempre cero, así que se adoptan dos clases de estrategias para salvar este problema. Una es tomando las desviaciones en valor absoluto (Desviación media) y otra es tomando las desviaciones al cuadrado (Varianza).
Rango intercuartil: Representa el 50% de los datos centrales
IQR = Q3 - Q1
Varianza: Sirve para comparar la variabilidad de dos o mas variables. La hay de dos tipos:
Muestral: S² = Σ(xi - X)²
n-1
Poblacional: Õ² = Σ(xi - )²
N
Desviación estandar: Es una medida que informa de la media de distancias que tienen los datos repecto de su media aritmetica expresada en las mismas unidades que la variable.
Muestral: S = S²
Poblacional: Õ = Õ²
Punto Z: Determina que tan lejos esta un punto de la media y se calcula:
Z = xi - X
S
Campa de Gauss: La campana de Gauss es una representación gráfica de la distribución normal de un grupo de datos. Éstos se reparten en valores bajos, medios y altos, creando un gráfico de forma acampanada y simétrica con respecto a un determinado parámetro. El punto máximo de la curva corresponde a la media, y tiene dos puntos de inflexión a ambos lados.
Este gráfico se usa en variables asociadas a fenómenos naturales: caracteres morfológicos de individuos como la estatura o el peso, caracteres fisiológicos como el efecto de un fármaco, caracteres sociológicos como el consumo de un determinado producto por un mismo grupo de individuos, caracteres psicológicos como el cociente intelectual.
Teorema de Chevichev: Permite conocer a cierta escala el comportamiento de sus individuos sabiendo la media y la desviación tipica.
1 - 1
Z²
Diagrama de Caja: Un diagrama de caja es un gráfico, basado en cuartiles, mediante el cual se visualiza un conjunto de datos. Está compuesto por un rectángulo, la "caja", y dos brazos, los "bigotes".
Es un gráfico que suministra información sobre los valores mínimo y máximo, los cuartiles Q1, Q2 o mediana y Q3, y sobre la existencia de valores atípicos y la simetría de la distribución.
Para el calculo de los "bigotes" se utiliza la siguiente formula:
Limite inferior: Q1 - 1,5(IQR)
Limite superior: Q2 + 1,5(IQR)
No hay comentarios:
Publicar un comentario