La tabla de distribución normal, explicada

01 Qué es la distribución normal (Diciembre 2024)

01 Qué es la distribución normal (Diciembre 2024)
La tabla de distribución normal, explicada
Anonim

La fórmula de distribución normal se basa en dos parámetros simples - media y desviación estándar - que cuantifican la características de un conjunto de datos dado. Mientras que la media indica el valor "central" o promedio de todo el conjunto de datos, la desviación estándar indica la "dispersión" o variación de los puntos de datos alrededor de ese valor medio.

Considere los siguientes 2 conjuntos de datos:

Dataset 1 = {10, 10, 10, 10, 10, 10, 10, 10, 10, 10}

Dataset 2 = {6, 8, 10, 12, 14, 14, 12, 10, 8, 6}

Para Dataset1, mean = 10 y la desviación estándar (stddev) = 0

Para Dataset2, mean = 10 y desviación estándar (stddev) = 2. 83

Grabemos estos valores para DataSet1:

De manera similar para DataSet2:

La línea horizontal roja en los gráficos anteriores indica el valor "medio" o promedio de cada conjunto de datos (10 en ambos casos). Las flechas rosadas en el segundo gráfico indican la extensión o variación de los valores de datos del valor medio. Esto se representa por el valor de desviación estándar de 2. 83 en el caso de DataSet2. Como DataSet1 tiene todos los valores iguales (como 10 cada uno) y no tiene variaciones, el valor stddev es cero y, por lo tanto, no se aplican flechas rosadas.

El valor stddev tiene algunas características significativas y útiles que son extremadamente útiles en el análisis de datos. Para una distribución normal, los valores de los datos se distribuyen simétricamente en cualquier lado de la media. Para cualquier conjunto de datos distribuidos normalmente, graficación de gráficos con stddev en el eje horizontal y no. de valores de datos en el eje vertical, se obtiene el siguiente gráfico.

Propiedades de una distribución normal

  1. La curva normal es simétrica con respecto a la media;
  2. La media está en el medio y divide el área en dos mitades;
  3. El área total bajo la curva es igual a 1 para mean = 0 y stdev = 1;
  4. La distribución está completamente descrita por su media y stddev

Como se puede ver en el gráfico anterior, stddev representa lo siguiente:

  • 68. 3% de los valores de datos están dentro de 1 desviación estándar de la media (-1 a +1)
  • 95. 4% de valores de datos están dentro de 2 desviaciones estándar de la media (-2 a +2)
  • 99. 7% de valores de datos están dentro de 3 desviaciones estándar de la media (-3 a +3)

El área debajo de la curva en forma de campana, cuando se mide, indica la probabilidad deseada de un dado rango:

  • menor que X: - e. gramo. probabilidad de que los valores de los datos sean menores que 70
  • mayores que X - e. gramo. probabilidad de que los valores de datos sean mayores que 95
  • entre X 1 y X 2 - e. gramo. probabilidad de valores de datos entre 65 y 85

donde X es un valor de interés (ejemplos a continuación).

Trazar y calcular el área no siempre es conveniente, ya que los diferentes conjuntos de datos tendrán diferentes valores de media y stddev.Para facilitar un método estándar uniforme para facilitar los cálculos y la aplicabilidad a problemas del mundo real, se introdujo la conversión estándar a valores Z, que forman la parte de la Tabla de distribución normal .

Z = (X - media) / stddev, donde X es la variable aleatoria.

Básicamente, esta conversión fuerza a la media y stddev a estandarizarse a 0 y 1 respectivamente, lo que permite utilizar un conjunto definido estándar de valores Z (de la Tabla de distribución normal ) para realizar cálculos sencillos . Una instantánea de la tabla de valores z estándar que contiene los valores de probabilidad es la siguiente:

z

0. 00

0. 01

0. 02

0. 03

0. 04

0. 05

0. 06

0. 0

0. 00000

0. 00399

0. 00798

0. 01197

0. 01595

0. 01994

0. 1

0. 0398

0. 04380

0. 04776

0. 05172

0. 05567

0. 05966

0. 2

0. 0793

0. 08317

0. 08706

0. 09095

0. 09483

0. 09871

0. 3

0. 11791

0. 12172

0. 12552

0. 12930

0. 13307

0. 13683

0. 4

0. 15542

0. 15910

0. 16276

0. 16640

0. 17003

0. 17364

0. 5

0. 19146

0. 19497

0. 19847

0. 20194

0. 20540

0. 20884

0. 6

0. 22575

0. 22907

0. 23237

0. 23565

0. 23891

0. 24215

0. 7

0. 25804

0. 26115

0. 26424

0. 26730

0. 27035

0. 27337

Para encontrar la probabilidad relacionada con el valor z de 0. 239865 , redondee primero a 2 decimales (es decir, 0. 24). Luego verifique los primeros 2 dígitos significativos (0. 2) en las filas y para el dígito menos significativo (restante 0. 04) en la columna. Eso llevará al valor de 0. 09483.

Aquí puede encontrar la tabla de distribución normal completa, con una precisión de hasta 5 puntos decimales para los valores de probabilidad (incluidos los valores negativos).

Veamos algunos ejemplos de la vida real. La altura de los individuos en un grupo grande sigue un patrón de distribución normal. Supongamos que tenemos un conjunto de 100 individuos cuyas alturas se registran y la media y el stddev se calculan para 66 y 6 pulgadas respectivamente.

Aquí hay algunas preguntas de muestra que se pueden responder fácilmente usando la tabla de valores z:

  • ¿Cuál es la probabilidad de que una persona en el grupo mida 70 pulgadas o menos?

La pregunta es para encontrar valor acumulado de P (X <= 70) i. mi. en todo el conjunto de datos de 100, cuántos valores estarán entre 0 y 70.

Primero, convierta el valor X de 70 en el valor Z equivalente.

Z = (X - media) / stddev = (70-66) / 6 = 4/6 = 0. 66667 = 0. 67 (redondee a 2 lugares decimales)

Ahora necesitamos encontrar P (Z <= 0. 67) = 0. 24857 (de la tabla z anterior)

i. mi. hay un 24. 857% de probabilidad de que un individuo en el grupo sea menor o igual a 70 pulgadas.

Pero espera, lo anterior está incompleto.Recuerde, estamos buscando la probabilidad de todas las alturas posibles hasta 70 i. mi. de 0 a 70. Lo anterior simplemente le da la porción del valor medio al deseado (es decir, 66 a 70). Necesitamos incluir la otra mitad, de 0 a 66, para llegar a la respuesta correcta.

Como 0 a 66 representa la mitad (es decir, un extremo a medio camino), su probabilidad es simplemente 0. 5.

De ahí la probabilidad correcta de que una persona sea 70 pulgadas o menos = 0. 24857 + 0. 5 = 0. 74857 = 74. 857%

Gráficamente (calculando el área), estas son las dos regiones sumadas que representan la solución:

  • ¿Cuál es la probabilidad de que una persona mida 75 pulgadas o más?

yo. mi. Encuentre Complementario acumulativo P (X> = 75).

Z = (X - media) / stddev = (75-66) / 6 = 9/6 = 1. 5

P (Z> = 1. 5) = 1- P (Z <= 1. 5) = 1 - (0. 5 + 0. 43319) = 0. 06681 = 6. 681%

  • ¿Cuál es la probabilidad de que una persona tenga entre 52 pulgadas y 67 pulgadas?

Encuentre P (52 <= x <= 67).

P (52 <= x <= 67) = p [(52-66) / 6 <= z <= (67-66) / 6] = p (-2. 33 <= z <= 0. 17)

= P (Z <= 0.17) -p (Z <= -0. 233) = (0. 5 + 0. 56749) - (. 40905) =

Este normal la tabla de distribución (y los valores z) comúnmente encuentra uso para cualquier cálculo de probabilidad sobre movimientos de precios esperados en bolsa para acciones e índices. Se utilizan en la negociación basada en rango, identificando tendencia alcista o tendencia bajista, niveles de soporte o resistencia y otros indicadores técnicos basados ​​en los conceptos de distribución normal de la media y la desviación estándar.