Estadística de bondad de ajuste. Criterio de acuerdo. ¿Qué haremos con el material recibido?

Dado que todos los supuestos acerca de la naturaleza de una distribución particular son hipótesis, no declaraciones categóricas, naturalmente, deben someterse a pruebas estadísticas utilizando las llamadas pruebas de bondad de ajuste.

Los criterios de bondad de ajuste, basados \u200b\u200ben la ley de distribución establecida, permiten establecer cuándo las discrepancias entre las frecuencias teóricas y empíricas deben reconocerse como insignificantes (aleatorias) y cuándo - significativas (no aleatorias). Así, los criterios de bondad de ajuste permiten rechazar o confirmar la veracidad de la hipótesis planteada al alinear la serie.

sobre la naturaleza de la distribución en la serie empírica y dar una respuesta si es posible aceptar para una distribución empírica dada un modelo expresado por alguna ley de distribución teórica.

Hay una serie de criterios para el consentimiento. Más a menudo que otros, se utilizan los criterios de Pearson, Romanovsky y Kolmogorov. Vamos a considerarlos.

La prueba de bondad de ajuste de Pearson% 2 (chi-cuadrado) es una de las principales pruebas de bondad de ajuste. El criterio fue propuesto por el matemático inglés Karl Pearson (1857-1936) para evaluar la aleatoriedad (significancia) de las discrepancias entre las frecuencias de las distribuciones empírica y teórica. Criterio de Pearson donde k

el número de grupos en los que se divide la distribución empírica;

la frecuencia observada de la característica en el i-ésimo grupo; frecuencia teórica calculada a partir de la distribución supuesta. Para la distribución de y), se compilan tablas que indican el valor crítico del criterio de concordancia% 2 para el nivel de significancia seleccionado ay un número dado de grados de libertad V (ver Apéndice 4).

El nivel de significancia a es la probabilidad de rechazo erróneo de la hipótesis propuesta, es decir la probabilidad de que se rechace una hipótesis correcta. En los estudios estadísticos, dependiendo de la importancia y responsabilidad de las tareas a resolver, se utilizan los siguientes tres niveles de significancia: 1)

a \u003d 0,10, luego P \u003d 0,90; 2)

a \u003d 0.05, luego P \u003d 0.95; 3)

a \u003d 0,01, luego P \u003d 0,99.

Por ejemplo, una probabilidad de 0.01 significa que la hipótesis correcta puede rechazarse en un caso de cada 100. En la investigación económica, la probabilidad de un error de 0,05 se considera prácticamente aceptable, es decir, en 5 casos de 100, se puede rechazar la hipótesis correcta.

Además, el criterio% 2 determinado a partir de la tabla también depende del número de grados de libertad. El número de grados de libertad V se define como el número de grupos en la serie de distribución k menos el número de enlaces con V

Se entiende por número de conexiones el número de indicadores de la serie empírica utilizados en el cálculo de frecuencias teóricas, es decir indicadores que vinculan empíricos y teóricos

frecuencias

Entonces, en el caso de la alineación a lo largo de la curva de distribución normal, hay tres relaciones:

x ~ x "" SU \u003d a "* x W \u003d Y

EMF theor 'EMF TheOr\u003e ^ 1EMF ^ / theor *

Por lo tanto, al alinear a lo largo de la curva de distribución normal, el número de grados de libertad se determina como V \u003d k - 3, donde k es el número de grupos en la fila.

En el caso de la alineación a lo largo de la curva de Poisson, V \u003d k - 2, ya que se utilizan dos restricciones limitantes en la construcción de frecuencias: x, 1tr /

Para evaluar la importancia relativa, el valor calculado de% 2calculated se compara con el tabular% 2tab.

Si las distribuciones teóricas y empíricas coinciden completamente,% 2 \u003d 0, de lo contrario% 2\u003e 0.

Si Xcalc\u003e Xtabl 'T0 PARA un nivel dado de significancia ay el número de grados de libertad V, rechazamos la hipótesis de que las discrepancias son insignificantes (aleatorias).

Si% 2acc ^ X2tabL 'concluimos que la serie empírica concuerda bien con la hipótesis de la distribución supuesta y con la probabilidad (1 - a), se puede argumentar que la discrepancia entre las frecuencias teórica y empírica es accidental.

Utilizando el criterio de acuerdo? 2, se deben cumplir las siguientes condiciones: 1)

el volumen de la población estudiada debe ser lo suficientemente grande (UU\u003e 50), mientras que la frecuencia o tamaño de cada grupo debe ser de al menos 5.

Si se viola esta condición, es necesario combinar primero las frecuencias pequeñas; 2)

la distribución empírica debe seleccionarse al azar, es decir, deben ser independientes.

Si en la serie empírica la distribución viene dada por las frecuencias / \\ m.

entonces y) debe calcularse mediante la fórmula

El criterio de Romanovsky Kp se basa en el criterio de Pearson% 2, es decir valores ya encontrados% 2, y el número de grados de libertad v:

Es muy útil en ausencia de tablas para% 2.

Si Kr 3, entonces no al azar

y, en consecuencia, la distribución teórica no puede servir como modelo para la distribución empírica estudiada.

El criterio X de Kolmogorov se basa en determinar la máxima discrepancia entre las frecuencias acumuladas o frecuencias de distribuciones empíricas y teóricas:

X \u003d -2 \u003d o X \u003d, iN

donde Dud es la diferencia máxima entre las frecuencias acumuladas (F - F ") y entre las frecuencias acumuladas

nym frecuencias (p - p ") de series de distribuciones empíricas y teóricas;

N es el número de unidades en el agregado.

Habiendo calculado el valor de X, de acuerdo con la tabla P (k) (ver Apéndice 6), determine la probabilidad con la que se puede argumentar que las desviaciones de las frecuencias empíricas de las teóricas son aleatorias. La probabilidad P (k) puede variar de 0 a 1. Cuando P (k) \u003d 1 hay una coincidencia completa de frecuencias, cuando P (k) \u003d 0 - una divergencia completa. Si A, toma valores hasta 0.3, entonces P (k) \u003d 1.

La condición principal para utilizar el criterio de Kolmogorov es un número suficientemente grande de observaciones.

Ejemplo. Usando los datos de la tabla. 5.17, para comprobar la veracidad de la hipótesis planteada sobre la distribución de reclutas en el área según la ley de distribución normal. Los valores necesarios para calcular los criterios de bondad de ajuste se dan en la tabla. 5.19.

Cuadro 5.19

Cálculo de cantidades para determinar los criterios de concordancia de Pearson x2 y Kolmogorov X Altura, cm Frecuencias de la serie de distribución (/ n - t ") 2 t" FF "cr, \\ t" A 1 2 3 4 5 6156-160 8 5 1 , 8 8 5 3161-165 17 16 0,1 25 21 4 166-170 42 40 0,1 67 61 6171-175 54 65 1,9 121126 5176-180 73 73 0194199 5181-185 57 57 0251256 5186-190 38 30 2.1 289286 3191-195 11 11 0300297 3 X 300297 6.0 Primero, calcule el criterio de Pearson

Luego elegimos el nivel de significancia a \u003d 0.05 y determinamos el número de grados de libertad V.En esta distribución hay 8 grupos y el número de conexiones (parámetros) es 3, por lo tanto, V \u003d 8 - 3 \u003d 5. De acuerdo con la tabla del Apéndice 4, encontramos para a \u003d 0, 05 y V \u003d 5 Prueba de Pearson% 2 \u003d 11.07.

Dado que% 2 se calculó, comprobemos la hipótesis planteada mediante la prueba de Romanovsky:

Yo X2 - V Yo 16.0 - 5 Yo 1

cr \u003d] G \u003d ^ \u003d 1 \u003d --r \u003d 0.3.

Dado que el criterio de Kp Romanovsky también confirma que las discrepancias entre las frecuencias empírica y teórica son insignificantes.

Consideremos ahora la aplicación del criterio A, de Kolmogorov. Como puede ver en la tabla. 5.19, la diferencia máxima entre las frecuencias acumuladas es 6, es decir B \u003d shah! / 1 - P "\\ \u003d 6. Por lo tanto, el criterio de Kolmogorov

X \u003d -? \u003d \u003d \u003d 0,35.

De acuerdo con la tabla del Apéndice 6, encontramos el valor de probabilidad en X \u003d 0.35: P (X) \u003d 0.9997. Esto significa que con una probabilidad cercana a la unidad, se puede argumentar que la hipótesis de una distribución normal no se rechaza, y las discrepancias entre las distribuciones empírica y teórica son aleatorias.

Ahora, una vez confirmada la exactitud de la hipótesis planteada utilizando los conocidos criterios de bondad de ajuste, es posible utilizar los resultados de la distribución para actividades prácticas.

Ejemplo. Usando los datos de la tabla. 5.18, para probar la hipótesis de que la distribución del número de fallas en los automóviles obedece a la ley de Poisson.

Los datos iniciales y el cálculo de los valores necesarios para determinar los criterios de bondad se dan en la tabla. 5.20.

Calculemos el valor% 2: 2

Dfasch ^ / 9

(ver tabla 5.20). xXtabl \u003d 9\u003e 49

(ver Apéndice 4).

Dado que% 2 calculó Por lo tanto, la hipótesis sobre la distribución del número de fallas en automóviles de acuerdo con la ley de Poisson no se rechaza.

Introducción

La relevancia de este tema es que durante el estudio de los fundamentos de la bioestadística, asumimos que se conoce la ley de distribución de la población general. Pero, ¿qué pasa si se desconoce la ley de distribución, pero hay razones para suponer que tiene una determinada forma (llamémosla A), entonces se prueba la hipótesis nula: la población general se distribuye de acuerdo con la ley A. Esta hipótesis se prueba usando una variable aleatoria especialmente seleccionada: la prueba de bondad de ajuste.

Las pruebas de bondad de ajuste son pruebas de hipótesis sobre la correspondencia de una distribución empírica con una distribución de probabilidad teórica. Dichos criterios se dividen en dos clases:

  • III Los criterios generales de bondad de ajuste se aplican a la formulación más general de una hipótesis, es decir, a la hipótesis de que los resultados observados concuerdan con cualquier distribución de probabilidad asumida a priori.
  • III Las pruebas especiales de bondad de ajuste implican hipótesis nulas especiales que establecen concordancia con una determinada forma de la distribución de probabilidad.

Criterio de consentimiento

Los criterios de bondad de ajuste más comunes son omega-cuadrado, chi-cuadrado, Kolmogorov y Kolmogorov-Smirnov.

Las pruebas de bondad no paramétricas de Kolmogorov, Smirnov y omega cuadrado se utilizan ampliamente. Sin embargo, están asociados con errores generalizados en la aplicación de métodos estadísticos.

El punto es que los criterios enumerados fueron diseñados para probar la concordancia con una distribución teórica completamente conocida. Las fórmulas de cálculo, las tablas de distribuciones y los valores críticos están muy extendidas. La idea principal de los criterios de Kolmogorov, omega cuadrado y similares es medir la distancia entre la función de distribución empírica y la función de distribución teórica. Estos criterios difieren en forma de distancias en el espacio de funciones de distribución.

Prueba de bondad ch2 de Pearson para una hipótesis simple

El teorema de K. Pearson se refiere a ensayos independientes con un número finito de resultados, es decir, a las pruebas de Bernoulli (en un sentido algo ampliado). Le permite juzgar si las observaciones en una gran cantidad de ensayos son consistentes con la frecuencia de estos resultados con sus probabilidades asumidas.

En muchos problemas prácticos, se desconoce la ley de distribución exacta. Por tanto, se plantea una hipótesis sobre la correspondencia de la ley empírica existente, construida a partir de observaciones, con alguna teórica. Esta hipótesis requiere pruebas estadísticas, cuyos resultados serán confirmados o refutados.

Sea X la variable aleatoria en estudio. Se requiere probar la hipótesis H0 de que esta variable aleatoria obedece a la ley de distribución F (x). Para hacer esto, es necesario hacer una muestra de n observaciones independientes y usarla para construir una ley de distribución empírica F "(x). Para comparar las leyes empíricas e hipotéticas, se usa una regla llamada criterio de bondad de ajuste. Una de las más populares es la prueba de bondad de chi-cuadrado de K. Pearson. se calcula la estadística de chi-cuadrado:

donde N es el número de intervalos usados \u200b\u200bpara construir la ley de distribución empírica (el número de columnas del histograma correspondiente), i es el número del intervalo, pt i es la probabilidad de que el valor de la variable aleatoria caiga en el i-ésimo intervalo para la ley de distribución teórica, pe i es la probabilidad del valor de la variable aleatoria en el intervalo i-ésimo para la ley de distribución empírica. Debe obedecer a la distribución chi-cuadrado.

Si el estadístico calculado excede el cuantil de la distribución de chi-cuadrado con k-p-1 grados de libertad para un nivel de significancia dado, entonces se rechaza la hipótesis H0. De lo contrario, se acepta con un nivel de significación determinado. Aquí k es el número de observaciones, p es el número de parámetros estimados de la ley de distribución.

Considere las estadísticas:

El estadístico p2 se denomina estadístico chi-cuadrado de Pearson para la hipótesis simple.

Está claro que h2 es el cuadrado de una cierta distancia entre dos vectores r-dimensionales: un vector de frecuencias relativas (mi / n,…, mr / n) y un vector de probabilidades (pi,…, pr). Esta distancia se diferencia de la distancia euclidiana solo en que diferentes coordenadas entran en ella con diferentes pesos.

Analicemos el comportamiento del estadístico h2 en el caso de que la hipótesis H sea verdadera y en el caso de que H no lo sea. Si H es verdadero, entonces el comportamiento asintótico de h2 para n\u003e? indica el teorema de K. Pearson. Para comprender lo que sucede con (2.2) cuando Н es incorrecta, observamos que, de acuerdo con la ley de los números grandes, mi / n\u003e pi para n\u003e ?, para i \u003d 1,…, r. Por tanto, para n\u003e ?:

Este valor es 0. Por lo tanto, si H es incorrecto, entonces h2\u003e? (para n\u003e?).

De lo dicho se desprende que H debe rechazarse si el valor de h2 obtenido en el experimento es demasiado grande. Aquí, como siempre, las palabras "demasiado grande" significan que el valor observado de h2 excede el valor crítico, que en este caso se puede tomar de las tablas de distribución de chi-cuadrado. En otras palabras, la probabilidad P (h2 npi h2) es un valor pequeño y, por lo tanto, es poco probable que obtenga accidentalmente lo mismo que en el experimento, o incluso una mayor discrepancia entre el vector de frecuencia y el vector de probabilidad.

La naturaleza asintótica del teorema de K. Pearson, que subyace a esta regla, requiere precaución en su uso práctico. Solo se puede confiar en él para n grandes. Es necesario juzgar si n es lo suficientemente grande teniendo en cuenta las probabilidades pi,…, pr. Por tanto, no se puede decir, por ejemplo, que cien observaciones serán suficientes, ya que no solo n debe ser grande, sino que los productos npi, ..., npr (frecuencias esperadas) tampoco deben ser pequeños. Por tanto, el problema de aproximar h2 (distribución continua) a la estadística h2, cuya distribución es discreta, resultó difícil. La combinación de argumentos teóricos y experimentales llevó a la creencia de que esta aproximación es aplicable si todas las frecuencias esperadas npi\u003e 10. si el número r (el número de resultados diferentes) aumenta, el límite para se reduce (a 5 o incluso a 3 si r es del orden de varias decenas). Para cumplir estos requisitos, en la práctica a veces es necesario combinar varios resultados, es decir vaya al esquema de Bernoulli con una r más pequeña.

El método descrito para verificar la concordancia puede aplicarse no solo a las pruebas de Bernoulli, sino también a muestras aleatorias. Previamente, sus observaciones deben convertirse en ensayos de Bernoulli agrupando. Lo hacen así: el espacio de observación se divide en un número finito de regiones que no se cruzan, y luego se calcula la frecuencia observada y la probabilidad hipotética para cada región.

En este caso, a las dificultades de aproximación enumeradas anteriormente, se agrega una más: la elección de una partición razonable del espacio original. Al mismo tiempo, se debe tener cuidado de que, en general, la regla para contrastar la hipótesis sobre la distribución inicial de la muestra sea suficientemente sensible a las posibles alternativas. Finalmente, observo que las pruebas estadísticas basadas en reducciones al esquema de Bernoulli, por regla general, no son consistentes con todas las alternativas. Por tanto, este método de comprobar el consentimiento tiene un valor limitado.

La prueba de bondad de Kolmogorov-Smirnov en su forma clásica es más poderosa que el criterio ch2 y se puede utilizar para probar la hipótesis sobre la correspondencia de la distribución empírica con cualquier distribución continua teórica F (x) con parámetros previamente conocidos. Esta última circunstancia impone restricciones a la posibilidad de una amplia aplicación práctica de este criterio al analizar los resultados de los ensayos mecánicos, ya que los parámetros de la función de distribución de las características de las propiedades mecánicas, por regla general, se estiman a partir de los datos de la propia muestra.

El criterio de Kolmogorov - Smirnov se utiliza para datos no agrupados o para datos agrupados en el caso de un intervalo de ancho pequeño (por ejemplo, igual al valor de división de escala de un medidor de fuerza, contador de ciclo de carga, etc.). Sea el resultado de probar una serie de n muestras una serie de variación de características de propiedades mecánicas

x1? x2? ...? xi? ...? xn. (3,93)

Se requiere probar la hipótesis nula de que la distribución muestral (3,93) pertenece a la ley teórica F (x).

El criterio de Kolmogorov-Smirnov se basa en la distribución de la desviación máxima del particular acumulado del valor de la función de distribución. Al usarlo, se calculan las estadísticas

que son las estadísticas de la prueba de Kolmogorov. Si la desigualdad

Dnvn? frente (3,97)

para tamaños de muestra grandes (n\u003e 35) o

Dn (vn + 0,12 + 0,11 / vn)? frente (3,98)

para n? 35, la hipótesis nula no se rechaza.

Si no se satisfacen las desigualdades (3.97) y (3.98), se adopta una hipótesis alternativa de que la muestra (3.93) pertenece a una distribución desconocida.

Los valores críticos de la frente son: l0,1 \u003d 1,22; l0,05 \u003d 1,36; l0,01 \u003d 1,63.

Si los parámetros de la función F (x) no se conocen de antemano, pero se estiman a partir de los datos de la muestra, la prueba de Kolmogorov-Smirnov pierde su universalidad y solo se puede utilizar para verificar la correspondencia de los datos experimentales con solo algunas funciones de distribución específicas.

Cuando se utiliza como hipótesis nula, independientemente de que los datos experimentales pertenezcan a una distribución normal o logarítmica normal, las estadísticas se calculan:

donde Ц (zi) es el valor de la función de Laplace para

Ц (zi) \u003d (xi - xср) / s El criterio de Kolmogorov - Smirnov para cualquier tamaño de muestra n se escribe en la forma

Los valores críticos de la frente en este caso son: l0,1 \u003d 0,82; l0,05 \u003d 0,89; l0,01 \u003d 1,04.

Si se verifica la hipótesis de la correspondencia de la muestra *** con la distribución exponencial, cuyo parámetro se estima a partir de los datos experimentales, se calculan estadísticas similares:

prueba de probabilidad empírica

y constituyen el criterio de Kolmogorov-Smirnov.

Valores críticos de la frente para este caso: l0,1 \u003d 0,99; l0,05 \u003d 1,09; l0,01 \u003d 1,31.

Para evaluar la estanqueidad de la conexión, se utilizan los indicadores de variación:

1. Varianza total atributo efectivo: refleja la influencia acumulativa de factores:

2. Varianza factorial rasgo efectivo: refleja la variación solo de la influencia del factor estudiado x:

Caracteriza la variabilidad de los valores alineados y xdel promedio total.

3. Varianza residual muestra la variación del rasgo efectivo ade todos los demás, excepto xfactores:

La relación entre factorial y total refleja el grado de cercanía de la relación entre x y a.

índice de determinación - la participación de la varianza factorial en la varianza total. Si esta expresión se presenta como, entonces Rserá índice de correlación .

Basado en la regla de suma de varianzas (\u003d + el índice de correlación se puede representar como: o. El índice de correlación se usa para evaluar la rigidez de la relación para todas las formas de comunicación.

Para medir la estanqueidad de la conexión de la línea, coeficiente de correlación lineal:

Se realiza una evaluación cualitativa de la cercanía de la relación entre indicadores utilizando la escala de Chaddock:

Consideremos usando un ejemplo condicional la aplicación del análisis de regresión-correlación de la conexión de correlación de pares. Existe información selectiva sobre el trabajo de 8 hoteles, los cuales tienen diferente ocupación promedio anual de habitaciones de hotel y diferente rentabilidad de sus actividades. Como resultado del análisis de regresión-correlación, es extremadamente importante determinar si existe una relación directa entre la ocupación de las habitaciones del hotel y, si la hay, qué tan cercana es:

N pp Ocupación (en %%) x Rentabilidad (en %%) x 2 a las 2 hu Ecualizado (teórico) y x
8,2 7,0 9,3 8,1 9,5 10,5 7,5 6,3 67,24 49,00 86,49 65,61 90,25 110,25 56,25 39,69 492,0 364,0 669,6 526,5 712,5 840,0 420,0 315,0 7,61 6,65 9,05 8,21 9,41 10,01 7,13 6,41
66,4 564,78 4339,6 64,48

Determinemos los parámetros de la ecuación de regresión de par lineal:

Nuestra ecuación de regresión por pares se verá así: Sustituya los valores empíricos de x en esta ecuación y calcule los valores teóricos de 7,61, etc.

Ahora determinemos la cercanía de la relación entre la ocupación de los hoteles y la rentabilidad de sus actividades:

Como resultado del análisis, se encontró que existe una relación directa muy alta entre la ocupación de los hoteles y la rentabilidad de sus actividades.

En la práctica, a menudo es extremadamente importante evaluar la proximidad de las frecuencias empíricas a las teóricas. Esta evaluación se puede realizar utilizando criterios de proximidad denominados criterios de consentimiento. Se utiliza con mayor frecuencia para estos fines: prueba de bondad de ajuste de Pearson (ʼʼHiʼʼ- cuadrado), que se calcula mediante la fórmula:

dónde f -frecuencias empíricas,

Frecuencias teóricas.

Una estimación de la proximidad de las frecuencias empíricas a las teóricas está determinada por la probabilidad de lograr este valor R ( ) con desviaciones de frecuencia aleatorias. En caso de que la probabilidad R ( ) difiere significativamente de cero (mayor que 0.05), entonces las desviaciones de las frecuencias empíricas de las teóricas pueden considerarse aleatorias. Si R ( )< 0.05, entonces las desviaciones no pueden considerarse aleatorias, y las distribuciones empírica y teórica son fundamentalmente diferentes entre sí.

La cantidad depende no solo de las desviaciones de las frecuencias reales de las teóricas, sino también del número de grupos en los que se divide la población, a este respecto, tablas de valores críticos calculado para diferentes grados de libertad de variación de frecuencias empíricas (apéndice). Cabe decir que para una distribución normal, el número de grados de libertad K \u003d n-3dónde norte Es el número de grupos P ( , que supera significativamente el 0,05. Esto significa que las desviaciones de las frecuencias reales de las empíricas pueden considerarse aleatorias, y la distribución en sí de la realización de los billetes es cercana a la distribución normal.

Apéndice 1

Criterios de consentimiento: concepto y tipos. Clasificación y características de la categoría "Criterios de acuerdo" 2017, 2018.

En el presente n ° consideraremos una de las cuestiones relacionadas con la comprobación de la probabilidad de hipótesis, a saber, la cuestión de la coherencia de las distribuciones teóricas y estadísticas.

Supongamos que la distribución estadística dada se aplana utilizando alguna curva teórica f (x)(figura 7.6.1). No importa qué tan bien se ajuste la curva teórica, algunas discrepancias son inevitables entre ella y la distribución estadística. La pregunta surge naturalmente: ¿estas discrepancias se explican solo por circunstancias aleatorias asociadas con un número limitado de observaciones, o son significativas y asociadas con el hecho de que la curva que hemos ajustado no aplana la distribución estadística dada? Los llamados "criterios de consentimiento" se utilizan para responder a esta pregunta.

LAS LEYES DE DISTRIBUCIÓN DE VALORES ALEATORIOS



La idea detrás de la aplicación de los criterios de bondad de ajuste es la siguiente.

Con base en este material estadístico, tenemos que probar la hipótesis Hque consiste en el hecho de que la variable aleatoria Xobedece a alguna ley de distribución definida. Esta ley se puede especificar de una forma u otra: por ejemplo, en forma de función de distribución F (x)o en forma de densidad de distribución f (x),o como un conjunto de probabilidades p t,dónde p tes la probabilidad de que la cantidad Xcaerá dentro yo algodescarga.

Dado que a partir de estas formas la función de distribución F (x)es el más general y define cualquier otro, formularemos la hipótesis Hconsiste en el hecho de que la cantidad Xtiene una función de distribución ^ (q :).

Para aceptar o refutar una hipótesis Hconsiderar alguna cantidad U,caracterizar el grado de discrepancia entre distribuciones teóricas y estadísticas. La cantidad Use puede seleccionar de varias formas; por ejemplo como Upuedes tomar la suma de los cuadrados de las desviaciones de las probabilidades teóricas p tde las frecuencias correspondientes r *o la suma de esos "* cuadrados con algunos coeficientes (" pesos "), o la desviación máxima de la función de distribución estadística F * (x)de teórico F (x)y así sucesivamente. Suponga que la cantidad Useleccionado de una forma u otra. Obviamente, esto es algo valor aleatorio.La ley de distribución de esta variable aleatoria depende de la ley de distribución de la variable aleatoria X,sobre qué experimentos se llevaron a cabo y sobre el número de experimentos pags.Si la hipótesis Hes cierto, entonces la ley de distribución de la cantidad Uestá determinada por la ley de distribución de la cantidad X(función F (x))y el numero pags.

Supongamos que conocemos esta ley de distribución. Como resultado de esta serie de experimentos, se encontró que la medida elegida



CRITERIOS DE CONSENTIMIENTO


divergencias Utomó algo de importancia y.La pregunta es si esto puede explicarse por razones aleatorias, o si esta discrepancia es demasiado grande e indica la presencia de una diferencia significativa entre las distribuciones teóricas y estadísticas y, en consecuencia, la inadecuación de la hipótesis. H?Para responder a esta pregunta, suponga que la hipótesis Hes correcto, y bajo este supuesto, calculemos la probabilidad de que, debido a razones aleatorias asociadas con un volumen insuficiente de material experimental, la medida de discrepancia Userá nada menos que el valor observado por nosotros en la experiencia y,es decir, calculamos la probabilidad de un evento:

Si esta probabilidad es muy pequeña, entonces la hipótesis Hdebe ser rechazado como poco probable; si esta probabilidad es significativa, debe reconocerse que los datos experimentales no contradicen la hipótesis NORTE.

Surge la pregunta de cómo se debe elegir la medida de la discrepancia £ /? Resulta que para algunos métodos de elección, la ley de distribución de la cantidad Uposee propiedades muy simples y para un tamaño suficientemente grande pAGSprácticamente independiente de la función F (x).Son estas medidas de discrepancia las que se utilizan en las estadísticas matemáticas como criterios de bondad de ajuste.

Considere una de las pruebas de bondad de ajuste más comúnmente utilizadas, la llamada "prueba y? "Pearson.

Supongamos que hemos realizado hectáreas de experimentos independientes, en cada uno de los cuales una variable aleatoria Xadquirió un cierto significado. Los resultados de los experimentos se resumen en kdígitos y tienen el formato de una serie estadística.

Cero (principal) Se denomina hipótesis sobre la forma de una distribución desconocida o sobre los parámetros de distribuciones conocidas. La competencia (alternativa) Se llama una hipótesis que contradice lo nulo.

Por ejemplo, si la hipótesis nula consiste en suponer que la variable aleatoria X se distribuye de acuerdo con la ley, entonces la hipótesis competitiva puede consistir en el supuesto de que la variable aleatoria X distribuido de acuerdo con una ley diferente.

Criterio estadistico (o simplemente criterio) llamar a alguna variable aleatoria A, que sirve para probar la hipótesis nula.

Después de elegir un determinado criterio, por ejemplo, un criterio, el conjunto de todos sus valores posibles se divide en dos subconjuntos disjuntos: uno de ellos contiene los valores del criterio para el que se rechaza la hipótesis nula y el otro para el que se acepta.

Área crítica Se llama al conjunto de valores del criterio, en el que se rechaza la hipótesis nula. El área de aceptación de la hipótesis. se llama al conjunto de valores de criterio en el que se acepta la hipótesis. Puntos críticos son los puntos que separan la región crítica de la región de aceptación de la hipótesis nula.

Para nuestro ejemplo, cuando el valor, el valor calculado a partir de la muestra corresponde al área de aceptación de hipótesis: la variable aleatoria se distribuye de acuerdo con la ley. Si el valor calculado, cae en la región crítica, es decir, se rechaza la hipótesis de la distribución de la variable aleatoria de acuerdo con la ley.

En el caso de la distribución, la región crítica está determinada por la desigualdad, la región de aceptación de la hipótesis nula está determinada por la desigualdad.

2.6.3. Criterio de consentimiento Pearson

Una de las tareas de la zootecnia y la genética veterinaria es desarrollar nuevas razas y especies con las características requeridas. Por ejemplo, mayor inmunidad, resistencia a enfermedades o decoloración del pelaje.

En la práctica, al analizar los resultados, a menudo resulta que los resultados reales corresponden en mayor o menor medida a alguna ley de distribución teórica. Se hace necesario evaluar el grado de correspondencia entre los datos reales (empíricos) y los teóricos (hipotéticos). Para ello, se plantea una hipótesis nula: la población resultante se distribuye según la ley "A". La hipótesis sobre la ley de distribución asumida se prueba utilizando una variable aleatoria especialmente seleccionada: la prueba de bondad de ajuste.

El criterio del consentimientose llama el criterio para probar la hipótesis sobre la supuesta ley de la distribución desconocida.

Existen varios criterios para el acuerdo: Pearson, Kolmogorov, Smirnov, etc. La prueba de bondad de ajuste de Pearson es la más utilizada.

Consideremos la aplicación del criterio de Pearson en el ejemplo de probar la hipótesis sobre la distribución normal de la población general. Para este propósito, compararemos las frecuencias empíricas y teóricas (calculadas en la continuación de la distribución normal).

Suele haber alguna diferencia entre las frecuencias teóricas y empíricas. por ejemplo:

Frecuencias empíricas 7 15 41 93113 84 25 13 5

Frecuencias teóricas 5 13 36 89114 91 29 14 6

Considere dos casos:

La discrepancia entre las frecuencias teóricas y empíricas es accidental (insignificante), es decir. se puede hacer una propuesta sobre la distribución de frecuencias empíricas según la ley normal;

La discrepancia entre las frecuencias teóricas y empíricas no es accidental (significativa), es decir. Las frecuencias teóricas se calculan en base a la hipótesis incorrecta de la distribución normal de la población general.

Utilizando el criterio de bondad de ajuste de Pearson, es posible determinar si la discrepancia entre las frecuencias teóricas y empíricas es aleatoria, es decir. determinar con un nivel de confianza dado si la población general se distribuye según la ley normal o no.

Entonces, se obtiene una distribución empírica para una muestra de tamaño n:

Opciones ... ...

Frecuencias empíricas ......

Supongamos que las frecuencias teóricas se calculan bajo el supuesto de una distribución normal. En el nivel de significancia, se requiere probar la hipótesis nula: la población general tiene una distribución normal.

Como criterio para probar la hipótesis nula, tomamos una variable aleatoria

(*)

Este valor es aleatorio, ya que en diferentes experimentos toma valores diferentes, previamente desconocidos. Está claro que cuanto menos difieren las frecuencias empíricas y teóricas, menor es el valor del criterio y, por lo tanto, en cierta medida, caracteriza la cercanía de las distribuciones empíricas y teóricas.

Está comprobado que en, la ley de distribución de una variable aleatoria (*), independientemente de a qué ley de distribución esté sujeta la población general, tiende a una ley de distribución con grados de libertad. Por lo tanto, la variable aleatoria (*) se denota mediante, y el criterio en sí mismo se llama prueba de bondad de ajuste "chi-cuadrado".

Denotemos el valor de criterio calculado a partir de los datos de observación hasta. Se designan valores críticos tabulados del criterio para un nivel de significancia dado y el número de grados de libertad. En este caso, el número de grados de libertad se determina a partir de la igualdad, donde el número de grupos (intervalos parciales) de la muestra o clases; - el número de parámetros de la distribución supuesta. La distribución normal tiene dos parámetros: la expectativa matemática y la desviación estándar. Por lo tanto, el número de grados de libertad para la distribución normal se encuentra a partir de la igualdad

Si el valor calculado y el valor de la tabla satisfacen la desigualdad , se acepta la hipótesis nula sobre la distribución normal de la población general. Si , se rechaza la hipótesis nula y se acepta una hipótesis alternativa (la población general no se distribuye de acuerdo con la ley normal).

Comentario. Cuando se utiliza la prueba de bondad de ajuste de Pearson, el tamaño de la muestra debe ser al menos 30. Cada grupo debe contener al menos 5 opciones. Si hay menos de 5 frecuencias en los grupos, se combinan con grupos vecinos.

En el caso general, el número de grados de libertad para la distribución de chi-cuadrado se define como el número total de cantidades utilizadas para calcular los indicadores correspondientes, menos el número de condiciones que conectan estas cantidades, es decir. reducir la posibilidad de variación entre ellos. En los casos más simples, al calcular, el número de grados de libertad será igual al número de clases, reducido en uno. Entonces, por ejemplo, con la división dihíbrida, se obtienen 4 clases, pero solo la primera clase se obtiene sin relación, las siguientes ya están conectadas con las anteriores. Por lo tanto, para la división dihíbrida, el número de grados de libertad.

Ejemplo 1. Determine el grado de correspondencia de la distribución real de grupos por el número de vacas con tuberculosis con la teóricamente esperada, que se calculó al considerar la distribución normal. Los datos iniciales se resumen en la tabla:

Decisión.

Por el nivel de significancia y el número de grados de libertad de la tabla de puntos críticos de distribución (ver Apéndice 4), encontramos el valor ... En la medida en , se puede concluir que la diferencia entre las frecuencias teóricas y reales es aleatoria. Así, la distribución real de grupos según el número de vacas con tuberculosis corresponde a la teóricamente esperada.

Ejemplo 2. La distribución de fenotipos teóricos de individuos obtenidos en la segunda generación por cruce dihíbrido de conejos de acuerdo con la ley de Mendel es 9: 3: 3: 1. Se requiere calcular la correspondencia de la distribución empírica de conejos de cruzar individuos negros con cabello normal con animales suaves - albinos. Cuando se cruzaron en la segunda generación, se obtuvieron 120 crías, incluidas 45 negras con pelo corto, 30 negras con pelo, 25 blancas con pelo corto, 20 conejos blancos con pelo corto.

Decisión. La división teóricamente esperada en la descendencia debe corresponder a la proporción de los cuatro fenotipos (9: 3: 3: 1). Calculemos las frecuencias teóricas (número de cabezas) para cada clase:

9 + 3 + 3 + 1 \u003d 16, por lo que puede esperar que los negros de pelo corto sean ; velloso negro - ; blanco de pelo corto - ; blanco suave -.

La distribución empírica (real) del fenotipo fue la siguiente 45; treinta; 25; 20)

Resumamos todos estos datos en la siguiente tabla:

Usando la prueba de bondad de ajuste de Pearson, calculamos el valor:

El número de grados de libertad en un cruce dihíbrido. Por nivel de significación encuentra el valor ... En la medida en , se puede concluir que la diferencia entre las frecuencias teóricas y reales no es accidental. En consecuencia, el grupo resultante de conejos se desvía en la distribución de fenotipos de la ley de Mendel durante el cruce dihíbrido y refleja la influencia de ciertos factores que cambian el tipo de división del fenotipo en la segunda generación de híbridos.

La prueba de ajuste de chi-cuadrado de Pearson también se puede utilizar para comparar dos distribuciones empíricas homogéneas entre sí, es decir, aquellos que comparten los mismos límites de clase. La hipótesis de igualdad de dos funciones de distribución desconocidas se acepta como una hipótesis nula. El criterio de chi-cuadrado en tales casos está determinado por la fórmula

(**)

donde y son los volúmenes de las distribuciones comparadas; y - las frecuencias de las clases respectivas.

Considere una comparación de dos distribuciones empíricas en el siguiente ejemplo.

Ejemplo 3. La longitud de los huevos de cuco se midió en dos zonas territoriales. En la primera zona se examinó una muestra de 76 huevos (), en la segunda, de 54 (). Los siguientes resultados fueron obtenidos:

Longitud (mm)
Frecuencias
Frecuencias - - -

En un nivel de significancia, se requiere probar la hipótesis nula de que ambas muestras de huevos pertenecen a la misma población de cucos.

Compartir este: