Autores: Ortega Páez E, Ochoa Sangrador C, Molina Arias M.
Reciba periódicamente por correo electrónico los últimos artículos publicados
SuscribirseCorrespondencia:
En Ciencias de la Salud es frecuente que se nos presenten situaciones en las que queramos conocer si una intervención determinada es satisfactoria o no en los mismos sujetos. Esta situación es propia de los estudios longitudinales, en los que analizamos si han existido cambios intrasujetos en las mediciones. El análisis no es posible hacerlo con las pruebas clásicas de comparación de proporciones vistas anteriormente, ya que las muestras a estudiar no son independientes; se debe realizar considerando que cada sujeto tiene una o varias medidas, que son muestras relacionadas, y estudiar si las diferencias entre las proporciones de las medidas son estadísticamente significativas. En este capítulo veremos la prueba de McNemar en el caso de comparación de dos medidas repetidas y la Q-Cochran para más de dos medidas repetidas. En ambas, el fundamento es el mismo, conocer si la proporción de éxitos o fracasos es la misma entre las mediciones de la variable y si ambas siguen una distribución de ji-cuadrado.
Se usa cuando se realizan dos medidas en distintos tiempos de una misma variable categórica en los mismos sujetos, o bien cuando tenemos dos variables categóricas en el mismo tiempo, pero los sujetos han sido emparejados entre sí.
Para mejor comprensión, lo veremos con un ejemplo ficticio. Supongamos que queremos conocer si la implementación de un programa de salud consistente en autocontrol en domicilio es útil para el control del asma infantil. Para ello, seleccionamos 45 niños con asma, medimos el control de asma previo a la intervención del programa de salud y al mes. Obtenemos los siguientes resultados: 22 están controlados antes y después, 5 están controlados antes y no controlados después, 15 no estaban controlados antes pero sí después y 3 no estaban controlados ni antes ni después.
Para ello, en lugar de introducir los datos de cada individuo en las casillas, se introducen las parejas de datos, es decir, cada individuo con la medida que tuvo antes y después de la intervención juntas. Observamos que tenemos 45 observaciones emparejadas, las mismas que sujetos, y cada una de ellas independientes entre sí, por lo que podemos utilizar la χ2 (Tabla 1).
Tabla 1. Tabla de contingencia para prueba de McNemar. Mostrar/ocultar
Hipótesis nula (H0) ⋮ pco = pnc.
Hipótesis alternativa (H1) ⋮ pco ≠ pnc.
En la Tabla 1 podemos observar que en realidad lo que estamos probando, bajo el supuesto de hipótesis nula, es la probabilidad (p) de que los totales de las filas y los totales de las columnas tengan la misma distribución, lo que significa que tenemos homogeneidad marginal. Esto es, siguiendo la notación de la Tabla 1, que pa+pb = pa+pc y, de forma similar, que pc+pd = pb+pd. Algebraicamente, simplificando en la primera expresión se elimina la pa y en la segunda la pd, quedando pb = pc. Esto quiere decir que lo que en realidad cuenta para el contraste de hipótesis son las parejas discordantes, las que tienen resultados distintos, las que de alguna manera tienen cambio de una medición a otra, reflejado en la diagonal de discordancias de la Tabla 1, obviando los resultados de parejas iguales. Por lo tanto:
Hipótesis nula (H0) ⋮ pb = pc.
Hipótesis alternativa (H1) ⋮ pb ≠ pc.
La prueba sigue una distribución χ2 con un grado de libertad (gl = 1 = n.º columnas -1x n.º filas -1). El estadístico tiene la siguiente fórmula:
$$\ χ^2\space de\space McNemar= {(b-c)^2\over b+c} = {(5-15)^2\over 5+15}= {100\over 20} = 5 $$
La χ2 de McNemar (5) es mayor que el valor crítico: 3,84 de la χ2 teórica para gl = 1; p = 0,02). Rechazamos la hipótesis nula de que la proporción de controlados es igual a la de no controlados después del programa. Podemos concluir que existen diferencias significativas (p <0,05) entre la proporción de asmáticos controlados y no controlados tras un programa de salud de autocontrol.
La prueba de McNemar es bilateral y simétrica, no presupone ninguna direccionalidad; de hecho, algunos autores la llaman prueba de simetría. Para conocer el sentido de esta y la interpretación tenemos que ver el número o proporciones de las dos casillas diagonales. En la Tabla 1 podemos observar que pb = 0,11 y pc = 0,33, luego la interpretación correcta sería que tras la intervención del programa de salud existe un mayor control del asma de forma significativa.
Comprobamos los supuestos de la prueba:
Para corregir el último supuesto lo haremos por el método de corrección por continuidad, más fácil que la prueba binomial exacta, que se consigue restando la unidad en el numerador a la fórmula vista con anterioridad.
$$\ χ^2\space de\space McNemar\space (correción\space por\space continuidad)= {[(b-c)-1]^2\over b+c} = {[(5-15)-1]^2\over 5+15}= {81\over 20} = 4,05 $$
Vemos que la χ2 corregida (4,05) es algo menor que sin corregir (5), pero sigue siendo mayor que el valor crítico de 3,84: p = 0,04 (<0,05). Observamos que la probabilidad de rechazar la hipótesis nula es mayor que con la prueba sin corregir y está al borde de la no significación (p = 0,04), por ello, debemos ofrecer los resultados de forma corregida ante esta situación.
Veamos el ejemplo utilizando un programa de acceso libre, el software estadístico R (https://www.r-project.org/). La prueba de McNemar no está disponible en el plugin RCommander, que hemos utilizado en capítulos anteriores de la serie, tenemos que realizarla mediante comandos de sintaxis.
En primer lugar, tenemos que crear la tabla 2x2. En la Figura 1 se detallan los pasos a seguir. Seguidamente, debemos instalar el paquete “stats”, lo seleccionamos y ejecutamos la prueba de McNemar (Figura 2). Podemos ver que los resultados son idénticos a los realizados de forma manual, McNemar's chi-squared = 5, df = 1, p-value = 0,02535. A continuación, la corrección por continuidad con idénticos resultados a la forma manual McNemar's chi-squared = 4,05, df = 1, p-value = 0,04417. R nos ofrece también la posibilidad de realizar la prueba binomial exacta mediante la función binom.test () del mismo paquete “stats” (Figura 3). En los resultados vemos el nombre de la prueba (Exact binomial), el valor de p = 0,0041 muy similar al de la corrección por continuidad, pero ligeramente inferior por ser más potente, y el intervalo de confianza al 95% para la diferencia de proporciones (0,08 a 0,49) que, como vemos, no llega a 0,5 que es el valor nulo de la ley binomial.
Figura 1. Creación de una tabla 2x2 en R. Mostrar/ocultar
Figura 2. Ejecución de la prueba de McNemar. Mostrar/ocultar
Figura 3. Ejecución de la prueba exacta de McNemar. Mostrar/ocultar
La prueba Q-Cochran es equivalente a la prueba de McNemar cuando tenemos más de dos medidas repetidas en el tiempo. El fundamento es el mismo que la de McNemar, estudiar si la distribución de una variable binomial es la misma en todos los grupos o, lo que es lo mismo, si la probabilidad de éxito o fracaso es la misma en todos los grupos. Cuando se realiza la prueba en dos grupos es equivalente a la prueba de McNemar.
Veamos la prueba con un ejemplo ficticio. Supongamos que tenemos 20 niños con jaquecas y probamos tres tratamientos distintos en tres episodios diferentes de jaqueca, (0 = mejoría, 1 = no mejoría). Se trata de conocer si la eficacia de los tres tratamientos es diferente.
Hipótesis nula (H0) ⋮ la proporción de sucesos verdaderos es la misma con los tres tratamientos.
Hipótesis alternativa (H1) ⋮ la proporción de sucesos verdaderos es distinta con al menos alguno de los tratamientos.
Al igual que en la prueba de McNemar, R no tiene implementado en el plugin RCommander la prueba Q-Cochran, tenemos que hacerla por sintaxis o códigos.
En la Tabla 2 tenemos los 20 niños con los tres episodios de jaqueca codificada como 0 = mejoría, 1 = no mejoría.
Tabla 2. Tabla de datos para prueba Q de Cochran. Mostrar/ocultar
Para realizar la prueba necesitamos el paquete “rstatix” y crear una base de datos nueva que sea de formato largo en vez de ancho que consta de tres variables: ID = identificación del paciente, respuesta = respuesta al tratamiento (0 = mejoría, 1 = no mejoría), tratamientos = aplicación de cada uno de los tratamientos (primer episodio = 1, segundo episodio = 2, tercer episodio = 3). Obsérvese que en esta variable hemos incluido cada episodio de forma consecutiva. La base de datos EeP_Fund_Jaqueca.Rdata está disponible en https://evidenciasenpediatria.es/files/43-232-RUTA//EeP_Fund_Jaqueca.RData
Con la instrucción table () creamos una tabla de contingencia con dos filas y tres columnas, donde el número de parejas que presentan mejoría de la jaqueca (0) es mayor en cada medida de tratamientos (7, 13, 17) (Figura 4).
Figura 4. Instalación del paquete “rstatix” y construcción de la tabla de contingencia para realizar prueba Q-Cochran (requiere la carga de la base de datos EeP_Fund_Jaqueca.Rdata). Mostrar/ocultar
En la Figura 5 se muestra la ejecución de la prueba Q-Cochran con la función cochran_qtest(). En la ventana de resultados, tenemos el valor estadístico de contraste (16,05) y el valor de p = 0,000255, menor de 0,05. Por tanto, rechazamos la hipótesis nula de que todos los tratamientos son igual de eficaces, al menos alguno de los tratamientos es mejor que los demás.
Figura 5. Ejecución de la prueba Q-Cochran. Mostrar/ocultar
Para tratar de conocer en cuál de los tres tratamientos se produce la mejora, podemos hacer comparaciones a posteriori. R las realiza comparando dos a dos mediante la prueba de McNemar, usando la función pairwise_mcnemar_test(), que por defecto nos ofrece la p sin ajustar y la ajustada. Observamos que la comparación 1 con la 3 es significativa, p = 0,00771 (<0,05). Resultados parecidos nos ofrece la prueba binomial exacta ajustada. Finalmente, concluimos que, en los pacientes con jaqueca, al menos uno de los tres tratamientos empleados es mejor, en concreto, el tratamiento primero es mejor que el tercero.
Ortega Páez E, Ochoa Sangrador C, Molina Arias M. Pruebas para muestras relacionadas. Variables cuantitativas. Evid Pediatr. 2022;19:10.
Envío de comentarios a los autores