Septiembre 2018. Volumen 14. Número 2

Estadística. Tipos de variables. Escalas de medida

Valoración: 0 (0 Votos)

Autores: Ochoa Sangrador C, Molina Arias M.

SuscriptionSuscripción gratuita al boletín de novedades

Reciba periódicamente por correo electrónico los últimos artículos publicados

Suscribirse
Imprimir Añadir a biblioteca Comentar este artículo Enviar

|

Autores:


Correspondencia:


Estadística. Concepto

Podemos definir la estadística como el conjunto de métodos científicos ligados con la toma, organización, recopilación, presentación y análisis de datos, tanto para la deducción de conclusiones como para tomar decisiones razonables de acuerdo con tales análisis. Una definición más funcional sería “el arte de tomar decisiones en presencia de incertidumbre”.

Dentro de la estadística podemos diferenciar dos tipos: la estadística descriptiva y la inferencial. La estadística descriptiva se limita a describir y analizar un conjunto de datos, limitándose a los mismos, mientras que la estadística inferencial (o inductiva) trata de sacar conclusiones sobre una población a partir del análisis de los datos extraídos de un subconjunto de ella (muestra). La inferencia estadística es el objetivo principal de la estadística, ya que es la que nos permite cuantificar nuestra incertidumbre y tomar decisiones, cuando la probabilidad de error es mínima. Dentro de la inferencia estadística, podemos diferenciar a su vez dos tipos de estrategias: la estimación de intervalos de confianza de nuestras estimaciones y el contraste de hipótesis en el que confrontamos dos o más alternativas, cuantificando la probabilidad de que las diferencias entre ellas se deban al azar.

Veamos un ejemplo para ilustrar las distintas funciones de la estadística: imaginemos que en una muestra de 63 niños con jaquecas recurrentes probamos en episodios sucesivos dos analgésicos distintos (A y B). De ellos, 31 manifestaron preferencia por el tratamiento A, 15 por el B y 17 no mostraron preferencia entre ellos. La estadística descriptiva nos permite estimar que un 49,2% prefirieron el tratamiento A, un 23,8% el B, con una diferencia entre ambos del 25,4% a favor del tratamiento A.

La inferencia estadística, mediante estimación de intervalos, nos permite avanzar hasta estimar que con un 95% de confianza (5% de error) la diferencia observada se situaría en un intervalo entre el 3,6% y 47,2% a favor del tratamiento A.

Por último, el contraste de hipótesis nos permite calcular (test de McNemar) que la probabilidad de que las diferencias encontradas sea debida al azar es del 0,018 (1,8%), por lo que asumimos que el tratamiento A parece mejor que el B.

Los elementos de análisis de la estadística son las variables, características medidas en los sujetos de estudio, que pueden adoptar una serie de valores posibles, pero cuyo valor concreto en cada sujeto u observación es a priori desconocido. En nuestro ejemplo, las variables son el tipo de analgésico tomado y la respuesta al mismo. Comenzaremos esta serie de fundamentos sobre estadística repasando los tipos de variables y sus características, principalmente sus escalas de medidas.

Variables

Recibe el nombre de variable toda característica medida en un estudio, se realice su medición en números (variables cuantitativas: edad o peso) o en categorías (variables cualitativas o categóricas). Se denomina variable porque, aunque podemos prever los valores posibles (espacio muestral), el valor observado en un momento dado en un individuo, grupo, comunidad o población es cambiante. Por ejemplo, podemos prever que los valores posibles del sexo de un nuevo recién nacido pueden ser masculino o femenino, pero hasta que no observamos al nuevo recién nacido no podemos asegurar cuál de ellos es. En este ejemplo la unidad de observación es el recién nacido, y el conjunto de recién nacidos examinados la muestra de estudio.

Aunque la mayoría de las variables de uso frecuente pueden ser de fácil comprensión, existen otras que no lo son y, por lo tanto, requerirán una definición operativa. Dicha definición incluirá el rango de valores posibles y la definición de cada uno de ellos. Veamos un ejemplo: evolución de una enfermedad. Podemos definir como valores posibles: curación (desaparición de síntomas), mejoría (disminución de la intensidad de los síntomas), persistencia o empeoramiento (persistencia o empeoramiento de síntomas).

Las variables se diferencian en función de diversas características (tabla 1): su papel en la pregunta de investigación, el número de posibles valores y su escala de medición. Es importante conocer las características de las variables ya que van a condicionar su recogida y análisis. Cuando presentemos los distintos test estadísticos comprenderemos la trascendencia del tipo de variables en la elección de los mismos.

Tabla 1.Tipos de variables. Mostrar/Ocultar

Papel en la pregunta de investigación

Podemos diferenciar las variables en función del papel que desempeñen en nuestra pregunta de investigación. Si estudiamos la asociación entre dos variables las denominaremos como dependiente e independiente, respectivamente. La que recibe el nombre de dependiente (variable resultado o efecto) es aquella que pensamos viene condicionada por la otra variable, que denominamos independiente (variable explicativa o de exposición). Por ejemplo, si queremos estudiar la prevalencia de diabetes en una muestra de población y conocer las variaciones según la edad y el sexo de sus componentes, la presencia de diabetes sería la variable dependiente y la edad y el sexo las independientes. Por el contrario, si estudiamos la influencia de la diabetes sobre los niveles de presión arterial, esta sería la variable dependiente y la diabetes se consideraría variable independiente.

Número de valores posibles de su espacio muestral

Son variables continuas las que pueden adoptar un número teóricamente infinito de valores a lo largo de un continuo (ejemplo: talla, peso). Son discretas cuando solo son posibles un número finito de valores (ejemplo: número de hijos de una pareja; esta variable no puede tener fracciones). A la hora de identificar las variables continuas debemos tener en cuenta que, aunque los valores teóricamente posibles sean infinitos, muchas muestras contienen valores finitos, bien por tener escasas observaciones o por falta de precisión en la medición (ejemplo: medición sin decimales).

Las variables discretas pueden medirse en cualquier escala, aunque habitualmente se medirán en escalas nominales u ordinales, mientras que las variables continuas solo pueden medirse en escalas de intervalos y de razones.

Escalas de medición de variables

Uno de los elementos fundamentales de la definición de una variable es el tipo de escala que utilizaremos para medirla. En función de la escala elegida decidiremos su codificación, tratamiento informático y estadístico.

Hay cuatro tipos de escalas de medición, que ordenadas en orden creciente de potencia, según la proporción de información que contienen, son:

  • Nominal.
  • Ordinal.
  • De intervalos.
  • De razones o ratios.

Escala nominal

Consta de dos o más categorías mutuamente excluyentes. Si solo hay dos, se llama escala nominal dicotómica. A cada categoría se le suele asignar un número de código sin significado cuantitativo, lo que facilita su introducción en bases de datos. En cualquier situación, si se usa una codificación propia, debe tenerse claro lo que significa cada código para cada variable.

Veamos algunos ejemplos:

  • Sexo: 1) masculino; 2) femenino.
  • Fumar: 0) no; 1) sí.
  • Estado civil: 1, casado; 2, soltero; 3, viudo; 4, divorciado,
  • Procedencia del ingreso: 1, urgencias; 2, consultas; 3, otro hospital.

Dependiendo del programa que va a ser utilizado para el análisis, se prefiere codificar las variables nominales dicotómicas de forma que la presencia de enfermedad o del factor de exposición se suele codificar como uno (1), mientras que la ausencia de enfermedad o de exposición a algún factor como cero (0) o dos (2). Por ejemplo, el antecedente de hábito tabáquico puede codificarse como 1 y 0 (1: fumador; 0: no fumador) o como 1 y 2 (1: fumador; 2: no fumador). Aunque matemáticamente la presencia/ausencia de una característica se corresponde con la codificación 1-0, es frecuente usar la codificación 1-2, para evitar que variables vacías sean asignadas al 0 por error.

Escala ordinal

Las variables ordinales tienen la cualidad adicional, respecto a la escala nominal, de que sus categorías están ordenadas por rango; cada clase posee una misma relación posicional con la siguiente; es decir, la escala muestra situaciones escalonadas. Si se usan números, su única significación está en indicar la posición de las distintas categorías en la serie; sin embargo, no asumen que la distancia del primer escalón al segundo sea la misma que la del segundo al tercero. Veamos algunos ejemplos:

  • Clase social: 1) baja, 2) media, 3) alta.
  • Grados de reflujo vesicoureteral: grados 1, 2, 3, 4.
  • Conformidad con una afirmación: 0) completo desacuerdo, 1) acuerdo parcial, 2) acuerdo total.
  • Fumar: 0) no fumador, 1) fumador leve, <10/día; 2) fumador moderado, 10-20/día, y 3) gran fumador, >20/día).

Existen escalas que serán mezcla de nominal y ordinal, porque solo algunas categorías estén ordenadas por rango; esto ocurre en las escalas en las que un valor representa a una categoría inclasificable (ejemplo: no sabe no contesta o resultado indeterminado).

Escalas de intervalos

Las escalas de intervalos poseen la cualidad adicional de que los intervalos entre sus clases son iguales. Diferencias iguales entre cualquier par de números de la escala indican diferencias también iguales en el atributo sometido a medición. Veamos un ejemplo: la diferencia de temperatura entre una habitación a 22 grados centígrados y otra a 26 es la misma que la existente entre dos a 33 y 37 grados centígrados, respectivamente.

Sin embargo, la razón entre los números de la escala no es necesariamente la misma que la existente entre las cantidades del atributo. Ejemplo: una habitación a 20 grados no está el doble caliente que otra a 10. Ello se debe a que el cero de la escala no expresa el valor nulo o ausencia de atributo.

Escalas de razones

Su cualidad adicional es que el cero sí indica ausencia de atributo. En consecuencia, la razón entre dos números de la escala es igual a la existente entre las cantidades del atributo medido. Ejemplos:

  • Peso: medido en kilogramos.
  • Concentración de glucosa en una muestra: medida en mg/dl.
  • Tasa de mortalidad: muertes por 1000 personas en riesgo.
  • Ingresos: medidos en euros.

Las escalas de intervalos y razones se llaman también métricas o dimensionales. Las variables continuas van a medirse con escalas de razones o intervalos, por lo que es habitual que nos refiramos a ellas englobándolas como escalas continuas, ya que comparten estrategias de análisis, como la elección del test estadístico. Algunos paquetes estadísticos, como SPSS, las denominan simplemente “escalas”.

Cuando en la recogida de una variable continua (escala de razones o intervalos) no podemos recoger valores a partir de un límite (por ejemplo: cargas virales superiores a 100 000), si optamos por mantener esas observaciones en el análisis, la variable se comporta en ese rango como una variable ordinal.

En la tabla 2 presentamos un resumen de las características de las diferentes escalas de medida.

Tabla 2. Características de las diferentes escalas de medida de variables. Mostrar/Ocultar

Elección de las escalas

La selección de una escala estará determinada por la definición operativa de la variable que hayamos realizado y por los métodos disponibles para medirla. Para algunas variables solo existirá un tipo de escala elegible, mientras que para la mayoría tendremos varias alternativas.

En general, siempre que sea posible, interesa utilizar en la recogida de datos la escala más precisa, aunque no sea la que posteriormente se utilice en el tratamiento estadístico. Ello nos permitirá adecuar la decisión, una vez conocida la verdadera distribución de nuestros datos. Por ejemplo, siempre será preferible recoger el número de cigarrillos que fuma una persona al día que el dato categorizado como <10, 10-20, >20; la primera estrategia facilitará la búsqueda durante el análisis de puntos de corte distintos a los empleados a priori.

Cuando se categorizan algunas variables, como la edad o los ingresos económicos, pasan de ser variables continuas (de intervalos o de razones) a variables ordinales o nominales, según los puntos de corte elegidos.

Si una variable continua se limita en uno de sus extremos con una categoría abierta (por ejemplo, carga viral mayor de 100 000), forzamos que tenga que ser considerada como ordinal.

Las categorías de las variables deben estar clara y operativamente definidas, la escala debe ser exhaustiva (incluir todas las posibilidades) y las clases mutuamente excluyentes (cada observación solo puede ser asignada a una opción). A menudo tendremos que recurrir a categorías complementarias que cubran todo el espectro como “otras”, “no aplicable” o “desconocido”, o establecer un orden de prioridades en caso de opciones intermedias.

Las escalas utilizadas para medir variables combinadas se llaman escalas compuestas, pueden basarse en combinaciones de categorías (por ejemplo: combinación de varios criterios diagnósticos simultáneos para asignar el estadio de un tumor), en el uso de fórmulas (por ejemplo: índice de masa corporal = peso / talla²) o de puntuaciones compuestas, obtenidas tras la suma de las asignadas a los distintos ítems implicados (por ejemplo, puntuación del test de Apgar).

Para poder diferenciar las escalas de medidas de una variable recomendamos hacer dos preguntas encadenadas:

  1. ¿Los valores posibles de la variable son teóricamente infinitos? Si los valores son teóricamente infinitos la escala de medida será continua, bien de intervalos, bien de razones. Aunque la característica operativa de estas escalas es que la unidad de medida es constante, en la práctica la mayoría de las variables continuas cumplen este criterio. No tiene mucho interés diferenciar si la escala es de intervalos o de razones (existe el 0 absoluto) ya que ambas escalas comparten características de análisis. Si la respuesta es negativa pasaríamos a la siguiente pregunta.
  2. ¿Están los posibles valores ordenados entre sí? Si los posibles valores están ordenados entre sí la escala es ordinal. Si la respuesta es negativa la escala es nominal.

Bibliografía

  • Altman DG. Practical statistics for medical research. Londres: Chapman & Hall; 1991.
  • Milton JS. Estadística para biología y ciencias de la Salud. México: McGraw-Hill; 2001.
  • Norman GR, Streiner DL. Bioestadística. México: Mosby/Doyma Libros; 1996.
  • Rosner B. Fundamentals of biostatistics. 7.ª edición. Boston: Brooks/Cole, Cengage Learning; 2011.

Cómo citar este artículo

Ochoa Sangrador C, Molina Arias M. Estadística. Tipos de variables. Escalas de medida. Evid Pediatr. 2018;14:29.