MÉTODOS DE ANÁLISIS PARA VARIABLES CUALITATIVAS EN MUESTRAS INDEPENDIENTES.

avatar
(Edited)

Hola estimados amigos de #hive, y en especial a las comunidades de habla hispana, espero que todos estén bien disfrutando de una excelente semana, hoy traemos un tema de las ciencias matemáticas y estadísticas, las que utilizamos día a día en nuestro trabajo, ya sea en la docencia o en la elaboración de análisis y sus presentaciones a través de tablas y gráficos.

La presentación la hemos organizado para un mejor entendimiento en dos temas, primero hablaremos sobre las pruebas estadísticas no paramétricas, haciendo referencia a las generalidades y explicando las principales ventajas y desventajas de las mismas y en un segundo momento, mostraremos ejemplos de dos de las técnicas más empleadas en nuestro medio.

Dentro de las pruebas estadísticas no paramétricas se incluyen pruebas que tienen una amplia difusión pues son útiles cuando no se cumplen los supuestos para realizar las pruebas clásicas o cuando enfrentamos un problema que no tiene solución por estas. Generalmente son fáciles de realizar y existen varias pruebas para resolver un mismo problema, en éste programa se incluyen algunas de las más utilizadas como son:

  • La prueba x2 , de Independencia , que permite determinar si 2 variables cualitativas tienen una asociación estadística significativa.

  • La prueba x2 , de Homogeneidad ,que permite determinar si varias proporciones poblacionales difieren significativamente.

Debo destacar que salvo en el caso de la primera prueba, que no tiene una alternativa clásica, todas las demás son pruebas alternativas a considerar cuando no se cumplen los supuestos para realizar una prueba clásica.

Cuando estamos trabajando con variables que tienen escalas de medición Nominal y Ordinal solo podremos utilizar para realizar el análisis estadístico métodos no paramétricos, ya que las Estadísticas Clásicas no permiten por sus restricciones usarlas en éste caso. Sin embargo, cuando trabajamos con variables medidas con escalas de Intervalo y de Razón podemos utilizar cualquier tipo de estadísticas, siempre verificando previamente que se cumplan los supuestos requeridos por las Estadísticas Clásicas.

La mayoría de los métodos estadísticos tienen 3 aspectos comunes:

(-) Se supone que la variable con que trabajamos tiene una distribución teórica conocida especifica.

(-) Se asume la igualdad de las varianzas de las variables con que estamos trabajando.

(-) Se refieren a la verificación de hipótesis o a la estimación de parámetros de una distribución teórica conocida.

Las pruebas de hipótesis que no hacen afirmaciones acerca de los parámetros de una población se conocen como Métodos no Paramétricos, mientras que aquellas pruebas que no hacen ningún supuesto acerca de la distribución de la población de la cual se extraen las muestras se llaman Métodos de Libre Distribución.

Aunque tienen significados diferentes generalmente todas estas pruebas se conocen como Métodos no Paramétricos.

Entre sus ventajas se encuentran las siguientes:

  1. -Tienen mayor eficiencia que los Métodos Paramétricos en distribuciones asimétricas, o sea cuando hay valores atípicos o datos aberrantes.

  2. -Tienen validez en el sentido que su nivel de confiabilidad es realmente el especificado en la mayoría de las pruebas.

  3. -Generalmente son de computo mucho más fácil que las técnicas de las estadísticas clásicas.

  4. -Son aplicables en situaciones donde los procedimientos clásicos no son aplicables.

  5. -Aun cuando se cumplan los requisitos para realizar una prueba paramétrica, si la muestra es pequeña la eficiencia relativa de la prueba no paramétrica es alta.

Entre sus desventajas se citan las siguientes:

  1. -Fundamentalmente cuando las muestras son muy grandes las Pruebas no Paramétricas tienen una eficiencia relativa baja con relación a las Paramétricas cuando se cumplen los supuestos.

  2. -Las hipótesis que se plantean en las pruebas no Paramétricas son menos precisas, lo que hace que la interpretación de los resultados sea más ambigua.

  3. -Su aplicación en muestras grandes se hace muy laboriosa.

  4. -Para un problema particular pueden existir varias pruebas, por lo que en ocasiones se hace difícil seleccionar la mejor.

En sentido general éste tipo de pruebas deben utilizarse cuando no se cumplan los supuestos para hacer una Prueba Paramétrica y cuando se duda sobre el cumplimiento de los supuestos en una muestra pequeña.

Cuando estamos ante un problema en el cual necesitamos estudiar la relación existente entre 2 variables cualitativas, la información se resume en una Tabla de Contingencia que no es más que una tabla estadística en la que se entrecruza la información de 2 o más variables cualitativas o de más nivel, pero con escala Nominal, Ordinal o de Intervalo, que se utiliza para estudiar la relación existente entre las mismas.

Vamos a ver a continuación una explicación de las pruebas estadísticas antes mencionadas, comenzamos por la.

PRUEBA X2 DE INDEPENDENCIA

Esta prueba permite medir la significación de la asociación entre 2 variables de clasificación o sea entre 2 variables cualitativas.

Limitaciones de la Prueba:

Siempre que en más del 20% de las celdas de la tabla de contingencia existan valores esperados menores que 5 o que en una sola celda haya un valor esperado menor que 1, no debe usarse la prueba. En éste caso deben agruparse las categorías siguiendo un sentido lógico para así poder aumentar los valores observados y por ende también los valores esperados.

En el caso de la tabla de 2x2 si existe una sola celda con valor esperado menor que 5, esto representaría un 25% de las celdas por lo que se utilizaría la Prueba de las Probabilidades exactas de Fisher en lugar de la Prueba x2 ,ya que en éste caso no es posible agrupar categorías.

Ejemplo:

Planteamiento y solución de una situación práctica.

Se desea conocer si existe asociación entre el escribir diario en la blockchain de hive y las ganancias generadas, para lo cual se selecciona una muestra aleatoria de 100 hivers, obteniéndose los resultados siguientes:

Considere alpha=0.05.

En éste caso hay 1 muestra aleatoria y se quiere determinar si existe asociación estadística significativa entre 2 variables cualitativas (Publicar diario y Ganancias) por lo que la prueba que debe utilizarse es la de Independencia.

Las Hipotesis a plantear serían las siguientes:

Debemos verificar si se cumplen las condiciones para realizar una Prueba Chi Cuadrado, calculando los valores esperados mediante la expresión ni. x n.j/n.., obteniendo los resultados siguientes:

Puede observarse que en todas las celdas las frecuencias esperadas son mayores que 5, por lo que puede realizarse la prueba.

Como tenemos una tabla de contingencia de 2x2, podemos utilizar la fórmula del estadígrafo simplificado:

Regla de Decisión:
Si la x2 calculada = 15.04 es mayor que la x2 tabulada = 3.84 con 1 grado de libertad y un alpha= 0.05 entonces rechazo la hipótesis nula , por lo que si rechazo que hay independencia , entonces hay asociación estadística significativa entre el Publicar diario y las Ganancias generadas.

Si realizamos la prueba con un paquete estadístico en una computadora obtendríamos los resultados siguientes:
X2 = 15.04 Grados de Libertad = 1 p= 0.0001052

Entonces verificaría que todos los valores esperados sean mayores que 5, y como en éste caso se cumple esta restricción podemos usar esta prueba.
Al considerar un alpha=0.05, como la p asociada al valor del estadígrafo

p= 0.0001052 es menor que alpha=0.05 , se rechaza la hipótesis nula de no-asociación, por lo que llegamos a la conclusión que hay asociación estadística significativa entre ambas variables.

PRUEBA DE X2 DE HOMOGENEIDAD.

Cuando tenemos varias muestras y se desea determinar si son homogéneas con relación a la distribución.

Limitaciones de la Prueba:

Al igual que en el caso de la Prueba de Independencia en esta Prueba existen las mismas restricciones, que se señalan a continuación;

Siempre que en más del 20% de las celdas de la tabla de contingencia existan valores esperados menores que 5 o que en una sola celda haya un valor esperado menor que 1, no debe usarse la prueba. En éste caso deben agruparse las categorías siguiendo un sentido lógico para así poder aumentar los valores observados y por ende también los valores esperados.

En el caso de la tabla de 2x2 sí existe una sola celda con valor esperado menor que 5 , esto representaría un 25% de las celdas, por lo que se utilizaría la Prueba de las Probabilidades exactas de Fisher en lugar de la Prueba x2 ,ya que en éste caso no es posible agrupar las categorías.

Ejemplo:

Planteamiento y solución de una situación práctica.

Se necesita probar la efectividad de 3 tratamientos para controlar la hipertensión arterial, para lo cual se seleccionan 3 muestras aleatorias de pacientes hipertensos de la comunidad de #stem-espanol y se asignan aleatoriamente los tratamientos a los pacientes estudiados.

La variable respuesta es el control de la hipertensión arterial a los 6 meses de tratamiento, los resultados obtenidos se relacionan a continuación:

Considere alpha=0.05.

En éste caso hay 3 muestras aleatorias y se quiere determinar si existen diferencias estadísticas significativas entre los porcentajes de pacientes controlados, por lo que la prueba que debe utilizarse es la de Homogeneidad.

Las Hipótesis a plantear serían las siguientes:

Debe verificarse si se cumplen las condiciones para realizar una Prueba Chi Cuadrado, calculando los valores esperados mediante la expresión ni. x n.j/n.., obteniendo los resultados siguientes:

Se observa que las celdas las frecuencias esperadas de todas las celdas son mayores que 5, por lo que puede realizarse la prueba x2.

Si se conocen los valores observados y los valores esperados sólo se necesita un estadígrafo con una distribución conocida que nos permita determinar si hay diferencias significativas entre los valores observados y los valores que se esperarían bajo el supuesto que la hipótesis nula fuera cierta , o sea si se cumpliera que la distribución de las proporciones en ambas muestras es similar.

El estadígrafo que nos permite determinar lo anterior es:

Entonces como estamos trabajando con una tabla de contingencia de 2 filas
(HTA controlada o no) y 3 columnas (3 tratamientos) , tenemos una TC de 2x3 en la que podemos trabajar con el estadígrafo x2 sin la corrección de Yates, como aparece en la expresión anterior.

Sustituyendo los datos en la expresión anterior tenemos:

Se busca entonces el valor de la x2 tabulada para una confiabilidad de un 95% con (C=2-1) x (R=3-1) grados de libertad, o sea con 1 x 2 = 2 grados de libertad que es 5.99, por lo que como 72.78 es mayor que 5.99 se rechaza la hipotesis nula de proporciones iguales.

Observemos cómo se comportan las proporciones de pacientes controlados:

Llegamos entonces a la conclusión de que la efectividad de los tratamientos es diferente, se observa que el tratamiento 1 es el menos eficiente mientras que el tratamiento 3 es el que produce mayor porcentaje de hipertensos hivers controlados.

Si realizamos la prueba con un paquete estadístico en la computadora obtendríamos los resultados siguientes:

X2 = 72.78 Grados de Libertad = 2 p= 0.000000

Entonces verificaría antes de aplicar la prueba si se cumplen restricciones, como en éste caso se cumplen la utilizaría.

Al considerar un alpha=0.05 , como la (p) asociada al valor del estadígrafo
p= 0.000000 es menor que alpha=0.05 , se rechaza la hipótesis nula de no diferencias entre las proporciones , por lo que llegamos a la conclusión que hay diferencias estadísticas significativas entre ambas poblaciones en relación a la distribución de esta variable.

Bueno amigos, espero que hayan entendido algo, de esta difícil, pero muy útil ciencia, si les gusto mi post, déjenlo en los comentarios, regálenme un like, para seguir motivando mi trabajo en este tema en la blockchain, excelente semana para todos, un abrazo hasta la próxima.

🙋🙋🙋🙋🙋🙋🙋🙋
👏👏👏👏👏
🥳🥳🥳



0
0
0.000
3 comments
avatar

Has sido votado por

PROYECTO ENLACE

'Conectando Ideas y Comunidades'

PROYECTO ENLACE es un proyecto de curación de habla hispana enfocado en recompensar contenido de calidad y apoyar autores en su proceso de crecimiento en HIVE.

Creemos y apostamos por el futuro de esta gran plataforma, y estamos muy emocionados de poder hacerla crecer junto a esta comunidad. Así que te invitamos a usar nuestra etiqueta ENLACE y estar atento a todas las actividades que tenemos preparadas y que estaremos publicando en breve.

¿QUIERES AUTOMATIZAR TUS GANANCIAS DE CURACIÓN? SE PARTE DEL PROYECTO ENLACE APOYANDO A NUESTRO TRAIL EN HIVE.VOTE INGRESA AQUÍ PARA CONOCER LOS DETALLES.

¿QUIERES INVERTIR ENLACE? DESCUBRE COMO HACERLO Y GENERAR INGRESOS DE FORMA SEMANAL MEDIANTE TU DELEGACIÓN DE HP AQUÍ TE EXPLICAMOS COMO.

Te invitamos a participar en nuestro servidor de Discord: https://discord.gg/3S9y7BbWfS

Atentamente

EQUIPO ENLACE 2022

0
0
0.000
avatar

Siempre es bueno ver contenido educativo en Hive.
¡Gracias por compartir!

!1UP

You can earn passive income by delegation of tribe tokens to "The Cartel".

cartel_curator_final.gif
Click this banner to join "The Cartel" discord server to know more.

0
0
0.000