Recomendaciones para la confección de Gráficos Estadísticos.

in StemSocial2 months ago (edited)

Buenos días amigos de @StemSocial y en especial a los lectores y escritores de la comunidad hispana de #stem-espanol, hoy les comentaré someramente en un primer momento sobre el Premio Anual de Salud y después sobre los aspectos básicos a tener en consideración al realizar un gráfico estadístico.

La pasada semana se realizó un importante evento científico, donde destacados investigadores de diferentes especialidades médicas mostraron resultados relevantes en el área de la investigación. Tal evento es conocido como Premio Anual de Salud.

Durante la presentación y discusión de los trabajos, notamos que existían dificultades en la confección de los gráficos estadísticos, lo que motivó la realización de este post. Donde explicaremos solo algunos gráficos, los más utilizados en nuestro medio, pues existen variedades y tipos en dependencia de las variables y de las ramas de las ciencias donde se apliquen.

Antes de empezar es preciso abordar algunos conceptos básicos que se mencionan durante el desarrollo del tema.

Variable: propiedad o cualidad que puede manifestarse bajo dos o más formas distintas en un individuo de una población.
Variable Cualitativas: expresan cualidades o atributos (ej. color).
Variable Cuantitativas: expresan magnitudes o cantidades que son resultados de medición de algún instrumento, conteos de eventos u operaciones matemáticas simples.

Las variables cuantitativas pueden ser:


Variable Cuantitativas Discretas: la magnitud es expresable sólo mediante números enteros (ej. Número de hijos de una familia)
Variable Cuantitativas Continuas: existe potencialmente un número infinito de valores entre dos puntos de la escala (ej. peso)

Representación gráfica.


--------👇👇👇👇👇👇--------

Una manera de presentar la información estadística es a través de los gráficos, su fin es obtener una impresión visual de conjunto del material presentado y tener una rápida comprensión de un fenómeno, también nos permite evidentes ciertas relaciones entre variables poco aparentes en el material tabulado.

El gráfico es un auxiliar de la tabla estadística, no la sustituye, la complementa. Ellos pueden resultar muy útiles, aunque en ocasiones el uso incorrecto los convierte en instrumentos inservibles, incluso cuando no se confeccionan de la manera correcta pueden conllevar a interpretaciones falsas.

Los mismos deben ser autoexplicativos, es decir, el lector no tiene que recurrir a fuentes externas para interpretarlos, con la simple observación los puede entender.

Veamos a continuación las siguientes partes que debe tener un gráfico estadístico.

Partes del gráfico.


--------👇👇👇👇👇👇--------

Presentación (Identificación y Titulo): la identificación consiste en numerar los gráficos consecutivamente, por ejemplo: Gráfico 1, Gráfico 2, etc. Rara vez hacemos una presentación con un solo gráfico, así que tienen que estar correctamente enumerados y el otro elemento importante es el título del gráfico el cual tiene que estar en correspondencia con la tabla que lo originó.

Gráfico propiamente dicho: este aspecto se refiere a los distintos tipos de gráficos que existen, sus características dependen del tipo de variable que vayamos a presentar.

Fuente: es la tabla estadística que le dió origen. Una tabla en ocasiones puede ser fuente de varios gráficos.

Notas explicativas: se utiliza cuando se quiere esclarecer algo contenido en el gráfico.

Leyenda: su fin es identificar los elementos del gráfico (barras, sectores, etc.) con su correspondiente origen.

Para una mejor comprensión vamos a verlo a través de la elaboración de diferentes gráficos, comenzamos por:

Gráfico de barras simples: Es un gráfico formado por barras separadas que representan a las categorías de la variable en estudio. Se utiliza cuando queremos representar una variable cualitativa o cuantitativa discreta, y la información se dispone en frecuencias absolutas o relativas, o en medidas de resumen.

Elementos a considerar en su construcción.


°°°°°°°°✍️✍️✍️✍️✍️✍️°°°°°°°°

  • Disponer las barras separadas entre sí, para dar la idea de discontinuidad de la variable representada.
  • El ancho de las barras será opcional, pero debe ser el mismo para todas.
  • La separación entre barras debe ser igual a la mitad del ancho de ellas.
  • Si la variable es nominal, ordene las barras en orden creciente o decreciente, en dependencia de su gusto.
  • Utilice tantas barras como categorías tenga la variable.
  • Puede colocar las barras en el eje vertical o en el horizontal.
  • Este gráfico se origina a partir de tablas unidimensionales.

Ejemplo: Un grupo de investigadores desea conocer el comportamiento de la vulnerabilidad psicosocial en ancianos de un área de salud. Para ello aplica el cuestionario de vulnerabilidad; bienestar psicosocial y obtiene los siguientes resultados: (Cuadro 1.) y a partir de estos datos confeccionamos el gráfico correspondiente (gráfico 1.)

Gráfico de pastel, de sectores o circular: Este gráfico se utiliza cuando queremos representar una variable cualitativa o cuantitativa discreta, y la información se dispone en porcentaje. Básicamente, es un círculo dividido en sectores que representan las categorías de la variable.

Elementos a considerar en su construcción.


°°°°°°°°✍️✍️✍️✍️✍️✍️°°°°°°°°

Ejemplo: Utilizando la información del ejemplo anterior, y haciendo los cálculos pertinentes, el gráfico quedaría de la siguiente forma:

Gráfico de barras múltiples: Este gráfico se utiliza cuando queremos representar dos variables, que pueden ser: cualitativas o cuantitativas discretas ambas, o una cualitativa y la otra cuantitativa discreta; y la información se dispone en frecuencias absolutas o relativas, o en medidas de resumen. Los datos se representan mediante barras agrupadas, como se verá a continuación.

Elementos a considerar en su construcción.


°°°°°°°°✍️✍️✍️✍️✍️✍️°°°°°°°°

  • Dispondrán grupos de dos, tres o más barras, es decir, barras dobles, triples, etc.
  • El número de grupos a formar dependerá del número de categorías consignadas en la columna matriz o en la fila de encabezamiento, según su gusto.
  • La separación entre cada grupo de barras es aproximadamente la mitad del ancho del grupo.
    Este gráfico se origina a partir de tablas bidimensionales.

Ejemplo: El siguiente gráfico resume la información de 300 niños de un Círculo Infantil atendido por un médico de familia, atendiendo a las variables sexo y raza. (Tabla 2)

Gráfico de barras compuestas: Al igual que el gráfico anterior, utilice este cuando se quiera representar dos variables: ambas cualitativas o cuantitativas discretas, o una cualitativa y la otra cuantitativa discreta; y se disponga de la información en frecuencias relativas. Aquí, la información perteneciente a una variable se representa en su totalidad en una sola barra.

Elementos a considerar en su construcción.


°°°°°°°°✍️✍️✍️✍️✍️✍️°°°°°°°°

  • Cada barra representa el ciento por ciento de la información del grupo representado.
  • El ancho de las barras queda a su gusto, pero debe ser el mismo para todas.
  • La separación entre las barras es aproximadamente la mitad del ancho de ellas.
  • Lo originan tablas bidimensionales.

Ejemplo: Utilizando la información del ejemplo anterior, el gráfico quedaría de la siguiente forma (Gráfico 4)

Quisiera terminar hablando de los gráficos de tallos y hojas, además del muy utilizado gráfico de cajas y bigotes

Una técnica para la observación de la distribución que funciona bien es el diagrama de tallo y hojas. Es un diagrama en el que los datos puntuales se agrupan de tal modo que se puede visualizar la forma de la distribución mientras que se mantiene la individualidad de los datos puntuales.

Un diagrama de tallos y hojas consiste en una serie de hileras horizontales de números. El número utilizado para designar una hilera es su tallo, el resto de números de la hilera se denominan hojas.
Diagrama de tallos simples

Elementos a considerar en su construcción.


°°°°°°°°✍️✍️✍️✍️✍️✍️°°°°°°°°

Se eligen algunos números oportunos que puedan servir de tallos. Para facilitar la determinación de la forma se necesitan al menos 5 tallos. Los tallos elegidos generalmente son el primero o los dos primeros dígitos de los números del conjunto de datos.

  • Se nombran las hileras mediante los tallos elegidos.
  • Se reproducen gráficamente los datos registrando el dígito, siguiendo el tallo, como una hoja del tallo adecuado.
  • Se gira el gráfico hacia un lado para ver cómo se distribuyen los números. En concreto, se intenta responder a preguntas como:

1.- ¿Los datos tienden a agruparse cerca de un tallo o tallos en particular o se distribuyen de forma uniforme por el diagrama?
2.- ¿Los datos tienden a juntarse hacia un extremo u otro del diagrama?
3.- Si se traza una curva a lo largo de la parte superior del diagrama ¿forma más o menos una campana? ¿Es plana? ¿Es simétrica?

Ejemplo: Los siguientes datos representan las observaciones sobre la magnitud de un terremoto en California según su medición en la escala de Richter:


1.0 8.3 3.1 1.1 5.1
1.2 1.0 4.1 1.1 4.0
2.0 1.9 6.3 1.4 1.3
3.3 2.2 2.3 2.1 2.1
1.4 2.7 2.4 3.0 4.1
5.0 2.2 1.2 7.7 1.5

Los primeros dígitos de estos números son: 1, 2, 3, 4, 5, 6, 7 y 8. Estos dígitos servirán como nombres de los tallos y las hileras. A continuación, se representan los datos gráficamente representando el número que aparece después de la coma decimal como una hoja del tallo apropiado.

En la siguiente figura se visualiza todo el conjunto de datos.

Para tener una idea de la forma, se observa la curva que se ha trazado en la parte superior del diagrama.
Observando el diagrama, puede deducirse que estos datos se aproximan al extremo inferior de la escala. Muchos terremotos eran suaves.

También se observa que el diagrama no es simétrico. Hay más bien una cola larga en el extremo superior. Se dice que los datos de este tipo están sesgados hacia la derecha.

Diagrama de tallos dobles

Elementos a considerar en su construcción.


°°°°°°°°✍️✍️✍️✍️✍️✍️°°°°°°°°

Algunas veces, la utilización del primero o los dos primeros dígitos de los datos puntuales como tallos no proporciona suficientes tallos como para permitirnos detectar la forma. Una manera de solucionar este problema es utilizar tallos dobles. Es decir, utilizar cada tallo dos veces: una vez para trazar las hojas inferiores 0, 1, 2, 3, 4 y a continuación nuevamente para trazar las hojas superiores 5, 6, 7, 8, 9.

Ejemplo: En un estudio del crecimiento de los varones se obtuvieron estas observaciones sobre el perímetro en centímetros de la cabeza de un niño al nacer:


33.1 34.6 34.2 36.1 34.2 35.6
34.5 35.8 34.5 34.2 34.3 35.2
33.7 36.0 34.2 34.7 34.6 34.3
33.4 34.9 33.8 33.6 35.2 34.6
33.7 34.8 33.9 34.7 35.1 34.2
36.5 34.1 34.0 35.1 35.3

Si se utilizan los primeros dos dígitos como tallos, sólo se tendrán cuatro tallos 33, 34, 35 y 36. Como no es suficiente para detectar la forma, se utilizarán dos veces cada uno de los tallos y se formará un gráfico de tallo doble con hojas inferiores y hojas superiores. A continuación, se presenta el diagrama obtenido:

Se observa que los datos tienden a agruparse en el área de 34 centímetros. Aunque el diagrama no es perfectamente simétrico, tiende a aproximarse a la forma de una campana.

Diagrama de caja y bigotes

El diagrama de caja y bigotes (boxplot) es una representación gráfica de un conjunto de datos que facilita la percepción visual de la posición, extensión y del grado y la dirección del sesgo. También permite identificar los datos atípicos. Es especialmente útil cuando se desean comparar dos o más conjuntos de datos.

Un diagrama de caja es un gráfico, basado en cuartiles, mediante el cual se visualiza un conjunto de datos. Está compuesto por un rectángulo, la caja, y dos brazos, los bigotes. Es un gráfico que suministra información sobre los valores mínimo y máximo, los cuartiles Q1, Q2 o mediana y Q3, y sobre la existencia de valores atípicos y la simetría de la distribución.

Elementos a considerar en su construcción.


°°°°°°°°✍️✍️✍️✍️✍️✍️°°°°°°°°

  1. -Ordenar los datos y obtener el valor mínimo, el máximo, los cuartiles Q1, Q2 y Q3 y el Rango Inter Cuartílico. (RI)
    En el ejemplo:
    Valor 7: es el Q1 (25% de los datos)
    Valor 8.5: es el Q2 o mediana (el 50% de los datos)
    Valor 9: es el Q3 (75% de los datos)
    Rango Inter Cuartílico RI (Q3-Q1) =2

  2. -Dibujar un rectángulo con Q1 y Q3 como extremos e indicar la posición de la mediana (Q2) mediante una línea.

  3. -Para dibujar los bigotes, las líneas que se extienden desde la caja, hay que calcular los límites superior e inferior, Li y Ls, que identifiquen a los valores atípicos. Para ello se calcula cuándo se consideran atípicos los valores. Son aquellos inferiores a Q1 - 1.5RIC o superiores a Q3 + 1.5RIC.
    En el ejemplo:
    inferior: 7-1.52=4
    superior: 9+1.5
    2=12

  4. -Ahora se buscan los últimos valores que NO son atípicos, que serán los extremos de los bigotes.
    En el ejemplo: (5 y 10.)

  5. -Marcar como atípicos todos los datos que están fuera del intervalo (Li, Ls).
    En el ejemplo: 0.5 y 3.5

  6. -Además, se pueden considerar valores extremadamente atípicos aquellos que exceden Q1-3RI o Q3+3RI.
    De modo que, en el ejemplo:
    inferior: 7-32=1,
    superior: 9+3
    2=15

  7. -El valor 0.5 seria atípico extremo (se denota mediante asterisco) y el 3.5 sería atípico moderado (se denota mediante círculo abierto).

Hasta aquí la presentación gráfica de las variables cualitativas y cuantitativas discretas, las variables cuantitativas continúas se representan a través de los gráficos aritméticos simples y constituye un tema ya tratado en este post, .Series temporales

Finalizó mostrando algunos ejemplos de gráficos elaborados durante algunos de mis análisis.

Bueno queridos lectores espero les haya resultado de interés el tema, sobre todo tener en consideración estos elementos a la hora de construir gráficos estadísticos

Blibliografia


--------👏👏👏👏👏👏--------

Bayarre E, Casrañeda I, Lourdes A. Libro bioestadística. Módulo 3. Escuela Nacional Salud Pública. Páginas 12-31. 2011.

--------👏👏👏👏👏👏--------

  • Los gráficos son de mi propiedad
  • Post 100 % original
Sort:  

Congratulations @lindoro! You have completed the following achievement on the Hive blockchain and have been rewarded with new badge(s):

You received more than 1000 upvotes.
Your next target is to reach 1250 upvotes.

You can view your badges on your board and compare yourself to others in the Ranking
If you no longer want to receive notifications, reply to this comment with the word STOP

Check out the last post from @hivebuzz:

Our Hive Power Delegations to the July PUM Winners
Feedback from the August 1st Hive Power Up Day
Hive Power Up Month Challenge 2022-07 - Winners List
Support the HiveBuzz project. Vote for our proposal!

Wow! It is mainly a plot class! What software are you using in your computational version?
!1UP

You can earn passive income by delegation of tribe tokens to "The Cartel".

dlmmqb-TheCartel-banner
Click this banner to join "The Cartel" discord server to know more.

1UP-PIZZA.png

You have received a 1UP from @gwajnberg!

The @oneup-cartel will soon upvote you with:
@stem-curator
And they will bring !PIZZA 🍕.

Learn more about our delegation service to earn daily rewards. Join the Cartel on Discord.

Thanks for your contribution to the STEMsocial community. Feel free to join us on discord to get to know the rest of us!

Please consider delegating to the @stemsocial account (85% of the curation rewards are returned).

You may also include @stemsocial as a beneficiary of the rewards of this post to get a stronger support.