Histograma – ¿Qué es y como hacerlo?
¿Qué es un histograma?
Un histograma es un tipo de gráfica que representa la distribución de frecuencias, un parámetro estadístico presente en la estadística descriptiva, mediante un conjunto de rectángulos cuyas amplitudes y alturas simbolizan unos intervalos de datos y sus frecuencias respectivamente.
Se utiliza para la representación del comportamiento de variables cuantitativas continuas. Este tipo de variable estadística se refiere a valores numéricos, operables matemáticamente. El término “continuas” se refiere a que la cantidad de valores, dentro de la investigación que se esté efectuando, es infinita.
En el eje horizontal del histograma se ubican los intervalos o clases, es decir, las variables agrupadas sobre las cuales se ha realizado una investigación. Estas clases pueden ser edades o mediciones métricas. Obsérvese que, aunque estas variables no son necesariamente infinitas, el número de valores que puede tomar es considerable.
En el eje vertical se ubican las frecuencias con que se presenta el fenómeno, característica o situación, en los objetos estudiados. Se refiere al número de casos que poseen o se ven afectadas por las clases, por ejemplo, el número de personas, de días, o cualquier otra cantidad de objetos.
Al implementar un histograma y, dependiendo cuál es el objeto de estudio de la investigación, se deben tener en cuenta si lo que se quiere representar son las frecuencias absolutas o las frecuencias relativas del comportamiento de los datos recopilados. En un breve paréntesis te explicamos de qué se tratan:
- Frecuencias absolutas: es el número de casos en los que se repite un fenómeno. Por ejemplo, 10 personas han respondido en una encuesta que tienen 18 años. Por lo tanto, la frecuencia absoluta de este dato (18 años) es 10.
- Frecuencias relativas: es el número de casos con que se presenta un fenómeno, con respecto al total de los casos estudiados. Aquí, se divide la frecuencia absoluta entre el total de los casos analizados. Por ejemplo, en la anterior encuesta se entrevistaron 100 personas en total, por lo que la frecuencia relativa del dato 18 años es 10 dividido 100, es decir, 0.1.
¿Cuándo utilizar un histograma?
Los histogramas son utilizados para representar la distribución de frecuencias de variables cuantitativas continuas. Al establecer intervalos, se hace necesario que los datos sean numéricos, pues se pueden establecer los rangos en que se dividen las clases de la investigación, mientras que características no contables (cualitativas) no se pueden ordenar por su valor numérico.
Estos datos incluyen edad; propiedades físicas o medidas como el peso, la masa, la distancia, la longitud. En las empresas, podrían considerar la cantidad de productos manufacturados y la frecuencia, en términos de tiempo, en que son fabricados. En este último caso, puede ser utilizado en la gestión del capital humano o en la contabilidad de las finanzas.
Cabe resaltar que los histogramas representan frecuencias y su implementación está enfocada a permitir analizar, de manera general, el comportamiento de unos datos numéricos bajo ciertos contextos. Existen otros tipos de gráficos que no necesariamente representan estas frecuencias, como los gráficos de dispersión, cascada, rectángulos y proyección solar, los cuales exponen otro tipo de información.
Características de un histograma
- Representa el comportamiento de variables cuantitativas continuas.
- Utiliza la escala de medición mediante intervalos.
- Gráficamente, sus columnas o barras están juntas.
- La altura y amplitud de las columnas o barras dependen de la frecuencia y el intervalo de cada dato, respectivamente.
- El eje horizontal o abscisas está compuesto por las clases o intervalos de datos.
- El eje vertical está compuesto por las frecuencias.
- Es un tipo de gráfico de distribución de frecuencias.
- Dentro de la clasificación de tipos de gráficas, es parte del grupo de gráficos superficiales rectangulares.
Ventajas y desventajas del histograma
Ventajas
- Facilita el análisis de distribución de frecuencias.
- Permite reunir una gran cantidad de datos.
- Al utilizar intervalos, se pueden analizar varios datos simultáneamente.
- Es una representación efectiva de las tendencias y recurrencia de ciertos fenómenos.
- Es de gran utilidad al comparar dos distribuciones de frecuencias.
- También permite realizar análisis de la tendencia central y dispersión de los datos.
- Representa la información de forma clara y sencilla.
- Se puede implementar fácilmente.
- Realizar conclusiones se hace más rápido gracias a su aplicación.
Desventajas
- Se limita a la representación de variables cuantitativas continuas.
- Al utilizar intervalos y agrupar grandes sectores, ciertos detalles importantes se pierden al análisis de la información.
- Se requiere de la recopilación de muchos datos para su implementación.
- No se pueden analizar los cambios de las variables fácilmente.
Tipos de histograma
Existen diversos tipos de histogramas o gráficos que están relacionados con él, algunos más apropiados que otros dependiendo del objetivo de la investigación y el estudio estadístico a realizar. Estos son:
Diagramas de barras simples
Este tipo de diagrama es el más utilizado. Es un diagrama de barras cuya información se representa mediante columnas separadas. Se puede utilizar para representar variables cuantitativas y cualitativas, especialmente, discretas. La altura de las columnas simboliza la frecuencia del fenómeno estudiado.
Diagramas de barras compuesta
El diagrama de barras compuestas o apiladas está conformado por columnas que representan dos tipos de variables, de manera que un tipo se encuentra sobre el otro, con el objetivo de comparar sus frecuencias.
Diagramas de barras agrupadas
En este tipo de gráfico estadístico es similar a el diagrama de barras compuestas, y se conforma de pares de columnas agrupadas, con el fin de comparar la frecuencia con que se dan dos clases de fenómenos o características diferentes.
Polígono de frecuencias
Es un tipo de gráfico estadístico de líneas, muy utilizado en estadística descriptiva, para describir variables cuantitativas continuas y discretas, así como cualitativas, y su comportamiento. Se conforma de una línea segmentada, donde cada punto representa una frecuencia, ya sea absoluta o relativa.
Ojiva porcentual
Este tipo de gráfico representa, al igual que el histograma, la información mediante intervalos. Sin embargo, su diferencia radica en que la figura utilizada es una línea segmentada, al igual que el polígono de frecuencias.
Diferencia entre histograma y gráfico de barras
Los histogramas y los gráficos de barras son similares tanto por la utilización de columnas o barras como por ser dos de los tipos de gráficos para representar la distribución de frecuencias. Sin embargo, los dos se diferencian, principalmente, por dos características:
- Gráficamente, las columnas o barras de un diagrama de barras están separadas unas de otras. Por otro lado, las columnas de un histograma están juntas.
Los diagramas o gráficos de barras se utilizan para representar la distribución de frecuencia de variables cuantitativas y cualitativas discretas, es decir, un número finito de valores. Los histogramas se utilizan para representar el comportamiento de las variables cuantitativas continuas, lo que quiere decir, un número infinito de valores.
Cómo hacer un histograma
Antes de realizar un histograma, los datos recopilados en la investigación deben estar organizados en una tabla de frecuencias, de manera que al diseñar cualquier gráfico estadístico, sea más fácil disponer de la información gráficamente. Para diseñar esta tabla, se realizan los siguientes pasos:
- Encontrar el rango: esto se hace restando el dato menor por el dato mayor (R = Xmayor – Xmenor)
- Encontrar el número de intervalos: aquí se debe de aplicar la regla de Sturges. La fórmula que se utiliza es K = 1 + 3.322log(n), donde n equivale al número de datos.
- Encontrar la amplitud de los intervalos: para encontrar este valor, se divide el rango entre el número de intervalos (R / K).
- Encontrar las marcas de clase: este término se refiere al promedio de los valores de un intervalo. Se suman el valor mayor y el valor menor, y se divide el resultado entre dos ([x1 + x2] / 2).
- Organizar los datos encontrados en la tabla: una vez calculados los anteriores valores, se organizan los intervalos en una tabla de manera ordenada. Generalmente, cada intervalo es cerrado en su límite menor y abierto en su límite mayor.
- Encontrar las frecuencias: para encontrar la frecuencia absoluta, representada por una f, se deben contar el número de datos que contiene cada intervalo. Es importante aclarar que los límites mayores de los intervalos no incluyen ese dato que representan, por lo que se cuenta en el siguiente intervalo.
Para hallar la frecuencia relativa, representada por fr, se divide cada una de las frecuencias absolutas de los intervalos entre el total de datos.
Ahora que los datos están organizados en una tabla de frecuencias, se procede a diseñar el histograma de la siguiente manera:
- Dibujar el plano: el eje horizontal se divide de acuerdo a los intervalos en que se agrupa los datos, enumerando las abscisas con el límite menor. El eje vertical se puede dividir con cualquier intervalo (de 3 en 3, de 5 en 5), mientras que se alcance la frecuencia mayor encontrada.
- Dibujar las columnas: dibujado el plano, solo queda representar los datos mediante columnas o barras. La frecuencia indica la altura de la columna y los intervalos, su amplitud.
Ejemplo de histograma
Para comprender mejor el concepto y la implementación de un histograma en un caso de la vida real, exponemos el siguiente ejemplo:
Una universidad necesita documentar la frecuencia absoluta con que un grupo de estudiantes de quinto semestre alcanzó un puntaje determinado en una prueba nacional. Se entrevistaron 300 estudiantes, entre los cuales uno alcanzó un puntaje de 97 puntos, mientras que el menor puntaje fue de 33.
Los datos calculados fueron:
- Rango: 64.
- Número de intervalos: 13.
- Amplitud de los intervalos: 5.
El histograma diseñado fue el siguiente:
Pasos para hacer un histograma en Excel
Excel es una herramienta excelente para realizar cálculos estadísticos y representarlos mediante gráficos. Aquí, te explicaremos cómo hacer un histograma en Excel, paso a paso, de acuerdo al anterior ejemplo:
- Primero, tenemos que tener nuestra tabla de frecuencias con los datos organizados.
- Una vez nuestros datos organizados en la tabla de frecuencias, seleccionamos las frecuencias absolutas y seleccionamos un gráfico de columnas agrupadas.
- Ahora, hacemos click derecho sobre la gráfica y entramos al apartado Seleccionar datos.
- Se mostrará un menú para seleccionar el origen de los datos de la gráfica. Haremos click sobre el botón Editar, y aparecerá un nuevo recuadro. Por último, seleccionamos la columna de la tabla donde se incluyen los intervalos y apretamos Aceptar.
- En la derecha de nuestro espacio de trabajo encontraremos una interfaz llamada Formato del área del gráfico (si está no aparece, clickeamos dos veces sobre la gráfica). Seleccionamos una de las columnas del gráfico y nos dirigimos a Opciones de serie, donde modificaremos el Ancho del intervalo, colocando cero en el recuadro.
- Hacemos click derecho sobre la gráfica y seleccionamos la opción Agregar etiquetas de datos.
- Por último, podemos personalizar nuestro histograma haciendo uso de las herramientas de diseño de Excel.
Etiqueta:cursos online, Excel, Microsoft Excel, trucos excel