¿QUE ES LA ESTADÍSTICA?
Como dijera Huntsberger: "La palabra estadística a menudo nos trae a la mente imágenes de números apilados en grandes arreglos y tablas, de volúmenes de cifras relativas a nacimientos, muertes, impuestos, poblaciones, ingresos, deudas, créditos y así sucesivamente". Huntsberger tiene razón pues al instante de escuchar esta palabra estas son las imágenes que llegan a nuestra cabeza.
La estadística es una ciencia formal y una herramienta que estudia el uso y los análisis provenientes de una muestra representativa de datos, busca explicar las correlaciones y dependencias de un fenómeno físico o natural, de ocurrencia en forma aleatoria o condicional.Es la parte de las Matemáticas que se encarga del estudio de una determinada característica en una población, recogiendo los datos, organizándolos en tablas, representándolos gráficamente y analizándolos para sacar conclusiones de dicha población. Sin embargo, la estadística es más que eso, es decir, es la herramienta fundamental que permite llevar a cabo el proceso relacionado con la investigación científica.
La estadística, en general, es la ciencia que trata de la recopilación, organización presentación, análisis e interpretación de datos numéricos con e fin de realizar una toma de decisión más efectiva.
La estadística aplicada puede ser dividida en dos ramas: la estadística descriptiva (refiere a los métodos de recolección, descripción, visualización y resumen de los datos, que pueden ser presentados en forma numérica o gráfica) y la estadística inferencial (la generación de los modelos y predicciones relacionadas a los fenómenos estudiados, teniendo en cuenta el aspecto aleatorio y la incertidumbre en las observaciones).
- Se dedica a la generación de los modelos, inferencias y predicciones asociadas a los fenómenos en cuestión teniendo en cuenta la aleatoriedad de las observaciones. Se usa para modelar patrones en los datos y extraer inferencias acerca de la población bajo estudio. Estas inferencias pueden tomar la forma de respuestas a preguntas sí/no (prueba de hipótesis), estimaciones de unas características numéricas (estimación), pronósticos de futuras observaciones, descripciones de asociación (correlación) o modela-miento de relaciones entre variables (análisis de regresión). Otras técnicas de modelamiento, series de tiempo y minería de datos. Realiza el estudio descriptivo sobre un subconjunto de la población llamado muestra y, posteriormente, extiende los resultados obtenidos a toda la población.
CONCEPTOS RELACIONADOS CON LA ESTADÍSTICA
Población
El concepto de población en estadística va más allá de lo que comúnmente se conoce como tal. también llamada universo o colectivo, es el conjunto de elementos de referencia sobre el que se realizan unas de las observaciones. Población (‘population’) es el conjunto sobre el que estamos interesados en obtener conclusiones (hacer inferencia). Normalmente es demasiado grande para poder abarcarlo. Una población se precisa como un conjunto finito o infinito de personas u objetos que presentan características comunes.
Muestra
Una muestra es un subconjunto de casos o individuos de una población estadística.Las muestras se obtienen con la intención de inferir propiedades de la totalidad de la población, para lo cual deben ser representativas de la misma. Para cumplir esta característica la inclusión de sujetos en la muestra debe seguir una técnica de muestreo. En tales casos, puede obtenerse una información similar a la de un estudio exhaustivo con mayor rapidez y menor coste.
Probabilidad
La probabilidad es un método por el cual se obtiene la frecuencia de un acontecimiento determinado mediante la realización de un experimento aleatorio, del que se conocen todos los resultados posibles, bajo condiciones suficientemente estables. La Probabilidad propone modelos para los fenómenos aleatorios, es decir, los que se pueden predecir con certeza, y estudia sus consecuencias lógicas.
Dato
Un dato estadístico es cada uno de los valores que se ha obtenido al realizar un estudio estadístico. Son los valores cualitativos o cuantitativos mediante los cuales se miden las características de los objetos, sucesos o fenómenos a estudiar.Variable
Una variable es una propiedad que puede fluctuar y cuya variación es susceptible de adoptar diferentes valores, los cuales pueden medirse u observarse. Las variables adquieren valor para la investigación cuando se relacionan con otras variables, es decir, si forman parte de una hipótesis o de una teoría.
Tipos de variables
- Variable cualitativa: Las modalidades de la variable son características no numéricas. (Ejemplo: color de pelo, nivel de estudios)
- Variable cuantitativa: Las modalidades de la variable son características numéricas.(Ejemplo: ingresos mensuales, edad)
- DISCRETA: El paso de un valor de la variable al siguiente representa un salto.
(Ejemplo: numero de empleados en una empresa)
- CONTINUA: Dados dos valores de la variable siempre existen infinitos valores
posibles entre el os dos. (Ejemplo: tiempo que transcurre entre dos averías de
una maquina)
Parámetro
Es un valor, medida o indicador representativo de la población que se selecciona para ser estudiado. Otra definición podría ser, función definida sobre valores numéricos de una población. Se llama parámetro a un valor representativo de una población, como la media aritmética, una proporción o su desviación típica.
Estadístico
Es el elemento que describe una muestra y sirve como una estimación del parámetro de la población correspondiente. El estadístico sirve como una estimación del parámetro. Aunque en realidad el interés se fija en el valor del parámetro de la población, con frecuencia debe haber conformidad con solo calcularlo con un estadístico de la muestra que se ha seleccionado.
Fenómeno aleatorio
- Un fenómeno aleatorio tiene la particularidad que de al ser observado, no se puede predecir con exactitud cual será el resultado observado. No se sabe lo que va a pasar.El presente cociente:
- Se podría repetir indefinidamente las observaciones bajo condiciones esencialmente invariables.
- Se es capaz de describir todos los posibles resultados de una observación, aún cuando no es posible establecer lo que será un resultado particular.
- Los resultados individuales de las observaciones repetidas pueden ocurrir de manera accidental, pero cuando el número de observaciones es grande aparece el patrón de regularidad estadística.
-----------------------------------------------------------------
Nº de observaciones
Características de un Fenómeno Aleatorio
Las características de un fenómeno aleatorio tiene los siguientes rasgos pertinentes:
Fenómeno determinista
Al repetirlo en idénticas condiciones se obtiene el mismo resultado.
POBLACIONES FINITAS
En los problemas planteados en las
distintas disciplinas se estudia el comportamiento de una o más variables sobre
un conjunto de unidades. A este conjunto de unidades lo denominamos población P. La unidades de la
población pueden ser pacientes, hospitales, alumnos, médicos,
objetos, etc. La variable es la
característica estudiada que puede tomar distintos valores de unidad en unidad.1 Cuando hablamos de poblaciones finitas, por lo menos en teoría,
podemos acceder a todos los individuos o elementos que la componen.
POBLACIONES INFINITAS
En muchos problemas interesa saber como se comporta una, o varias variables, al
observarlas cuando se repite un experimento definido de antemano, pero
no existe un número fijo, finito, de experimentos ya que teóricamente se los
puede repetir cuantas veces se quiera.
Si estudiamos pacientes hipertensos y medimos su tensión arterial, estas
mediciones se pueden repetir cuantas veces se quiera, por lo menos en teoría,
en pacientes actuales y futuros repartidos a lo largo del mundo.
Estadística y su relación con otras ciencias
Cualquiera sea el punto de vista, lo fundamental es la importancia científica que tiene la estadística, debido al gran campo de aplicación que posee. La investigación en Psicología, Sociología y Educación, al igual que ocurre en otras ciencias, en buena medida se basa en el manejo de recursos estadísticos como elementos indispensables para llegar a conclusiones aceptables por el resto de la comunidadcientífica. Dada la peculiaridad de su objeto de estudio, inabordable en la mayoría de los casos si no es a través de perspectivas complejas de relación entre variables, la atención de los investigadores en las ciencias humanas y sociales se concentra cada vez más en la llamada Estadística Multivariante. Los diseños complejos de investigación y análisis, las aportaciones más recientes de la informática para la aplicación de técnicas avanzadas de manipulación de datos y la discusión de estos aspectos desde perspectivas teóricas y aplicadas, preocupan y concentran a multitud de profesionales cuyo quehacer cotidiano es el estudio de cómo se investiga, haciendo de ello su especialidad. Paralelamente, otras especialidades dentro de estas ciencias utilizan el conocimiento ya elaborado y retransmitido, preocupadas más por los resultados y posibilidades que por las condiciones de aplicación y el fundamentos de uso, de tal forma que se ha propiciado la utilización de las técnicas estadísticas, sin considerar la adecuación de éstas a las condiciones en las que se aplican.
A su vez, las ciencias sociales se han visto apabulladas en los últimos años por avances vertiginosos en informática y aplicaciones estadísticas (Manheim, 1982; Rossi y otros, 1983), y muy especialmente en la psicología (Judd y otros, 1995), lo que favorece una absorción de poca calidad por parte de los especialistas en áreas no metodológicas. Por otro lado, la adopción de procedimientos informáticos para realizar tareas metodológicas no parece ser una solución inmediata, considerando la ansiedad que generan los ordenadores, fenómeno muy generalizado (Fa riña y Arce, 1993).
La fusión de esta creciente complicación de las herramientas de análisis, junto con la discrepancia entre los objetivos de formación y la necesidad de uso de los recursos estadísticos, consigue finalmente que el especialista en áreas aplicadas tiende a descuidar aspectos muy básicos, previos a la aplicación de estos recursos estadísticos complejos. Por otro lado, en muchas ocasiones, la aplicación de herramientas estadísticas se deja arrastrar por hipótesis de comodidad, en el sentido de aplicarse para permitir la ejecución de una prueba o el ajuste de un modelo, no porque son las estrategias más adecuadas, sino porque son las más cómodas
La física estadística o mecánica estadística es la parte de la física que trata de determinar el comportamiento agregado termodinámico de sistemas microscópicos a partir de consideraciones microscópicas utilizando para ello herramientas estadísticas junto a leyes mecánicas.
La física estadística puede describir numerosos campos con una naturaleza estocástica (reacciones nucleares, sistemas biológicos, químicos, neurológicos).
La estadística industrial es la rama de la estadística que busca implementar los procesos probabilísticos y estadísticos de análisis e interpretación de datos o características de un conjunto de elementos al entorno industrial, a efectos de ayudar en la toma de decisiones y en el control de los procesos industriales y organizacionales.
La historia es la ciencia que tiene como objeto de estudio el pasado de la humanidad y como método el propio de las ciencias sociales.[1] Se denomina también historia al periodo histórico que transcurre desde la aparición de la escritura hasta la actualidad.
Es considerada "la ciencia de las ciencias" por englobar en su estudio multitud de otras ciencias, a proprio sin relación a ella. Más allá de las acepciones propias de la ciencia histórica, historia en el lenguaje usual es la narración de cualquier suceso, incluso de sucesos imaginarios y de mentiras. En medicina se utiliza el concepto de historia clínica para el registro de datos sanitarios significativos de un paciente, que se remontan hasta su nacimiento o incluso a su herencia genética.
En la historia la estadística cumple una función primordial para poder ubicar en el tiempo y en el espacio cada uno de los acontecimientos desde la creación del universo.
La bioestadística, de forma general, es la aplicación de la estadística a la biología. Debido a que las cuestiones a investigar en biología son de naturaleza muy variada, por ejemplo, la medicina, ciencias agropecuarias y forestales, la bioestadística ha expandido sus dominios para incluir cualquier modelo cuantitativo, no sólo estadístico, que pueda ser usado para responder a estas necesidades.
La bioestadística puede ser considerada como una rama, altamente especializada, de la informática médica que puede ser, a su vez, complementada por la bioinformática.
Algunos campos de investigación usan la estadística tan extensamente que tienen terminología especializada. Estas disciplinas incluyen:
- Ciencias actuariales
- Física estadística
- Estadística industrial
- Estadística Espacial
- Matemáticas Estadística
- Estadística en Medicina
- Estadística en Nutrición
- Estadística en Agronomía
- Estadística en Planificación
- Estadística en Investigación
- Estadística en Derecho
- Estadística en Restauración de Obras
- Estadística en Literatura
- Estadística en Astronomía
- Estadística en la Antropología (Antropometría)
- Estadística en Historia
- Estadística Militar
- Geoestadística
- Bioestadística
- Estadísticas de Negocios
- Estadística Computacional
- Estadística en las Ciencias de la Salud
- Investigación de Operaciones
- Estadísticas de Consultoría
- Estadística de la educación, la enseñanza, y la formación
- Estadística en la comercialización o mercadotecnia
- Cienciometría
- Estadística del Medio Ambiente
- Estadística en Epidemiología
- Minería de datos (aplica estadística y reconocimiento de patrones para el conocimiento de datos)
- Estadística económica (Econometría)
- Estadística en Ingeniería
- Geografía y Sistemas de información geográfica, más específicamente en Análisis espacial
- Demografía
- Estadística en psicología (Psicometría)
- Calidad y productividad
- Estadísticas sociales (para todas las ciencias sociales)
- Cultura estadística
- Encuestas por Muestreo
- Análisis de procesos y quimioterapia (para análisis de datos en química analítica e ingeniería química)
- Estadísticas Deportivas
METODO CIENTIFICO
El método científico fue desarrollado por Galileo para estudiar los fenómenos naturales llevando un registro detallado de sus observaciones. Su método se basaba fundamentalmente en la observación y en la experimentación; aspectos que en la actualidad para la Ingeniería son muy importantes en la solución de problemas.
Se basa en una experimentación sistemática por medio de medidas y análisis cuidadosos. El Método científico es una serie de pasos ordenados que sirven para determinar todas las características de los sucesos estudiados. A partir de los análisis se deducen conclusiones. Posteriormente estas conclusiones se prueban para determinar si son válidas.
Etapas del Método científico
§ Observación: Consiste en examinar atentamente a simple vista o con auxilio de ciertos instrumentos y herramientas la naturaleza de los objetos. En Ingeniería la observación es fundamental para detectar necesidades en un problema determinado.
§ Inducción: La acción y efecto de extraer, a partir de determinadas observaciones o experiencias particulares, el principio particular de cada una de ellas.
§ Hipótesis: Consiste en hacer una serie de suposiciones y pronóstico formulando un aseveración o bien enunciado que antecede a otros constituyendo su fundamento. En Ingeniería la Hipótesis es parte de la planeación, fundamentando lo que se espera.
§ Experimentación: Consiste en probar y examinar llevando a nivel de laboratorio el problema en estudio. En Ingeniería la experimentación es fundamental, para dar una correcta solución a un problema de Ingeniería es necesario desarrollar repetidamente la propuesta de solución al problema, para poder llegar a conclusiones.
§ Comprobación: Consiste en proponer pruebas para llegar a la respuesta del problema con certeza y claridad, involucrando toda la información que de solución a la situación que se desarrolló a nivel de laboratorio. En Ingeniería la comprobación es decisiva, ya que por medio de indicadores se evalúa si el proyecto procede o no.
§ Teoría: Es el conocimiento especulativo considerado con independencia de toda aplicación. En Ingeniería la teoría es una solución conceptual sin tomar en cuenta el desarrollo del proyecto en su ejecución.
§ Ley: Es la regla o norma constante e invariable de las cosas. En Ingeniería es imposible llegar a una ley, ya que siempre está abierta al cambio y se adapta a él, por lo tanto el proyecto de ingeniería depende de muchos factores que influyen en su desarrollo y la Ingeniería constantemente tiene que dar soluciones.
RELACIÓN ENTRE EL MÉTODO CIENTÍFICO Y LA ESTADÍSTICA
La estadística, instrumento de investigación científica tiene como propósito
fundamental presentar a los investigadores en todas las ramas del quehacer
científico, la importancia de la estadística en los procesos de investigación.
Este trabajo muestra cómo la estadística apoya el trabajo del investigador desde el
planteamiento del problema, la formulación de la hipótesis y el diseño del tamaño
de la muestra, así como las técnicas estadísticas univariables, bivariables,
multivariables, y las técnicas estadísticas no paramétricas para el análisis de los
datos obtenidos en el trabajo de campo. Asimismo, se hace mención del software
estadístico disponible para su aplicación.
También se argumenta cómo el método científico encuentra en los métodos
estadísticos una herramienta fundamental para alcanzar sus objetivos. Y cómo la
estadística aporta información valiosa a los datos obtenidos de un proceso de
investigación cualitativa con el fin de obtener conclusiones más asertivas
°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°°
ESTRUCTURA PARA DISEÑAR TABLAS ESESTADÍSTICAS
Un estudio estadístico consta de las siguientes fases:
Recogida de datos.
Organización y representación de datos.
Análisis de datos.
Obtención de conclusiones.
DISEÑO DE TABLAS
ESTRUCTURA PARA DISEÑAR TABLAS ESTADÍSTICAS
Los gráficos estadísticos y las tablas son formas de transmitir un conjunto complejo de información.Las tablas estadísticas están constituidas en su estructura por elementos que se describen a continuación:
*Código o numero de identificación: Con la finalidad de reconocer de forma practica una tabla estadística se recomienda asignarle un código para su identificación, esto se hace necesario cuando se utilizan mas de una.
*Titulo: es un letrero que se coloca después del código, el texto de dicho titulo debe ser claro y preciso dando a conocer las variables y las unidades de análisis involucradas en la tabla.
*Nota de titulo: es un texto muy concreto que se ubica entre paréntesis después del titulo. sirven para clarificar algún aspecto importante de la tabla y que no fue posible exponerlo en el titulo.
*Encabezado: son los títulos que se colocan en la parte superior de las columnas que forman la tabla.
*Columna matriz: se refiere a la primera columna de la tabla situada al lado izquierdo de la tabla y en esta columna comprende des partes del encabezado de la misma y el listado de clasificaciones.
*Cuerpo: es el área de la tabla constituida por una sección de casillas o celdas en donde se colocan los datos numéricos correspondientes a los conceptos presentados en el encabezamiento y la columna matriz. *Pie de tabla: es la parte inferior de la tabla donde se pueden colocar textos muy concretos.
*Nota: es el texto que proporciona información de carácter general sobre el contenido de la tabla.
*Fuente: es un texto que tiene como propósitos señalar el documento de donde se obtiene la información presentada.
Tabla para variable cualitativa
En el caso de variable cualitativa no se pueden calcular las frecuencias acumuladas pues no es posible establecer un orden en las clases dentro de la modalidad.Colocamos en la tabla aquellos valores que son independientes del lugar en que se pongan las modalidades.
En el caso de variable cualitativa no se pueden calcular las frecuencias acumuladas pues no es posible establecer un orden en las clases dentro de la modalidad.Colocamos en la tabla aquellos valores que son independientes del lugar en que se pongan las modalidades.
Calculemos la tabla de frecuencias para una variable cualitativa.
Inactivos por tipos de inactividad declarada (miles de personas).
| Modalidad | ni | fi | pi |
| Estudiante | 522,6 | 0,1380 | 13,80% |
| Percibiendo una pensión de jubilación o unos ingresos de prejubilación | 712,3 | 0,1882 | 18,82% |
| Labores del hogar | 1.480,00 | 0,3910 | 39,10% |
| Incapacitado permanente | 265,9 | 0,0702 | 7,02% |
| Percibiendo una pensión distinta de la jubilación o prejubilación | 525,3 | 0,1388 | 13,88% |
| Otras situaciones | 279,5 | 0,0738 | 7,38% |
| 3785,6 | 1 | 100,00% |
Generar Tablas con variables Cualitativas
Generalmente la información de los archivos de datos, esta conformada en su mayoría por variables categóricas, debido en gran medida a que este tipo de variables nos permiten enfocar las preguntas de las encuestas al objetivo del análisis. Teniendo esto en cuenta, vamos a iniciar el estudio de las aplicaciones del módulo de tablas con este tipo de variables y posteriormente abordaremos las variables de escala, con el fin de evidenciar las diferencias que se presentan entre ellas.
Tablas De Frecuencias Por Intervalos
Las distribuciones de frecuencias son tablas que resumen los datos originales en frecuencias.
Los tipos de frecuencia pueden ser:
- Frecuencia Absoluta (f).- Es el número de veces que se repite el valor de cada variable. La suma de frecuencias absolutas es siempre al total de datos observados.
- Frecuencia Relativa (fr).- Indica la proporción con que se repite un valor. Es el cociente entre la frecuencia absoluta y el número total de datos. La suma de las frecuencias relativas es siempre 1

- Frecuencia Acumulada (fa).- Indica el número de valores que son menores o iguales que el valor dado. Es la suma de la frecuencia absoluta primera con la segunda, este valor con la tercera, y así sucesivamente.
- Frecuencia Porcentual (f%).- Llamada también frecuencia relativa porcentual. Se obtiene multiplicando la frecuencia relativa por 100. La suma de las frecuencias porcentuales es siempre 100%. Se calcula así:

- Frecuencia Relativa Acumulada (fra).- Es la suma de la frecuencia relativa primera con la segunda, este valor con la tercera, y así sucesivamente.
- Frecuencia Relativa Acumulada Porcentual (fra%).- Indica el número de valores que son menores o iguales que el valor dado. Se obtiene multiplicando la frecuencia relativa acumulada por 100. Se calcula así:

Cuando los datos contienen una gran cantidad de elementos, para facilitar los cálculos es necesario agruparlos, a estos grupos se los llama intervalos o clases. Un intervalo es una serie de números incluidos entre dos extremos, así por ejemplo, el intervalo 40 – 45 está formado por 40, 41, 42, 43, 44 y 45, siendo 40 el límite inferior, 45 el límite superior, 39,5 límite real inferior (límite inferior disminuido en 5 décimas) y 40,5 el límite real superior (límite superior aumentado en 5 décimas).
Las reglas generales para formas distribuciones de frecuencias para datos agrupados en intervalos son:
1) Calcule el Rango (R).- También se llama recorrido o amplitud total. Es la diferencia entre el valor mayor y el menor de los datos.

2) Seleccione el Número de Intervalos de Clase (ni).- No debe ser menor de 5 y mayor de 12, ya que un número mayor o menor de clases podría oscurecer el comportamiento de los datos. Para calcular el número de intervalos se aplica la regla de Sturges:

Siendo n el tamaño de la muestra.
3) Calcule el Ancho del Intervalo (i).- Se obtiene dividiendo el Rango para el número de intervalos

Cuando el valor de i no es exacto, se debe redondear al valor superior más cercano. Esto altera el valor de rango por lo que es necesario efectuar un ajuste así:

Clases
|
f
|
xm
|
fr
|
fa
|
f%
|
fra
|
fra%
| |||
30-35
|
8
|
(30+35)/2 = 32,5
|
0,2
|
8
|
20
|
0,2
|
20
| |||
36-41
|
6
|
(36+41)/2 = 38,5
|
0,15
|
14
|
15
|
0,35
|
35
| |||
42-47
|
5
|
(42+47)/2 = 44,5
|
0,125
|
19
|
12,5
|
0,475
|
47,5
| |||
48-53
|
7
|
(48+53)/2 = 50,5
|
0,175
|
26
|
17,5
|
0,65
|
65
| |||
54-59
|
11
|
(54+59)/2 = 56,5
|
0,275
|
37
|
27,5
|
0,925
|
92,5
| |||
60-65
|
3
|
(60+65)/2 = 62,5
|
0,075
|
40
|
7,5
|
1
|
100
| |||
Total
|
40
|
1
|
100
| |||||||
A continuación se presenta algunas interpretaciones de la tabla:
El valor de f =8: Significa que 8 estudiantes dedicaron a estudiar la semana pasada entre 30 y 35 horas.
El valor de xm = 50,5: Significa que 7 estudiantes dedicaron en promedio a estudiar la semana pasada 50,5 horas.
El valor de fr = 0,15 y f% = 15%: Significa que el 0,15 o el 15% de los estudiantes dedicaron a estudiar la semana pasada entre 36 y 41 horas.
El valor de fa = 26: Significa que 26 estudiantes dedicaron a estudiar la semana pasada entre 30 y 53 horas.
El valor de fra = 0,65 y fra% = 65%: Significa que el 0,65 o el 65% de los estudiantes dedicaron a estudiar la semana pasado entre 30 y 53 horas.
Gráficos para variables cualitativas
Los gráficos más usuales para representar variables de tipo nominal son los siguientes:
- Diagramas de barras:
- Siguiendo la figura 1.1, representamos en el eje de ordenadas las modalidades y en abscisas las frecuencias absolutas o bien, las frecuencias relativas. Si, mediante el gráfico, se intenta comparar varias poblaciones entre sí, existen otras modalidades, como las mostradas en la figura 1.2. Cuando los tamaños de las dos poblaciones son diferentes, es conveniente utilizar las frecuencias relativas, ya que en otro caso podrían resultar engañosas.
Figura 1.2: Diagramas de barras para comparar una variable cualitativa en diferentes poblaciones. Se ha de tener en cuenta que la altura de cada barra es proporcional al número de observaciones (frecuencias relativas). ![\includegraphics[angle=-90, width=0.5\textwidth]{fig01-02.eps}](http://www.bioestadistica.uma.es/libro/img107.gif)
- Diagramas de sectores
- (también llamados tartas). Se divide un círculo en tantas porciones como clases existan, de modo que a cada clase le corresponde un arco de círculo proporcional a su frecuencia absoluta o relativa (figura 1.3).
El arco de cada porción se calcula usando la regla de tres:

Gráficos para variables cuantitativas
Para las variables cuantitativas, consideraremos dos tipos de gráficos, en función de que para realizarlos se usen las frecuencias (absolutas o relativas) o las frecuencias acumuladas:
- Diagramas diferenciales:
- Son aquellos en los que se representan frecuencias absolutas o relativas. En ellos se representa el número o porcentaje de elementos que presenta una modalidad dada.
- Diagramas integrales:
- Son aquellos en los que se representan el número de elementos que presentan una modalidad inferior o igual a una dada. Se realizan a partir de las frecuencias acumuladas, lo que da lugar a gráficos crecientes, y es obvio que este tipo de gráficos no tiene sentido para variables cualitativas.
Según hemos visto existen dos tipos de variables cuantitativas: discretas y continuas. Vemos a continuación las diferentes representaciones gráficas que pueden realizarse para cada una de ellas así como los nombres específicos que reciben.
Gráficos para variables discretas
Cuando representamos una variable discreta, usamos el diagrama de barras cuando pretendemos hacer una gráfica diferencial. Las barras deben ser estrechas para representar el que los valores que toma la variable son discretos. El diagrama integral o acumulado tiene, por la naturaleza de la variable, forma de escalera. Un ejemplo de diagrama de barras así como su diagrama integral correspondiente.
![]() |
Gráficos para variables continuas
Cuando las variables son continuas, utilizamos como diagramas diferenciales los histogramas y los polígonos de frecuencias.
Un histograma se construye a partir de la tabla estadística, representando sobre cada intervalo, un rectángulo que tiene a este segmento como base. El criterio para calcular la altura de cada rectángulo es el de mantener la proporcionalidad entre las frecuencias absolutas (o relativas) de cada intervalo y el área de los mismos.
El polígono de frecuencias se construye fácilmente si tenemos representado previamente el histograma, ya que consiste en unir mediante lineas rectas los puntos del histograma que corresponden a las marcas de clase. Para representar el polígono de frecuencias en el primer y último intervalo, suponemos que adyacentes a ellos existen otros intervalos de la misma amplitud y frecuencia nula, y se unen por una línea recta los puntos del histograma que corresponden a sus marcas de clase.
![]() |
Diagramas diferenciales:
Son aquellos en los que se representan frecuencias absolutas o relativas. En ellos se representa el número o porcentaje de elementos que presenta una modalidad dada.
Diagramas integrales:
Son aquellos en los que se representan el número de elementos que presentan una modalidad inferior o igual a una dada. Se realizan a partir de las frecuencias acumuladas, lo que da lugar a gráficos crecientes, y es obvio que este tipo de gráficos no tiene sentido para variables cualitativas.
Según hemos visto existen dos tipos de variables cuantitativas: discretas y continuas. Vemos a continuación las diferentes representaciones gráficas que pueden realizarse para cada una de ellas así como los nombres específicos que reciben.





![\includegraphics[angle=0, width=0.5\textwidth]{fig01-01.eps}](http://www.bioestadistica.uma.es/libro/img106.gif)
![\includegraphics[angle=-90, width=0.6\textwidth]{fig01-03.epsi}](http://www.bioestadistica.uma.es/libro/img108.gif)
![\includegraphics[angle=0, width=0.8\textwidth]{fig01-06.eps}](http://www.bioestadistica.uma.es/libro/img116.gif)
![\includegraphics[angle=0, width=0.5\textwidth]{fig01-08.epsi}](http://www.bioestadistica.uma.es/libro/img118.gif)

No hay comentarios:
Publicar un comentario