Es una disciplina que se
encarga de estudiar el conjunto de métodos encaminados a la obtención,
organización, representación y análisis de datos, con el fin de inferir
generalizaciones acerca de ésta información y tomar decisiones acertadas.
ÁREAS DE APLICACIÓN
Se
aplica en toda la actividad humana, ciencia o profesión. Por ejemplo:
Negocios, gastos
familiares, escuelas, ingeniería, medicina, economía, industria, etc.
¿POR QUÉ ESTUDIAR
ESTADÍSTICA?
Los datos se encuentran en todos lados como en la radio, televisión,
periódico, internet, vida diaria, negocios, etc. ejemplo: El número de
accidentes causados por conductores ebrios.
CLASIFICACIÓN DE LA
ETADÍSTICA
Para su estudio la estadística se clasifica en dos áreas:
Estadística descriptiva: Es el estudio que incluye la
obtención, organización, presentación y descripción de la información numérica.
Estadística inferencial: Es una técnica mediante la cual se
obtiene generalizaciones o se toman decisiones en base a la información parcial
o completa obtenida mediante técnicas descriptivas.
os se encuentran en
todos lados como en la radio, televisión, periódico, internet, vida diaria,
negocio
La estadística descriptiva y la inferencial son dos áreas que conforman a la
disciplina de la estadística moderna. Las dos son esenciales y una complementa
a la otra para la toma de decisiones.
ETAPAS DE
LA INVESTIGACIÓN ESTADÍSTICA
PLANIFICACIÓN: Selección y determinación de la población o muestra y las
características contenidas que se desean estudiar. En caso de que se
desee tomar una muestra, es necesario determinar el tamaño de la misma y el
tipo de muestreo a realizar (probabilístico o no probabilístico).
RECOLECCIÓN DE DATOS: Puede ser realizada mediante la
observación directa de los elementos, la aplicación de las encuestas y
entrevistas, y la realización de experimentos.
ORGANIZACIÓN
(tabulación, procesamiento y
presentación de datos): La tabulación implica el resumen de los
datos en tablas y gráficos estadísticos.
ANÁLISIS E INTERPRETACIÓN DE
RESULTADOS
Cálculo e interpretación de indicadores
estadísticos.
análisis descriptivo: Medidas de tendencia central,
dispersión, posición y forma.
análisis inferencial: Aplicación de técnicas de tratamiento de
datos que involucran elementos probabilísticos que permiten inferir
conclusiones de una muestra hacia la población (opcional). CONCLUSIONES: Construcción del informe final.
POBLACIÓN:
Es una colección de animales,
plantas, objetos etc. Conjunto formado por todos los elementos que se deseen
estudiar.
CLASIFICACIÓN:
FINITA, cuando el número de elementos es limitado.
INFINITA, cuando el número de los elementos de la población
es muy grande
MUESTRA
Parte de la
población que se toma como base para el análisis del conjunto que se desea
estudiar.
Un gráfico es una representación mediante coordenadas, esquemas, o dibujos
de toda clase de datos numéricos o de hechos y fenómenos susceptibles de
observación y tabulación estadística.
Los gráficos tienen por finalidad dar
una información general de conjunto de datos, es decir, se busca con ellos
el que el lector se forme una idea rápida y global del comportamiento de
la característica ya sea en la muestra como en la población.Un gráfico no
intenta mostrar información detallada si no hechos sobresalientes de un
conjunto de datos.
A menudo resulta difícil leer datos exactos en un gráfico, como
tampoco son útiles en el proceso de la inferencia estadística. Estas
desventajas se solucionan presentando los datos en tablas , ya que estas
presentan un resumen numérico del conjunto de datos.
Hay
numerosos tipos de gráficos entre los cuales podemos mencionar: diagrama de
frecuencias,histogramas, polígonos, ojivas, diagrama de barras, diagramas
circulares entre otros.
La forma del
gráfico depende del gusto y los requerimientos de quien lo elabora, sin
embargo, hay ciertos principios generales que se deben tener en cuenta en
el logro de un buen gráfico. A continuación se indicarán algunos de los
más aceptados.
1.-El mejor gráfico es el más simple. Las
líneas y símbolos usados deben ser los estrictamente para un mejor aspecto
de la información.
2.-Si hay más de dos gráficos, deben ser
numerados o trazados con colores diferentes de tal manera que permita
diferenciarlos.
3.-Todo gráfico debe llevar un título que
aclare el contenido del mismo.se dice que el titulo debe responder a
interrogantes: qué, cómo, cuándo y dónde.
4.-La posición del título en el gráfico se
considera de gusto personal, de ahí que algunos aconsejan que deben ser
colocados en la parte superior y otros en la parte inferior.
5.-Las líneas que llevan escalas deben
dibujarse más gruesas que las demás coordenadas.
6.-La línea vertical, denominada ordenada, se
utiliza para representar la frecuencia, la cual debe comenzar de cero.
7.-Las características cuantitativas y
cualitativas, por lo general van en línea horizontal.
8.-La lectura de la escala del eje horizontal
se hace de izquierda a derecha y la lectura del eje vertical de abajo
hacia arriba.
TIPOS DE GRÁFICAS
a) Gráfico de barras:
Es un gráfico estadístico que está formado por varios rectángulos igualmente
espaciados, del mismo ancho, cuyas bases están colocadas sobre una misma línea
horizontal.
A los rectángulos que forman el gráfico de barras se les llama barras.
En este tipo de gráfico, es posible observar que las barras:
1.- Están sobre el eje de las abscisas.
2.- Tienen el mismo ancho.
3.- Están igualmente espaciadas.
En el eje de las abscisas se representan los valores de una de
las variables (eje x) y en el eje de las ordenadas se representa la otra
variable (eje y).
Se usa generalmente cuando se pretende resaltar la representación de
porcentajes de datos que componen un total.
Gráfico circular:
Muestra las relaciones o proporciones de las
partes con un todo. Este gráfico (a la derecha) es de utilidad cuando se
pretende destacar un elemento importante.
Un gráfico circular siempre se compone de una
serie de datos.
Histograma o gráfico de barras
El histograma es un gráfico de barras en que se presentan las frecuencias
(absolutas, relativas o porcentuales).
En el eje horizontal se ubican los intervalos o datos en cuestión y en el
eje vertical anotamos la frecuencia o frecuencia relativa de cada intervalo o
dato.
Es un gráfico en el cual el dato en estudio (o intervalo) es puesto en el
eje horizontal. Para ello se utilizan rectángulos cuyo alto, indicado en el eje
Y, señala la frecuencia del dato en estudio.
Observa que en este histograma en particular se presentan dificultades para
distinguir las frecuencias de cada intervalo. Para resolver lo anterior,
algunas veces se anota la frecuencia respectiva sobre la columna.
Gráfico de líneas
Este tipo de gráfico frecuentemente aparece en diarios y revistas, ya que
ilustra con mucha claridad los cambios que tiene alguna variable en estudio.
También se le llama Poligonal y consiste en unir los centros de cada barra del
Histograma.
2.4 Pictograma
Es un gráfico donde se ocupa una figura o ícono que representa el dato que
se está estudiando.
Gráfico ojiva: Es un gráfico de línea que
interpreta el crecimiento acumulado de las frecuencias absolutas, relativas o
porcentuales. Se realiza una tabla de frecuencias y de frecuencias acumuladas,
la que se grafica considerando en el eje horizontal las clases y en el eje
vertical las frecuencias acumuladas.
La ojiva es el polígono de frecuencia acumuladas, es decir, que
en ella se permite ver cuántas observaciones se encuentran por encima o debajo
de ciertos valores, en lugar de solo exhibir los números asignados a cada
intervalo.
El gráfico ojiva es siempre creciente en tramos, demostrando los períodos
que son de mayor o menor crecimiento.
La distribución
de frecuencias o tabla de frecuencias es una ordenación en
forma de tabla de los datos estadísticos, asignando a cada dato
su frecuencia correspondiente.
Tipos de frecuencias
Frecuencia absoluta
La frecuencia
absoluta es el número de veces que aparece un determinado valor
en un estudio estadístico.
Se
representa por fi.
La suma
de las frecuencias absolutas es igual al número total de datos, que se
representa por N.
Para
indicar resumidamente estas sumas se utiliza la letra griega Σ (sigma
mayúscula) que se lee suma o sumatoria
Frecuencia relativa
La frecuencia relativa es el cociente
entre la frecuencia absoluta de un determinado valor y el número
total de datos.
Se puede expresar en tantos por ciento y se representa por ni.
La suma de las frecuencias relativas es igual a 1.
Frecuencia acumulada
La frecuencia acumulada es la suma de las
frecuencias absolutas de todos los valores inferiores o
iguales al valor considerado.
Se representa por Fi.
Frecuencia relativa acumulada
La frecuencia relativa acumulada es el cociente
entre la frecuencia acumulada de un determinado valor
y el número total de datos. Se puede expresar en tantos por
ciento.
EJEMPLO:
Durante
el mes de julio, en una ciudad se han registrado las siguientes temperaturas
máximas:
En la
primera columna de la tabla colocamos la variable ordenada de menor a mayor, en
la segunda hacemos el recuento y en la tercera anotamos la frecuencia absoluta.
xi
Recuento
fi
Fi
ni
Ni
27
I
1
1
0.032
0.032
28
II
2
3
0.065
0.097
29
6
9
0.194
0.290
30
7
16
0.226
0.516
31
8
24
0.258
0.774
32
III
3
27
0.097
0.871
33
III
3
30
0.097
0.968
34
I
1
31
0.032
1
31
1
Distribución de frecuencias agrupadas
La distribución
de frecuencias agrupadas o tabla con datos agrupados se emplea si
las variables toman un número grande de valores o la variable
es continua.
Se agrupan
los valores en intervalos que tengan la misma amplitud
denominados clases. A cada clase se le asigna su frecuencia
correspondiente.
Límites de la clase
Cada clase
está delimitada por el límite inferior de la clase y el límite
superior de la clase.
Amplitud de la clase
La amplitud
de la clase es la diferencia entre el límite superior e inferior
de la clase.
Marca de clase
La marca
de clase es el punto medio de cada intervalo y es el valor
que representa a todo el intervalo para el cálculo de algunos parámetros.
1º Se
localizan los valores menor y mayor de la distribución. En este caso son 3 y
48.
2º Se
restan y se busca un número entero un poco mayor que la diferencia y que sea
divisible por el número de intervalos queramos establecer.
Es
conveniente que el número de intervalos oscile entre 6 y 15.
En este
caso, 48 - 3 = 45, incrementamos el número hasta 50 : 5 = 10 intervalos.
Se forman
los intervalos teniendo presente que el límite inferior de una clase pertenece
al intervalo, pero el límite superior no pertenece intervalo, se cuenta en el
siguiente intervalo.
ci
fi
Fi
ni
Ni
[0, 5)
2.5
1
1
0.025
0.025
[5, 10)
7.5
1
2
0.025
0.050
[10, 15)
12.5
3
5
0.075
0.125
[15, 20)
17.5
3
8
0.075
0.200
[20, 25)
22.5
3
11
0.075
0.275
[25, 30)
27.5
6
17
0.150
0.425
[30, 35)
32.5
7
24
0.175
0.600
[35, 40)
37.5
10
34
0.250
0.850
[40, 45)
42.5
4
38
0.100
0.950
[45, 50)
47.5
2
40
0.050
1
40
1
VIDEOS : CONSTRUCCIÓN DE TABLA DE DISTRIBUCIÓN DE FRECUENCIAS PARA DATOS AGRUPADOS.
VIDEO: TABLAS DE DISTRIBUCIÓ DE FRECUENCIA EN EXCELL.