sábado, 30 de julio de 2011

DISTRIBUCION DE FRECUENCIAS

UNIVERSIDAD  PANAMERICANA DE GUATEMALA
SEDE SAN LUIS PETEN.
CARRERA: PSICOLOGIA Y CONSEJERIA SOCIAL
CURSO: ESTADISTICA I
CATEDRATICO: LIC. ERIC LEONARDO SALAZAR CHOC
TEMA: DISTRIBUCION DE FRECUENCIAS

1.     DISTRIBUCIONES

Una distribución o tabla de frecuencia es un formato que el estadígrafo usa para organizar y resumir sus datos.  Por lo que podemos construir una tabla de frecuencias con datos cualitativos o cuantitativos, pero en ambos casos el conjunto de datos estará agrupado en varias clases.
En una tabulación de los datos podemos clasificar la información en forma:

a)     Cronológica
b)     Cualitativa
c)     Geográfica
d)     Cuantitativa

a)     Clasificación cronológica: En esta clasificación se toma como base el tiempo. Ejemplo: el ingreso tributario del Gobierno Central del 2001 a 2010, en millones de quetzales.


Años
Ingresos tributarios
2001
2002
2003
2004
2005
2006
2007
2008
2009
2010
678.3
651.7
626.7
572.3
497.9
679.3
1111.4
1430.7
1793.7
1842.6


b)     Clasificación cualitativa
En esta clasificación tomaremos como base la agrupación de algún atributo o cualidad de elementos que se van a analizar.  Ejemplo: mujeres que laboran en una maquiladora según su estado civil.

Estado civil
No. De mujeres
Solteras
Casadas
Divorciadas
Viudas
54
63
32
12

c)     Clasificación geográfica

En esta clasificación se toma en cuenta a los departamentos, aldeas municipio o países, según lo que se está investigando. Ejemplo: Las tasas de desempleo que hay en los países de América Latina en los años 2009 y 2010

Países
2009
2010
Guatemala
Costa Rica
Panamá
Honduras
El Salvador
Nicaragua
15.9
8.5
8.9
12.8
10.8
13.4
20.2
5.6
6.7
13.9
9.6
13.6

d)     Clasificación cuantitativa

En esta clasificación se tomará como base de agrupación, una variable numérica divida en intervalos de amplitud constante o de amplitud variable

Salario
No. de empleados
200-249
250-299
300-349
350-399
400-449
450-499
8
16
26
22
5
3

2.     DISTRIBUCION DE FRECUENCIAS

El Agrupamiento de datos es una técnica que se utiliza para tabular, ordenar e interpretar los datos de muestras que contienen muchos valores. A este ordenamiento se le conoce como distribución de frecuencias.   Cada una de las categorías o intervalos contiene un número de datos de la variable, que se está analizando, llamada frecuencias.

Se utilizará una técnica para realizar dicho agrupamiento, esto no significa que este procedimiento sea único, por el contrario existen varios métodos para realizar la distribución de frecuencias de la variable en estudio.  Se recomienda utilizar la distribución de frecuencias cuando se tienen más de 30 datos y a dichos conjunto le llamamos datos agrupados en intervalos.  Para muestras de menos de 30 datos no es conveniente agruparlos en intervalos y les llamamos datos simples (datos no agrupados)

2.1 DISTRIBUCION DE FRECUENCIAS SIMPLES
Es una distribución de frecuencias simples es la que nos va a indicar la frecuencia con que aparecen los número desde el menor del conjunto de los datos hasta el mayor de ese conjunto o viceversa.
Ejemplo: Organizar en una distribución de frecuencias simples, los salarios semanales de 40 trabajadores en una maquiladora. 
SALARIOS SEMANALES
61       55       60       58       62       64       66       68       70       75
76       70       51       55       60       65       70       73       80       75
78       66       68       70       75       76       78       80       79       68
53       54       56       58       60       64       58       70       75       80
Para organizar estos datos, el primer paso es encontrar, el dato menor y el dato mayor, el cual el 51 y 80. Luego ordenamos ya sea en forma ascendente o descendente.

51       53       54       55       56       58       58       58       60       60
60       61       62       64       64       65       66       66       68       68
68       68       68       70       70       70       70       70       75       75
75       75       76       76       78       78       79       80       80       80


Salarios
Frecuencia
51
1
53
1
54
1
55
1
56
1
58
3
60
3
61
1
62
1
64
2
65
1
66
2
68
5
70
5
75
4
76
2
78
2
79
1
80
3
                            Σ = 40

2.2  DISTRIBUCION DE FRECUENCIAS DE VALORES AGRUPADOS EN INTERVALOS DE AMPLITUD CONSTANTE

 Es un resumen tabular en el que los datos se presentan en agrupamientos o categorías convenientemente establecidas de clases ordenadas numéricamente. La tabla de distribución de frecuencias proporciona pistas acerca de las características de la población sujeta a estudio. 

Además permite realizar cálculos posteriores para el análisis de los datos.  Al agrupar o condensar en tablas de distribución de frecuencias, el proceso del  análisis e interpretación de los datos se hace mucho más manejable y significativo.

La tabla de distribución de frecuencias, está compuesta por los siguientes elementos:
ü  Rango
ü  Número de clases o intervalos
ü  Ancho de la clase o intervalo
ü  Límites aparentes
ü  Límites reales
ü  Frecuencias
ü  Marcas de clase

a)  RANGO (R)

Es la diferencia que existe entre el mayor y el menor de los datos.
R = Dato mayor – Dato menor

b)     NUMERO DE CLASES O INTERVALOS (K)

El número de agrupamientos de clase a utilizar depende principalmente del número de observaciones en los datos, es decir, un número mayor de observaciones requiere un número mayor de grupos de clase o intervalos.  El número de clases debe estar entre 5 y 15.  Si no hay suficientes intervalos o si hay demasiados, se obtendrá poca información.  Una tabla con demasiada concentración de datos no es significativa.  Lo mismo sería cierto en el otro extremo, si una tabla tuviera demasiados intervalos, habría una   subconcentración  de datos y se sabría muy poco.  Para determinar el número de clases se emplea la siguiente relación: 1 + 3.3 (log N), donde “N” es el número de datos de la muestra.
K =1 + 3.3 (LOG N)

c)     INTERVALOS DE CLASE (i)

Para estudiar un hecho en el que la amplitud de la población es grande, se definen los intervalos de clase.  Estas clases  pueden tener una amplitud constante o variable, así por ejemplo, si se trata de estudiar la estatura de un grupo de estudiantes universitarios, una vez elegida la muestra, es conveniente dividir en clases las estaturas de los alumnos investigados, los cuales  se pueden clasificar de la siguiente forma.

De 160 a 169 cms.
De 170 a 179 cms.
De 180 a 189 cms.

Las cifras tienen una amplitud de 10 cms. L os  límites son 160 cms. es el extremo inferior y que 169 cms. es el extremo superior. Se llaman límites del intervalo a los valores extremos de dichos intervalos.  
Por ejemplo, dado el intervalo del ejemplo anterior 160-169 cms. Diremos que 160 cms. es el extremo inferior y que 169 cms. es el extremo superior. 

Sin embargo, resulta un poco confuso pensar que los extremos son valores que se incluyen en dos intervalos de clase; para que esto no suceda, es necesario considerar  únicamente el extremo inferior en cada intervalo, mientras que el superior se considera incluido en el siguiente intervalo o viceversa.

d)  LIMITE  APARENTE (La)

Todo intervalo está formado por dos límites de clase y límites aparentes, un límite inferior y límite superior. Los límites aparentes se utilizan para evitar ambigüedad en la clasificación por intervalos.   Por ejemplo, de las estaturas anteriores se tiene: 160 a 169, de 170 a 179, igual o más de 180 cm.

e)     LIMITES REALES DE CLASE (Lr)

Se les denomina también límites verdaderos y se obtienen encontrando el punto medio de los dos límites aparentes que sustituye.  También pueden calcularse a partir de los límites aparentes considerando que:

ü  Si los límites son números enteros, entonces, restar 0.5 al límite inferior y sumar 0.5 al límite superior.

ü  Si los límites no son números enteros, se debe restar y sumar a los intervalos de clase 0.05 si tienen un solo decimal, 0.005 si tienen dos decimales, 0.0005 si tienen tres decimales, etc.

f)      ANCHO DE INTERVALO (i)

El tamaño o anchura del intervalo o clase viene dado por:
I = Rango / No. De clases o sea i = R/K

g)     MARCAS DE CLASE (Xi)

Son los puntos medios de cada intervalo y son los valores usados para representar todos los datos resumidos en un intervalo particular.


Ejemplo Ilustrativo
Si los límites de intervalo son 160-169, entonces los límites reales serán 159.5 – 169.5

y la marca de clase es 160 + 169 = 164.5
                                      2

3    FRECUENCIAS

3.1 Frecuencia absoluta o de intervalo (fi)

La frecuencia absoluta de una población estadística de tamaño N es el número de veces que un suceso aparece en el total de casos posibles que se presentan en la muestra.

3.2 Frecuencia relativa (fr)

La frecuencia relativa es la proporción entre la frecuencia de un intervalo y el número total de datos, es decir, el valor de una fracción cuyo numerador es la frecuencia absoluta y cuyo denominador es el número de individuos de la población.  La frecuencia relativa esta comprendida siempre entre 0 y 1.

3.3 Frecuencia porcentual (fr%)

Si la frecuencia relativa la expresamos mediante porcentajes, encontramos la frecuencia porcentual.  Se calcula multiplicando por 100 el valor de la frecuencia relativa.  La frecuencia porcentual esta comprendida lógicamente entre 0 y 100.

El uso de la frecuencia relativa o porcentual se vuelve esencial siempre que una serie de datos se compara con otras series de datos, especialmente si difiere el número de observaciones en cada serie de datos.

3.2  Frecuencia acumulada absoluta (Fa)

La frecuencia acumulada es el número de datos iguales o menores que el rango de cada intervalo sucesivo.  Proporciona la suma de las frecuencias absolutas de las repeticiones anteriores a un intervalo determinado.

3.3  Frecuencia acumulada relativa (Fr)

La frecuencia acumulada relativa es el cociente entre la frecuencia acumulada y el número total de datos observados, nos da la suma de las frecuencias relativa de las repeticiones anteriores a ésta.
Ejemplo 1 (Tabla de distribución de frecuencias con enteros)
Los punteos obtenidos por un grupo de 40 estudiantes en el curso de Psicología del desarrollo.

          80       20       60     75     40     55     70     75     60     85
          40       60       75     78     37     42     60     80     88     75
          70       60       80     90     95     65     32     43     44     62
          28       45       35     63     66     88     95     98     96     94

Ordenar
          20       28       32     35     37     40     40     42     43     44 
          45       55       60     60     60     60     60     62     63     65
          66       70       70     75     75     75     75     78     80     80 
          80       85       88     88     90     94     95     95     96     98

Calcular:

a)     Número de clases o intervalos.
b)     Rango.
c)     Ancho del intervalo.
d)     Distribución de frecuencias.

Solución:

a)    

IMPORTANTE:
El ancho del intervalo deberá tomarse igual a los datos originales, esto significa que si los datos son:
Enteros: el valor de “i” será entero.
Un decimal: el valor de “i” se redondea a un decimal.
Dos decimales: el valor de “i” se redondea a dos decimales.
El  número de clases o intervalos viene dado por:
K = 1 + 3.3 • log 40
K = 1 + 3.3 (1.60206)
K = 1 + 5.2868 = 6.2868
       Aproximadamente se tiene que usar 6 o 7 intervalos.


b)     El rango se calcula de la siguiente manera:
R = Dato mayor – Dato menor
R = 98 – 20 = 78
c)   Ancho del intervalo (i) =  R/K
      i = 78/6.2868 = 12.407
Como los datos son números enteros se aproxima “i” al entero, entonces “i” = 12.
d)     Los intervalos se calculan iniciando del dato menor que será el límite inferior, en este caso sería 20.  Los datos se muestran en la tabla siguiente.


Los límites aparentes de los intervalos se calculan sumando al límite inferior  el ancho del intervalo y restando la  aproximación que se utilice en los datos, es decir:
Límite superior = Límite inferior + ancho del intervalo – aproximación.
20 + 12 – 1 = 31
Entonces el primer intervalo sería 20 – 31

Donde la aproximación es: 1 si los datos son enteros. 0.1 si los datos tienen un decimal,  0.01 sin tienen dos decimales, 0.001 si tienen tres decimales.



Observación: El primer intervalo de la tabla es 20 – 31 debido a que  al incluir el 32 y calcular los límites reales se tendría un intervalo de 13 unidades y no de 12  como se calculó en el inciso anterior.

e)  Frecuencias absolutas:

Para calcular  las frecuencias hacemos un conteo del número de datos que pertenecen a cada intervalo.  El procedimiento puede ser:

·           Ordenando los datos en forma ascendente o descendente (como se hizo anteriormente).

·           Contando cuantos valores hay en cada intervalo, es decir de 20 – 31  hay 2, de 32 – 43 hay 7, y así sucesivamente.

·           O bien por cada dato del grupo original marcamos mediante una línea en el intervalo al que pertenece, como se ilustra en la tabla siguiente.

Límites aparentes
Conteo
Frecuencia
Inferior
Superior
20
31
//
2
32
43
//// //
7
44
55
///
3
56
67
//// ////
9
68
79
//// //
7
80
91
////  //
7
92
103
////
5

           Σ =   40

Ejemplo No. 2 (Tabla de distribución de frecuencias con decimal)
Los siguientes datos son los kilómetros por galón que registraron 30 vehículos en un recorrido de 100 km. por la ciudad.


31.5    34.4    36.0    35.5    36.1    35.0    32.8    30.8    31.8    34.7
18.8    37.1    34.2    33.2    31.0    35.2    36.8    33.7    33.4    34.0
33.9    24.1    23.3    35.3    29.6    27.6    33.6    30.8    25.4    16.4 

Ordenar
16.4    18.4    23.3    24.1    25.4    27.6    29.6    30.8    30.8    31.0  
31.5   31.8     32.8    33.2    33.4    33.6    33.7    33.9    34.0    34.2           
34.4    34.7    35.0    35.2    35.3    35.5    36.0    36.1    36.8    37.1  

Construir una tabla de distribución de frecuencias que contenga:

a)  Límites reales (Lr).
b)  Frecuencias relativas (fr).
c)  Frecuencias acumuladas absolutas (Fa).
d)  Frecuencia porcentual (fr%).
e)  Marca de clase.

Solución:
En toda construcción de una tabla de distribución de frecuencias se procede de la siguiente manera.

Ø Rango (R) = Dato mayor – Dato menor
R = 37.1 – 16.4 = 20.7

Ø Número de intervalos (K)
K = 1 + 3.3  • log. 30
K = 1. + 3.3 • 1.47712
K = 1 + 4.8745 = 5.8745
Aproximadamente se usaran entre 5 y 6 intervalos.

Ø Tamaño del intervalo (i)
i = R/K
i = 20.7/5.8745 = 3.5237
Como se indicó anteriormente se debe aproximar de acuerdo al número de decimales que tenga los datos originales, como en este caso los datos tienen un decimal, entonces:         
i = 3.5

El primer intervalo se construye iniciándose con el dato menor que será el límite inferior. Así:   Límite inferior + ancho del intervalo – aproximación = Límite superior.
16.4 + 3.5 – 0.1 = 19.8
De manera que el primer intervalo es 16.4 – 19.8

Ø  Para el cálculo de los límites reales se procede de la siguiente manera: El límite real inferior = Limite inferior aparente – 0.05 (aproximación de datos con un decimal).
16.4 – 0.05 = 16.35

El límite real superior = Límite superior aparente + 0.05 (aproximación de datos con un decimal).
19.8 + 0.05 = 19.85  


 OBSERVACIONES PARA LÍMITES REALES:
1.     cada límite real superior corresponde al límite real inferior del siguiente intervalo.

2.     La diferencia entre los límites reales de un intervalo es igual al tamaño del intervalo “i”

También para el cálculo del límite real superior se puede proceder de la siguiente manera:
Límite real inferior + amplitud = 16.35 + 3.5 = 19.85

De manera que el primer intervalo de los límites reales será: 16.35 – 19.85

Ø La marca de clase es el punto medio de los intervalos aparentes 16.4 + 19.8 = 18.1
                                                                                                                                             2

Los resultados se muestran en la siguiente tabla.

Límites aparentes
Límites reales

fi

fr

Fa

fr%

Xi
L.i
 (km/gal)
L.s
(km/gal)
L.r.i
L.r.s
16.4
19.9
23.4
26.9
30.4
33.9
19.8
23.3
26.8
30.3
33.8
37.3
16.35
19.85
23.35
26.85
30.35
33.8
19.85
23.35
26.85
30.35
33.85
37.35
   2
   1
   2
   2
 10
 13
2/30 =  0.07
1/30 =  0.03
2/30 =  0.07
2/30 =  0.07
10/30 = 0.33
13/30 = 0.43
                 2
2 + 1 =      3
3 + 2 =      5
5 + 2 =      7
7 + 10 =  17
 17 + 13 = 30
 0.07 •100 =   7
 0.03 •100 =   3
 0.07 •100 =   7
 0.07 •100 =   7
 0.33 •100 = 33
 0.43 •100 = 43
18.1
21.6
25.1
28.6
32.1
35.6




N=30
          Σ  = 1

         Σ = 100 






EJERCITACIÓN PROPUESTA

1.   Busca recortes o  haz ejemplos de: Clasificación cronológica, clasificación cualitativa, clasificación geográfica, clasificación cuantitativa.
2.   El departamento de Personal de la Compañía R & S, se ha evaluado a 28 personas para el puesto de contador, las notas obtenidas en los exámenes fueron:
66   57        68        72        65        64        73        72        68        75
57   66        65        70        59        60        64        68        68        74
                         66    72         65        68       80        75         69        76                
Organiza estos datos en una distribución de frecuencias simples

3.   El número de enfermeras en servicio cada día en el hospital “Yaxkin” se agrupa en una distribución  que tiene las clases  20 – 34,  35- 49,  50- 64,  65 – 79  y 80-94.

Obtener
a)  Los límites reales de clase. 
b)  Las marcas de clase.
c)  El rango.

4.   Los siguientes datos son los pesos corporales  (en gramos) de 40 ratas, usadas en un estudio de deficiencias vitamínicos.
   136             92             115           118           121
   132           120             104           125           119
   101           129               87           108           110
   135           126             127           103           110
   118             82             126           118           100
   106           125             117           102           146    
   124           113               95           148           113
   137           115             133           126           129    
a) Agrupe estas cantidades en una tabla que tenga las clases 80 – 89, 90 – 99,  100- 109, 110 – 119, 120 – 129, 130 – 139  y  140 – 149.

b) Convierta la distribución obtenida en el inciso a)  en una distribución de frecuencia acumulada ascendente.      



5.   Los siguientes datos son calificaciones que obtuvieron 50 estudiantes en una prueba de contabilidad.
                      73        65        82        70        45        70     54        32        75      75
                      65        60        75        87        83        72     64        58        75      89
                      73        55        61        78        89        43     51        59        38      65      
                      75        85        65        85        49        55     60        76        75      69      
                      45        63        50        67        40        70     93        71        97      85
a) Elabore una tabla de distribución con valores agrupados en intervalos con frecuencias acumuladas descendente.

6.   Los siguientes datos representan los minutos que un médico tuvo esperando a 60 pacientes después de las horas de sus citas:

                            12.1       9.8            10.5            5.6            8.2
                              8.3       1.3              7.9          11.3            6.3
                              1.2       4.6            10.3            8.5          10.0
                            12.7     11.5              3.8          12.9          13.0
                              9.6       6.4            15.7            5.8            9.7
                              2.5     13.0              4.8          10.7          11.4
                              0.5       6.8            10.1          17.2            4.2
                              7.2       9.3              9.9            7.2          12.7
                            12.8        9.6            13.5          10.9            5.1
                              3.9       7.5            16.1          11.1            8.3
                            11.9       2.4              5.2            8.4          16.7
                              9.3       4.7              6.0            9.5          14.6
Agrupe estos datos en una distribución de frecuencias y obtenga

a)  La frecuencia  porcentual (fr%)
b)  Frecuencia acumulada relativa (Fr)

7.   Los diámetros en centímetros de 50 cojinetes fabricados por “Cojinetes, S.A.” se muestran a continuación:
                            0.529     0.536        0.538        0.525        0.542
                            0.539     0.535        0.534        0.531        0.535
                            0.527     0.535        0.540        0.540        0.537
                            0.544     0.535        0.540        0.532        0.537
                            0.527     0.528        0.536        0.535        0.545
                            0.538     0.534        0.536        0.524        0.528
                            0.535     0.532        0.535        0.541        0.533
                            0.532     0.542        0.536        0.543        0.546
                            0.529     0.537        0.536        0.530        0.532
                            0.535     0.530        0.526        0.539        0.534
Elabore una tabla de distribución de frecuencias y calcule:
a)  Límites reales
b)  Frecuencia porcentual (fr%)
c)  Frecuencia acumulada relativa (Fr)
d)  Marca de clase(xi)

8.   Cuando se les pidió  que calificaran la maniobrabilidad de un automóvil como: excelente, muy buena, buena, regular, deficiente o muy deficiente, 40 conductores respondieron de la siguiente manera:

     Muy buena, buena, buena, regular, excelente, buena, buena, buena, muy buena, deficiente, buena, buena, buena, buena, muy buena, buena, regular, buena, buena, muy deficiente, muy buena, regular, buena, buena, excelente, muy buena, buena, buena, buena, regular, regular, muy buena, buena, muy buena, excelente, muy buena, regular, buena, buena y muy buena.

     Construya una distribución que muestre las frecuencias correspondientes a las diferentes calificaciones de la maniobrabilidad del automóvil.

9.   Con la tabla siguiente:
Volumen de 25 paquetes despachados en un departamento de chequeo y empaque

VOLUMEN
Fi
0.95 – 1.01
1.02 – 1.08
1.09 – 1.15
1.16 – 1.22
1.23 – 1.29
1.30 – 1.36
         
3
2
4
5
7
4


Determinar:
a)    El límite inferior de la cuarta clase:
b)    Los límites aparentes de la tercera clase:
c)    Los límites reales de la segunda clase:
d)    La amplitud de los intervalos:
e)    La frecuencia de la quinta clase:
f)     Los límites reales del primer intervalo:
g)    Los límites aparentes de la quinta clase:
h)    La frecuencia del segundo intervalo:
i)      La amplitud de tercer intervalo:
j)      El punto medio del primer intervalo: