sábado, 24 de octubre de 2009

examen matematicas v

SEMS
DIRECCIÓN GENERAL DE EDUCACIÓN TECNOLÓGICA INDUSTRIAL
CBTIS 160
Examen para la materia de MATEMATICAS V
SAETI
define con tus palabras los siguientes terminos

1. Que es la estadística
2. En cuantas ramas se divide la estadística
3. Que es la estadística descriptiva
4. Que es población
5. Que es una muestra
6. Que es una variable y que tipos de variable hay
7. Que es distribución
8. Que es una media aritmética
9. Que es mediana
10. Que es moda
11. Que es cuantil
12. Que son las medidas de dispersión
13. Que es el recorrido
14. Que es la varianza
15. Que es desviación típica

apuntes de soporte

DEFINICION Y DIVISONES DE LA ESTADISTICA

° La estadística es la rama de las matemáticas que trata de la recopilación, organización, presentación, análisis e interpretación de datos numéricos; con el fin de poder inferir las características de una población.
Objetivo: describir el conjunto de datos obtenido y tomar decisiones o realizar generalizaciones acerca delas características de todas las posibles observaciones bajo consideración.
° La estadística se divide o se clasifica en dos tipos que son: Estadística Descriptiva y la Estadística inferencial, también llamada inferencia Estadística.
· Estadística Descriptiva: Es aquella técnica que incluye la obtención, organización, presentación y descripción de datos.
Objetivo: Resumir y describir las características de un conjunto de datos con el fin de facilitar su utilización. Por lo general con ayuda de tablas, graficas o medidas numéricas de resumen.
· Estadística Inferencial: Es aquella técnica mediante la cual se obtienen conclusiones o generalizaciones acerca del parámetro de una población; basándose en el análisis estadístico de una muestra.

Objetivo: Sacar conclusiones útiles y hacer deducciones razonables sobre la totalidad de todas las observaciones posibles de que se trate; basándose en la información numérica obtenida mediante técnicas estadísticas descriptivas.










ELEMENTOS DE LA ESTADISTICA

POBLACION: Es la totalidad o conjunto formado por todos los valores posibles (personas, objetos o medidas) que puede asumir una variable y tienen una característica en común; que son de interés para un estadístico en un experimento o estudio particular. Al estudio completo de la población se le llama censo.
El concepto de población es la idea fundamental más importante de la estadística, debe definirse cuidadosamente en cada caso, a fin de poder determinar la pertenencia a ella.
A las poblaciones generalmente se les clasifica en dos categorías: finitas e infinitas.
Población finita: Es aquella que indica que es “posible alcanzarse o sobrepasarse al contar” Por lo tanto, es aquella que posee o incluye un numero limitado de personas, objetos o medidas. Ejemplo:
· Gastos en cigarros de lo alumnos de un salón de la escuela.
· Conjunto de calificaciones finales de matemáticas de alumnos de tercer semestre.

Población infinita: Es aquella que incluye un gran conjunto de medidas u observaciones que no pueden alcanzarse por conteo; es decir, una población es infinita si no hay, cuando menos hipotéticamente, limite para el numero de elementos que puede contener. Por lo tanto, es aquella que posee un número ilimitado de valores. Ejemplo:

· Todos los nacimientos vivos de seres humanos en el pasado y en el futuro.
· La producción futura de una maquina para hacer lápices.

MUESTRA: Es un subconjunto de la población; es decir, una, muestra se compone de algunos de los individuos, objetos o medidas de una población. Al estudio de la muestra la llamamos muestreo.
Muestra Representativa: Es un subconjunto representativo de la población. Para que la muestra sea representativa deben seguirse ciertos procedimientos de selección (métodos de muestreo).
Una buena muestra es aquella que refleja las características esenciales de la población de la cual se obtuvo, al estudio de la muestra le llamamos muestreo y su objetivo es establecer generalizaciones con respecto a un grupo total de elementos (población) sin tener que examinarlo uno por uno.
Ejemplo:
Si se quiere contestar la pregunta “¿Quién es el mejor maestro de estadística?” como seria difícil y llevaría mucho tiempo preguntar a cada estudiante, en vez de ello podemos preguntar a un subconjunto representativo de la población; este subconjunto representativo de la población constituye una muestra y la información de esta, puede usarse para estimar quien es el mejor maestro de estadística.

VARIABLE Y TIPOS DE VARIABLE (DATOS)

Variable

Cuantitativa Cualitativa

Continúa Discreta Nominal Ordinal

VARIABLE: Es toda característica que toma diferentes valores en distintas personas, lugares o cosas que interesan en una investigación. Por ejemplo:
· El peso de los alumnos de cierto grupo en una universidad
· El numero de personas que esperan ser atendidas en la caja de una tienda de autoservicio.
Datos: Son agrupaciones de números o medidas (valores) recopilados como resultados de observaciones. Los datos pueden prevenir de recuentos tales como numero de alumnos que asisten a una clase de estadística o de mediciones como la estatura de varias personas, si se trata de variables cuantitativas. Si se trata de una variable cualitativa esta no es numerable por naturaleza; sin embargo, cuando se aplican, ya sea a una muestra o a una población, es posible asignar cada individuo a una categoría.
POR EJEMPLO, si la variable de interés es sexo, esta puede asumir los valores cualitativos masculino o femenino y luego contamos el número que queda en cada una de ellas. Si tenemos 40 alumnos en un grupo y contamos cuantos hombres y mujeres hay (25 mujeres 15 hombres). Por lo tanto podemos decir que lo datos nominales se obtienen cuando se definen las categorías y se cuenta el numero de observaciones que queda en cada una de ellas.
VARIABLE CUANTITATIVA: Es aquella que los valores que puede asumir son el resultado de medidas numéricas. Por ejemplo:
· El ingreso mensual de una familia
· La edad de un estudiante
· La duración de una pila alcalina
VARIABLE CUANTITATIVA CONTINUA: Es aquella que teóricamente puede tomar cualquier valor dentro de un intervalo de valores; es decir, toma valores en todos los puntos de una escala sin interrupciones entre valores posibles. Considérese las características medidas en unidades de dinero, tiempo, distancia, volumen, temperatura, presión, peso, puntos, promedios etc.
La edad de un alumno puede ser 20 o 21 años, pero también podría ser, al menos teóricamente, cualquiera de los infinitos valores entre 20 y 21 años como, por ejemplo, 20.36 o 20.635 años. Del mismo modo el alumno puede pesar 60 o 61 kilogramos, así como también cualquiera de los infinitos valores entre 60 y 61 kilogramos, tal como 60.30 o 60.955 kg. Ejemplos de variables continuas son:
· El diámetro de una pieza de motor
· El promedio de posibles clientes que visita un vendedor por mes.
· La cantidad de gasolina que consume un vehículo a la semana.
· Tiempo necesario para ensamblar un artículo.
· La cantidad de agua bombeada cada hora por un pozo.
· La presión sanguínea de una persona.
· La velocidad de un automóvil.
· La temperatura de un día determinado.
· La presión de neumáticos.
· Sueldos quincenales de un grupo de gerentes.
Los datos continuos se obtienen por medio de un proceso de medición; la mayoría de estos datos se presentan con fracciones o decimales, pero en algunos casos por comodidad o por criterio se redondean a un número entero, sin que esto signifique que se conviertan en datos discretos.

VARIABLE CUANTITATIVA DISCRETA: Es aquella que puede tomar solo un numero limitado de valores en una escala de medidas (presencia de “vacios” o “interrupciones “entre los valores que puede tomar), es decir, toma valores separados entre si por alguna cantidad. El numero de alumnos en un curso de estadística, por ejemplo, puede ser 50 o 51, pero ciertamente no puede ser 50.8 o 50.95. Análogamente, el numero de piezas defectuosas en una hora determinada, producidas en cierta maquina puede ser 1, 2, 3,4…… pero no puede ser 2.2 ni 4.95. Otros ejemplos son:
· Numero de personas que llegan a una empresa en un día determinado a solicitar trabajo.
· Llamadas telefónicas que llegan por hora en una agencia de empleos.
· Palabras escritas por una persona en un minuto dado.
· Numero de niños en una familia.
· Numero de pólizas llanadas por un auxiliar contable en un mes de trabajo.
· Cantidad de libros que hay en un estante.
· Defectos en pares de zapatos.
· Total de accidentes ocurridos en una semana en el periférico.
· Numero de juegos perdidos por un equipo.
· Cantidad de pilas alcalinas producidas por día en una fabrica.
Los datos obtenidos por un proceso de conteo son datos discretos.

VARIABLE CUALITATIVA (O CATEGORICA): Es aquella que tiene naturaleza de categoría, es decir, que en lugar de tener valores numéricos, los resultados posibles pertenecen a categorías o atributos que pueden clasificarse según criterio o cualidad. Por ejemplo:
· El sexo de una persona.
· El diseño de empaque.
· Tamaño de ciertos recipientes.
· Medios de publicidad.
VARIABLE CUALITATIVA NOMINAL: Son aquellas que en lugar de números toman nombres o palabras que pertenecen a categorías o atributos y que no se pueden graduar en un orden predeterminado y con cierta garantía de secuencia.
Por ejemplo:
· Afiliación política de una persona.
· Preferencia sobro la marca de cigarros en cuautitlan.
· Nacionalidad de 150 personas.
· Estado civil de una persona.
VARIABLE CUALITATIVA ORDINAL: Son aquellas que en lugar de números toman nombres o palabras que pertenecen a categorías o atributos y que se pueden graduar en un orden predeterminado y con cierta garantía de secuencia.
Por ejemplo:
· Puesto de las personas en el trabajo.
· Nivel de estudios.
· Los grados de la escuela.
· Tamaño del envase de una marca de refresco.




DISTRIBUCIONES UNIDIMENSIONALES DE FRECUENCIA
En este apartado consideraremos que tenemos datos correspondientes a un solo carácter, el cual, como antes dijimos llamaremos variable estadística y representaremos por X.
Llamaremos frecuencia total al número de datos n. Llamaremos frecuencia absoluta ni de la modalidad Mi (valor xi o intervalo Ii) de la variable X al número de datos que presentan la modalidad Mi (valor xi o valor del intervalo Ii). Si existen k modalidades posibles, se verificará
ni = n1 + n2 + ... + nk = n
Llamaremos frecuencia relativa fi de la modalidad Mi (valor xi o intervalo Ii) de la variable X al cociente fi = ni/n, verificándose:
fi = f1 + f2 + ... + fk = 1
Llamaremos frecuencia absoluta acumulada Ni hasta la modalidad Mi (valor xi o intervalo Ii) a la suma
Ni=n1 + ... + ni= nj
Claramente es Nk= nj=n
Llamaremos frecuencia relativa acumulada Fi hasta la modalidad Mi (valor xi o intervalo Ii) al cociente Fi=Ni/N, o lo que es lo mismo, a
Fi=f1 + ... + fi= fj
Siendo Fk= fj=1
Distribuciones unidimensionales de frecuencias
La tabla formada por las distintas modalidades (valores o intervalos) del carácter X y por las frecuencias absolutas (relativas, absolutas acumuladas o relativas acumuladas) recibe el nombre de distribución de frecuencias absolutas (relativas, absolutas acumuladas o relativas acumuladas respectivamente).
Tenemos, por tanto, para cada tipo de datos, cuatro distribuciones de frecuencias, obteniéndose a partir de una cualquiera de ellas las tres restantes, supuesto que se conoce la frecuencia total.
Las cuatro distribuciones de frecuencias se expresan en tablas como siguientes dependiendo del tipo de datos que sean:
Carácter cualitativo:
Mi
ni
fi
Ni
Fi
Cualidad1
n1
f1
N1
F1
Cualidad2
n2
f2
N2
F2
. . .
. . .
. . .
. . .
. . .
Cualidadi
ni
fi
Ni
Fi
. . .
. . .
. . .
. . .
. . .
Cualidadk
nk
fk
Nk=n
Fk=1

n
1


Carácter Cualitativo



2. Carácter cuantitativo sin agrupar:
Xi
ni
fi
Ni
Fi
x1
n1
f1
N1
F1
x2
n2
f2
N2
F2
. . .
. . .
. . .
. . .
. . .
xi
ni
fi
Ni
Fi
. . .
. . .
. . .
. . .
. . .
xk
nk
fk
Nk=n
Fk=1

n
1


Carácter Cuantitativo sin Agrupar
Carácter cuantitativo agrupado en intervalos:
Ii
ni
fi
Ni
Fi
I1
n1
f1
N1
F1
I2
n2
f2
N2
F2
. . .
. . .
. . .
. . .
. . .
Ii
ni
fi
Ni
Fi
. . .
. . .
. . .
. . .
. . .
Ik
nk
fk
Nk=n
Fk=1

n
1


Carácter Cuantitativo Agrupado en Intervalos

Ejemplo: "Tratamiento de Radiación y Cirugía"
En un estudio sobre las razones por las que no fue completado un tratamiento de radiación seguido de cirugía en pacientes de cáncer de cabeza y cuello se obtuvieron los datos dados por la siguiente distribució de frecuencias absolutas,
Causas
ni
Rehusaron Cirugía
26
Rehusaron Radiación
3
Empeoraron por una enfermedad ajena al cáncer
10
Otras causas
1

40
Datos
Las cuatro distribuciones de frecuencia serán:
Causas
ni
fi
Ni
Fi
Rehusaron Cirugía
26
0'650
26
0'650
Rehusaron Radiación
3
0'075
29
0'725
Empeoraron por una enfermedad ajena al cáncer
10
0'250
39
0'975
Otras causas
1
0'025
40
1

40
1


Distribución de Frecuencias

Ejemplo: "N° de Hijos"
Tras encuestar a 25 familias sobre el número de hijos que tenían, se obtuvieron los siguientes datos,
Nº de hijos(Xi)
0
1
2
3
4
Nº de familias(ni)
5
6
8
4
2
25
Datos
Las cuatro distribuciones de frecuencia serán:
Xi
ni
fi
Ni
Fi
0
5
0'20
5
0'20
1
6
0'24
11
0'44
2
8
0'32
19
0'76
3
4
0'16
23
0'92
4
2
0'08
25
1

25
1


Distribución de Frecuencias

Ejemplo:
Los datos del de los Niveles de Colinesterasa, agrupados en los intervalos allí obtenidos, proporcionan las cuatro siguientes distribuciones de frecuencias
Ii
ni
fi
Ni
Fi
7'5-9
3
0'088
3
0'088
9-10'5
8
0'236
11
0'324
10'5-12
10
0'294
21
0'618
12-13'5
10
0'294
31
0'912
13'5-15
1
0'029
32
0'941
15-16'5
2
0'059
34
1

34
1


Distribución de Fecuencias

Representación Gráfica de las Distribuciones Unidimensionales de Frecuencias
La representación gráfica de una distribución de frecuencias depende del tipo de datos que la constituya.
Datos correspondientes a un carácter cualitativo
La representación gráfica de este tipo de datos está basada en la proporcionalidad de las áreas a las frecuencias absolutas o relativas. Veremos dos tipos de representaciones:
Diagrama de sectores:
Está representación gráfica consiste en dividir un círculo en tantos sectores circulares como modalidades presente el carácter cualitativo, asignando un ángulo central a cada sector circular proporcional a la frecuencia absoluta ni, consiguiendo de esta manera un sector con área proporcional también a ni.
Ejemplo:
Así, los ángulos que corresponden a las cuatro modalidades de la tabla adjunta serán:

Número de casos
Ángulo(grados)
Rehusaron cirugía
26
234°
Rehusaron radiación
3
27°
Empeoraron por una enfermedad ajena al cáncer
10
90°
Otras causas
1

Y su representación en un diagrama de sectores será:
Diagrama de rectángulos:
Esta representación gráfica consiste en construir tantos rectángulos como modalidades presente el carácter cualitativo en estudio, todos ellos con base de igual amplitud. La altura se toma igual a la frecuencia absolua o relativa (según la distribución de frecuencias que estemos representando), consiguiendo de esta manera rectángulos con áreas proporcionales a las frecuencias que se quieren representar.
Ejemplo:
La representación gráfica de la distribución de frecuencias absolutas del ejemplo anterior será de la forma:
Datos sin agrupar correspondientes a un carácter cuantitativo
Estudiaremos dos tipos de representaciones gráficas, correspondientes a distribuciones de frecuencias (absolutas o relativas) no acumuladas y acumuladas.
Diagrama de barras:
Consiste en levantar, para cada valor de la variable, una barra cuya altura sea su frecuencia absoluta o relativa, dependiendo de la distribución de frecuencias que estemos representando.
Ejemplo:
Así, la representación gráfica de la distribución de frecuencias del ejemplo del nº de hijos será:
Diagrama de frecuencias acumuladas:
Esta representación gráfica se corresponde con la de una función constante entre cada dos valores de la variable a representar, e igual en cada tramo a la frecuencia relativa acumulada (o absoluta acumulada si se trata de representar una distribución de frecuencias absolutas) hasta el menor de los dos valores de la variable que construyen el tramo en el que es constante.
Ejemplo:
También para el ejemplo del Número de Hijos, se tendrá un diagrama de frecuencias acumuladas como el del siguiente gráfico:
Datos agrupados en intervalos correspondientes a un carácter cuantitativo
Al igual que antes, existen también dos tipos de representaciones gráficas dependiendo de si la distribución de frecuencias en estudio es de datos acumulados o de datos sin acumular.
Histograma:
Al ser esta representación una representación por áreas, hay que distinguir si los intervalos en los que aparecen agrupados los datos son de igual amplitud o no.
Si la amplitud de los intervalos es constante, dicha amplitud puede tomarse como unidad y al ser
Frecuencia (área) = amplitud del intervalo · altura
la altura correspondiente a cada intervalo puede tomarse igual a la frecuencia.
Si los intervalos tienen diferente amplitud, se toma alguna de ellas como unidad (generalmente la menor) y se levantan alturas para cada intervalo de forma que la ecuación anterior se cumpla.
Ejemplo:
En el ejemplo de los Niveles de Colinesterasa, al tener los intervalos igual amplitud, la representación gráfica será:
Ejemplo:
Si tuviéramos una distribución de frecuencias como la siguiente, correspondiente a puntuaciones obtenidas en un test psicológico y en la que los intervalos son de diferente amplitud
Ii
ni
fi
0-20
8
8/70
20-30
9
9/70
30-40
12
12/70
40-45
10
10/70
45-50
9
9/70
50-60
10
10/70
60-80
8
8/70
80-100
4
4/70

?ni= 70
?fi=1
Tomando la amplitud 5 como unidad, deberemos levantar para el primer intervalo una altura de 2/70 para que el área sea la freceuncia relativa 8/70. Procediendo de la misma manera con el resto de los intervalos obtendríamos como representación gráfica la figura siguiente:
Obsérvese que la suma de todas las áreas debe ser 1, tanto si los intervalos de la distribución de frecuencias relativas son o no de igual amplitud.
Polígono de frecuencias acumuladas:
Se utiliza para representar distribuciones de frecuencias (relativas o absolutas) acumuladas. Consiste en representar la gráfica de una función que una por segmentos las alturas correspondientes a los extremos superiores de cada intervalo, tengan o no todos igual amplitud, siendo dicha altura igual a la frecuencia acumulada, dando una altura cero al extremo inferior del primer intervalo y siendo constante a partir del extremo superior del último.
Ejemplo:
Así, para el ejemplo de los Niveles de Colinesterasa, el polígono de frecuencias relativas acumuladas tendrá una representación gráfica de la forma:

MEDIDAS DE CENTRALIZACION

En esta sección definiremos una serie de medidas o valores que tratan de representar o resumir a una distribución de frecuencias dada, sirviendo la cual además para realizar comparaciones entre distintas distribuciones de frecuencias. Estas medidas reciben el nombre de promedios, medidas de posición o medidas de tendencia central.
Media aritmética
Llamando xl, ..., xk a los datos distintos de un carácter en estudio, o las marcas de clase de los intervalos en los que se han agrupado dichos datos, y ni,..., nk a las correspondientes frecuencias absolutas de dichos valores o marcas de clase, llamaremos media aritmética de la distribución de frecuencias a
En donde n es la frecuencia total.

Ejemplo 1:
La media aritmética de las veinticinco familias encuestadas será:
es decir, las familias encuestadas tienen un número medio de hijos de 1'68.
Ejemplo 2:
Se midieron los niveles de colinesterasa en un recuento de eritrocitos en μmol/min/ml de 34 agricultores expuestos a insecticidas agrícolas, obteniéndose los siguientes datos:
Individuo
Nivel
Individuo
Nivel
Individuo
Nivel
1
10,6
13
12,2
25
11,8
2
12,5
14
10,8
26
12,7
3
11,1
15
16,5
27
11,4
4
9,2
16
15,0
28
9,3
5
11,5
17
10,3
29
8,6
6
9,9
18
12,4
30
8,5
7
11,9
19
9,1
31
10,1
8
11,6
20
7,8
32
12,4
9
14,9
21
11,3
33
11,1
10
12,5
22
12,3
34
10,2
11
12,5
23
9,7


12
12,3
24
12,0


La distribución de frecuencias las marcas de clase será:
Intervalo
Ii
7'5-9
9-10'5
10'5-12
12-13'5
13'5-15
15-16'5

Marca de Clase
xi
8'25
9'75
11'25
12'75
14'25
15'75

Frecuencia
ni
3
8
10
10
1
2
?ni=25
la cual proporciona una media aritmética de
Mediana

La mediana es otra medida de posición, la cual se define como aquel valor de la variable tal que, supuestos ordenados los valores de ésta en orden creciente, la mitad son menores o iguales y la otra mitad mayores o iguales
Así, si en la siguiente distribución de frecuencias,
xi
ni
Ni
0
3
3
1
2
5
2
2
7

7

ordenamos los valores en orden creciente,
0 0 0 1 1 2 2
el 1 será el valor que cumple la definición de mediana.
Lógicamente, en cuanto el valor de la frecuencia total sea ligeramente mayor, este procedimiento resulta inviable. Por esta razón, daremos a continuación una fórmula que permita calcularla. No obstante, será necesario distinguir los casos en los que los datos vengan agrupados de aquellos en los que vengan sin agrupar.
Datos sin agrupar:

Las gráficas siguientes, correspondientes a un diagrama de frecuencias absolutas acumuladas, recogen las dos situaciones que se pueden presentar:
Si la situación es como la de la figura de la derecha, es decir, si
Si la situación que se presenta es como la de la figura de la izquierda, entonces la mediana queda indeterminada, aunque en este caso se toma como mediana la media aritmética de los dos valores entre los que se produce la indeterminación; así pues, si
Nj-1 = n/2 < Nj
Entonces la mediana es
Ejemplo 1:
La distribución de frecuencias acumuladas del ejemplo del número de hijos era
Nº de hijos(xi)
0
1
2
3
4
Frecuencias Acumuladas(Ni)
5
11
19
23
25
y como es n/2=12'5 y en consecuencia
11 < 12'5 < 19
la mediana será Me= 2.
Datos Agrupados

Las gráficas siguientes, correspondientes a polígonos de frecuencias absolutas acumuladas, nos plantea de nuevo dos situaciones diferentes a considerar:
El más sencillo, el de la derecha, en el que existe una frecuencia absoluta acumulada Nj tal que n/2 = Nj, la mediana es Me = xj.
Si la situación es como la que se representa en la figura de la izquierda, en la que
Nj-l < n/2 < Nj
Entonces, la mediana, está en el intervalo [xj-1, xj), es decir entre xj-1 y xj, tomándose en ese caso, por razonamientos de proporcionalidad, como mediana el valor
Siendo cj la amplitud del intervalo [xj-1, xj).
Ejemplo:
La distribución de frecuencias del ejemplo de los niveles de colinesterasa es:
Intervalo
Ii
7'5-9
9-10'5
10'5-12
12-13'5
13'5-15
15-16'5
Frecuencia
ni
3
8
10
10
1
2
Frecuencia Acumulada
Ni
3
11
21
31
32
34
Al ser n/2 = 17 y estar
11 < 17 < 21
la mediana estará en el intervalo [10'5 , 12), y aplicando la fórmula anterior, será
Moda

La moda se define como aquel valor de la variable al que corresponde máxima frecuencia (absoluta o relativa). Para calcularla, también será necesario distinguir si los datos están o no agrupados.
Datos sin agrupar:

Para datos sin agrupar, la determinación del valor o valores (ya que puede haber más de uno) modales es muy sencilla. Basta observar a que valor le corresponde una mayor ni. Ese será la moda.
Así en el ejemplo del número de hijos, la simple inspección de la tabla siguiente proporciona como valor para la moda el Md = 2.
Nº de hijos(xi)
0
1
2
3
4
Nº de familias(ni)
5
6
8
4
2
?ni=25
Datos agrupados:

Si los datos se presentan agrupados en intervalos es necesario, a su vez, distinguir si éstos tienen o no igual amplitud.
Si tienen amplitud constante c, una vez identificado el intervalo modal [xj-1, xj), es decir el intervalo al que corresponde mayor frecuencia absoluta nj = max{nl, ..., nk}, la moda se define, también por razones geométricas, como
Ejemplo:
Este ejemplo presenta un caso de distribución bimodal, ya que tanto el intervalo [10'5 - 12) como el [12 - 13'5) tienen frecuencia absoluta máxima. Deberíamos aplicar, por tanto, para cada uno de los dos intervalos la fórmula anterior, determinando así las dos modas de la distribución. No obstante, este ejemplo presenta además la peculiaridad adicional de ser ambos intervalos modales contiguos. En esta situación se considera la distribución unimodal, eligiendo como moda el extremo común, Md = 12.
Si los intervalos tuvieran distinta amplitud cj, primeros debemos normalizar las frecuencias absolutas nj, determinando los cocientes
Y luego aplicar la regla definida para el caso de intervalos de amplitud constante a los lj. Es decir, primero calcular el lj = max{l1,...., lk} para determinar el intervalo modal [xj-1, xj) y luego aplicar la fórmula
Siendo cj la amplitud del intervalo modal [xj-1, xj).
Ejemplo:
Las frecuencias normalizadas correspondientes al ejemplo de intervalos con distinta amplitud serán,
Ii
ni
li
0-20
8
0'4
20-30
9
0'9
30-40
12
1'2
40-45
10
2
45-50
9
1'8
50-60
10
1
60-80
8
0'4
80-100
4
0'2
con lo que el intervalo modal es el [40 - 45) y la moda
A diferencia de lo que ocurre con la media o con la mediana, sí es posible determinar la moda en el caso de datos cualitativos. Así, en el ejemplo del tratamiento de radiación seguido de cirugía puede afirmarse que la causa modal por la que no fue completado el tratamiento es Md = rehusaron cirugía.
Cuantiles

Los cuantiles o cuantilas son las últimas medidas de posición que veremos. De hecho algunos autores las incluyen dentro de las medidas de dispersión al ser medidas de posición no centrales.
El cuantil pr/k r= 1,2,..., k - 1 se define como aquel valor de la variable que divide la distribución de frecuencias, previamente ordenada de forma creciente, en dos partes, estando el (100·r/k)% de ésta formado por valores menores que pr/k.
Si k = 4 los (tres) cuantiles reciben el nombre de cuartíles. Si k = 10 los (nueve) cuantiles reciben, en este caso, el nombre de decíles. Por último, si k = 100 los (noventa y nueve) cuantiles reciben el nombre de centiles.
Obsérvese que siempre que r y k mantengan la misma proporción (r/k) obtendremos el mismo valor. Es decir, por ejemplo, el primer cuartil es igual al vigésimo quinto centil.
En este sentido, la mediana Me es el segundo cuartil, o el quinto decil, etc.
Para el cálculo de los cuantiles de nuevo hay que considerar si los datos vienen o no agrupados en intervalos.
Datos sin agrupar:

Si los datos vienen sin agrupar y es
Nj-1 < < Nj
el r-ésimo cuantil de orden k será pr/k= xj, valor al que corresponde la frecuencia absoluta acumulada Nj.
Si la situación fuera de la forma
Nj-1 = < Nj
tomaríamos, en esta situación indeterminada,
Datos agrupados:

Si los datos se presentan agrupados y, para algún j, fuera
< Nj
el résimo cuantil de orden k sería pr/k= xj.
Por último, si fuera
Nj-1 < < Nj
el intervalo a considerar sería el [xj-1, xj), al que corresponde frecuencia absoluta ni y absoluta acumulada Ni, siendo entonces el cuantil el dado por la expresión,
en donde cj es la amplitud del intervalo [xj-1, xj).
Si el intervalo a considerar fuera el [x0 , x1), se tomaría en la expresión anterior Nj-1 = 0.
Ejemplo:
Vamos a determinar la tercera cuartila del ejemplo del número de hijos.
Nº de hijos(xi)
0
1
2
3
4
Nº de familias(ni)
5
6
8
4
2
?ni=25
Nº de familias(ni)
5
11
19
23
25

Como es
y 11 < 18'75 < 19, será p3/4=2.
Ejemplo:
Vamos a determinar la séptima decila del ejemplo de los niveles de colinesterasa.
Intervalo
Ii
7'5-9
9-10'5
10'5-12
12-13'5
13'5-15
15-16'5
Frecuencia
ni
3
8
10
10
1
2
Frecuencia Acumulada
Ni
3
11
21
31
32
34

Como es:
21 < 23'8 < 31, el intervalo a considerar será el [12 , 13'5), siendo


Medidas de dispersión
Las medidas de posición estudiadas en la sección anterior servían para resumir la distribución de frecuencias en un solo valor. Las medidas de dispersión, a las cuales dedicaremos esta sección, tienen como propósito estudiar lo concentrada que está la distribución en torno a algún promedio.
Estudiaremos las cuatro medidas de dispersión más utilizadas: recorrido, varianza, desviación típica y coeficiente de variación de Pearson, estando definidas las tres primeras medidas en unidades concretas y estándolo la cuarta en unidades abstractas.
Recorrido
Si x max es el dato mayor o la última marca de clase, si es que los datos vienen agrupados en intervalos, y x min el dato menor o primera marca de clase, llamaremos recorrido a
R = x max - x min
Así, en el ejemplo de los niveles de colinesterasa el recorrido es
R = 15'75 - 8'25 = 7'5
y en el ejemplo del número de hijos será R = 4 - 0 = 4.
La principal ventaja del recorrido es la de proporcionar una medida de la dispersión de los datos fácil y rápida de calcular.
Varianza
Denotando por x1,...,xk los datos o las marcas de clase, llamaremos varianza a
Siendo a la media de la distribución.
Así en el ejemplo del número de hijos la varianza es
s2 = 4'24 - (1'68)2 = 1'4176.
Y en ejemplo de los niveles de colinesterasa
s2 = 133'97 - (11'426)2 = 3'42.
Al valor
Se le denomina cuasivarzanza.
Desviación Típica
La varianza tiene un problema, y es que está expresada en unidades al cuadrado. Esto puede producir una falsa imagen de la dispersión de la distribución. En su lugar suele utilizarse su raíz cuadrada, denominada desviación típica. Así, la desviación típica de la distribución de frecuencias del ejemplo de los niveles de colinesterasa es s = 1'1906 y la del ejemplo del número de hijos s = 1'85.
Coeficiente de Variación de Pearson
La desviación típica sirve para medir de forma eficaz la dispersión de un conjunto de datos entorno a su media. Desgraciadamente esta medida puede resultar engañosa cuando tratamos de comparar la dispersión de dos conjuntos de datos. Así, si por ejemplo tenemos dos grupos de mujeres de 11 y 25 años con medias y desviaciones típicas dadas por la tabla siguiente:

Peso Medio
Desviación Típica
11 años
40 Kgr.
2 Kgr.
25 años
50 Kgr.
2 Kgr.
puede parecernos, al observar en ambos grupos una desviación típica igual, que ambos grupos de datos tienen la misma dispersión. No obstante, como parece lógico, no es lo mismo una variación de dos kilos en un grupo de elefantes que en uno de conejos. El coeficiente de Variación de Pearson elimina esa posible confusión al ser una medida de la variación de los datos pero en relación con su media. Se defide como
Siendo s y a respectivamente la desviación típica y la media de la distribución en estudio y en donde el factor 100 tiene como único objetivo el evitar operar con valores decimales.
De la defición de Vp se deduce fácilmente que aquella distribución a la que corresponda mayor coeficiente tendrá mayor dispersión.
En el ejemplo anterior, al grupo de mujeres de 11 años le corresponde un coeficiente de variación de Pearson igual a
Y al grupo de las mujeres de 25 años
Lo que indica una mayor dispersión en el grupo de mujeres de 11 años.
Para el ejemplo del número de hijos Vp toma el valor
Y en el de los niveles de colinesterasa