ESTIMACIÓN

 

Llamaremos así al procedimiento utilizado cuando se quiere conocer las características de un parámetro poblacional, a partir del conocimiento de la muestra.

Imaginemos que hemos hecho la encuesta a la que se aludía en el apartado anterior, y queremos saber cual es la verdadera media del instituto. Podemos hacer una primera aproximación, utilizando la media muestral km. Sin embargo , este valor está sesgado debido a que solo representa a una muestra.

Podríamos decir que la media buscada es próxima a 3, pero ¿cuánto de próxima?. ¿Digamos que 200 metros más o menos?. Esto significaría que la media estaría entre 2,8 y 3,2. Esto último se denomina estimar por intervalo, y es el método que ahora vamos a ver.

INTERVALO DE CONFIANZA

Se llama así a un intervalo en el que sabemos que está un parámetro, con un nivel de confianza específico

Si dijéramos que la media se encuentra en el intervalo (2,8 , 3,2) con un nivel de confianza del 95%, lo que decimos es que si hiciéramos muestras de tamaño 40, y fuéramos contabilizando sus medias, a la larga, en el 95% de los casos, la media calculada estaría en dicho intervalo.

Además, al valor 0,2 (200 metros), que mide la mitad de la anchura del intervalo, se le denomina error máximo de la estimación. Lo anteriormente argumentado se expresa en términos estadísticos como:

"A un nivel de confianza del 95%, la media poblacional es 3 km, con un error máximo de estimación de  km."

Por tanto:

NIVEL DE CONFIANZA

Probabilidad de que el parámetro a estimar se encuentre en el intervalo de confianza.

Los valores que se suelen utilizar para el nivel de confianza son el 95%, 99% y 99,9%

ERROR DE ESTIMACIÓN MÁXIMO

 Es el radio de anchura del intervalo de confianza.

Este valor nos dice en qué margen de la media muestral se encuentra la media poblacional al nivel de confianza asignado.

Durante este curso aprenderemos a realizar estimaciones sobre la media y la proporción de una característica en una población. La estimación de otros parámetros poblacionales, tales como la desviación típica, quedará fuera de nuestro estudio.

 

ESTIMACIÓN DE LA MEDIA DE UNA POBLACIÓN

 

Para estimar la media poblacional por medio de intervalos de confianza, será necesario recordar que el Teorema Central del Límite nos daba información de como se hallaban distribuidas las medias muestrales: "normalmente" con una media igual a la de la población original m (que es la que ahora tratamos de conocer) y desviación típica

Supongamos que hemos analizado la muestra ya nombrada de media  Km., y que sabemos que la desv. típica de la población es de s=0,4 km., y que nos planteamos estimar la media de todo el instituto, con un nivel de confianza del 95% .El proceso para realizar la estimación es el siguiente:

Sabemos por el T.C.L. que las medias muestrales se distribuyen según

 La siguiente figura nos ilustrará:

 

Hallamos el valor k de forma que  p(-k<Z<k)=0,95 , o lo que es lo mismo p(Z<k)=0,975. Consultando nuestra tabla de la distribución normal, encontraremos que k=1.96   .

Este valor nos dice que la medias muestrales se encuentran en un 95% de los casos como máximo a 1.96 desviaciones típicas de la media buscada,  es decir,  nuestra media , en un 95% de los casos, dista de la media poblacional menos de 1,96.0,063=0,124 km.

  Si tomamos un intervalo con centro en dicha media muestral , y radio 0,124, en un 95% de los casos la media buscada estará dentro del intervalo.

Encontramos por tanto que a un nivel de confianza del 95%, la media poblacional es de 3 km. con un error máximo de

o lo que es lo mismo, existe una probabilidad del 95%, de que la media buscada se encuentre en el intervalo  de confianza (3-0,124 , 3+0,124) = (2,976 , 3,124 ).

Así pues en general para un proceso de estimación de la media, el intervalo de confianza será:

( - E , + E)

siendo la media de la muestra, y el error de estimación.

Para entender mejor el proceso, observa el gráfico interactivo en el que se supone que la verdadera media de la población es µ=3.1 km. Comenzamos con el valor k=1,96, que corresponde a una confianza del 95%. Luego hallamos el área roja, que corresponde a las medias muestrales que tienen una probabilidad de aparición del 95%. Si la media muestral (mm) obtenida es, como en el caso que nos ocupa, , puedes comprobar como el intervalo de confianza contiene a la media de la población.

Varía el nivel  de confianza, y anota que le ocurre al intervalo de confianza. Así mismo, puedes variar el valor de la media muestral, e investigar, qué valores dan lugar a intervalos que no contienen a la media de la población y cuál es la probabilidad de ocurrencia de dichos valores.

 

TAMAÑO DE LA MUESTRA

 

Pero imaginemos ahora, que nos disponemos a elegir una muestra para poder determinar con un 95% de confianza la media, con un margen de error de 50 metros. Desde luego hará falta una muestra mayor para tener tan poco margen de error ¿Cuál deberá ser el tamaño de la muestra para conseguirlo? .

Despejando en

obtenemos que

Como k=1,96 , E=0,05 y s=0,4   calculando obtendremos que n=245,8 es decir, redondeando, hará falta una muestra correspondiente a 246 estudiantes para que el margen de error sea de tan sólo 50 metros.

De la expresión del tamaño de la muestra, se deduce muy fácilmente, que deberá ser mayor cuanto mayor sea:

a) El nivel de confianza asignado

b) El grado de variabilidad de los datos originales

Por el contrario, cuanto mayor sea el tamaño de la muestra, menor será el error de la estimación.

 

Resultará muy interesante que además de las siguientes, realices las actividades de la hoja de cálculo "Estimación de la media"

 

ACTIVIDADES

1.- El Ayuntamiento de Las Palmas, para planificar su política social, ha hecho en un barrio una encuesta, basada en un muestreo aleatorio a 36 adultos, sobre los ingresos medios mensuales, obteniéndose 72800 pts de media y s=12000 pts.

Estimar el valor medio de los ingresos en dicho barrio con un intervalo de confianza del 95% y del 99%.

2.- "El Corte Inglés" desea conocer cuanto gastan como media los poseedores de una de sus tarjetas, a lo largo de un mes. Ha diseñado un muestra de 1000 clientes, y sabe por experiencia que la desv. típica poblacional es de 25.000 pts. Si desea tener una confianza del 99% en la estimación, ¿cuál será el error máximo que cometerá?

3.- Se desea establecer , con un nivel de confianza del 95%, el peso medio de las naranjas de un barco que acaba de atracar, de forma que el error no sobrepase los 15 gramos.

Si la desviación típica (conocida por numerosos casos anteriores) es de 60 g., ¿cuántas naranjas deberán ser escogidas al azar para poder establecer dicha media?

4.- Razona que efecto tiene cada uno de los siguientes conceptos sobre el ancho de un intervalo de confianza:

 a) Nivel de confianza  

 b) Tamaño muestral    

 c) Variabilidad de las características que se miden

5.- Para conocer con un 95% de confianza y un error máximo de 500 pts, se quiere hacer una encuesta a jovenes, sobre sus gastos durante el fín de semana. ¿Cuál deberá ser el tamaño de la muestra? (supóngase que s=750 pts)

6.- Una encuesta realizada sobre 40 aviones comerciales, revela que la antigüedad media de estos es de 13,41 años, con una desviación típica muestral s=8,28

a) ¿Cuál es con un 90% de confianza la antigüedad media de toda la flota comercial?

b) Si se quisiera obtener un nivel de confianza del 95%, cometiendo el mismo error que en el apartado anterior, y suponiendo también s=8,28, ¿cuántos elementos deberían componer la muestra?

7.- Al medir el tiempo de reacción , un psicólogo estima que la desviación típica del mismo es de 0,5 segundos. ¿Cuál será el número de medidas que deberá hacer para que sea del 99% la confianza de que el error de su estimación no excederá de 0,1 segundos?  (P.A.U. 1996)

8.- En una muestra de 50 jóvenes encontramos que la dedicación media diaria al ocio es de 400 minutos y la desviación típica muestral de 63 minutos. Calcular el intervalo de confianza de la media de la población al 95% de nivel de confianza. (P.A.U. 1996).

9.- La duración de las bombillas fabricadas por una empresa sigue una distribución normal de media desconocida y desviación típica 50 horas. Para estimar la duración se experimenta con una muestra de tamaño n. Calcular el valor de n para que, con un nivel de confianza del 95%, se consiga un error en la estimación inferior a las 5 horas. (P.A.U. 1996).

10.- Una muestra aleatoria de 60 personas tiene una media de 235 mg/dl (miligramos por decilitro) en medidas de colesterol. Suponiendo que la desviación típica de la variable que mide las unidades de colesterol es s=28 mg/dl, se pide:

a) Calcular el intervalo de confianza , con un nivel de confianza  0'95 para la media de la población.

b) Determinar el tamaño muestral necesario para reducir el intervalo de confianza anterior a la mitad. (P.A.U. 1996)

 

Atrás ] Adelante ]