| Imprimir | INSTITUTO TECNOLOGICO DE CHIHUAHUA | << Contenido >> |
Estimación de una Proporción
Un estimador puntual de la proporción P en un experimento binomial está dado por la estadística P=X/N, donde x representa el número de éxitos en n pruebas. Por tanto, la proporción de la muestra p =x/n se utiuñlizará como estimador puntual del parámetro P.
Si no se espera que la proporción P desconocida esté demasiado cerca de 0 ó de 1, se puede establecer un intervalo de confianza para P al considerar la distribución muestral de proporciones.

Al despejar P de esta ecuación nos queda:
![]()
En este despeje podemos observar que se necesita el valor del parámetro P y es precisamente lo que queremos estimar, por lo que lo sustituiremos por la proporción de la muestra p siempre y cuando el tamaño de muestra no sea pequeño.
![]()
Cuando n es pequeña y la proporción desconocida P se considera cercana a 0 ó a 1, el procedimiento del intervalo de confianza que se establece aquí no es confiable, por tanto, no se debe utilizar. Para estar seguro, se debe requerir que np ó nq sea mayor o igual a 5.
El error de estimación será la diferencia absoluta entre p y P, y podemos tener el nivel de confianza de que esta diferencia no excederá
.
Ejemplos:
Solución:
n=500
p = 15/500 = 0.03
z(0.90) = 1.645
![]()
0.0237<P<0.0376
Se sabe con un nivel de confianza del 90% que la proporción de discos defectuosos que no pasan la prueba en esa población esta entre 0.0237 y 0.0376.
Solución:
p=x/n = 20/400=0.05
z(0.95)=1.96

Si p=0.05 se usa para estimar P, podemos tener un 95% de confianza en que P dista menos de 0.021 de p. En otras palabras, si p=0.05 se usa para erstimar P, el error máximo de estimación será aproximadamente 0.021 con un nivel de confianza del 95%.
Para calcular el intervalo de confianza se tendría:
![]()
Esto da por resultado dos valores, (0.029, 0.071). Con un nivel de confianza del 95% se sabe que la proporción de pulas defectuosas de esta compañía está entre 0.029 y 0.071.
Si se requiere un menor error con un mismo nivel de confianza sólo se necesita aumentar el tamaño de la muestra.
Solución:
P= 60/300 = 0.20
Z(0.90) = 1.645
![]()
0.162<P<0.238
Estimación de la Diferencia entre dos Medias
Si se tienen dos poblaciones con medias
1 y
2 y varianzas
12 y
22, respectivamente, un estimador puntual de la diferencia entre
1 y
2 está dado por la estadística
. Por tanto. Para obtener una estimación puntual de
1-
2, se seleccionan dos muestras aleatorias independientes, una de cada población, de tamaño n1 y n2, se calcula la diferencia
, de las medias muestrales.
Recordando a la distribución muestral de diferencia de medias:

Al despejar de esta ecuación
1-
2 se tiene:

En el caso en que se desconozcan las varianzas de la población y los tamaños de muestra sean mayores a 30 se podrá utilizar la varianza de la muestra como una estimación puntual.
Ejemplos:
Solución:
Es deseable que la diferencia de medias sea positiva por lo que se recomienda restar la media mayor menos la media menor. En este caso será la media del motor B menos la media del motor A.
El valor de z para un nivel de confianza del 96% es de 2.05.

3.43<
B-
A<8.57
La interpretación de este ejemplo sería que con un nivel de confianza del 96% la diferencia del rendimiento promedio esta entre 3.43 y 8.57 millas por galón a favor del motor B. Esto quiere decir que el motor B da mas rendimiento promedio que el motor A, ya que los dos valores del intervalo son positivos.
Solución:

-
2662.68<Gráficamente:

Como el intervalo contiene el valor "cero", no hay razón para creer que el promedio de duración del neumático de la marca B es mayor al de la marca A, pues el cero nos está indicando que pueden tener la misma duración promedio.
Estimación de la Diferencia de dos Proporciones
En la sección anterior se vio el tema de la generación de las distribuciones muestrales, en donde se tenía el valor de los parámetros, se seleccionaban dos muestras y podíamos calcular la probabilidad del comportamiento de los estadísticos. Para este caso en particular se utilizará la distribución muestral de diferencia de proporciones para la estimación de las misma. Recordando la formula:

Despejando P1-P2 de esta ecuación:

Aquí se tiene el mismo caso que en la estimación de una proporción, ya que al hacer el despeje nos queda las dos proporciones poblacionales y es precisamente lo que queremos estimar, por lo que se utilizarán las proporciones de la muestra como estimadores puntuales:

Ejemplos:
Solución:
Sean P1 y P2 las proporciones reales de defectuosos para los procesos actual y nuevo, respectivamente. De aquí, p1=75/1500 = 0.05 y p2 = 80/2000 = 0.04. con el uso de la tabla encontramos que z para un nivel de confianza del 90% es de 1.645.

-0.0017
<P1-P2<0.0217Como el intervalo contiene el valor de cero, no hay razón para creer que el nuevo procedimiento producirá una disminución significativa en la proporción de artículos defectuosos comparado con el método existente.
|
Usuaria |
No Usuaria |
|
|
Tamaño Muestral |
1246 |
11178 |
|
Número de disfunciones |
42 |
294 |
|
Proporción muestral |
0.0337 |
0.0263 |
Encuentre el intervalo de confianza del 99% para la diferencia de proporciones.
Solución:
Representemos P1 la proporción de nacimientos donde aparecen disfunciones entre todas las madres que fuman marihuana y definamos P2, de manera similar, para las no fumadoras. El valor de z para un 99% de confianza es de 2.58.

-0.0064
<P1-P2<0.0212Este intervalo es bastante angosto, lo cual sugiere que P1-P2 ha sido estimado de manera precisa.
Determinación de Tamaños de Muestra para Estimaciones
Al iniciar cualquier investigación, la primer pregunta que surge es: ¿de qué tamaño debe ser la o las muestras?. La respuesta a esta pregunta la veremos en esta sección, con conceptos que ya se han visto a través de este material.
Cálculo del Tamaño de la Muestra para Estimar una Media
¿Qué tan grande debe ser una muestra si la media muestral se va a usar para estimar la media poblacional?. La respuesta depende del error estándar de la media, si este fuera cero, entonces se necesitaría una sola media que será igual necesariamente a la media poblacional desconocida
, porque
= 0. Este caso extremo no se encuentra en la práctica, pero refuerza el hecho de que mientras menor sea el error estándar de la media, menor es el tamaño de muestra necesario para lograr un cierto grado de precisión.
Se estableció antes que una forma de disminuir el error de estimación es aumentar el tamaño de la muestra, si éste incluye el total de la población, entonces
sería igual a cero. Con esto en mente, parece razonable que para un nivel de confianza fijo, sea posible determinar un tamaño de la muestra tal que el error de estimación sea tan pequeño como queramos, para ser mas preciso, dado un nivel de confianza y un error fijo de estimación
, se puede escoger un tamaño de muestra n tal que P(
) = Nivel de confianza. Con el propósito de determinar n. El error máximo de estimación esta dado por:

Si se eleva al cuadrado ambos lados de esta ecuación y se despeja n de la ecuación resultante, obtenemos:

Como n debe de ser un número entero, redondeamos hacia arriba todos los resultados fraccionarios.
En el caso de que se tenga una población finita y un muestreo sin reemplazo, el error de estimación se convierte en:

De nuevo se eleva al cuadrado ambos lados y se despeja la n, obteniendo:

Ejemplos:
Solución:
![]()
En consecuencia, si el tamaño de la muestra es 36, se puede tener un 95% de confianza en que
difiere en menos de 4 libras de
.

Se necesita una muestra de 68 focos para estimar la media de la población y tener un error máximo de 10 horas.
¿Qué pasaría si en lugar de tener un error de estimación de 10 horas sólo se requiere un error de 5 horas?

Se puede observar como el tamaño de la muestra aumenta, pero esto tiene como beneficio una estimación más exacta.
Solución:
Como se tiene una población finita y un muestreo sin reemplazo es necesario utilizar la formula con el factor de corrección.

Si se tiene una población finita de 300 focos sólo se tiene que extraer de la población una muestra sin reemplazo de 56 focos para poder estimar la duración media de los focos restantes con un error máximo de 10 horas.
Cálculo del Tamaño de la Muestra para Estimar una Proporción
Se desea saber que tan grande se requiere que sea una muestra para asegurar que el error al estimar P sea menor que una cantidad específica
.

Elevando al cuadrado la ecuación anterior se despeja n y nos queda:

Esta fórmula está algo engañosa, pues debemos utilizar p para determinar el tamaño de la muestra, pero p se calcula a partir de la muestra. Existen ocasiones en las cuales se tiene una idea del comportamiento de la proporción de la población y ese valor se puede sustituir en la fórmula, pero si no se sabe nada referente a esa proporción entonces se tienen dos opciones:
Se desconoce el valor de P, por lo que se utilizarán diferentes valores y se sustituirán en la formula para observar los diferentes tamaños de muestras. El nivel de confianza que se utilizará es del 95% con un error de estimación de 0.30.
|
p |
|
n |
|
0.10 |
|
3.84 |
|
0.20 |
|
6.82 |
|
0.30 |
|
8.96 |
|
0.40 |
|
10.24 |
|
0.50 |
|
10.67 |
|
0.60 |
|
10.24 |
|
0.70 |
|
8.96 |
|
0.80 |
|
6.82 |
|
0.90 |
|
3.84 |
Como se puede observar en la tabla anterior cuando P vale 0.5 el tamaño de la muestra alcanza su máximo valor.
En el caso de que se tenga una población finita y un muestreo sin reemplazo, el error de estimación se convierte en:

De nuevo se eleva al cuadrado ambos lados y se despeja la n, obteniendo:

Ejemplos:
Solución:
Se tratarán a las 500 familias como una muestra preliminar que proporciona una estimación de p=340/500=0.68.
![]()
Por lo tanto si basamos nuestra estimación de P sobre una muestra aleatoria de tamaño 2090, se puede tener una confianza de 95% de que nuestra proporción muestral no diferirá de la proporción real por más de 0.02.
Solución:
En este problema, se desconoce totalmente la proporción de residentes que conoce la opinión de la legisladora, por lo que se utilizará un valor de 0.5 para p.

Se requiere un tamaño de muestra de 97 residentes para que con una confianza del 95% la estimación tenga un error máximo de 0.10.
Cálculo del Tamaño de la Muestra para Estimar la Diferencia de Medias
Si se recuerda a la distribución muestral de diferencia de medias se tiene que error esta dado por:

En esta ecuación se nos pueden presentar dos casos:
Para el primer caso no se tiene ningún problema, se eleva al cuadrado la ecuación y se despeja n ya que n1 es igual a n2.

Para el segundo caso se pondrá una n en función de la otra. Este caso se utiliza cuando las poblaciones son de diferente tamaño y se sabe que una es K veces mayor que la otra.

![]()
Ejemplo:
Un director de personal quiere comparar la efectividad de dos métodos de entrenamiento para trabajadores industriales a fin de efectuar cierta operación de montaje. Se divide un número de operarios en dos grupos iguales: el primero recibe el método de entrenamiento 1, y el segundo, el método 2. Cada uno realizará la operación de montaje y se registrará el tiempo de trabajo. Se espera que las mediciones para ambos grupos tengan una desviación estándar aproximadamente de 2 minutos. Si se desea que la estimación de la diferencia en tiempo medio de montaje sea correcta hasta por un minuto, con una probabilidad igual a 0.95, ¿cuántos trabajadores se tienen que incluir en cada grupo de entrenamiento?
![]()
Cada grupo debe contener aproximadamente 31 empleados.
Cálculo del Tamaño de la Muestra para Estimar la Diferencia de Proporciones
Si se recuerda a la distribución muestral de diferencia de medias se tiene que error esta dado por:

En esta ecuación se nos pueden presentar dos casos:
Para el primer caso no se tiene ningún problema, se eleva al cuadrado la ecuación y se despeja n ya que n1 es igual a n2.

Para el segundo caso se pondrá una n en función de la otra. Este caso se utiliza cuando las poblaciones son de diferente tamaño y se sabe que una es K veces mayor que la otra.


Ejemplo:
Una compañía de productos alimenticios contrató a una empresa de investigación de mercadotecnia , para muestrear dos mercados, I y II, a fin de comparar las proporciones de consumidores que prefieren la comida congelada de la compañía con los productos de sus competidores. No hay información previa acerca de la magnitud de las proporciones P1 y P2. Si la empresa de productos alimenticios quiere estimar la diferencia dentro de 0.04, con una probabilidad de 0.95, ¿ cuántos consumidores habrá que muestrear en cada mercado?

Se tendrá que realizar encuestas a 1201 consumidores de cada mercado para tener una estimación con una confianza del 95% y un error máximo de 0.04.
Respuesta a los Problemas propuestos
| Imprimir | INSTITUTO TECNOLOGICO DE CHIHUAHUA | << Contenido >> |