Как найти предельную ошибку выборочной средней. Средние ошибки повторной и бесповторной выборки

Сопоставление формул повторного и бесповторного отбора свидетельствует о том, что применение последнего приводит к уменьшению ошибки выборки. В тех случаях, когда численности генеральной совокупности (N) очень велика по сравнению с числом отобранных единиц (n), ошибку бесповторного отбора можно определить по формуле для повторного отбора (lim (1-n) / N → 1).

Исходя из приведенных выше формул можно утверждать, что средняя величина случайной ошибки репрезентативности зависит от принятого способа формирования выборочной совокупности, объема выборки, степени колеблемости изучаемого признака в генеральной совокупности.

Для решения практических задач выборочного обследования расчета средней ошибки выборки недостаточно. Так, из генеральной совокупности может быть получено несколько выборок. При этом фактическая ошибка каждой конкретной выборки может быть больше или меньше средней ошибки. Поэтому помимо средней, рассчитыва-ется предельная ошибка выборки . Ее величина зависит от того, с какой вероятностью должна гарантироваться ошибка выборки. Уро-вень доверительной вероятности определяется при помощи специаль-ного коэффициента t , называемого коэффициентом доверия. Наибо-лее часто употребляются следующие уровни доверительной вероятно-сти и значений t:

t=1 P=0,683; t=2 P=0,954; t=3 P=0,997

Расчет предельной ошибки производится по формулам (6,1) и (6,2):

Величина генеральной средней или доли представляется в виде пределов следующим образом (6,3) и (6,4):

Таким образом, по результатам выборочного наблюдения с оп-ределенной степенью достоверности можно утверждать, что гене-ральная средняя или доля не выйдет за установленные пределы.

Пример. Из партии лампочек в 1000 шт. отобрано способом случайной бесповторной выборки 100 шт. Средняя продолжитель-ность горения по отобранной части составляет 1200 ч, а среднее квадратичное отклонение 200 ч. Из отобранных лампочек 90 шт. удовлетворяли стандарту. Требуется определить границы среднего значения продолжительности горения (с вероятностью 0,997), а также границы доли лампочек, удовлетворяющих стандарту (с веро-ятностью 0,954), во всей партии.

Средняя ошибка средней продолжительности горения лампочек оп-ределяется по формуле собственно-случайного бесповторного отбора:

Предельная ошибка средней продолжительности горения лампочек определяется с учетом коэффициента доверия, соответствующего требуемому уровню доверительной вероятности (t = 3 при P = 0,997):

Пределы средней продолжительности горения лампочек в партии:

Таким образам, с вероятностью Р = 0.997 можно утверждать, что средняя продолжитель ность горения лампочек во всей партии будет заключена в пределах от 1143 до 125Т ч.

Доля лампочек в выборке, удовлетворяющих стандарту (выборочная доля), составляет

Средняя ошибка доли стандартных лампочек определяется по формуле для собственно-случайного бесповторного отбора:

Предельная ошибка доли стандартных лампочек определяется с учетом коэффициента доверия, соответствующего требуемому уровню доверительной вероятности (t = 2 при P = 0,954):

Пределы доли лампочек, удовлетворяющих стандарту, во всей партии

С вероятностью Р-0,954 можно утверждать, что доля лампочек, удовлетворяющих стандарту, во всей партии будет заключена в пределах от 84,4 до 95,6%.

Пример. 10%-ный бесповторный типический отбор рабочих предприятия, пропорциональный размерам цехов, проводимый с целью оценки потерь рабочего времени из- за временной нетрудоспособности, привел к результатам, представленным в таблице. Из числа обследованных 90 рабочих первого цеха, 120 рабочих второго цеха и 70 рабочих третьего не имели случаев нетрудоспособности. С вероятностью 0,954 требуется определить границы среднего числа дней нетрудоспособности, а также границы доли рабочих, не имевших случаев нетрудоспособности, по предприятию в целом.

Среднее число дней временной нетрудоспособности в выбороч-ной совокупности определяется по формуле средней арифметической взвешенной:

Средняя из внутригрупповых дисперсий числа дней временной нетрудоспособности по трем цехам завода

Средняя ошибка среднего числа дней нетрудоспособности рас-считывается по формуле для типического бесповторного отбора:

Предельная ошибка выборки определяется с учетом довери-тельной вероятности 0,954:

Пределы среднего числа дней нетрудоспособности по предпри-ятию в целом

Доля рабочих, не имевших случаев нетрудоспособности, по це-хам предприятия составляет:

Доля рабочих, не имевших случаев нетрудоспособности, по выборке в целом определяется по формуле средней арифметической взвешенной:

Для определения средней ошибки доли рассчитаем среднюю из внутригрупповых дисперсий:

Средняя ошибка доли рабочих, не имевших случаев нетрудоспособности:

Предельная ошибка доли рабочих, не имевших нетрудоспособности:

Пределы доли рабочих, не имевших случаев нетрудоспособности, по предприятию в целом

Пример. На склад завода поступило 100 ящиков готовых изделий по 80 шт. в каждом. Для установления среднего веса деталей проведена серийная выборка. Выборочные средние по сериям составили 16; 15,5; 15 и 15,9 г. Доля бракованных деталей по сериям составила 5; б; 4иЗ% соответственно. С вероятностью 0,954 определите средний вес деталей и долю бракованных деталей в партии.

Средний вес деталей в выборке определяется по формуле средней арифметической простой:

Межгрупповая (межсерийная) дисперсия веса деталей в выборке

Средняя ошибка среднего веса деталей определяется по формуле для серийного бесповторного отбора:

На стадии организации выборочного наблюдения решается вопрос о том, каков должен быть объем выборочной совокупности, для того, чтобы была обеспечена требуемая точность результатов наблюдений. Уменьшение ошибки выборки, а следовательно, увеличение точности определения параметров генеральной совокупности всегда связано с увеличением объема выборки. Увеличивая численность выборки, можно довести ее ошибку до сколь угодно малых размеров.

Однако из формул средней ошибки выборки следует, что уменьшение ошибки в kраз тре-бует увеличения объема выборки в k 2 раз. Увеличение объема исследо-ваний, в свою очередь, вызывает дополнительные затраты труда и средств, снижает оперативность информации. Поэтому вопрос об опти-мальной численности выборки имеет важное практическое значение.

Определение необходимой численности выборки основывается на формуле ее предельной ошибки. Так, при случайном повторном отборе объема необходимой численности выборки получаем в результате преобразования соответствующей формулы:

Таким же образом выводятся формулы для расчета численности выборки при других способах отбора (табл. 6.2). Расчетную величину объема выборки с целью получения запаса точности большую сторону. Для упрощения расчетов при определении объема бесповторной выборки может использоваться формула для повторно выборки, что также дает запас точности.

Иногда на практике задается не величина абсолютной предельной ошибки , величина относительной, выраженная в процентах к средней, . В этом случае формулы для расчета необходимого объема выборки также получаются в результате преобразования соответ-ствующих формул ошибки выборки.

Предельная ошибка — максимально возможное расхождение средних или максимум ошибок при заданной вероятности ее появления.

1. Предельную ошибку выборки для средней при повторном отборе в рассчитывают по формуле:

где t - нормированное отклонение - «коэффициент доверия», который зависит от вероятности, гарантирующей предельную ошибку выборки;

мю х - средняя ошибка выборки.

2. Предельная ошибка выборки для доли при повторном отборе определяется по формуле:

3. Предельная ошибка выборки для средней при бесповторном отборе:

Предельную относительную ошибку выборки определяют как процентное соотношение предельной ошибки выборки к соответствующей характеристике выборочной совокупности. Она определяется таким образом:

Малая выборка

Теория малых выборок была разработана английским статистиком Стьюдентом в начале 20 века. В 1908 г. он выявил специальное распределение, которое позволяет и при малых выборках соотносить t и доверительную вероятность F(t). При n больше 100 дают такие же результаты, что и таблицы интеграла вероятностей Лапласа, при 30 < n < 100 различия получаются незначительные. Поэтому на практике к малым выборкам относятся выборки объемом менее 30 единиц.

Средняя ошибка выборки всегда присутствует в выборочных исследованиях и появляется вследствие того, что обследуются не все единицы статистической совокупности, а лишь ее часть.

Средняя ошибка выборки превращается в предельную ошибку Δ при умножении ее на коэффициент доверияt , который задается предварительно, исходя из требуемой точности наблюдения. Предельная ошибка позволяет судить об «истинном» размере параметра в генеральной совокупности с определенной степенью вероятности

При типическом и серийном отборе, при расчете ошибки выборки вместо общей дисперсии (σ 2 ) следует использовать среднюю из внутригрупповых дисперсий и межгрупповую дисперсию
, где
- частная дисперсия i группы,объем i группы

Формулы предельной ошибки случайной выборки при определении средней

Для повторного отбора

Формулы предельной ошибки случайной выборки при определении доли

Для повторного отбора

Для бесповторного отбора

Формулы численности случайной выборки при определении средней величины

Формулы численности случайной выборки при определении доли изучаемого признака

Предельная разница между генеральной и выборочной средней соответствует величине предельной ошибки

Значения вероятности и соответственно t находятся по таблицам распределения:

Стьюдента (в случае малой выборки)

Формулы случайной выборки подходят и для механической выборки.

При необходимости округления, при случайной выборке – округление в большую сторону, при механической – в меньшую.

Малая выборка

Если численность выборочной совокупности не более 30 единиц, то средняя ошибка малой выборки при определении средней величины рассчитывается по формуле:

Для расчета ошибки малой выборки применяется уточненная формула дисперсии

Типы задач выборочного наблюдения

определение ошибки выборки,

определение численности выборочной совокупности n ,

определение вероятности того, что выборочная средняя (или доля) отклонится от генеральной не более, чем на заданную величину t=Δ/μ,

оценка случайности расхождений показателей выборочных наблюдений,

перенос выборочных характеристик на генеральную совокупность.

Проверка гипотез о средней и доле

Оценка случайности расхождений показателей выборочных наблюдений

Методы переноса выборочных данных на генеральную совокупность

метод взвешивания;

метод перевзвешивания;

метод заполнения случайным подбором в классах замещения.

Понятие о выборочном наблюдении.

При статистическом методе наблюдения возможно применение двух методов наблюдения: сплошного, охватывающего все единицы совокупности, и выборочного (несплошного).

Под выборочным понимается метод исследования, связанный с установлением обобщающих показателей совокупности по некоторой ее части на основе метода случайного отбора.

При выборочном наблюдении обследованию подвергается сравнительно небольшая часть всей совокупности (5-10%).

Вся совокупность, подлежащая обследованию, называется генеральной совокупностью .

Отобранная из генеральной совокупности часть единиц, подвергающаяся обследованию, называется выборочной совокупностью или выборкой.

Показатели, характеризующие генеральную и выборочную совокупность:

1) Доля альтернативного признака;

В генеральной совокупности доля единиц, обладающих каким-либо альтернативным признаком, обозначается буквой «Р».

В выборочной совокупности доля единиц, обладающих каким-либо альтернативным признаком, обозначается буквой «w».

2) Средний размер признака;

В генеральной совокупности средний размер признака обозначается буквой (генеральная средняя).

В выборочной совокупности средний размер признака обозначается буквой (выборочная средняя).

Определение ошибки выборки.

Выборочное наблюдение основано на принципе равной возможности попадания единиц генеральной совокупности в выборочную. Это позволяет избежать систематических ошибок наблюдения. Однако, в связи с тем, что исследуемая совокупность состоит из единиц с варьирующими признаками, состав выборки может отличаться от состава генеральной совокупности, вызывая расхождения между генеральными и выборочными характеристиками.

Такие расхождения называются ошибками репрезентативности или ошибками выборки.

Определение ошибки выборки – основная задача, решаемая при выборочном наблюдении.

В математической статистике доказывается, что средняя ошибка выборки определяется по формуле:

Где m - ошибка выборки;

s 2 0 – дисперсия генеральной совокупности;

n – количество единиц выборочной совокупности.

На практике для определения средней ошибки выборки используется дисперсия выборочной совокупности s 2 .

Между генеральной и выборочной дисперсиями существует равенство:

(2).

Из формулы (2) видно, что генеральная дисперсия больше выборочной на величину (). Однако при достаточно большой величине выборки это соотношение близко к единице, поэтому можно записать, что

Однако такая формула для определения средней ошибки выборки применяется только при повторном отборе.

На практике обычно применяется бесповторный отбор и средняя ошибка выборки рассчитывается несколько иначе, так как численность выборки в ходе исследования сокращается:

(4)

где n – численность выборочной совокупности;

N – численность генеральной совокупности;

s 2 - выборочная дисперсия.

Для доли альтернативного признака средняя ошибка выборки при бесповторном отборе определяется по формуле:

(5), где

w (1-w) - средняя ошибка выборочной доли альтернативного признака;

w – доля альтернативного признака выборочной совокупности.

При повторном отборе средняя ошибка доли альтернативного признака определяется по упрощенной формуле:

(6)

Если численность выборки не превышает 5%, средняя ошибка выборочной доли и выборочной средней определяется по упрощенным формулам (3) и (6).

Определение средней ошибки выборочной средней и выборочной доли необходимо для установления возможных значений генеральной средней (х) и генеральной доли (Р) на основе выборочной средней (х) и выборочной доли (w).

Одно из возможных значений, в пределах которого находится генеральная средняя, определяется по формуле:

Для генеральной доли этот интервал можно записать в виде:

(8)

Полученные таким образом характеристики доли и средней в генеральной совокупности отличаются от величины выборочной доли и выборочной средней на величину m. Однако гарантировать это можно не с полной уверенностью, а лишь с определенной степенью вероятности.

В математической статистике доказывается, что пределы значений характеристик генеральной и выборочной средней отличаются на величину m лишь с вероятностью 0,683. Следовательно, только в 683 случаях из 1000 генеральная средняя находится в пределах х= х m х, в остальных случаях она выйдет за эти пределы.

Вероятность суждений можно повысить, если расширить пределы отклонений, приняв в качестве меры среднюю ошибку выборки, увеличенную в t раз.

Множитель t называют коэффициентом доверия. Он определяется в зависимости от того, с какой доверительной вероятностью надо гарантировать результаты исследования.

Математик А.М.Ляпушев рассчитал различные значения t , которые обычно приводятся в готовых таблицах.