Оценивание параметров
и проверка гипотез
о нормальном распределении
Оглавление
Исходные данные задачи *
Построение интервального вариационного ряда распределения *
Графическое изображение вариационных рядов *
Анализ графиков и выводы *
Расчет теоретической нормальной кривой распределения *
Проверка гипотез о нормальном законе распределения *
Продолжительность горения электролампочек (ч) следующая:
750 | 750 | 756 | 769 | 757 | 767 | 760 | 743 | 745 | 759 |
750 | 750 | 739 | 751 | 746 | 758 | 750 | 758 | 753 | 747 |
751 | 762 | 748 | 750 | 752 | 763 | 739 | 744 | 764 | 755 |
751 | 750 | 733 | 752 | 750 | 763 | 749 | 754 | 745 | 747 |
762 | 751 | 738 | 766 | 757 | 769 | 739 | 746 | 750 | 753 |
738 | 735 | 760 | 738 | 747 | 752 | 747 | 750 | 746 | 748 |
742 | 742 | 758 | 751 | 752 | 762 | 740 | 753 | 758 | 754 |
737 | 743 | 748 | 747 | 754 | 754 | 750 | 753 | 754 | 760 |
740 | 756 | 741 | 752 | 747 | 749 | 745 | 757 | 755 | 764 |
756 | 764 | 751 | 759 | 754 | 745 | 752 | 755 | 765 | 762 |
Необходимо построить интервальный вариационный ряд распределения.
Построение интервального вариационного ряда распределения
Max: 769
Min: 733
R=769-733=36
H= R / 1+3,32 lg n=36/(1+3,32lg100)=4,712
A1= x min - h/2=730,644
B1=A1+h; B2=A2+h
Необходимо определить выборочные характеристики по вариационному ряду, а именно среднюю арифметическую (x ср.), центральные моменты (мю к, к=1,4), дисперсию (S^2), среднее квадратическое отклонение (S), коэффициенты асимметрии (Ас) и эксцесса (Ек), медиану (Ме), моду (Мо), коэффициент вариации(Vs).
D i=(xi- xср)
xср =е xi mi/е mi
xср = 751,7539
Выборочный центральный момент К-го порядка равен M k = ( xi - x)^k mi/ mi
В данном примере:
Центр момент 1 | 0,00 |
Центр момент 2 | 63,94 |
Центр момент 3 | -2,85 |
Центр момент 4 | 12123,03 |
Выборочная дисперсия S^2 равна центральному моменту второго порядка:
В данном примере:
S^2=63,94
Выборочное средне квадратическое отклонение:
В данном примере:
S= 7,996
Выборочные коэффициенты асимметрии Ас и эксцесса Fk по формулам
Ac = m3/ S^3;
В данном примере:
Ас =-0,00557
Ek = m4/ S^4 -3;
В данном примере:
Ek = -0,03442
Медиана Ме - значение признака x (e), приходящееся на середину ранжированного ряда наблюдений (n = 2l -1). При четном числе наблюдений( n= 2l) медианой Ме является средняя арифметическая двух значений, расположенных в середине ранжированного ряда: Me=( x(e) + x( e+1) /2
Исходя из интервального ряда, медиана вычисляется по формуле:
Me= a me +h * ( n/2 - mh( me-1) / m me
где mе- означает номер медианного интервала, ( mе -1) - интервала, предшествующего медианному.
В данном примере:
Me=751,646
Мода Мо соответствует значению признака с большей частотой.
Для одно-модального интервального ряда вычисление моды можно производить по формуле
Mo= a mo + h * ( m mo- m(mo-1))/2 m mo- m( mo-1) - m( mo+1)
где мо означает номер модального интервала (интервала с наибольшей частотой), мо-1, мо+1- номера предшествующего модальному и следующего за ним интервалов.
В данном примере:
Mo = 751,49476
Так как Хср, Mo Me почти не отличаются друг от друга, есть основания предполагать теоретическое распределение нормальным.
Коэффициент вариации Vs = S/ x * 100 %= 3.06%
В нашем примере:
Vs= 1,06%
Необходимо построить гистограмму, полигон и кумуляту.
Графическое изображение вариационных рядов
Полигон и кумулята используются как для изображения дискретных, так и интервальных рядов, гистограмма – для изображения только интервальных рядов. Чтобы построить графики необходимо записать вариационные ряды распределения (интервальный и дискретный) относительных частот. Wi=mi/n, накопленных относительных частот Whi и найдем отношение Wi/h
Вариационные ряды изображают графически, для визуального подбора теоретического распределения, а также выявления положения среднего значения (x ср.) и характера рассеивания (S^2 и S).
Интервалы xi Wi Whi Wi/h
Ai-bi
1 2 3 4 5
4,97-5,08 5,03 0,02 0.02 0,18
5,08-5,19 5,14 0,03 0,05 0,27
5,19-5,30 5,25 0.12 0,17 1,09
5,30-5,41 5,36 0,19 0,36 1,73
5,41-5,52 5,47 0,29 0,65 2,64
5,52-5,63 5,58 0,18 0,83 1,64
5,63-5,74 5,69 0,13 0,96 1,18
5,74-5,85 5,80 0,04 1,00 0,36
- 1,00 - |
Чтобы создать гистограмму относительных частот (частостей) на оси абсцисс необходимо отложить частичные интервалы, на каждом из которых строим прямоугольник, площадь которого равна относительной частоте Wi данного i-го интервала. Тогда высота элементарного прямоугольника должна быть равна Wi/h,. Следовательно, позади под гистограммой равна сумме всех относительных частот, т.е. единице.
Из гистограммы можно получить полигон того же распределения. Если середины верхних оснований прямоугольников соединить отрезками прямой.
Необходимо проанализировать форму ряда распределения по виду гистограммы и полигона, а также по значениям коэффициентов Ас и Ек.
По виду гистограммы и полигона можно судить о гипотическом законе распределения. Полигон гистограмма также характеризуются как аппроксимация кривой плотности
Для интервального ряда по оси абсцисс откладывают интервалы .
Чтобы построить кумуляту дискретного ряда по оси абсцисс откладывают значения признака xi, а по оси ординат – накопленные относительные частоты Whi. С кумулятой сравнивается график интегральной функции распределения F(x).
Коэффициенты асимметрии и эксцесса не сильно отличаются от нуля. Коэффициент асимметрии отрицателен (Ас=-0,005) это говорит о небольшой левосторонней асимметрии данного распределения. Эксцесс также отрицательный (Ек= -0,034). Так как кривая, изображающая ряд распределения, по сравнению с нормальной, имеет несколько более плоскую вершину. Вид гистограмма и полигон напоминают кривую нормального распределения (рис.1.1 и 1.2.). В следствии всего выше сказанного можно выдвинуть гипотезу о том, что распределение продолжительности горения электролампочек является нормальным.
Расчет теоретической нормальной кривой распределения
Покажем один из способов расчета теоретического нормального распределения по двум найденным выборочным характеристикам x и S эмпирического ряда.
При нахождении теоретических частот m^тi за оценку математического ожидания (мю) и среднего квадратического отклонения G нормального закона распределения принимают значения соответствующих выборочных характеристик x ср. и S, т.е. (мю)=Xср.= 751,7539; G=S=7,99.
Теоретические частоты находят по формуле: M^i=npi, где n – объем; Pi – величина попадания значения нормально распределенной случайной величины в i-й интервал.
Вероятность Pi определяется по формуле
Pi=P(ai<x<=bi)=1/2[Ф(t2i)-Ф(t1i)], где Ф(t)=2 2(пи)=интегралу с границами от (0;t) е^x2/2dx - интегральная функция Лапласа – находится по таблице для
T2i=bi-x ср. S
T1i=ai-x ср.S
Таблицы. Для вычисления вероятности нормальной кривой распределения
Интервалы | Mi | T1 | T2 | 1/2Ф(T1) | 1/2Ф(T2) | Pi | |
a(i) | b(i) | ||||||
730,644 | 735,356 | 2 | -2,640 | -2,051 | 0,4958 | 0,4798 | -0,0080 |
735,356 | 740,068 | 8 | -2,051 | -1,461 | 0,4798 | 0,4279 | -0,0260 |
740,068 | 744,780 | 6 | -1,461 | -0,872 | 0,4279 | 0,3078 | -0,0601 |
744,780 | 749,492 | 18 | -0,872 | -0,283 | 0,3078 | 1,1103 | 0,4013 |
749,492 | 754,204 | 35 | -0,283 | 0,306 | 0,0300 | 0,6619 | 0,3160 |
754,204 | 758,916 | 12 | 0,306 | 0,896 | 0,1179 | 0,3133 | 0,0977 |
758,916 | 763,628 | 11 | 0,896 | 1,485 | 0,3133 | 0,4306 | 0,0587 |
763,628 | 768,340 | 6 | 1,485 | 2,074 | 0,4306 | 0,4808 | 0,0251 |
768,340 | 773,052 | 2 | 2,074 | 2,664 | 0,4808 | 0,4960 | 0,0076 |
Pi*n | Mi(теор) | Mi(теор)/h | Mi(теор)накоп | ||||
-0,8000 | 1 | 0,002 | 0,0080 | ||||
-2,5950 | 3 | 0,006 | 0,0340 | ||||
-6,0050 | 6 | 0,013 | 0,0940 | ||||
40,1250 | 40 | 0,085 | 0,4953 | ||||
31,5950 | 32 | 0,068 | 0,8153 | ||||
9,7700 | 10 | 0,021 | 0,9130 | ||||
5,8650 | 6 | 0,012 | 0,9716 | ||||
2,5100 | 3 | 0,005 | 0,9967 | ||||
0,7600 | 1 | 0,002 | 1,0000 | ||||
100 |
Сравнивая гистограммы и нормальную кривую можно заметить согласованность между теоретическим и эмпирическим распределением.
Проверка гипотез о нормальном законе распределения
Для проверки распределения частот эмпирического ряда распределения по нормальному закону используют критерий X^2, основанный на сравнении эмпирических частот mi с теоретическими m^тi, которые можно получить при принятии определенной нулевой гипотезы.
Значение X^2набл. – наблюдаемое значение критерия, полученное по результатам наблюдений, равно к – число интервалов (после объединения); M^i – теоретические частоты; F^2набл.= (mi-m^тi); I=1 m^i.
Вычисление критерия X^2 при проверке нормальности продолжительности горения электролампочек
Интервалы | Mi(Практ) | Mi(теор) | (Mi-Mi(теор))^2 | …../Mi(теор) | |
a(i) | b(i) | ||||
730,644 | 735,356 | 2 | 2 | 9 | 1,29 |
735,356 | 740,068 | 8 | 5 | ||
740,068 | 744,780 | 6 | 13 | 49 | 3,88 |
744,780 | 749,492 | 18 | 21 | 9 | 0,43 |
749,492 | 754,204 | 35 | 25 | 100 | 4,01 |
754,204 | 758,916 | 12 | 21 | 81 | 3,89 |
758,916 | 763,628 | 11 | 12 | 1 | 0,08 |
763,628 | 768,340 | 6 | 5 | 1 | 0,14 |
768,340 | 773,052 | 2 | 2 | ||
X^2набл | 13,71 |
Проверка гипотезы:
- По таблице распределения найдем xu-квадрат критического значения X^2кр.(альфа для числа степеной свободы V=к-3 и заданного уровня значимости альфа.
- Далее необходимо сравнить X^2кр.
- Если X^2 набл.<=X^2кр., то выдвинутая гипотеза о законе распределения не отвергается (не противоречит опытным данным).
- Если X^2 набл. >X^2кр., то выдвинутая гипотеза о нормальном законе распределения отвергается с вероятностью ошибки a .
Для данного примера X^2набл.=13,71, a =0,005, V=7-3=4 (число интервалов после объединения стало равным 7) и X^2кр. (0,005; 4) =14,9
В связи с тем, что X^2набл.<X^2кр., следует, что согласно критерию Пирсона гипотеза о нормальном законе не отвергается с вероятностью ошибки 0,005. Делаем вывод: распределение продолжительности горения электролампочек является нормальным. Что подтверждают графики и значения моды и медианы.