Скачать .docx Скачать .pdf

Реферат: Контрольная работа: Методика обработки экспериментальных данных 2

Задание на курсовую работу

1. Построить вариационный ряд

2. Рассчитать числовые характеристики статистического ряда:

а) Размах варьирования.

б) Среднее арифметическое значение.

в) Оценки дисперсии.

г) Оценки среднеквадратического отклонения.

д) Мода.

е) Медиана.

ж) Коэффициент вариации.

3. Построить полигон и гистограмму относительных частот.

4. Построить эмпирическую функцию распределения.

5. Построить статистическую проверку гипотезы по нормальному распределению с помощью критерии Пирсона или Колмогорова.

6. Вычислить асимметрию и эксцесс.

7. Построить доверительные интервалы, для математического ожидания и среднеквадратического отклонения для надежности 95%.

8. Выводы.

Данные по выборке вариант 34

-678 -752 -624 -727 -612 -632 -704 -697 -627 -727
-561 -748 -686 -676 -676 -696 -717 -694 -700 -707
-680 -681 -687 -656 -692 -644 -805 -758 -695 -722
-706 -704 -681 -608 -647 -699 -658 -686 -689 -643
-701 -716 -731 -623 -693 -703 -731 -700 -765 -697
-662 -705 -667 -677 -701 -678 -667 -673 -697 -701
-597 -716 -689 -694 -695 -729 -700 -717 -647 -673
-690 -578 -703 -688 -666 -670 -671 -693 -688 -646
-667 -689 -711 -731 -604 -691 -675 -686 -670 -703
-696 -702 -660 -662 -681 -666 -677 -645 -746 -685

1. Построение вариационного ранжированного ряда

Сортируем экспериментальные данные по возрастанию. Получаем вариационный ряд.

Таблица 1

-805 -727 -705 -700 -695 -689 -681 -673 -662 -632
-765 -727 -704 -700 -694 -688 -680 -671 -660 -627
-758 -722 -704 -700 -694 -688 -678 -670 -658 -624
-752 -717 -703 -699 -693 -687 -678 -670 -656 -623
-748 -717 -703 -697 -693 -686 -677 -667 -647 -612
-746 -716 -703 -697 -692 -686 -677 -667 -647 -608
-731 -716 -702 -697 -691 -686 -676 -667 -646 -604
-731 -711 -701 -696 -690 -685 -676 -666 -645 -597
-731 -707 -701 -696 -689 -681 -675 -666 -644 -578
-729 -706 -701 -695 -689 -681 -673 -662 -643 -561

Вывод: Вариационный ряд послужит нам для облегчения дальнейших расчетов, и для определения относительных частот и разделения на интервалы и расчета ряда числовых характеристик.

2. Расчет числовых характеристик статистического ряда

2.1 Размах варьирования

Размах варьирования вычисляется по формуле:

(2.1)

где R – размах варьирования;

x max – максимальный элемент вариационного ряда;

xmin – минимальный элемент вариационного ряда;

x max = – 561

xmin = -805

R = -561+805=244

2.2 Среднеарифметическое значение статистического ряда


(2.2)

где ni – частота варианты xi ;

xi – варианта выборки;

n = ∑ ni – объем выборки;

Распределение выборки представлено в таблице 2.

Таблица 2

Xi n Xi n Xi n Xi n Xi n Xi n Xi n
-805 1 -717 2 -700 3 -689 3 -675 1 -647 2 -608 1
-765 1 -716 2 -699 1 -688 2 -673 2 -646 1 -604 1
-758 1 -711 1 -697 3 -687 1 -671 1 -645 1 -597 1
-752 1 -707 1 -696 2 -686 3 -670 2 -644 1 -578 1
-748 1 -706 1 -695 2 -685 1 -667 3 -643 1 -561 1
-746 1 -705 1 -694 2 -681 3 -666 2 -632 1
-731 3 -704 2 -693 2 -680 1 -662 2 -627 1
-729 1 -703 3 -692 1 -678 2 -660 1 -624 1
-727 2 -702 1 -691 1 -677 2 -658 1 -623 1
-722 1 -701 3 -690 1 -676 2 -656 1 -612 1

2.3 Оценка дисперсии

(2.3)

где s2 – несмещенная оценка генеральной дисперсии;

2.4 Оценка среднего квадратического отклонения

(2.4)


2.5 Определение моды

Модой называют варианту с наибольшей частотой повторений.

Из таблицы 2 находим, что наибольшую частоту n =3имеют варианты x = -731, x = -703,x = -701,x = -700,x = -697, x = -689,x = -686, x = -681, x = -667.

2.6 Определение медианы

Если количество вариант число четное, то медиана вычисляется по формуле:

МВ =( xk + xk +1 )/2 (2.5.)

где xk – пятидесятый член вариационного ряда;

x k+1 – пятьдесят первый член вариационного ряда;

n Количество вариант и n =2* k

МВ =( xk + xk +1 )/2=(-689–689)/2= -689

2.7 Расчет коэффициента вариации

Расчет коэффициента вариации проведем по формуле:

(2.6)

Вывод:

Размах варьирования является простейшей характеристикой рассеяния вариационного ряда.

Для того чтобы охарактеризовать рассеяние значений количественного признака X генеральной совокупности вокруг своего среднего значения, вводят сводные характеристики – генеральную дисперсию и средним квадратическим отклонением.

Коэффициент вариации служит для сравнения величин рассеяния по отношению к выборочной средней двух вариационных рядов: тот из рядов имеет большее рассеяние, у которого коэффициент больше (эта величина безразмерная поэтому он пригоден для сравнения вариационных рядов, варианты которых имеют различную размерность.

В целом числовые характеристики служат для сравнения рассеяния вариационных рядов в сравнении с аналогичными числовыми характеристиками других вариационных рядов.

3. Построение полигона и гистограммы относительных частот

Для построения гистограммы и полигона относительных частот поделим вариационный ряд (табл. 1) на частичные интервалы. Результаты занесем в таблицу 3.

Таблица 3

Номер интервала

I

Частичный интервал xi –xx +1

Сумма относительных частот

wi

Плотность частот

xi xx +1
1 -805 -780,6 0,01 0,00041
2 -780,6 -756,2 0,02 0,00082
3 -756,2 -731,8 0,03 0,00123
4 -731,8 -707,4 0,12 0,00492
5 -707,4 -683 0,4 0,01639
6 -683 -658,6 0,24 0,00984
7 -658,6 -634,2 0,08 0,00328
8 -634,2 -609,8 0,05 0,00205
9 -609,8 -585,4 0,03 0,00123
10 -585,4 -561 0,02 0,00082

По таб. 3 строим гистограмму относительных частот (рис. 1).

Полигон получаем соединением вершин столбцов гистограммы. (рис. 1) Полигон получаем соединением вершин столбцов гистограммы.


Рис 1.

Вывод: Полигон и гистограмму – графики статистического распределения строят для наглядности относительных частот в выборке.

4. Построение эмпирической функции распределения

Эмпирическая функция распределения выборки находится по формуле:

(4.1)

где nx – число вариант меньших х ;

n объем выборки.

По формуле (4.1) построим эмпирическую функцию распределения.

Для более точного и правильного построения возьмем середины интервалов:

F(x) Интервал
0 X< -792,8
0,01 -792,8 <x< -768,4
0,02 -768,4 <x< -744
0,03 -744 <x< -719,6
0,05 -719,6 <x< -695,2
0,08 -695,2 <x< -670,8
0,12 -670,8 <x< -646,4
0,19 -646,4 <x< -622
0,27 -622 <x< -597,6
0,41 -597,6 <x< -573,2
0,67 -573,2 <x< -548,8
1 x> -548,8

Вывод:

Итак, эмпирическая функция распределения выборки служит для оценки теоретической функции распределения генеральной совокупности

5. Статистическая проверка гипотезы о нормальном распределении с помощью критерия Пирсона или Колмагорова

Проверку проводим с помощью критерия Пирсона.

В этом задании, с помощью критерии Пирсона проверим гипотезу о нормальном распределении генеральной совокупности, с этой целью будем сравнивать эмпирические и теоретические частоты.

– Среднее арифметическое значение

– Количество вариантов

– Шаг интервалов

– Оценка среднеквадратического отклонения.

Вычислим данные по таблице:

I ni Xi X (i+1) Zi Z (I+1)

1 1 -805 -780,6 -2,7340 -0,5 -0,469 3,1 1,4226 0,3226
2 1 -780,6 -756,2 -2,7340 -2,1140 -0,469 -0,408 6,1 4,2639 0,1639
3 4 -756,2 -731,8 -2,1140 -1,4941 -0,408 -0,285 12,3 5,6008 1,3008
4 7 -731,8 -707,4 -1,4941 -0,8741 -0,285 -0,099 18,6 7,2344 2,6344
5 26 -707,4 -683 -0,8741 -0,2542 -0,099 0,1141 21,31 1,0322 31,7222
6 33 -683 -658,6 -0,2542 0,3658 0,1141 0,2939 17,98 12,5473 60,5673
7 14 -658,6 -634,2 0,3658 0,9857 0,2939 0,4131 11,92 0,3630 16,4430
8 8 -634,2 -609,8 0,9857 1,6057 0,4131 0,4713 5,82 0,8166 10,9966
9 3 -609,8 -585,4 1,6057 2,2256 0,4713 0,4927 2,14 0,3456 4,2056
10 3 -585,4 -561 2,2256 0,4927 0,5 0,73 7,0588 12,3288
СУММА 100 100 40,6851 140,6851

X2 набл =40,685

Контроль: 140,685–100=40,685

Исходя из требований, чтобы вероятность попадания критерия в критическую область в предположении справедливости нулевой гипотезы была равна принятому уровню значимости .

Таким образом, правосторонняя критическая область определяется неравенством , а область принятия нулевой гипотезы – неравенством.

Уровень значимости = 0,05;

По таблице критических точек распределения χ² (приложение 3), по уровню значимости α = 0,05 и числу степеней свободы K=10–3=7 находим критическую точку правосторонней критической области χ²кр (0,05; 7) = 14,1.

Вывод: Так как X2 набл > X2 кр, то нулевую гипотезу отвергают, значит гипотезу о нормальном распределении отвергают.


6. Расчет асимметрии и эксцесса

Асимметрия – отношение центрального момента 3-го порядка к кубу среднего квадратического отклонения.

, где

Эксцесс – характеристика «крутости» рассматриваемой случайной величины.

, где

Значение ХВ, s вычисляем по формулам:

,

где С – Ложный нуль (варианта, которая имеет наибольшую частоту).

,

где h – шаг (разность между двумя соседними вариантами);

(условный момент второго порядка);

(условный момент первого порядка);

(условная варианта).

Расчеты занесем в таблицу 7:


Xi Ni Ui XB M1 M2 s m3 m4 AS EK
-805 1 -2,73 -684,67 0,30 1,06 23,97 3433,28 4193007,72 0,25 12,71
-780,6 1 -2,11
-756,2 4 -1,49
-731,8 7 -0,87
-707,4 26 -0,25
-683 33 0,37
-658,6 14 0,99
-634,2 8 1,61
-609,8 3 2,23
-585,4 3 2,85

Вывод:

Т.к. асимметрия положительна то ‘длинная часть’ кривой распределения расположена справа от математического ожидания или мода.

Т.к. Эксцесс больше нуля, то кривая распределения имеет более высокую и ‘острую’ вершину, чем нормальная кривая.

7. Построение доверительного интервала для математического ожидания и среднего квадратического отклонения

Доверительный интервал для математического ожидания (с вероятностью g) находят как:

(7.1)

где n – объем выборки;

t g – случайная величина имеющее распределение Стьюдента находим по приложению 1.

s – исправленное среднее квадратическое отклонение;

– выборочное среднее;

Найдем интервал:

по приложению 1 находим t g = 1.984 при g = 0.95 и n = 100 ;

=-684,67; s = 38,19 ;

Получаем

-692,25<a<-677.09

Доверительный интервал для среднего квадратического отклонения

(с надежностью g) находят как:

при q <1 (7.2)

при q >1 (7.3)

где q находят по приложению 2, по заданным n и g ;

Исходя из приложения 2, n = 100 и g = 0.95 находим q =0.143;

Поэтому интервал находим по формуле (7.2):

38.19(1-0.143)<<38.19(1+0.143) 35,58(1+0.143)

32.73 << 43.65

Вывод:

Итак, с надежностью 0,95 неизвестное математическое ожидание ‘а’ находится в доверительном интервале -692,25<a<-677.09, а неизвестное среднее квадратическое отклонение ‘ ’ находиться в доверительном интервале 32.73 << 43.65.

Вывод

Для представления генеральной совокупности я исследовала выборку, которая имеет объём 100 элементов.

Я нашла:

размах варьирования R = 244;

среднеарифметическое значение статистического ряда =-684,67;

несмещенную оценку генеральной дисперсии s 2 = 1458,99;

среднее квадратическое отклонение s = 38,19;

медиану МВ = -689 и коэффициент вариации V= 5,58%.

С надежностью 0.95 оценил математическое ожидание в интервале

-692,25<а < -677,09

и среднее квадратическое отклонение в интервале

32,73 << 43,65

Выборка имеет варианты x = -731, x = -703,x = -701,x = -700,x = -697, x = -689,x = -686, x = -681, x = -667, которые встречаются 3 раза.

На рис. 1 построила гистограмму и полигон относительных частот. По рис. 1 можно выдвинуть гипотезу о нормальном распределении генеральной совокупности.

После проверки гипотезы о нормальном распределении с помощью критерия Пирсона при a=0.05, я отвергла ее. Из этого следует, что расхождения между практическими и теоретическими частотами значимо.

Асимметрия as =0,25. Из этого следует, что правое крыло функции более вытянуто относительно ее моды.

Эксцесс ek =12,71. Из-за того, что у эксцесса положительный знак, эмпирическая функция распределения острее по сравнению с теоретическим распределением.


Список литературы

1. Гмурман В.Е. Руководство к решению задач по теории вероятностей и математической статистике. М.: Высшая школа, 2001.

2. Гмурман В.Е. Теория вероятностей и математическая статистика.

М.: Высшая школа, 2001.