Скачать .docx Скачать .pdf

Курсовая работа: Планирование и организация эксперимента

Министерство образования и науки Российской Федерации Государственное общеобразовательное учреждение высшего профессионального образования «Национальный исследовательский ТОМСКИЙ ПОЛИТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ»

Институт - кибернетики

Направление (специальность) - метрология, стандартизация, сертификация

Кафедра - компьютерных измерительных систем и метрологии

ПЛАНИРОВАНИЕ И ОРГАНИЗАЦИЯ ЭКСПЕРИМЕНТА

Курсовая работа по дисциплине «Планирование и организация эксперимента»

Вариант № 1

Выполнил __________________ М.В. Волкова

(дата)

студент гр. 1Г70 __________________

(роспись)

Проверил ___________________ В.Ю. Серик

(дата)

доцент кафедры КИСМ ___________________

(роспись)

Томск – 2010

МинистерствообразованияинаукиРоссийскойФедерацииГосударственноеобщеобразовательноеучреждениевысшегопрофессиональногообразования «НациональныйисследовательскийТОМСКИЙПОЛИТЕХНИЧЕСКИЙУНИВЕРСИТЕТ»

Институт кибернетики.

Кафедра компьютерных измерительных систем и метрологии.

ЗАДАНИЕ

на выполнение курсовой работы

Студенту гр. 1Г70 Болтовской Ольге Аркадьевне

1. Тема курсовой работы: «Планирование и организация эксперимента. Вариант №1».

2. Срок сдачи студентом готовой работы: 01.12.2010 .

3. Исходные данные к работе:

3.1. программная оболочка для моделирования экспериментальной установки, в среде MatLab – генератор случайных чисел;

3.2. генератор отклика для эксперимента.

4. Содержание текстового документа (перечень подлежащих разработке вопросов)

4.1. Составить план эксперимента по определению характеристик случайной величины: определить вид распределения, получить точечные и интервальные оценки параметров распределения, определить объем выборки для получения оценок с заданной точностью. Указание : Программа генерирует выборки заданного объема для непрерывной случайной величины. При этом возможны распределения вида: нормальное, равномерное, экспоненциальное, Рэлея.

4.2. Составить план эксперимента по выяснению регрессионной зависимости, осуществить компьютерный эксперимент и провести статистическую обработку его результатов. Указание : Использовать факторные планы.

5. Перечень графического материала (с точным указанием обязательных чертежей)

5.1. Гистограмма, функция плотности распределения, эмпирическая функция распределения, теоретическая функция распределения (задание 1)

5.2. Таблица факторного плана, регрессия (задание 2).

6. Консультанты по разделам выпускной квалификационной работы (с указанием разделов) – Казаков В.Ю. (по всем разделам).

7. Дата выдачи задания на выполнение выпускной квалификационной работы (курсового проекта, работы) – 01.10.10 .

Руководитель ______________ (Казаков В.Ю.)

Задание принял к исполнению ______________ (Болтовская О.А.)

(подпись, дата)

Содержание

стр.
Введение 4
1 Эксперимент по определению характеристик случайной величины 5
1.1 Предварительный анализ данных 5
1.2 Определение вида распределения 6
1.2.1 Построение гистограммы 6
1.2.2 Формулировка проверяемой гипотезы 8
1.2.3 Проверка гипотезы о нормальности распределения с помощью графического метода 9
1.2.4 Критерий Колмогорова-Смирнова, модифицированный для проверки нормальности распределения 11
1.3 Получение точечных и интервальных оценок параметров распределения 12
1.3.1 Сущность задачи точечного и интервального оценивания параметров 12
1.3.2 Точечные оценки параметров распределения 13
1.3.3 Определение объема выборки для получения оценок с заданной точностью 14
1.3.4 Интервальная оценка математического ожидания 15
1.3.5 Проверка гипотезы о равенстве математического ожидания заданному значению 16
1.3.6 Интервальная оценка дисперсии 17
1.3.7 Проверка гипотезы о равенстве дисперсии заданному значению 18
1.4 Построение графиков функции плотности распределения, графиков эмпирической и теоретической функций распределения 19
1.4.1 Функция плотности распределения 19
1.4.2 Теоретическая функция распределения 20
1.4.3 Эмпирическая функция распределения 21
2 План эксперимента по выяснению регрессионной зависимости 22
Заключение 32
Список использованной литературы 33
Приложение А 34
Приложение Б 36

Введение

Планирование и организация эксперимента играет большую роль в современном мире. Оно имеет практическое значение в различных сферах деятельности человека.

Планирование и организация эксперимента позволяет повысить эффективность статистических методов контроля качества и управления качеством, широко применяемых в настоящее время во многих странах.

Наряду с контролем продукции нередко требуется провести контроль параметров технологических процессов. Эта задача может быть решена путем проверки статистических гипотез. Однако, наибольшего эффекта, можно добиться не контролем параметров качества, а такой организацией производственных процессов, при которой брак продукции не производится.

Поэтому целью данной курсовой работы является ознакомление с основными этапами планирования эксперимента и применение их на практике для определения вида распределения генеральной совокупности и определения ее основных параметров, а также для проведения регрессионного анализа.


1 Эксперимент по определению характеристик случайной величины

1.1 Предварительный анализ данных

Для того чтобы сформулировать гипотезу о виде распределения, необходимо использовать априорную информацию. В нашем случае, дана выборка из неизвестной генеральной совокупности, физическое происхождение ни выборки, ни генеральной совокупности неизвестно. Следовательно, чтобы предположить вид распределения, необходимо построить гистограмму по полученным значениям выборки. Для получения наиболее четкой картины предполагаемого распределения возьмем выборку n=500 (Приложение А) и выполним построение гистограммы с помощью программы STATISTICA с количеством интервалов равным 10.

Рисунок 1 – Гистограмма, полученная в программе STATISTICA

По построенной гистограмме можно предположить, что данная выборка распределена по нормальному закону.

1.2 Определение вида распределения

Знание закона распределения вероятностей для практического применения методов теории вероятностей и математической статистики чрезвычайно важно. Предварительная обработка результатов измерений и наблюдений необходима для того, чтобы в дальнейшем при построении эмпирических зависимостей (функции отклика), с наибольшей эффективностью использовать статистические методы и корректно анализировать полученные результаты.

Любая обработка результатов наблюдений в первую очередь должна отвечать на вопрос определения вида распределения вероятностей обрабатываемого ряда случайных величин. На практике данная проблема обычно формулируется выдвижением статистической гипотезы. Задача первичного исследования — принять или отклонить выдвинутую гипотезу.

Чтобы предположить конкретный вид распределения сгенерированной программой случайной величины, необходимо построить гистограмму.

1.2.1 Построение гистограммы

Для построения гистограммы по данным из Приложения А выполним следующие действия:

a) По полученной выборке построим вариационный ряд, т.е. преобразуем данные в порядке неубывания {Xi }.

b) Определим число интервалов группирования по формуле k = 1 + 3,32lg(500) ≈ 10. Рекомендации по выбору количества интервалов указаны в книге [1].

c) Вычислим ширину интервала группирования по формуле (1):

(1)

где Xmax – Xmin = R =26,873 - размах.

d) Разбиваем вариационный ряд на интервалы:

m1 : [-12,141; -9,4537); m6 : [1,2955; 3,9828);

m2 : [-9,4537; -6,7664); m7 : [3,9828; 6,6701);

m3 : [-6,7664; -4,0791); m8 : [6,6701; 9,3574);

m4 : [-4,0791; -1,3918); m9 : [9,3574; 12,0447);

m5 : [-1,3918; 1,2955); m10 : [12,0447; 14,732].

e) Определяем nj – число значений Х из вариационного ряда, попавших в j–ый интервал группирования.

n1 = 6; n6 = 100;

n2 = 15; n7 = 89;

n3 = 41; n8 = 58;

n4 = 63; n9 = 25;

n5 = 97; n10 = 6.

f) Строим гистограмму для данной выборки.

Рисунок 2 – Гистограмма

Следует отметить, что при построении гистограммы по оси абсцисс откладывают величины границ интервалов группирования, а по оси ординат - частоту попадания измеренной величины хi в j-ый интервал.

Согласно полученной гистограмме можно предположить, что данный закон распределения является нормальным. Для подтверждения или опровержения данного высказывая нам необходимо сформулировать гипотезу о виде распределения случайной величины и проверить ее с помощью специальных критериев.

1.2.2 Формулировка проверяемой гипотезы

Сформулируем нулевую гипотезу:

Н0 : Выборка из генеральной совокупности распределена по нормальному закону.

Альтернативная гипотеза

Н1 : Выборка из генеральной совокупности распределена по закону, отличному от нормального.

Как известно, нормальное распределение (распределение Гаусса) - распределение вероятностей случайной величины Х, характеризуемой плотностью вероятности [1]. Теоретической основой нормального закона распределения вероятностей является центральная предельная теорема Ляпунова, утверждающая, что распределение суммы независимых случайных величин с любым исходным распределением будет нормальным, если число слагаемых достаточно велико, а вклад каждого в сумму мал.

Согласно [1] нормальное распределение симметрично относительно точки х = μ и имеет два параметра μ=0 и σ=1, совпадающих со средним значением и стандартным отклонением. Параметр μхарактеризует положение μна оси х, а параметр σ определяет степень рассеяния случайной величины относительно μ.

1.2.3 Проверка гипотезы о нормальности распределения с помощью графического метода

Данный метод основан на построении кумулятивной функции распределения наблюденных значений на бумаге для нормальных вероятностных графиков. Вертикальная ось имеет нелинейную шкалу, соответствующую площади под стандартной функцией нормального распределения и размечена значениями кумулятивной относительной частоты (в %). Другая ось имеет линейную шкалу для упорядоченных значений х. Если кумулятивная функция распределения переменной Х приближается к прямой линии, то распределение переменной Х будет нормальным [2].

Этот подход важен тем, что дает наглядную информацию по типу отклонения от нормального распределения. Чем больше объем выборки, тем более надежны заключения, которые можно вывести из вида графика функции распределения. Именно поэтому мною был выбран этот метод.

Графическая процедура состоит в расположении наблюденных значений (х1 , х2 , …хn ) в неубывающем порядке и затем в нанесении значений вероятности Pk , рассчитанных по формуле (2):

(2)

на бумагу для нормальных вероятностных графиков (где k- порядковый номер х; k=1,…, n).

По данным выборки построим вариационный ряд, рассчитаем значения кумулятивной относительной частоты (в %) и заполним таблицу 1.

Таблица 1 – Данные для построениякумулятивной функции распределения

k xk P, %
1 -12,141 0,124938
2 -11,405 0,324838
3 -10,759 0,524738
4 -10,361 0,724638
5 -9,91 0,924538
496 12,774 99,07546
497 13,832 99,27536
498 13,981 99,47526
499 14,237 99,67516
500 14,732 99,87506

По рассчитанным значениям построим график кумулятивной функции распределения заданной выборки:

Рисунок 3 – Кумулятивная функция распределения

Построенный график представлен набором точек, которые рассеяны около прямой линии - это дает первое подтверждение гипотезе о нормальном распределении генеральной совокупности, из которой взята выборка. Следует также отметить, что в данном случае частотное распределение имеет большую кривизну (график более выпуклый), но это не опровергает гипотезу Н0 . Можно сделать вывод, что гипотеза о нормальном распределении для выборки наблюдений адекватна.

К сожалению, использование только одного критерия для проверки гипотезы о виде распределения не может быть до конца объективным. Поэтому рассмотрим еще один критерий – Колмогорова-Смирнова, модифицированный для проверки нормальности распределения.

1.2.4 Критерий Колмогорова-Смирнова, модифицирован-ный для проверки нормальности распределения

Данный критерий основан на общем критерии Колмогорова-Смирнова и его применение в нашем эксперименте возможно, так как теоретическая функция распределения неизвестна нам с точностью до параметров μ и σ (они будут оцениваться по выборке). Алгоритм проверки гипотезы Н0 аналогичен алгоритму общего критерия, в данном случае меняются только критические значения - используется модифицированная статистика, рассчитываемая по формуле (3):

(3)

критические значения которой (α - уровень значимости) приведены в таблице 2.

Таблица 2 – Критические значения статистики Колмогорова-Смирнова, модифицированной для проверки нормальности распределения

По формулам (4), (5) находим среднее значение и стандартное отклонение для заданной выборки:

(4), (5)

=2,006742, S = 4,8843.

Тогдаzi = . Результаты расчетов сведем в таблицу 3.

Таблица 3 - Результаты расчетов модифицированного критерия Колмогорова - Смирнова

i xi zi Ф(zi ) - Ф(zi ) Ф(zi ) –
1 -12,141 -2,89656 0,001886 0,002 0 0,000114 0,001886
2 -11,405 -2,74588 0,003017 0,004 0,002 0,000983 0,001017
3 -10,759 -2,61362 0,004479 0,006 0,004 0,001521 0,000479
4 -10,361 -2,53213 0,005669 0,008 0,006 0,002331 -0,00033
5 -9,91 -2,4398 0,007348 0,01 0,008 0,002652 -0,00065
6 -9,642 -2,38493 0,008541 0,012 0,01 0,003459 -0,00146
7 -9,396 -2,33456 0,009783 0,014 0,012 0,004217 -0,00222
495 12,29 2,105361 0,98237 0,99 0,988 0,00763 -0,00563
496 12,774 2,204454 0,986254 0,992 0,99 0,005746 -0,00375
497 13,832 2,421065 0,992262 0,994 0,992 0,001738 0,000262
498 13,981 2,451571 0,992888 0,996 0,994 0,003112 -0,00111
499 14,237 2,503984 0,99386 0,998 0,996 0,00414 -0,00214
500 14,732 2,605328 0,995411 1 0,998 0,004589 -0,00259

Из таблицы 3 следует, что:

,

.

=

Далее = 0,59782. Из таблицы 2 имеем = 0,895.

Так как =0,59782 < =0,895, гипотеза нормальности распределения не отклоняется.

1.3 Получение точечных и интервальных оценок параметров распределения

1.3.1 Сущность задачи точечного и интервального оценивания параметров

Точечная оценка предполагает нахождение единственной числовой величины, которая и принимается за значение параметра. Такую оценку целесообразно определять в тех случаях, когда объем экспериментальных данных достаточно велик. Причем не существует единого понятия о достаточном объеме экспериментальных данных, его значение зависит от вида оцениваемого параметра. При малом объеме экспериментальных данных точечные оценки могут значительно отличаться от истинных значений параметров, что делает их непригодными для использования.

Интервальный метод оценивания параметров распределения случайных величин заключается в определении интервала (а не единичного значения), в котором с заданной степенью достоверности будет заключено значение оцениваемого параметра. Интервальная оценка характеризуется двумя числами – концами интервала, внутри которого предположительно находится истинное значение параметра. Иначе говоря, вместо отдельной точки для оцениваемого параметра можно установить интервал значений, одна из точек которого является своего рода "лучшей" оценкой. Интервальные оценки являются более полными и надежными по сравнению с точечными, они применяются как для больших, так и для малых выборок. Совокупность методов определения промежутка, в котором лежит значение параметра Т , получила название методов интервального оценивания.

Для нормального распределения параметрами являются μ и σ2 . Параметр μ — среднее значение (математическое ожидание) случайной величины и указывает координату максимума кривой плотности распределения, а σ² — дисперсия, которая определяет меру разброса данной случайной величины.

1.3.2 Точечные оценки параметров распределения

Согласно [3] оценка среднего значения выборки из генеральной совокупности производится по формуле (6):

(6)

Точечная оценка дисперсии D и стандартного отклонения σ генеральной совокупности осуществляется по формулам (7), (8):

(7)

(8)

1.3.3 Определение объема выборки для получения оценок с заданной точностью

В производстве при оценке мат.ожидания и дисперсии нерационально работать с выборками большого объема, так как это требует больших финансовых и временных затрат. В соответствии с этим объем выборки для получения интервальных оценок параметров распределения должен быть небольшим и определяться по формуле (9):

, (9)

где - квантиль распределения Стьюдента с ν = n – 1 степенями свободы и уровнем значимости 1 – α/2 (α = 0,01);

εдоп = 0,5 – показывает величину доверительного интервала, отнесенного к стандартному отклонению случайной величины;

n – объем выборки.

Подберем такой объем выборки n, чтобы выполнялось равенство (9). Это возможно при n=30:

= 2,756, 2,756 ≈ 2,74.

Таким образом объем выборки, достаточный для получения интервальных оценок с заданной точностьюεдоп = 0,5, равен 30. В Приложении Б представлена выборка необходимого объема, полученная с помощью генератора случайных чисел.

1.3.4 Интервальная оценка математического ожидания

Определим интервальную оценку мат. ожидания заданной выборки из генеральной совокупности согласно методике, описанной в [3]. Для этого заполним таблицу 4.

Таблица 4 – Определение интервальной оценки мат.ожидания выборки

Статистические и исходные данные Табличные данные и вычисления

1 Объем выборки:

30

1 Квантиль распределения Стьюдента уровня с степенями свободы:

2,462

2 Сумма значений наблюдаемых величин:

51,847

2 Квантиль распределения Стьюдента уровня с степенями свободы:

2,756

3 Сумма квадратов значений наблюдаемых величин:

687,716923

3 Вычисляем:

1,728233333

4 Степени свободы:

29

4 Вычисляем:

20,62459343

5 Выбранная доверительная вероятность:

0,99

5 Вычисляем:

4,541430769

6 Вычисляем:

0,4494976

7 Вычисляем:

0,5031745

Результат

Двусторонний симметричный доверительный интервал для параметра :

; -0,556899 ≤ m ≤ 4,013365

1.3.5 Проверка гипотезы о равенстве математического ожидания заданному значению

Предположим, что μ равно целому значению близкому к точечной оценке данного параметра (п.1.3.2), для этого проверим гипотезу о равенстве математического ожидания заданной величине.

Формулируем гипотезу Н0 : m= 2.000;

Н1 : m 2.000.

Осуществляем проверку гипотезы по методике описанной в [3] и заполняем таблицу 5.

Таблица 5 – Проверка равенства мат.ожидания заданному значению

Статистические и исходные данные Табличные данные и вычисления

1 Объем выборки:

30

1 Квантиль распределения Стьюдента уровня с степенями свободы:

2,462

2 Сумма значений наблюдаемых величин:

51,847

2 Квантиль распределения Стьюдента уровня с степенями свободы:

2,756

3 Сумма квадратов значений наблюдаемых величин:

687,716923

3 Вычисляем:

1,728233333

4 Заданное значение:

2,000

4 Вычисляем:

20,62459343

5 Степени свободы: 29

5 Вычисляем:

4,541430769

6 Выбранный уровень значимости:

0,01

Результаты

Предположение равенства выборочного среднего и заданного значений (нулевая гипотеза) отклоняется, если:

, 0,271767 < 2,2851

Равенство не выполняется, следовательно гипотеза Н1 отклоняется (выборка не противоречит нулевой гипотезе), и выполняется гипотеза Н0 : m=2,000.

1.3.6 Интервальная оценка дисперсии

Аналогично п.1.3.4 определим интервальную оценку дисперсии заданной выборки из генеральной совокупности согласно методике, описанной в [3]. Для этого заполним таблицу 6.

Таблица 6 – Определение интервальной оценки дисперсии

Статистические и исходные данные Табличные данные и вычисления

1 Объем выборки:

30

1 Квантили распределения с степенями свободы уровней , , и соответственно:

14,256

49,588

13,12114895

52,3356178

2 Сумма значений наблюдаемых величин:

51,847

3 Сумма квадратов значений наблюдаемых величин:

687,716923

3 Вычисляем:

=598,1132094

4 Степени свободы:

29

4 Вычисляем;

20,62459343

5 Выбранная доверительная вероятность:

0,99

Результат

Двусторонний доверительный интервал для дисперсии :

; 11,4284 < D < 45,5839.

1.3.7 Проверка гипотезы о равенстве дисперсии заданному значению

Предположим, что σ2 равно целому значению близкому к точечной оценке данного параметра (п.1.3.2), для этого проверим гипотезу о равенстве дисперсии заданной величине.

Формулируем гипотезу Н0 : D = 24,000;

Н1 : D 24,000.

Осуществляем проверку гипотезы по методике описанной в [3] и заполняем таблицу 7.

Таблица 7 - Проверка равенства дисперсии заданному значению

Статистические и исходные данные Табличные данные и вычисления

1 Объем выборки:

30

1 Квантили распределения с степенями свободы уровней , , и соответственно:

14,256

49,588

13,12114895

52,3356178

2 Сумма значений наблюдаемых величин:

51,847

3 Сумма квадратов значений наблюдаемых

величин:

687,716923

2 Вычисляем:

=598,1132094

4 Заданное значение:

24,000

3 Вычисляем:

24,92138

5 Степени свободы:

29

6 Выбранный уровень значимости:

0,01

Результаты

Предположение равенства дисперсии (стандартного отклонения) и заданного значения (нулевая гипотеза) отклоняется, если:

или ,

но 24,92138 > 13,121 или 24,92138 < 52,336

Равенство не выполняется, следовательно гипотеза Н1 отклоняется (выборка не противоречит нулевой гипотезе), и выполняется гипотеза Н0 : D = 24,000.

1.4 Построение графиков функции плотности распределения, графиков эмпирической и теоретической функций распределения

В п.1.2.3 и п.1.2.4 мы убедились, что заданная генеральная совокупность распределена по нормальному закону. С помощью программы Mathcad построим для этого закона графики функции распределения и плотности распределения.

1.4.1 Функция плотности распределения

В соответствии с [1] функция плотности распределения для нормального закона распределения имеет следующий вид (10):

(10)

Данные необходимые для построения графика функции плотности распределения получены в п.1.3.5 и п.1.3.7: μ= 2,000, D=24,000.


Рисунок 4 – График функции плотности распределения

1.4.2 Теоретическая функция распределения

Функция распределения выглядит следующим образом (11):

. (11)

График теоретической функции распределения показан на рисунке 5.

Рисунок 5 – График теоретической функции распределения случайной величины

1.4.3 Эмпирическая функция распределения

По определению, эмпирическая функция распределения - это естественное приближение теоретической функции распределения данной случайной величины, построенное по выборке. По оси абсцисс откладываются интервалы группирования данных, а по оси ординат – накопленная частость.

График эмпирической функции распределения по накопленным частотам представлен на рисунке 6:

Рисунок 6 – График эмпирической функции распределения

2 План эксперимента по выяснению регрессионной зависимости

1. Целью данного задания является установление регрессионной зависимости между тремя факторами (температура - X1 , давление - X2 , влажность - X3 ) и откликом компьютерного эксперимента. Следовательно, количество возможных комбинаций 23 = 8. Так как в нашем эксперименте значения отклика мы получаем с помощью компьютера, то количество повторов можно выбрать произвольно на заданных уровнях факторов, я считаю, что достаточно 5 повторов. В результате проведения эксперимента были получены значения отклика Y (таблица 8). С помощью ПФЭ найдем математическое описание процесса в окрестности точки факторного пространства с координатами: X01 = 20°C, X02 = 1 атм, X03 = 0,55 и шагами варьирования: ΔX1 = 20°C, ΔX2 = 0,5 атм, ΔX3 = 0,45.

Х1 min =0 °С, Х1 max =40 °С

Х2 min =0,5 атм., Х2 max =1,5 атм.

Х3 min =0,1, Х3 max =1,0

2. Рассчитаем средние значения отклика, которые будут использоваться в качестве результата эксперимента по формулам (12), (13), результаты занесем таблицу 8.

Таблица 8 – Результаты компьютерного эксперимента и расчетов

1 2 3 4 5 6 7 8
Y1 241,027 10,1927 144,381 11,9076 232,399 0,0418024 129,766 2,34972
Y2 243,087 8,51102 142,766 13,8678 236,413 0,919956 128,315 2,487
Y3 239,495 11,7412 139,398 12,6462 233,021 1,51475 129,055 1,57699
Y4 240,38 10,4207 142,178 13,2803 232,694 4,67587 127,087 0,647587
Y5 240,692 14,485 135,943 7,71659 234,224 5,00082 127,914 0,846054
Yср 240,9362 11,07012 140,9332 11,8837 233,7502 2,43064 128,4274 1,58147
1,770059 4,96309 11,0137 5,95848 2,6970057 5,11861 1,0646543 0,705797

Формулы для расчетов:

, , (12), (13)

где l - число параллельных опытов в i -той строке матрицы: k - номер параллельного опыта.

3. Будем использовать полную линейную модель регрессии со взаимодействием (14). В том случае, если наша модель окажется проще, незначимые коэффициенты обратятся в 0, и мы их отбросим, так как будем проводить эксперимент на обезразмеренных величинах.

(14)

где θi – параметры модели;

Xi – факторы (независимые переменные);

Yi – отклик.

4. Для упрощения обработки результатов эксперимента, производим кодирование значений факторов по выра­жению (15):

, (15)

где - натуральное значение i-гофактора,

- натуральное значение основного уровня (центра плана по фактору ),

- интервал варьирования фактора,

- кодированный безразмерный фактор, который принимает значения .

То есть кодированные значения факторов равны: X* 1 =1- max, X* 1 = -1 – min; X* 2 = 1 – max, X* 2 = -1- min; X* 3 = 1 - max, X* 3 = -1 - min.

Таким образом, значения факторов:

Х1 min =0 °С, Х1 max =40 °С

Х2 min =0,5 атм., Х2 max =1,5 атм.

Х3 min =0,1, Х3 max =1,0

В результате такого кодирования получаем расширенную матрицу планирования полного факторного эксперимента в безраз­мерных величинах . Далее мы будем иметь дело с кодированными переменными, поэтому звездочку будем опускать.

Строим расширенную матрицу планирования:

№ опыта f0 f11 f22 f33 f41 ·х2 f51 ·х3 f62 ·х3 f71 ·х2 ·х3
1 + + + + + + + + 240,9362
2 + - + + - - + - 11,07012
3 + + - + - + - - 140,9332
4 + - - + + - - + 11,8837
5 + + + - + - - - 233,7502
6 + - + - - + - + 2,43064
7 + + - - - - + + 128,4274
8 + - - - + + + - 1,58147
ϴ0 ϴ1 ϴ2 ϴ3 ϴ4 ϴ5 ϴ6 ϴ7

5. Построенная матрица планирования является ортогональной, так как выполняются следующие соотношения (16):

(16)

6. Определим коэффициенты уравнения регрессии по выражению (17):

. (17)

Согласно расширенной матрице плана, получим формулы для определения оценки для коэффициентов регрессии:

ϴ0 = · (у12345678 ),

ϴ1 = · (у12345678 ),

ϴ2 = · (у12345678 ),

ϴ3 = · (у12345678 ),

ϴ4 = · (у12345678 ),

ϴ5 = · (у12345678 ),

ϴ6 = · (у12345678 ),

ϴ7 = · (у12345678 ).

7. Произведем контроль воспроизводимости результатов исследова­ния, т.е. проверим равноточность измерений. Такая проверка необходима при малом числе опытов, т.к. в этом случае даже одна грубая ошибка может сильно исказить результаты. Проверка воспроизводимости производится с помощью критерия Кохрена, согласно которому, если имеются дисперсии по строкам и имеется их сумма , то для проверки равноточности необходимо выбрать самую большую из построчных дисперсий и определить G – критерий

, G = = 0,330827.

Сформулируем и проверим гипотезу об однородности дисперсий.

Н­0 : G < Gкрит , дисперсии однородные,

Н1 :G > Gкрит , дисперсии неоднородные.

По таблице значений критерия Кохрена для уровня значимости 0,05 найдем Gкр для числа степеней свободы и числа выборки , Gкр = 0,391.

Так как G=0,330827 < Gкрит =0,391, можно сделать вывод, что опыты равноточные и дисперсии однородные, гипотеза Н0 принимается.

8. Определим оценки коэффициентов регрессии по формулам, полученным в п.6:

ϴ0 = · (240,9362+11,07012+140,9332+11,8837+233,7502+2,43064+ +128,4274 +1,58147) = 96,3766,

ϴ1 = · (240,9362-11,07012+140,9332-11,8837+233,7502-2,43064+ +128,4274-1,58147) = 89,635,

ϴ2 = · (240,9362+11,07012-140,9332-11,8837+233,7502+2,43064- -128,4274-1,58147) = 25,6702,

ϴ3 = · (240,9362+11,07012+140,9332+11,8837-233,7502-2,43064- -128,4274-1,58147) = 4,82919,

ϴ4 = · (240,9362-11,07012-140,9332+11,8837+233,7502-2,43064- -128,4274+1,58147) = 25,6613,

ϴ5 = · (240,9362-11,07012+140,9332-11,8837-233,7502+2,43064- -128,4274+1,58147) = 0,09376,

ϴ6 = · (240,9362+11,07012-140,9332-11,8837-233,7502-2,43064+ +128,4274+1,58147) = -0,872819,

ϴ7 = · (240,9362-11,07012-140,9332+11,8837-233,7502+2,43064+ +128,4274-1,58147) = -0,45713.

9. Произведем оценку дисперсии воспроизводимости по формуле (18): (18)

= 4,1614245.

Определим дисперсию воспроизводимости для среднего значения отклика по формуле: S 2 () = 0,8322849.

Определим среднеквадратичное отклонение по формулеS () = 0,912296.

10. Произведем оценку значимости коэффициентов.

Сформулируем гипотезу:

Н0 : ϴi = 0 - коэффициент ϴi незначим;

Н1 : ϴi ≠ 0 - коэффициент ϴi значим.

Для проверки используется критерий Стьюдента t при уровне значимости 1-α/2 (α выбирается равным 0,05) и числе степеней свободы ν = = n(l -1) = 8·(5-1) = 32.

Для ортогонального планирования, оценки дисперсии коэффициентов уравнения регрессии равны между собой и определяются по формуле (19):

, = 0,104036 (19)

Коэффициент уравнения статистически значим, если , где значение критерия Стьюдента для уровня значимости α и числа степеней свободы ν :

при α = 0,975 и ν = 32.

, 96,3766 > 0,656993, коэффициент уравнения статически значим, принимаем гипотезу Н1 .

, 89,635 > 0,656993, коэффициент уравнения статически значим, принимаем гипотезу Н1 .

, 25,6702 > 0,656993, коэффициент уравнения статически значим, принимаем гипотезу Н1 .

, 4,82919 > 0,656993, коэффициент уравнения статически значим, принимаем гипотезу Н1 .

, 25,6613 > 0,656993, коэффициент уравнения статически значим, принимаем гипотезу Н1 .

, 0,09376 < 0,656993, коэффициент уравнения статически незначим, принимаем гипотезу Н0 .

, 0,872819 > 0,656993, коэффициент уравнения статически значим, принимаем гипотезу Н1 .

, 0,45713 < 0,656993, коэффициент уравнения статически незначим, принимаем гипотезу Н0 .

Коэффициенты, признанные незначимыми (Θ5 и Θ7 ), приравняем к 0. Так как при ортогональном планировании коэффициенты уравнения регрессии оцениваются независимо друг от друга, то мы можем не производить пересчет коэффициентов и не проверять их значимость заново, а просто откинуть незначимые коэффициенты.

Статистическая незначимость некоторых коэффициентов может быть вызвана следующими причинами:

1. Большая ошибка эксперимента из-за наличия неуправляемых и неконтролируемых переменных.

2. Данный фактор или взаимодействие факторов действительно не ока­зывают существенного влияния на значение параметра отклика у.

Отбросив (приравняв к нулю) незначимые коэффициенты, получим уравнение связи между откликом у и факторами хi :

y = f(x1 , x2 , x3 ) = ϴ0 + ϴ1 ·x1 + ϴ2 ·x2 + ϴ3 ·x3 + ϴ4 ·x1 ·x2 + ϴ6 ·x2 ·x3 + ε.

11. Оценим адекватность математической модели.

Для проверки адекватности полученной математической модели произ­водится оценка дисперсии адекватности:

,

где d = 6 - число значимых коэффициентов в уравнении; n = 8 - число опытов.

Найдем , используя выбранную математическую модель и полученные коэффициенты регрессии.

= ϴ0 + ϴ1 + ϴ2 + ϴ3 + ϴ4 + ϴ6 = 241,29947.

= ϴ0 - ϴ1 + ϴ2 + ϴ3 - ϴ4 + ϴ6 = 10,70687.

= ϴ0 + ϴ1 - ϴ2 + ϴ3 - ϴ4 - ϴ6 = 140,3821.

= ϴ0 - ϴ1 - ϴ2 + ϴ3 + ϴ4 - ϴ6 = 12,4347.

= ϴ0 + ϴ1 + ϴ2 - ϴ3 + ϴ4 - ϴ6 = 233,3867.

= ϴ0 - ϴ1 + ϴ2 - ϴ3 - ϴ4 - ϴ6 = 2,79413.

= ϴ0 + ϴ1 - ϴ2 - ϴ3 - ϴ4 + ϴ6 = 128,9781.

= ϴ0 - ϴ1 - ϴ2 - ϴ3 + ϴ4 + ϴ6 = 1,03069.

Тогда S2 ад = 0,871040685.

Сформулируем гипотезу об адекватности модели:

Н­0 : F крит > F – модель адекватна,

Н­1 : F крит < F – модель не адекватна.

Для проверки гипотезы об адекватности воспользуемся критерием Фишера для выбранного уровня значимости α=0,05 и числа степеней свободы числителя при d = 6 и n = 8, , для знаменателя при . Найдем критическое значение критерия Фишера по таблице:

F крит (0,05; 2; 32) = 3,295.

Вычислим расчетное значение критерия Фишера по формуле:

== 1,04657.

Сравнив рассчитанное и критическое значения критерия Фишера, получим Fкрит > F, следовательно, данная модель является адекватной, принимаем гипотезу Н0 .

12. Запишем модель в размерном виде для всех значимых коэффициентов. Для того чтобы перевести модель в размерный вид необходимо перейти от безразмерных величин к размерным величинам для этого формулу подставляем в уравнение , занулив при этом незначимые коэффициенты. В результате получаем:

y=.

Рассчитаем новые коэффициенты:

Θ = -1,3119 ≈ -1,31;

Θ = 1,9156 ≈ 1,92;

Θ = 2,1512 ≈ 2,15;

Θ = 14,6108 ≈ 14,61;

Θ = 2,56613 ≈ 2,57;

Θ = -3,8793 ≈ -3,88.

Запишем математическую модель в окончательном виде:

y = -1,31 + 1,92·x1 + 2,15·x2 + 14,61·x3 + 2,57·x1 ·x2 - 3,88·x2 ·x3 .

13. Анализ робастности регрессионной модели.

Под анализом робастности понимается выяснение практической возможности полученной регрессионной модели.

Определяем коэффициент детерминации, который показывает долю общего рассеяния относительно среднего, обусловленного регрессионной зависимостью (20):

(20)

где - среднее по опыту;

- расчетные значения отклика;

- значение отклика для i-того опыта в j-том повторе;

- среднее средних значений по опыту;

i – количество опытов при каждом уровне фактора;

j – количество повторов в каждом опыте.

R2 = 0,999995357.

Модель считается работоспособной, если R2 > 0,75.

Таким образом, полученную регрессионную модель

y = -1,31 + 1,92·x1 + 2,15·x2 + 14,61·x3 + 2,57·x1 ·x2 - 3,88·x2 ·x3 можно считать работоспособной, так как R2 =0,999995357> 0,75.

Заключение

В результате проделанной работы мы познакомились с основными математическими статистическими методами планирования эксперимента, а также с методами анализа законов распределения вероятностей случайных величин. На первоначальном этапе была собрана априорная информация, необходимая для дальнейшего исследования, было выдвинуто предположение о виде закона распределения случайной величины и проведено доказательство данного предположения, были определены оценки параметров данного распределения. Во второй части работы выяснялась зависимость между факторами, действующими на исследуемую величину, и изменение этой величины. Для предвидения влияния определенных факторов используется полный факторный эксперимент для построения регрессионной математической модели. Эта модель позволяет нормировать измерения вне зависимости от влияющих факторов или указывает на влияющее воздействие, которое необходимо устранить.

Несмотря на простоту методов, они представляют собой мощный механизм повышения качества продукции и могут использоваться для решения весьма обширного круга задач, когда приходится принимать решения в условиях действия многочисленных влияющих на процесс факторов.

Преимущество простых статистических методов здесь выражается в том, что появляется возможность проведения корректировки производственного процесса еще тогда, когда в нем возникают некоторые отклонения, которые еще не приводят к браку, но уже создают угрозу появления дефектной продукции. Такое управление качеством процессов, называемое управлением по отклонениям, неизмеримо эффективнее, чем применяемый в настоящее время контроль качества продукции по результатам, при котором контролируется не процесс, а продукция на разных стадиях ее изготовления путем применения либо сплошного, либо выборочного статистического контроля.

Список использованной литературы

1. Кобзарь А. И. Прикладная математическая статистика. Для инженеров и научных работников. - М.: ФИЗМАТЛИТ, 2006. - 816 с. - ISBN 5-9221-0707-0.

2. ГОСТ Р ИСО 5479-2002 «Статистические методы. Проверка отклонения распределения вероятностей от нормального распределения».

3. ГОСТ Р 50779.21–2004 (ИСО 2854:1976) «Статистические методы. Правила определения и методы расчета статистических характеристик по выборочным данным».

4. Козлов М. В., Прохоров А. В. Введение в математическую статистику. – М.: Изд-во МГУ, 1987. - 264 с.


Приложение А

Выборка случайных величин (n=500)

-6,039 8,182 2,386 -1,405 -1,341 0,481 1,487 -1,914 1,927 1,314
4,828 5,229 0,682 1,011 8,332 7,836 1,603 -7,404 -0,775 4,862
3,465 10,157 3,674 9,962 -9,91 2,469 -2,922 0,868 8,28 -1,985
0,843 4,482 6,526 -2,986 6,385 4,69 0,476 6,223 9,079 4,998
8,044 8,701 -4,03 -7,621 -0,34 2,194 8,934 -2,333 2,955 4,075
5,473 -5,083 -3,823 4,87 1,635 5,869 3,929 11,45 2,573 1,889
2,756 8,121 5,545 3,533 3,567 2,582 -0,46 -1,214 6,021 -7,342
-3,455 1,978 14,732 9,607 -7,862 1,796 -3,272 -5,256 -2,111 2,827
5,118 2,557 5,846 -1,178 2,336 -4,473 -5,304 3,005 4,356 14,237
-6,238 5,192 -0,269 -0,993 -1,5 6,106 -9,396 7,457 -8,051 4,991
1,868 -5,578 -1,422 -3,17 -0,059 1,736 4,415 -1,995 2,306 2,844
7,643 -0,201 6,662 2,676 5,002 -1,745 2,679 4,28 -5,764 -4,329
1,12 0,521 4,192 -1,037 -4,674 1,285 3,825 11,484 3,84 3,773
4,906 -0,508 6,75 1,236 4,264 9,361 -5,654 10,331 5,76 -0,549
8,373 3,088 -2,867 0,345 2,591 3,879 0,223 7,841 6,511 -5,032
-1,449 -4,89 8,443 2,751 6,067 5,058 3,943 2,742 0,1 4,438
1,369 -0,83 5,17 7,178 -0,925 4,873 1,166 5,428 7,005 3,767
1,203 -1,443 1,025 -2,7 10,662 5,313 4 3,74 3,732 8,351
7,817 -3,211 2,59 4,077 -4,839 10,971 8,261 -10,759 9,01 -0,023
1,159 4,033 5,974 3,513 3,453 5,278 -4,612 -4,47 6,845 8,102
-4,82 12,02 2,285 2,472 -4,175 3,413 -8,04 4,209 5,778 3,31
-0,791 2,726 0,562 -6,808 11,105 9,814 10,349 -3,131 5,792 0,443
-7,87 10,94 -4,077 -4,312 6,876 -6,628 1,787 -0,154 2,04 -3,595
6,714 -4,498 -4,164 -11,405 -2,002 6,619 6,888 -4,194 2,904 8,026
8,265 4,371 -4,374 5,451 3,03 0,104 7,629 -0,864 1,096 3,456
-2,344 2,769 7,967 3,753 -0,298 0,809 3,772 0,019 0,209 -1,403
-0,233 -4,28 7,226 -4,47 5,764 2,096 2,558 7,107 -0,032 4,517
10,377 1,076 -0,236 8,311 7,472 2,134 3,553 2,102 13,981 0,905
-4,847 10,066 1,002 2,685 4,871 -4,54 -0,743 1,27 4,954 -4,076
5,253 -0,52 -7,13 -3,944 2,082 -1,537 -9,642 4,944 -5,491 -0,845
-3,71 3,529 3,542 -1,729 1,496 -4,809 -1,662 9,107 6,093 -1,445
10,559 -7,257 -0,915 -0,841 -5,139 -0,932 0,872 0,258 4,981 0,812
-2,581 -0,091 8,148 0,514 -0,251 2,096 4,727 -3,021 -4,292 4,883
-5,084 3,343 -1,287 6,799 6,756 4,403 -10,361 2,517 3,787 7,52
-7,462 4,425 -4,425 2,846 1,657 5,512 0,544 0,011 0,1 -3,012
-2,02 0,345 1,434 6,536 5,632 8,212 -2,882 2,978 -1,095 3,067
6,546 8,398 12,29 -7,319 0,196 0,568 4,242 -1,027 6,687 0,275
5,741 -4,407 -4,091 -1,456 -2,697 4,082 1,004 6,881 2,583 -2,917
10,422 -5,135 7,478 9,164 -1,261 4,897 -4,234 6,422 -2,268 -1,219
1,279 4,951 -2,452 2,887 0,969 0,71 11,569 -2,504 5,845 0,399
4,912 -3,373 4,596 -0,601 5,103 -0,137 3,035 -0,665 8,49 -3,68
2,145 0,84 9,438 1,97 2,114 1,819 6,123 0,657 6,11 5,064
11,57 -3,025 -2,993 4,973 8,625 3,975 -3,728 4,871 -3,183 -3,5
-1,981 0,704 7,943 12,774 1,313 4,96 2,336 -0,984 6,594 -6,467
0,317 1,919 -3,085 7,993 10,955 0,851 -6,562 9,876 5,189 2,623
2,575 8,101 13,832 5,362 -1,571 -4,962 3,176 -1,259 8,897 -2,329
9,168 5,812 -7,515 7,226 -2,184 -1,596 6,68 2,496 -1,247 -1,883
9,333 -8,179 -0,499 8,907 -1,871 -1,445 -1,49 -12,141 0,976 0,66
3,985 3,051 1,987 9,918 0,25 4,785 2,165 5,953 2,625 9,295
9,846 4,785 -0,32 4,777 3,067 3,298 3,604 -2,463 7,195 0,133

Приложение Б

Выборка случайных величин (n=30)

-5,623 0,893 4,587 -3,576 -1,016 3,500
5,124 4,282 0,542 1,656 12,398 2,723
2,788 3,331 4,010 2,556 -2,365 3,956
-7,706 -6,927 0,867 9,781 4,695 -0,813
-0,347 9,380 4,619 -0,675 -0,312 -0,481