Скачать .docx |
Реферат: Корреляционный и регрессионный анализ
Содержание
1. Исходные данные. 2
2. Решение задачи 1. 3
3.Решение задачи 2. 7
Вывод: 11
Список использованных источников. 12
Задание 1
1. Построить линейное уравнение парной регрессии;
2. Рассчитать линейный коэффициент парной корреляции и среднюю ошибку аппроксимации;
3. Оценить статистическую зависимость параметров регрессии и корреляции (с помощью F-критерия Фишера и Т-статистики Стьюдента).
Задание 2
1. Построить уравнение парной регрессии в виде нелинейной функции: степенной у = ах b , экспоненты у = ае b х , показательной у = abx , любой на выбор;
2. Для оценки параметров модель линеаризируется путем логарифмирования или потенцирования;
3. Определяется коэффициент эластичности и индекс корреляции;
4. Значимость определяется по критерию Фишера.
Исходные данные для решения задач приведены в таблице 1.
Таблица 1 - Исходные данные
N | X | Y |
1 | 23 | 110 |
2 | 45 | 125 |
3 | 34 | 111 |
4 | 51 | 121 |
5 | 28 | 109 |
6 | 62 | 127 |
7 | 71 | 143 |
8 | 63 | 121 |
9 | 70 | 154 |
10 | 45 | 108 |
11 | 51 | 136 |
12 | 27 | 109 |
13 | 62 | 125 |
14 | 57 | 110 |
15 | 63 | 120 |
16 | 69 | 134 |
17 | 74 | 131 |
18 | 35 | 105 |
19 | 21 | 74 |
20 | 60 | 120 |
Определим линейное уравнение парной регрессии.
Для этого составим и решим следующую систему уравнений:
;
.
;
.
Решая данную систему уравнений получаем:
а=81,232;
b=0,76.
Итого получаем:
Рассчитаем линейные коэффициенты парной корреляции и среднюю ошибку аппроксимации
Расчет будем вести табличным способом, и представим в таблице 2.
Таблица 2 - Расчет линейных коэффициентов парной корреляции и средняя ошибка аппроксимации
N | X | Y | X∙Y | X2 | Y2 | Y- | |||
1 | 23 | 110 | 2530 | 529 | 12100 | 98,71 | 11,29 | 127,42 | 10,26 |
2 | 45 | 125 | 5625 | 2025 | 15625 | 115,43 | 9,57 | 91,55 | 7,65 |
3 | 34 | 111 | 3774 | 1156 | 12321 | 107,07 | 3,93 | 15,43 | 3,54 |
4 | 51 | 121 | 6171 | 2601 | 14641 | 119,99 | 1,01 | 1,02 | 0,83 |
5 | 28 | 109 | 3052 | 784 | 11881 | 102,51 | 6,49 | 42,09 | 5,95 |
6 | 62 | 127 | 7874 | 3844 | 16129 | 128,35 | -1,35 | 1,83 | 1,06 |
7 | 71 | 143 | 10153 | 5041 | 20449 | 135,19 | 7,81 | 60,96 | 5,46 |
8 | 63 | 121 | 7623 | 3969 | 14641 | 129,11 | -8,11 | 65,80 | 6,70 |
9 | 70 | 154 | 10780 | 4900 | 23716 | 134,43 | 19,57 | 382,91 | 12,71 |
10 | 45 | 108 | 4860 | 2025 | 11664 | 115,43 | -7,43 | 55,23 | 6,88 |
11 | 51 | 136 | 6936 | 2601 | 18496 | 119,99 | 16,01 | 256,26 | 11,77 |
13 | 27 | 109 | 2943 | 729 | 11881 | 101,75 | 7,25 | 52,53 | 6,65 |
13 | 62 | 125 | 7750 | 3844 | 15625 | 128,35 | -3,35 | 11,24 | 2,68 |
14 | 57 | 110 | 6270 | 3249 | 12100 | 124,55 | -14,55 | 211,76 | 13,23 |
15 | 63 | 120 | 7560 | 3969 | 14400 | 129,11 | -9,11 | 83,03 | 7,59 |
16 | 69 | 134 | 9246 | 4761 | 17956 | 133,67 | 0,33 | 0,11 | 0,24 |
17 | 74 | 131 | 9694 | 5476 | 17161 | 137,47 | -6,47 | 41,89 | 4,94 |
18 | 35 | 105 | 3675 | 1225 | 11025 | 107,83 | -2,83 | 8,02 | 2,70 |
19 | 21 | 74 | 1554 | 441 | 5476 | 97,19 | -23,19 | 537,87 | 31,34 |
20 | 60 | 120 | 7200 | 3600 | 14400 | 126,83 | -6,83 | 46,68 | 5,69 |
∑ | 1011 | 2393 | 125270 | 56769 | 291687 | 2393 | 0 | 2093,62 | 147,90 |
Ср. | 50,55 | 119,65 | 6263,5 | 2838,45 | 14584,35 | 119,65 | 0 | 104,68 | 7,39 |
На рисунке 1 представим поле корреляции.
Рисунок 1 - Поле корреляции
Оценим статистическую зависимость параметров регрессии и корреляции (с помощью F-критерия Фишера и Т-статистики Стьюдента).
Определение коэффициента корреляции
Для определения коэффициента корреляции, определим дисперсию:
;
.
Определим коэффициент корреляции:
.
Данный коэффициент корреляции характеризует высокую тесноту связи
Определим коэффициент детерминации:
Это значит, что 61% вариации "у" объясняется вариацией фактор "х".
Определение статистической значимости уравнения регрессии с помощью F-критерия Фишера
Определим F- критерий Фишера:
.
Табличное значение критерия при пятипроцентном уровне значимости и степенях свободы 1 и (20-2)=18 составляет Fтаб = 4,45.
Имеем F> Fтаб , следовательно уравнение регрессии признается статистическим значимым.
Оценка статистической значимости параметров регрессии с помощью t-статистики Стьюдента
Табличное значение t-критерия для числа степеней свободы df=n-2=20-2=18 и уровня значимости α=0,05 составит tтабл =1,743.
Определим стандартные ошибки:
;
;
.
Тогда
;
;
.
Фактические значения t-статистики превосходят табличное значение:
, поэтому параметры а, b, и rxy не случайно отличаются от нуля, а статистически значимы.
Рассчитаем доверительные интервалы для параметров регрессии а и b. Для этого определим предельную ошибку для каждого показателя:
;
.
Получаем доверительные интервалы:
и ;
и .
Анализ верхней и нижней границ доверительных интервалов приводит к выводу о том, что с вероятностью р=1-α=1-0,05=0,95 параметры а и b, находятся в указанных границах, не принимают нулевых значений, т.е. являются статистически значимыми и существенно отличны от нуля.
3. Решение задачи 2
В качестве уравнения нелинейной функции примем показательную, т.е.
у = a∙bx .
Определим экспоненциальное уравнение парной регрессии
Для определения параметров а и b прологарифмируем данное уравнение:
ln(у) =ln(а)+ x∙ln(b),
Произведем следующую замену: А= ln(а), B= ln(b).
Составим и решим систему уравнений:
;
.
;
.
Решая данную систему уравнений получаем:
А=4,436 следовательно a=84,452;
B= 0,0067 следовательно b=1,0067.
Итого получаем
.
Рассчитаем линейные коэффициенты парной корреляции и среднюю ошибку аппроксимации
Расчет будем вести табличным способом, и представим в таблице 3.
Таблица 3 - Расчет линейных коэффициентов парной корреляции и средняя ошибка аппроксимации
N | X | Y | X∙Y | X2 | Y2 | Y- | ||||
1 | 23 | 110 | 2530 | 529,00 | 12100 | 98,47 | 11,53 | 132,90 | 201,64 | 10,48 |
2 | 45 | 125 | 5625 | 2025,00 | 15625 | 114,05 | 10,95 | 119,80 | 0,64 | 8,76 |
3 | 34 | 111 | 3774 | 1156,00 | 12321 | 105,98 | 5,02 | 25,23 | 174,24 | 4,53 |
4 | 51 | 121 | 6171 | 2601,00 | 14641 | 118,72 | 2,28 | 5,21 | 10,24 | 1,89 |
5 | 28 | 109 | 3052 | 784,00 | 11881 | 101,82 | 7,18 | 51,62 | 231,04 | 6,59 |
6 | 62 | 127 | 7874 | 3844,00 | 16129 | 127,77 | -0,77 | 0,59 | 7,84 | 0,60 |
7 | 71 | 143 | 10153 | 5041,00 | 20449 | 135,68 | 7,32 | 53,59 | 353,44 | 5,12 |
8 | 63 | 121 | 7623 | 3969,00 | 14641 | 128,62 | -7,62 | 58,09 | 10,24 | 6,30 |
9 | 70 | 154 | 10780 | 4900,00 | 23716 | 134,78 | 19,22 | 369,54 | 888,04 | 12,48 |
10 | 45 | 108 | 4860 | 2025,00 | 11664 | 114,05 | -6,05 | 36,66 | 262,44 | 5,61 |
11 | 51 | 136 | 6936 | 2601,00 | 18496 | 118,72 | 17,28 | 298,70 | 139,24 | 12,71 |
12 | 27 | 109 | 2943 | 729,00 | 11881 | 101,14 | 7,86 | 61,82 | 231,04 | 7,21 |
13 | 62 | 125 | 7750 | 3844,00 | 15625 | 127,77 | -2,77 | 7,65 | 0,64 | 2,21 |
14 | 57 | 110 | 6270 | 3249,00 | 12100 | 123,57 | -13,57 | 184,15 | 201,64 | 12,34 |
15 | 63 | 120 | 7560 | 3969,00 | 14400 | 128,62 | -8,62 | 74,33 | 17,64 | 7,18 |
16 | 69 | 134 | 9246 | 4761,00 | 17956 | 133,88 | 0,12 | 0,01 | 96,04 | 0,09 |
17 | 74 | 131 | 9694 | 5476,00 | 17161 | 138,43 | -7,43 | 55,13 | 46,24 | 5,67 |
18 | 35 | 105 | 3675 | 1225,00 | 11025 | 106,69 | -1,69 | 2,85 | 368,64 | 1,61 |
19 | 21 | 74 | 1554 | 441,00 | 5476 | 97,17 | -23,17 | 536,63 | 2520,04 | 31,30 |
20 | 60 | 120 | 7200 | 3600,00 | 14400 | 126,07 | -6,07 | 36,85 | 17,64 | 5,06 |
∑ | 1011 | 2393 | 125270 | 56769,00 | 291687 | 2381,97 | 11,03 | 2111,36 | 5778,60 | 147,73 |
Ср. | 50,55 | 119,65 | 6263,50 | 2838,45 | 14584,35 | 119,10 | 0,55 | 105,57 | 288,93 | 7,39 |
На рисунке 3 представим поле корреляции.
Рисунок 2 - Поле корреляции
Определяется коэффициент эластичности и индекс корреляции
Определим коэффициент эластичности
,
где
,
следовательно при изменении фактора"х" на 1% от своего среднего значения, "у" изменится на 0,334 % от своей средней величины.
Определение индекс корреляции
.
Данный коэффициент корреляции характеризует высокую тесноту связи
Определим индекс детерминации:
Это значит, что 63,5% вариации "у" объясняется вариацией фактор "х".
Определение статистической значимости уравнения регрессии с помощью F-критерия Фишера
Определим F- критерий Фишера:
.
Табличное значение критерия при пятипроцентном уровне значимости и степенях свободы 1 и (20-2)=18 составляет Fтаб = 4,45.
Имеем F> Fтаб , следовательно уравнение регрессии признается статистическим значимым.
Вывод
В результате проведенного корреляционного анализа исходных данных была выявлена функциональная зависимость между значениями "х" и "у", то есть: . Данная зависимость обладает максимальным значением индекса корреляции и детерминации, а так же F-критерия Фишера.
Список использованных источников
1. Учебно-методическое пособие к изучению курса "Статистика". Н.Н. Щуренко, Г.В. Девликамиова: Уфа, 2004.- 55с.
2. Эконометрика для начинающих. Основные понятия, элементарные методы, границы применимости, интерпретация результатов В.П. Носко: Москва, 2000. - 249с.
3. Эконометрика. И.И. Елисеева: Москва "Финансы и статистика", 2003.- 338с.
4. Общая теория статистики. Н.М. Виноградова, В.Т. Евдокимов, Е.М. Хитарова, Н.И. Яковлева: Москва,1968.- 381с.