Скачать .docx | Скачать .pdf |
Реферат: Математическое моделирование
ВВЕДЕНИЕ
Различают четыре типа зависимостей между переменными:
1)Зависимость между неслучайными переменными, не требующую для своего изучения применения статистических методов;
2) 1)Зависимость случайной переменной y от неслучайных переменных, исследуемую методами регрессионного анализа ;
3) 1)Зависимость между случайными переменными y и xi , изучаемую методами корреляционного анализа ;
4) 1)Зависимость между неслучайными переменными, когда все они содержат ошибки измерения, требующую для своего изучения применения конфлюэнтного анализа .
Применение регрессионного анализа для обработки результатов наблюдений позволяет получить оценку влияния переменных, рассматриваемых в качестве аргументов (независимых переменных) на переменную, которая считается зависимой от первых.
Курсовая работа направлена на освоение методов регрессионного анализа в процессе разработки математического описания исследуемого процесса или явления. Курсовая работа предусматривает обработку экспериментальных данных и поиск наиболее удовлетворительной гипотезы взаимосвязи между функцией и аргументами.
В качестве таких гипотез рассматриваются линейная и нелинейная регрессионные модели, каждая из которых может быть парной (только две переменных - функция и аргумент) или множественной (одна функция и несколько аргументов).
Относительно закона изменения независимых переменных x i не делается никаких ограничений –
ЛИНЕЙН АЯ ПАРНАЯ РЕГРЕССИЯ
Для нахождени я те оретиче ской лин ии регрессии по данным производственных замеров или специально поставленных экспериментов применяется метод наименьших квадратов , с помощью которого путем определенных вычислений находится уравнение y = f(x), соответствующее взаимосвязи рассматриваемых параметров. А именно, отыскивается теоретическая лини я регресси и у по х, занимающая в корреляционном поле такое положение, при котором выполняется требование, чтобы сумма квадратов расстояний от этой линии до каждой точки в корреляционном поле являлась минимальной.
При изображении корреляционного поля на графике по оси у откладывают значения функции, а по оси х — значения аргумента . Теоретическая линия регрессии у по х должна быть внесена в корреляционное поле таким образом, чтобы соблюдался принцип наименьших квадратов:
m
S 2 = S Dyj 2 = S ( yj -y' j )2 ( 1 )
j = 1
где j — порядковый номер точки в исходном числовом материале:
у j — измеренное значение функции для определенного значения аргумента (х );
y'/ --расчетное значение функции при заданной величине аргумента ( х ) в соответствии с теоретической их взаимосвязью. В случае линейной зависимости
y'j = a + b x j . (2)
Задача сводится к отысканию коэффи циентов регрессии а и b уравнения (2), т. е. заранее установлено, что рассматриваемые п араметрыу и х связаны линейной зависимостью по уравнению (2).
Величина D yj представляющая собой расстояние от каждой точки корреляционного поля до теоретической линии регрессии, определяется из уравнения
D yj = yj -(a + b x j ) (3)
гдеx j — параметр х , соответствующий измеренному значению у j .
Для определения численных значений коэффициентов регрессии a и b , исходя изпринципа наименьших квадратов отклонений, нужно приравнять нулю частные производные функции S 2 по a иb :
¶ S 2 / ¶ a = ¶ ( S Dyj ) 2 / ¶ a = 0, ( 4 )
¶ S 2 / ¶ b = ¶ ( S Dyj ) 2 / ¶ b = 0 ( 5 )
Выполнив необходимые преобразования, получим систему двух уравнений с двумя неизвестными для определения a и b :
S y = m a + b S x
S yx = a S x + b S x 2 . ( 6 )
Решая систему уравнений относительно a и b , находим численные знаяения коэффициентов регрессии. Величины S y , S x ,S yx , S x 2 находятся непосредственно по данным производственных измерений, которые заданы в курсовой работе.
Величина свободного члена уравнения регрессии (2), или коэффициента а равна функции у приx = 0.
Коэффицие нт b в уравнениирегрессии характеризует изменение функции у при изменении аргумента х на единицу. и графически отражает угол наклона линии уравнения регрессии
При решении практических задач регрессионного анализа возникает вопрос об оценке тесноты исследуемой взаимосвязи, т. е. насколько полученные на основе обработки производственных или лабораторных данных уравнения регрессии достоверны. В случае парной линейной корреляции в качестве оценки тесноты связи используют обычно коэффициент корреляции , который рассчитывается по формуле:
r = ( XY -X * Y ) / ( s x * s y ). ( 7 )
Числитель выражения для коэффициента корреляции r представляет собой разность между средним значением произведения XY и произведением сре дних значений X * Y измеренных значений параметров x и y исходной информации. Знаменатель равен произведению средних квадратических отклон ений значений параметров у и х от своих средних. Средние квадратические отклонения (стандартные отклонения ) рассчитываются по формулам:
s x = { [ S ( x j -X ) 2 ] / m } 1/2 ( 8 )
s y = { [ S ( y j -Y ) 2 ] / m } 1/2 .( 9 )
Квадраты средних квадратических отклоненийy и х (s x 2 иs y 2 ) называются дисперсиями
D x = [ S ( x j -X ) 2 ] / m ( 10 )
Dy = [ S ( y j -Y ) 2 ] / m ( 11 )
и являются важными статистическими оценками рассеяния значений какой-либо величины около ее среднего значения.
Величина коэффициента корреляцииr может изменяться от 0 при полном отсутствии связи до ± 1 при наличии линейной функциональной связи х с у. Если r > 0, между х и у имеет место положительная корреляционная связь, т. е. с ростом параметра х увеличивается параметр у , если r < 0, между х и у имеет место отрицательная связь. С коэффициентом регрессии b в уравнении (2) коэффициент корреляции связан соотношением
Угловой коэффициент ре грессииb представляет собой тангенс угла наклона линии регрессии к оси абсцисс. Следовательно, чем больше наклон линии регрессии к оси абсцисс, тем больше значение коэффициента корреляции, т. е. тем значительнее будет изменение функции у при изменении на единицу аргумента х .
Малая величина коэффициента корреляции указывает на отсутствие линейной связи, однако криволинейная связь между рассматриваемыми параметрами при этом может быть достаточно тесной. Коэффициент корреляции отражает не только величину приращения у при изменении х , но и тесноту связи функции и аргумента. Чем больше разброс точе к относительно линии регрессии, тем меньше коэффициент корреляции. Это свойство коэффициента корре ляции отражено в его формуле в виде соотношения стандартных отклонений.
Для оцен ки надежности полученного результата используют иногда критерий надежности m , который учи тывает как величи ну коэффициента корреляции, так и число пар измерений. Кри терий надежности m рассчитывается по формуле
m = r * [ m - 1] 1/2 / (1 -r 2 ), (13)
где r — коэффициент корре ляции;
т — число пар измерений.
Как видно из формулы критерия надежности, чем выше коэффициент корреляции и большее число пар измерений, тем больше показатель надежности. При m , > 2,6 связь считается статисти чески достоверной.
Располагая данными можно выполнить анализ взаимосвязи аргумента и функции : построить график с корреляционным полем рассматриваемых показателей, определить теоретическую линию регрессии, оценить тесноту связи для выбранных параметров. Однако, проанализировав конфигурацию корреляционного поля, построенного по исходным данным, можно усмотреть что описание взаимосвязи рассматриваемых параметров с помощью прямой линии не является наилучшей аппроксимацией. Иногда в данное поле корреляции значительно лучше впишется некоторая кривая.
Таким образом из технологического опыта может следовать, что связь между аргументом и функцией имеет криволинейный характер. Возможно, что аппроксимация производственных данных в виде кривой точнее отражала бы существующую взаимосвязь.
КРИВОЛИНЕЙНАЯ ПАРНАЯ РЕГРЕССИЯ
Аппроксимация кривой выполняется тем же путем с использованием метода наименьших квадратов, что и выравнивание по прямой линии. Линия регрессии должна удовлетворять условию минимума суммы квадратов расстояни й до каждой точки корреляцион ного поля. В данном случае в уравнении (1)у представляет собой расчетное значение функции, определенное при помощи уравнения в ыбранной криволинейной связи по фактическим значениям х j . Например, если для аппроксимации связи выбрана парабола второго порядка, то
y = а + b x + c x2 , ( 14 )
.а разность между точкой, лежащей на кривой, и данной точкой корреляционного поля при соответствующем аргументе можно записать аналогично уравнению (3) в виде
Dyj = yj -(a + b x +c x2 ) ( 15 )
При этом сумма квадратов расстояний от каждой точки корреляционного поля до новой линии регрессии в случае параболы второго порядка будет иметь вид:
S 2 = S Dyj 2 = S [ yj -(a + b x +c x2 )] 2 ( 16 )
Исходя из условия минимума этой суммы, частные производные S 2 по а , b и с приравниваются к нулю. Выполнив необходимые преобразования, получим систему трех уравнений с тремя неизвестными для определенияa, b и с .
, S y = m a + b S x + c S x 2
S yx = a S x + b S x 2 + c S x 2 .
S yx 2 = a S x 2 + b S x 3 + c S x 4 . ( 17 ).
Решая систему уравнений относительно a, b ис , находим численные значения коэффициентов регрессии. ВеличиныS y ,S x, S x 2 ,S yx ,S yx 2 , S x 3 , S x 4. находятся непосредственно по данным прои зводственных измерений.
Оценкой тесноты связи при криволинейной зависимости служит теоретическое корреляционное отношение h xу , представляющее собой корень квадратный из соотношения двух дисперсий: среднего квадрата sр 2 отклонений расчетных значений y' j функции по найденному уравнению регрессии от среднеарифметического значения Y величины y к среднему квадрату отклонений sy 2 фактических значений функции y j от ее среднеарифметического значения :
hxу = { sр 2 / sy 2 } 1/2 = { S (y' j - Y )2 / S (y j - Y )2 } 1/2 ( 18 )
Квадрат корреляционного отношения hxу 2 показывает долю полной изменчивости зависимой переменной у, обусловленную изменчивостью аргумента х . Этот показатель называется коэффициентом детерминации . В отлично от коэффициента корреляции величина корреляционного отношения может принимать только положительные значения от 0 до 1. При полном отсутствии связи корреляционное отношение равно нулю , при наличии функциональной связи оно равно единице , а при наличии регрессионной связи различной тесноты корреляционное отношение принимает значения между нулем и единицей. Выбор типа кривой имеет большое значение в регрессионном анализе, поскольку от вида выбранной взаимосвязи зависит точность аппроксимации и статистические оценки тесноты связи. Наиболее простой метод выбора типа кривой состоит в построении корреляционных полей и в подборе соответствующих типов регрессионных уравнений по расположению точек на этих полях. Методы регрессионного анализа позволяют отыскивать численные значения коэффициентов регрессии для сложных видов взаимосвязи параметров, описываемых, например, полиномами высоких степеней. Часто вид кривой может быть определен на основе физической сущности рассматриваемого процесса или явления. Полиномы высоких степеней имеет смысл применять для описания быстро меняющихся процессов в том случае, если пределы колебания параметров этих процессов значительные.
Применительно к исследованиям металлургического процесса достаточно использовать кривые низших порядков, например параболу второго порядка.
Эта кривая может иметь один экстремум, что, как показала практика, вполне достаточно для описания различных характеристик металлургического процесса.
Результаты расчетов параметров парной корреляц ионной взаи мосвязи были бы достоверны н представляли бы практическую ценн ость в том случае, если бы и спользуемая информация была получена для условий широких пределов колебаний аргумента при постоянстве всех прочих параметров процесса. Следовательно, методы исследования парной корреляционной взаимосвязи параметров могут быть использованы для решения практических задач лишь тогда, когда существует уверенность в отсутстви и других серьезных влияний на функцию, кроме анализируемого аргумента. В производственных условиях вести процесс таким образом продолжительное время невозможно. Однако если иметь информа цию об основных параметрах процесса, влияющих на его результаты, то математическим путем можно исключить влияние этих параметров и выделить в “чистом виде” взаимосвязь интересующей нас функции и аргумента. Такая связь называется частной, или индивидуальной. Для ее определения используется ме тод множественной регрессии.
МНОЖЕСТВЕННАЯ ЛИНЕЙНАЯ РЕГРЕССИЯ
Множественной регрессией называется взаимосвязь трех и более переменных, или влияние двух и более аргументов на функцию
y = f ( x 1 , x 2 , .... xn ) . ( 19 )
Для простоты рассмотрим случай, когда функция у сопоставляется с двумя аргументами x 1 и x 2 . Такую зависимость графически можно представить в трехмерно м пространстве { у , x 1 , x 2 } Со вокупность всех т точек пред ставляет собой корреляционное пространство. Задача определения связи у отx 1 и x 2 со стоит в том, чтобы подобрать такую плоскость, например плоскость Р , которая наилучшим образом вписалась бы в данное корреляционное пространство:
y = a + b 1 x 1 +b 2 x 2 . ( 20 )
При этом под словами “наилучшим образом” понимается удовлетворение требованию наименьших квадратов, т. е. сумма квадратов расстояний каждой точки корреляционного поля от искомой плоскости [уравнениеy = a + b 1 x 1 + b 2 x 2 ] должна быть минимальной. Это расстояни е определяется выражением
Dyj = yj -(a + b 1 x 1 + b 2 x 2 ) ( 21 )
Требуется найти значения коэффициентовa , b 1 и b 2 .
Выполнив необходимые преобразования, получим систему трех уравнений с тремя неизвестными:
,S y = m a + b 1 S x 1 + b 2 S x 2
S yx 1 = a S x 1 + b 1 S x 1 2 + b 2 S x 1 x 2 .
S yx 2 = a S x 2 + b 1 S x 1 x2 + b 2 S x 2 2 . ( 22 )
Решение системы уравнений относительно коэффициентов a , b 1 и b 2 , позволяет определить их численные значения. ВеличиныS y ,S x 1 , S x 1 2 ,S yx 1 ,S y x 2 , S x 2 , S x 2 2 ,S x 1 x 2 . находятся непосредственно по данным производственных измерений.
Таким образом, найденное уравнение регрессии описывает совместное влияниеx 1 и x 2 на функцию у . Коэффициентыa , b 1 и b 2 при этом имеют математический смысл.
Коэффициента равен функции у при нулевых значениях аргументовx 1 и x 2 . В геометрической интерпретации коэффициент а соответствует ординате точки пересечения плоскости регрессии Р с осью y .
Коэффициентb 1 равен измен ению функции у при изменении первого аргумента х 1 на единицу при неизменном втором аргументе x 2 . Аналогично коэффициент регрессии b 2 равен изменению функцииу при изменении второго аргументаx 2 на единицу при неизменном первом аргументеx 1 .
Из уравнения множественной линейной регрессии могут быть получены уравне ния частной регрессии аргументовx 1 и x 2 на функцию у :
у = a ' 1 + b 1 х 1 ( 23 a )
у = a ' 2 + b 2 х 2 ( 23 b )
При этом угловые коэффициенты регрессииb 1 и b 2 сохраняют те же числовые значения, что и в уравнении множественной регрес сии. Свободные члены уравнений для y можно подсчитать следующим образом:
a ' 1 = а +b 2 X 2 , ( 24 a )
a ' 2 = а +b 1 X 1 , ( 24 b )
где а — свободный член в уравнении множественной регрес сии ;
X 1 , X 2 — средние значения соответствующих аргументов.
х \.
Закономерности и выводы, используемые при исследовании взаимосвязи трех переменных (в трехмерном пространстве), применимы и для взаимосвязи большего числа переменных, .т. е. для многомерного пространства типа
y= f ( x 1 , x 2 , .... xn ) ( 25 )
В этом случае расчет уравнения множественной линейной регрессии типа
y = a + b 1 x 1 + b 2 x 2 +. b 3 x 3 + + b n x n ( 26 )
ведется для определения коэффициентовa , b 1 , b 2 ,b n .
Чтобы определить численные значени я этих ве личин, необходимо решить систему уравне ний: аналогичную приведенной выше для двух аргументов и функции.
Определив коэффициенты регрессии решением системы уравнений , получим уравнение множественной линейной регрессии , из которого могут быть получены уравнения частной взаимосвязи функции с каждым аргументом:
у = a' i + b i х i ,(27)
где a ' i — свободный член частного уравнения регрессии;
i - порядковый номер анализируемого аргумента.
Так же как и в случае трехмерной задачи, угловой коэффициент регрессииb i сохраняет то же численное значение, что и в уравнении множественной линейной регрессии . Свободный член частного уравнения регрессии рассчитывается по формуле
n
a' i = а +S b i X i -b e X e ( 28 )
i = 1
гдеа — свободный член множественного линейного уравнения регрессии;
X i — средние значения аргументов;
X e —среднее значение одного из -аргументов.
Оценкой тесноты связи при множественной линейной регрессии служит коэффициент множественной корреляции R, определяемый по формуле:
R = { b 1 [ sx 1 / sy ] r yx 1 + ... + b n [ sx n / sy ] r yx n } 1/2 ( 29 )
Величина коэффициента мно жественной корреляции всегда положительна и может меняться от 0 (при отсутствии связи) до 1 (при функциональной связи). С помощью коэффициента множественной корреляции оценивают совместное влияние на зависимую переменную всех включенных в расчет аргументов. Квадрат величины коэффициента множественной корреляции показывает долю изменчивости зависимой переменной, обусловленн ую изменением всех рассматриваемых аргументов, и называется коэффициентом множественной детерминации .
Для оценки тесноты частной взаимосвязи функции и каждого а ргумента служит коэффициент частной корреляции . Этот статистич ески й показатель учитывает тесноту взаимосвязи функции и одног о из показателей-аргументов при условии, что остальные аргументы з акреплены на уровне своих средних значений и не влияют на функц ию. Коэффициент частной корреляции обозначается индексом r y x i , гдеi — порядковый номер оцениваемого аргумента) и рассчитыв ается по формуле
{ 1 -R 2 n } } 1/2
r yx i = { 1 - ----------------} ( 30 )
{ 1 -R 2 n - 1 }
где R 2 n — квадрат коэффициента множественной корреляции для п аргументов;
R 2 n - 1 —- квадрат коэффициен та множественнойкор реляци и для n— 1 аргументов безi- того^. Ка к видно из формулы ( 30 ), коэффициент частной корреляции позволяет выделить уменьшение изменчивости фактических значений функции вокруг расчетных, связанное с введением в расчет уравнения множестве нной регрессии i -того аргумента. Коэффици ент r yx i прини мает значения от 0 ( при отсутствии связи) до 1 (п ри наличии функциональной св язи). Из формулы (30 )н евозможно опре делить знак коэффициента частной корреляции, поэтому его определяют по знаку углового коэффициента регрессииb i для данного аргумента. Значение коэффициента частной корреляции может отличаться от коэффициента парной корреляции не только по величине, но и по знаку для одной и той же задачи. При этом нужно помнить, что коэффициент частной корреляции является более объ ективной оценкой действительной взаимосвязи.
Оценка тесноты и ндивидуальной связи функции и аргумента при множественной регресси и с помощью коэффициента частной корреляции является более достоверной. Это соображение подтверждается уменьшением рассеяния точек относи тельно ли нии частной регрессии по сравнению с линией парной регрессии. Следовательно, даже при уменьшении коэффициента частной корреляции по сравнению с парным при частной регрессии наблюдается более тесная связь ме жду функцией и аргументом.
Для расчета по формуле (30) необходимо рассчитать коэффициенты регрессии с помощью систем уравнений отдельно для п и п — 1 аргументов. При этом значения коэффициентов будут различными.
Итак, в результате решения уравнения множественной регрессии , можно найти численные значения коэффициентов а , b 1 , b 2 ,b 3 , ..., b п . , определить показатели тесноты связи, а и менно коэффициент множественнойкорреляцииR , коэффициент детерминации , коэффициенты частной корреляции r' ух i .
Несмотря на то что уравнения частной линейной регрессии характеризуют реальную взаимосвязь функции иi -того аргумента с большей достоверностью, чем уравнения парной регрессии, они во многих случаях не удовлетворяют исследователей. Недостаток уравнений частной линейной регрессии заключается в том, что анализируемая зависимость представляется в виде прямой. В действительности, большинство взаимосвязей параметров металлургических процессов име ет криволинейный характер. Любое техническое мероприятие тем эффективней, чем хуже абсолютные исходные показатели.
Для повышения достоверности взаимосвязей параметров технологического процесса необходимо определить уравнения частной криволинейной регрессии. Рассмотрим несколько способов такого определения.
ЧАСТНАЯ КРИВОЛИНЕЙНАЯ РЕГРЕССИЯ НА ОСНОВЕ МНОЖЕСТВЕННОЙ ЛИНЕЙНОЙ РЕГРЕССИИ
Для упрощения рассмотрим задачу, в которой фигурируют два аргумента ( x 1 и x 2 ) и функция у . Рассчитаем уравнением ножественной линейной регресси и, т. е. определим численные значения коэффициентов а , b 1 и b 2
Найдем уравнения частной криволинейной регрессии. Например, чтобы получить уравнение частной регрессии у поx 2 , нужно исключить влияние на у аргументаx 1 . Для этого можно использовать следующий прием: каждое значение функции у в таблице исходной информации нужно скорректировать на величину отклонения первого аргумента от своего среднего, пользуясь для этого найденным угловым коэффициентом регрессииb i. Тогда каждое скорректированное значение функцииу' будет равно:
y' j = y j - (x 1j -X j )b 1 , ( 31 )
где y j — значение функции в таблице исходной информаци и
x 1j —значение первого аргумента в таблице исходной информации;
X j - среднее значение первого аргумента
Таким образом, скорректированное значение функции представляет собой фактическое значение функции скорректированное на влияние первого аргумента. В результате получаем ряд скорректированных значений функции, который не имеет регрессионной связи с рядом значений первого аргумента (коэффициент корреляции между скорректированной функцией и первым аргументом равен нулю).
Если в задаче имеется, например,п аргументов, то корректировка исходных значений функции должна быть выполнена по всем аргументам, кроме одного, частную связь которого с функцией предполагается определить. Для этого скорректированные значения функции у по всем аргументам, кроме второго, можно рассчитать по уравнению:
y' j = y j - (x 1 j -X 1j )b 1 - (x 3 j -X j )b 3 - (x n j -X n ) b n ( 32 )
угловой коэффици ент регре ссии из Таким:
^ == 523, 0— 0,00493Шл + 0,0001155Шл".
. Расчет парной криволинейной связи между у' j и х 2j может быть выполнен по методике, рассмотренной выше с использованием метода наименьших квадратов. Например, если для аппроксимации связи выбрана парабола второго порядка, то уравнение частной криволинейной регрессии следующее
у** j = а ** +b ** 2 x 2 + c ** 2 x 2 2 ( 33) .
а разность между точкой, лежащей на кривой, и данной точкой корреляционного поля
Dyj = y'j -у** j = y'j -(а ** +b ** 2 x 2 + c ** 2 x 2 2 ) (34 )
При этом сумма квадратов расстояний от каждой точки корреляционного поля до новой линии регрессии в случае параболы второго порядка будет иметь вид:
S 2 = S Dyj 2 = S [ y'j -(а** +b** 2 x 2 + c** 2 x 2 2 )] 2 ( 35 )
Исходя из условия минимума этой суммы, частные производные S 2 по а**, b** 2 и с** 2 приравниваются к нулю. Выполнив необходимые преобразования, получим систему трех уравнений с тремя неизвестными для определенияa**, b** и с**.
,S y' = m a ** + b ** 2 S x 2 + c ** 2 S x 2 2
S y'x 2 = a** S x 2 + b** 2 S x 2 2 + c** 2 S x 2 3
S y'x2 2 = a ** S x 2 2 + b ** 2 S x 2 3 + c ** 2 S x 2 4. ( 36 )
Решая систему уравнений (36) относительноa **, b ** 2 и с ** 2 , находим численные значения коэффициентов регрессии
Определяется парное корреляционное отношение для связи между скорректированными значениями функции у' и соответствующим аргументомx i . Парное корреляционное отношение является частным корреляционным отношением для связи между фактическими исходными значениями функции у и соответствующим аргументом к. В отличие от парного частное корреляционное отношение будем обозначать индексом h**уx i , где i— -порядковый номер аргумента, теснота связи с которым оценивается данным корреляционным отношением. Значение частного корреляционного отношения то же, что и коэффициента частной корреляции в случае множественной линейной корреляции.
Частное корреляционное отношение h**уx i :, определяется аналогично парному корреляционному отношению.
h** уx i ={ S (y** j -Y )2 / S (y' j -Y )2 } 1/2 ( 37 )
Аналогичным путем рассчитываются частные в заимосвязи фун кции со всеми остальными аргументами.
Рассмотрим еще одну методику определения частн ой криволинейной регрессии, котора я лишена этого недостатка.
ЧАСТНАЯ КРИВОЛИНЕЙНАЯ РЕГРЕССИЯ НА ОСНОВЕ МНОЖЕСТВЕННОЙ НЕЛИНЕЙНОЙ РЕГРЕССИИ
Для определения уравнения множественной криволинейной регрессии также используется метод наименьших квадратов.
Рассмотрим случай, когда функция зависит от двух аргументов (x 1 и x 2 ) аналогично примеру, рассмотренному приoписании множественной линейной корреляции. В систе ме координат у— X 1 — Х 2 располагается некое корреляционное пространство, образованное множе ством точек , каждая из которых соответствует результатам измерения параметров процесса. Задача состоит в том, чтобы вписать в д анноекорреляционное пространство некую поверхность, которая удовлетворяла бы условию наименьших квадратов отклонений. Условию наи меньших квадратов удовлетворяет поверхность для которой сумма квадратов расстояний до точек корреляционного поля минимальна:
Уравнение такой поверхности наилучшим образом опише т взаимосвязь у, X 1 иХ 2 .
y = a + b 1 x 1 + c 1 x 1 2 + b 2 x 2 + c 2 x 2 2 .( 38 ) ,
Для определения коэффициентов такого уравнения используем систему пяти уравнений с пятью неизвестными.
S y = m a + b 1 S x 1 + с 1 S x 1 2 + b 2 S x 2 +с 2 S x 2 2
S yx 1 = a S x 1 + b 1 S x 1 2 + с 1 S x 1 3 + b 2 S x 1 x 2 +с 2 S x 2 2 x 1
S yx 1 2 = a S x 1 2 + b 1 S x 1 3 + с 1 S x 1 4 + b 2 S x2 . x 1 2 +с 2 S x 2 2 x 1 2
S yx 2 = a S x 2 + b 1 S x 1 x 2 + с 1 S x 1 2 x 2 + b 2 S x 2 2 +с 2 S x 2 3
S yx 2 2 = a S x 2 2 + b 1 S x 1 x2 2 + с 1 S x 1 2 x 2 2 + b 2 S x2 3 . +с 2 S x 2 4 (39)
Если все точки корреляционного пространства находятся на расчетной поверхности, то множественное корреляционное отношение будет равно единице. При этом связь между функцией у и аргументамиx 1 и x 2 будет функциональной. По мере удаления точе к от расчетной поверхности этот показатель будет уменьшаться, приближаясь к нулю.
При переходе к анализу криволинейных связей возникает проблема выбора типа кри вой, с помощью которой выполняется аппроксимация каждой пары рассматриваемых пере менных. Для монотонно меняющегося процесса в сравнительно небольших интервалах изменения параметров, каким является металлургический процесс, можно без значительной ошибки аппроксимировать все существующие связиXi— Хе и у —Xi с помощью полиномов второй степе ни. Такое допущение намного упрощает методику расчета, , но в то же время сохраняет рассмотренные выше преимущества, присущие криволинейной аппроксимации. На основе сделанного допущения можно рассчитать уравнение множестве нной криволи нейной регрессии вида:
y = a + S b i x i + S c i xi 2 ( 40 )
гдеb и c — коэффициенты регрессии п риi-том аргументе(1 = 1, 2 ,. ..,п );
n —число аргументов в регрессионной модели;
а — свободный член уравнения регрессии.
Коэффициенты а , b иc , так же как и прежде, находятся методом наименьших квадратов из системы уравнений, которая в данном случае будет большей по сравнению с системой для определения коэффициентов множественной линейной регрессии. Количество неизвестных (а , b иc ), равное числу уравнений в случае множественной криволинейной регрессии, составитz = 2 n + 1, где п — число аргументов в корреляционной модели. Таким образом, если для определения уравнения множественной линейной корреляции с десятью аргументами необходимо решить систему из 11 уравнений с 11 неизвестными { а и10 x ), то для нахождения уравнения с десятью аргументами необходимо решить систему из 21 уравнения с21 неизвестным.
Частное уравнение регре ссии в этом случае имеет вид
уx i = а ' +b i x i + c i x i 2 , (41) .
причем свободный член этого уравнения а ' для каждой связи у — x i имеет свое численное значение, отличное от свободного члена а в уравнении множественной регрессии ( ), ( ), а значения коэффициенты регрессииb i и c i те же. Свободный член частного уравнения регрессии в данном случае рассчитывается по формуле
a 'i = a + S b 1- (n - i ) X 1- (n - i ) + S c 1- (n - i ) X 2 1- (n - i ) ( 42 )
гдеa — свободный член уравнения множественной регрессии.
Второй член правой части уравнения представляет собой сумму произведений средних значени й каждого аргумента, кроме 1 -того, на его коэффициент регрессии b i , а третий член правой части уравнения представляет собой сумму прои зведени й квадратов средних значений каждого аргумента, кромеt -того, на его коэффициент регрессииc i. Коэффициенты регрессии b и c взяты из уравнения множественной регрессии . Таким образом, из уравнения множественной регрессии может быть получен ряд уравнений частной регрессии (по числу аргументов п в корреляционной модели), с помощью которых определяютсяхарактер индивидуальных взаимосвязей функции и каждого аргумента.
Оценкой тесноты частной корреляционной связи в данном случае служит частное корреляционное отношение. Этот показатель рассчитывается аналогично парному корреляционному отношению .
ЗАДАНИЕ НА ВЫПОЛНЕНИЕ КУРСОВОЙ РАБОТЫ
Задание на выполнение курсовой работы состоит из краткого текста, поясняющего существо приводимых в задании групп исходных данных и самих групп исходных данных. Среди этих данных имеется несколько аргументов и одна функция. В задача курсовой работы входит проверка гипотез возможных связей между аргументами и функцией. Критерием правильности одной из гипотез является показатель тесноты связи. Это либо коэффициент парной или частной корреляции, либо парное или частное корреляционное отношение. После статистической обработки исходных данных проводится сравнение полученных показателей и делаются выводы о правомерности одного из предположений о характере связей.
СОСТАВ, ОБЪЕМ И СОДЕРЖАНИЕ КУРСОВОЙ РАБОТЫ
Курсовая работа включает теоретическую часть, в которой приводится описание методов регрессионного анализа, применяемых в данной работе.
Следующий раздел предусматривает предварительную статистическую обработку данных для их последующего рационального использования. Автор работы указывает на необходимость вычисления средних значений аргументов, средних квадратов аргументов, средних значений третьей и четвертой степени и т.д., после чего составляется таблица обработки исходных данных. Вид таблицы приведен ниже.
NN x 1 x 1 2 x 1 3 x 1 4 x 2 x 2 2 x 2 3 x 2 4 y yx 1 yx 2 yx 1 2 yx 2 2
--------------------------------------------------------------------------------------
...... ..... .... ..... ..... ...... ..... ..... ..... ..... ...... ...... ......
----------------------------------------------------------------------------------------------------------------
Средние
значенияX 1 X 1 2 X 1 3 X 1 4 X 2 X 2 2 X 2 3 X 2 4 Y YX 1 YX 2 YX 1 2 YX 2 2
Правильно составленная таблица позволяет легче справляться с вычмслением различнхы ситуаций в процессе решения разделов регрессионного анализа.
ОФОРМЛЕНИЕ КУРСОВОЙ РАБОТЫ
Курсовая работа офрмляется следующим образом.
- Титульный лист с указанием фамилии , имени, отчества студента и фамилии преподавателя
- Оригинал задания на выполнение курсовой работы
- Аннотация курсовой работы
- Оглавление работы
Теоретическая часть
Практическая часть работы
Выводы
Список использованной литературы
Приложения
ЗАШИТА КУРСОВОЙ РАБОТЫ
Защита курсовой работы происходит перед комиссией, составленной из преподавателей кафедры. Студент в течение 5-8 минут докладывает основное содержание работы, ее резулььаты и выводы, отвечает на вопросы членов комиссии. Оценка курсовой работы производится членами комиссии по пятибалльной системе с учетом содержания работы и ответа на вопросы.