Бейсик Статыстыка падыход да аналізу колькасных дадзеных
Лінейныя Рэгрэсійная мадэлі выкарыстоўваюцца , каб паказаць ці прадказаць сувязь паміж двума зменнымі або фактарамі . Фактар , які ў цяперашні час прагназуецца (фактар , што раўнанне вырашае для) завецца залежнай пераменнай. Фактары, якія выкарыстоўваюцца для прадказанні значэння залежнай пераменнай называюцца незалежнымі зменнымі.
Добрыя дадзеныя не заўсёды кажуць поўную гісторыю. Рэгрэсійная аналіз шырока выкарыстоўваецца ў навуковых даследаваннях, як гэта ўстаноўлена, што існуе карэляцыя паміж зменнымі.
Але карэляцыя ня такія ж , як прычынна - следчая сувязь . Нават лінія ў простай лінейнай рэгрэсіі, якая адпавядае кропках дадзеных таксама не можа сказаць нешта канчатковае аб прычынна-следчай сувязі.
У простай лінейнай рэгрэсіі, кожнае назіранне складаецца з двух значэнняў. Адно значэнне залежнай пераменнай і адно значэнне для незалежнай зменнай.
- Просты лінейны Рэгрэсійная аналіз Самай простай формай Рэгрэсійная аналізу выкарыстоўвае па залежнай пераменнай і адной незалежнай зменнай. У гэтай простай мадэлі , прамая апраксімуецца суадносіны паміж залежнай пераменнай і незалежнай зменнай.
- Множны ня Рэгрэсійная аналіз Калі два ці больш незалежныя зменныя выкарыстоўваюцца ў Рэгрэсійная аналізе, мадэль ужо не з'яўляецца простым лінейным.
Простыя мадэлі лінейнай рэгрэсіі
Простая лінейная Рэгрэсійная мадэль прадстаўлена наступным чынам: Y = (& beta ; 0 + β 1 + Ε
Па матэматычнай канвенцыі, два фактары, якія ўдзельнічаюць у просты лінейнай рэгрэсіі пазначаюць х і у.
Раўнанне , якое апісвае , як у звязана з й вядома як Рэгрэсійная мадэллю. Мадэль лінейнай рэгрэсіі таксама змяшчае хібнасць , якая прадстаўлена Е, або грэцкай літарай эпсілон. Тэрмін памылкі выкарыстоўваецца для ўліку зменлівасці у , якія не могуць быць растлумачаны з дапамогай лінейнай залежнасці паміж х і у.
Там таксама параметры, якія ўяўляюць насельніцтва вывучаемыя. Гэтыя параметры мадэлі , якія прадстаўленыя (β 0+ β 1 х).
Простыя мадэлі лінейнай рэгрэсіі
Простае лінейнае раўнанне рэгрэсіі прадстаўлена наступным чынам: Ε (у) = (β 0 + β 1 х).
Простае раўнанне лінейнай рэгрэсіі графічна ў выглядзе прамой лініі.
(& Beta ; 0 з'яўляецца ў перасячэння лініі рэгрэсіі.
β 1 уяўляе сабой нахіл.
Ε (у) бок сярэдняя або чаканае значэнне ў пры зададзеным значэнні х.
Рэгрэсійная лінія можа паказаць станоўчую лінейную залежнасць, адмоўную лінейную залежнасць, ці не адносіны. Калі рэнтгенаграфічным лінія ў простай лінейнай рэгрэсіі з'яўляецца плоскім (не нахільным), няма ніякай сувязі паміж гэтымі двума зменнымі. Калі лінія рэгрэсія нахіленая ўверх з ніжнім канцом лініі на ў перахопу (восі) графіка, а верхні канца лініі , які праходзіць ўверх у поле графіка, удалечыні ад й перахопу (восі) станоўчая лінейная залежнасць існуе , Калі лінія рэгрэсіі нахіленая ўніз з верхняга канца лініі на ў перахопу (восі) графіка, а ніжні канец лініі , якая праходзіць ўніз ў полі графіка, у кірунку х перахопу (восі) адмоўная лінейная залежнасць існуе.
Разлікова Раўнанне лінейнай рэгрэсіі
Калі параметры папуляцыі былі вядомыя, простае лінейнае раўнанне рэгрэсіі (паказана ніжэй) можа быць выкарыстана для вылічэнні сярэдняга значэння ў пры вядомым значэнні х.
Ε (у) = (β 0 + β 1 х).
Аднак, на практыцы, значэнне параметраў не вядома , так што яны павінны быць ацэнены з выкарыстаннем дадзеных па выбарцы насельніцтва. У папуляцыйныя параметры ацэньваюцца з дапамогай статыстычных выбарак . У статыстычных выбарак прадстаўлены B 0 + B 1. Калі статыстычныя дадзеныя выбаркі замяняюцца для параметраў насельніцтва, фармуецца ацэначнае раўнанне рэгрэсіі.
Ацэньваюцца раўнанне рэгрэсіі паказана ніжэй.
(Y) = (β 0 + & beta ; 1 х
(Y) вымаўляецца у капелюшы.
Графік разліковай простага раўнання рэгрэсіі называецца ацэненай лінія рэгрэсіі.
Б 0 ёсць у перахопу.
B 1 уяўляе сабой нахіл.
Y) з'яўляецца ацэначнай велічынёй у пры зададзеным значэнні х.
Важнае заўвага: Рэгрэсійная аналіз не выкарыстоўваецца для інтэрпрэтацыі прычынна-следчых сувязяў паміж зменнымі. Рэгрэсійная аналіз можа, аднак, пазначыць , як зменныя звязаны або ў якой ступені зменныя звязаны адзін з адным.
Пры гэтым, Рэгрэсійная аналіз , як правіла, робяць істотныя адносіны , якія патрабуюць дасведчаных даследчыка Прыгледзеўшыся .
Таксама вядома як: двухмерных рэгрэсія, Рэгрэсійная аналіз
Прыклады: Найменш метадам найменшых квадратаў ўяўляе сабой статыстычны працэдура з выкарыстаннем выбарачных дадзеных , каб знайсці значэнне ацэненага раўнання рэгрэсіі. Метаду найменшых квадратаў быў прапанаваны Гаўса, які нарадзіўся ў 1777 годзе і памёр у 1855. метаду найменшых квадратаў па-ранейшаму шырока выкарыстоўваецца.
крыніцы:
Anderson, DR, Sweeney, ды-джэй, і Williams, TA (2003). Асновы статыстыкі для бізнесу і эканомікі Мэйсан, Агаё (3-е выд.): Паўднёва-Заходні, Томпсан навучання.
______. (2010). Растлумачыў гэта так: Рэгрэсійная аналіз. MIT News.
Макінтайр, Л. (1994). Выкарыстанне цыгарэты дадзеных для Увядзення ў множную рэгрэсію. Часопіс статыстыкі адукацыі, 2 (1).
Менденхалл, У. і Sincich, Т. (1992). Статыстыка для інжынерыі і навук (3-е выд.), Нью-Ёрк, Нью-Ёрк: Dellen Publishing Co.
Панчанка, Д. 18.443 Статыстыка для прыкладанняў, Fall 2006 г., раздзел 14, Простая лінейная рэгрэсія. (Масачусецкі тэхналагічны інстытут: MIT OpenCourseWare)