Даведайцеся, што Простая лінейная рэгрэсія і як гэта працуе

Бейсик Статыстыка падыход да аналізу колькасных дадзеных

Прадастаўлена Colin Broug, фатограф. © 10 чэрвеня 2010 Stock.xchng

Лінейныя Рэгрэсійная мадэлі выкарыстоўваюцца , каб паказаць ці прадказаць сувязь паміж двума зменнымі або фактарамі . Фактар , які ў цяперашні час прагназуецца (фактар , што раўнанне вырашае для) завецца залежнай пераменнай. Фактары, якія выкарыстоўваюцца для прадказанні значэння залежнай пераменнай называюцца незалежнымі зменнымі.

Добрыя дадзеныя не заўсёды кажуць поўную гісторыю. Рэгрэсійная аналіз шырока выкарыстоўваецца ў навуковых даследаваннях, як гэта ўстаноўлена, што існуе карэляцыя паміж зменнымі.

Але карэляцыя ня такія ж , як прычынна - следчая сувязь . Нават лінія ў простай лінейнай рэгрэсіі, якая адпавядае кропках дадзеных таксама не можа сказаць нешта канчатковае аб прычынна-следчай сувязі.

У простай лінейнай рэгрэсіі, кожнае назіранне складаецца з двух значэнняў. Адно значэнне залежнай пераменнай і адно значэнне для незалежнай зменнай.

Простыя мадэлі лінейнай рэгрэсіі

Простая лінейная Рэгрэсійная мадэль прадстаўлена наступным чынам: Y = (& beta ; 0 + β 1 + Ε

Па матэматычнай канвенцыі, два фактары, якія ўдзельнічаюць у просты лінейнай рэгрэсіі пазначаюць х і у.

Раўнанне , якое апісвае , як у звязана з й вядома як Рэгрэсійная мадэллю. Мадэль лінейнай рэгрэсіі таксама змяшчае хібнасць , якая прадстаўлена Е, або грэцкай літарай эпсілон. Тэрмін памылкі выкарыстоўваецца для ўліку зменлівасці у , якія не могуць быць растлумачаны з дапамогай лінейнай залежнасці паміж х і у.

Там таксама параметры, якія ўяўляюць насельніцтва вывучаемыя. Гэтыя параметры мадэлі , якія прадстаўленыя 0+ β 1 х).

Простыя мадэлі лінейнай рэгрэсіі

Простае лінейнае раўнанне рэгрэсіі прадстаўлена наступным чынам: Ε (у) = 0 + β 1 х).

Простае раўнанне лінейнай рэгрэсіі графічна ў выглядзе прамой лініі.

(& Beta ; 0 з'яўляецца ў перасячэння лініі рэгрэсіі.

β 1 уяўляе сабой нахіл.

Ε (у) бок сярэдняя або чаканае значэнне ў пры зададзеным значэнні х.

Рэгрэсійная лінія можа паказаць станоўчую лінейную залежнасць, адмоўную лінейную залежнасць, ці не адносіны. Калі рэнтгенаграфічным лінія ў простай лінейнай рэгрэсіі з'яўляецца плоскім (не нахільным), няма ніякай сувязі паміж гэтымі двума зменнымі. Калі лінія рэгрэсія нахіленая ўверх з ніжнім канцом лініі на ў перахопу (восі) графіка, а верхні канца лініі , які праходзіць ўверх у поле графіка, удалечыні ад й перахопу (восі) станоўчая лінейная залежнасць існуе , Калі лінія рэгрэсіі нахіленая ўніз з верхняга канца лініі на ў перахопу (восі) графіка, а ніжні канец лініі , якая праходзіць ўніз ў полі графіка, у кірунку х перахопу (восі) адмоўная лінейная залежнасць існуе.

Разлікова Раўнанне лінейнай рэгрэсіі

Калі параметры папуляцыі былі вядомыя, простае лінейнае раўнанне рэгрэсіі (паказана ніжэй) можа быць выкарыстана для вылічэнні сярэдняга значэння ў пры вядомым значэнні х.

Ε (у) = 0 + β 1 х).

Аднак, на практыцы, значэнне параметраў не вядома , так што яны павінны быць ацэнены з выкарыстаннем дадзеных па выбарцы насельніцтва. У папуляцыйныя параметры ацэньваюцца з дапамогай статыстычных выбарак . У статыстычных выбарак прадстаўлены B 0 + B 1. Калі статыстычныя дадзеныя выбаркі замяняюцца для параметраў насельніцтва, фармуецца ацэначнае раўнанне рэгрэсіі.

Ацэньваюцца раўнанне рэгрэсіі паказана ніжэй.

(Y) = 0 + & beta ; 1 х

(Y) вымаўляецца у капелюшы.

Графік разліковай простага раўнання рэгрэсіі называецца ацэненай лінія рэгрэсіі.

Б 0 ёсць у перахопу.

B 1 уяўляе сабой нахіл.

Y) з'яўляецца ацэначнай велічынёй у пры зададзеным значэнні х.

Важнае заўвага: Рэгрэсійная аналіз не выкарыстоўваецца для інтэрпрэтацыі прычынна-следчых сувязяў паміж зменнымі. Рэгрэсійная аналіз можа, аднак, пазначыць , як зменныя звязаны або ў якой ступені зменныя звязаны адзін з адным.

Пры гэтым, Рэгрэсійная аналіз , як правіла, робяць істотныя адносіны , якія патрабуюць дасведчаных даследчыка Прыгледзеўшыся .

Таксама вядома як: двухмерных рэгрэсія, Рэгрэсійная аналіз

Прыклады: Найменш метадам найменшых квадратаў ўяўляе сабой статыстычны працэдура з выкарыстаннем выбарачных дадзеных , каб знайсці значэнне ацэненага раўнання рэгрэсіі. Метаду найменшых квадратаў быў прапанаваны Гаўса, які нарадзіўся ў 1777 годзе і памёр у 1855. метаду найменшых квадратаў па-ранейшаму шырока выкарыстоўваецца.

крыніцы:

Anderson, DR, Sweeney, ды-джэй, і Williams, TA (2003). Асновы статыстыкі для бізнесу і эканомікі Мэйсан, Агаё (3-е выд.): Паўднёва-Заходні, Томпсан навучання.

______. (2010). Растлумачыў гэта так: Рэгрэсійная аналіз. MIT News.

Макінтайр, Л. (1994). Выкарыстанне цыгарэты дадзеных для Увядзення ў множную рэгрэсію. Часопіс статыстыкі адукацыі, 2 (1).

Менденхалл, У. і Sincich, Т. (1992). Статыстыка для інжынерыі і навук (3-е выд.), Нью-Ёрк, Нью-Ёрк: Dellen Publishing Co.

Панчанка, Д. 18.443 Статыстыка для прыкладанняў, Fall 2006 г., раздзел 14, Простая лінейная рэгрэсія. (Масачусецкі тэхналагічны інстытут: MIT OpenCourseWare)