“ема 6: —татистичне вим≥рюванн¤ зв'¤зку

 

1. ¬иди взаЇмозвТ¤зк≥в.

2. ћодель анал≥тичного групуванн¤.

а) теоретичне обгрунтуванн¤ модел≥;

б) оц≥нка л≥н≥њ регресс≥њ;

в) вим≥рюванн¤ т≥сноти звТ¤зку;

г) перев≥рка суттЇвост≥ звТ¤зку.

3. –егрес≥йна модель.

а) теоретичне обгрунтуванн¤ однофакторноњ регрес≥йноњ модел≥;

б) оц≥нка л≥н≥њ регресс≥њ;

в) вим≥рюванн¤ т≥сноти звТ¤зку;

г) перев≥рка суттЇвост≥ звТ¤зку.

 

1. ¬иди взаЇмозвТ¤зк≥в

¬с≥ ¤вища в природ≥ ≥ сусп≥льств≥ взаЇмоповТ¤зан≥ ≥ взаЇмообумовлен≥.

¬ажлив≥шою особлив≥стю такого всеб≥чного зв'¤зку Ї причина залежн≥сть. ¬с≥ ¤вища соц≥ально-економ≥чного житт¤ Ї результатом впливу р¤ду причин, ¤к≥ в свою чергу Ї результатом ≥нших причин.

ѕри статистичному вивченн≥ взаЇмозвТ¤зк≥в розр≥зн¤ють факторн≥ ознаки (причини) ≥ результативн≥ ознаки (насл≥дки).

≤ндив≥дуальн≥ значенн¤ факторних ознак при¤н¤то позначати через х1, х2, хn; ≥ндив≥дуальн≥ значенн¤ результативноњ Ц y1, y2, yn.

–озгл¤немо приклад взаЇмозвТ¤зк≥в окремих статистичних показник≥в.

‘ондоозброЇн≥сть прац≥ (причина) Ц продуктивн≥сть прац≥ (насл≥док);

продуктивн≥сть прац≥ (причина) Ц соб≥варт≥сть продукц≥њ (насл≥док);

соб≥варт≥сть одиниц≥ продукц≥њ (причина) Ц прибуток (насл≥док) тощо.

¬ажливим завданн¤м статистики Ї ви¤вленн¤ ≥ вим≥рюванн¤ причинних залежностей.

–озр≥зн¤ють так≥ види залежностей:

1) функ≥ональна

2) стохастична ("ймов≥рний").

‘унк≥ональна Ц така залежн≥сть м≥ж ознакою "y" ≥ ознакою "x", коли кожному ≥ндив≥дуальному значенню ознаки x в≥дпов≥даЇ строго визначене значенн¤ ознаки y.

“ак, наприклад, за виготовленн¤ одиниц≥ вироба незалежно в≥д ≥нших умов виплачуЇтьс¤ 3грн. “од≥ залежн≥сть оплати в≥д к≥лькост≥ виробленоњ продукц≥њ можна записати так

y = 3 x

y 3 = 9 грн.

‘ункц≥ональна залежн≥сть однозначна, тобто знаючи ≥ндив≥дуальне значенн¤ x, можна ч≥тко вказати на значенн¤y.

ѕроте така залежн≥сть в сусп≥льно-економ≥чному житт≥ зустр≥чаЇтьс¤ дуже р≥дко.

—тохастична залежн≥сть про¤вл¤Їтьс¤ в тому, що при зм≥н≥ значень факторноњ ознаки, зм≥нюЇтьс¤ розпод≥л одиниць сукупност≥ за результативною ознакою.

“аким чином, умовн≥ розпод≥ли при р≥зних значенн¤х факторноњ ознаки неоднаков≥.

”мовним називаЇтьс¤ розпод≥л одиниць сукупност≥ за одн≥Їю ознакою при ф≥ксованому значенн≥ ≥ншоњ ознаки.

ѕриклад стохастичноњ залежност≥.

 

–озпод≥л роб≥тник≥в за системами оплати прац≥ та зм≥нним вироботком.

—истема

„исло роб≥тник≥в з вироб≥тником деталей (шт.)

оплати прац≥

13

14

15

16

17

разом

почасова

3

5

1

1

Ц

10

в≥др¤дна

Ц

2

4

16

8

30

разом

3

7

5

17

8

40

як бачимо з таблиц≥, при в≥др¤дн≥й оплат≥ прац≥ част≥ше зустр≥чаЇтьс¤ роб≥тник≥ з б≥льш високим р≥внем вироб≥тку.

—аме цей фактор дозвол¤Ї висунути г≥потезу про на¤вн≥сть звТ¤зку м≥ж системою оплати прац≥ ≥ к≥льк≥стю виготовленн¤ деталей одним роб≥тником

ќкремим випадком стохастичноњ залежност≥ Ї корел¤ц≥йна залежн≥сть. ѕри корел¤ц≥йн≥й залежност≥ середн≥ значенн¤ результуючоњ ознаки по кожному з умовних розпод≥л≥в р≥зн≥. «≥ зм≥ною значень факторноњ ознаки при на¤вност≥ корел¤ц≥йноњ залежност≥ спостер≥гаЇтьс¤ законом≥рна зм≥на середн≥х значень результивноњ ознаки.

¬изначемо, наприклад, середн≥й вироб≥ток деталей за даними таблиц≥, що наведена вище.

дет.

дет.

—ередн≥й вироб≥ток при в≥др¤дн≥й б≥льший.

¬ под≥бних випадках мова йде про корел¤ц≥йну залежн≥сть. ÷¤ залежн≥сть неоднозначна, бо кр≥м обраного фактору x на результативну ознаку мають вплив ≥нш≥ причини. “ому говоримо, що корел¤ц≥йна залежн≥сть про¤вл¤Їтьс¤ лише в середньому ≥ про¤витись вона може лише при умов≥ значноњ чисельност≥ елемент≥в сукупност≥, тобто на масових даних.

—уть корел¤ц≥йноњ залежност≥ пол¤гаЇ в тому, що з≥ зм≥ною ≥ндив≥дуальних значень ознаки Ђxї законом≥рно, систематично зм≥нюЇтьс¤ середнЇ значенн¤ ознаки Ђyї.

 

2. ћодель анал≥тичного групуванн¤ (ћј√)

¬ажлив≥шою к≥льк≥сною характеристикою корел¤ц≥йного звТ¤зку Ї так звана л≥н≥¤ регрес≥њ. Ћ≥н≥Їю регрес≥њ ФyФ на ФxФ називаЇтьс¤ функц≥¤, що звТ¤зуЇ умовн≥ середн≥ значенн¤ результативноњ ознаки з ≥ндив≥дуаль-ними значенн¤ми факторноњ ознаки.

Ћ≥н≥¤ регрес≥њ ¤к ≥ функц≥¤ може мати 3 зображенн¤:

1) граф≥чне;

2) таблиичне;

3) анал≥тичне.

√раф≥чне зображенн¤ самост≥йноњ рол≥ у вивченн≥ взаЇмозвТ¤зк≥в немаЇ.

Ќа табличному зображенн≥ базуЇтьс¤ метод анал≥тичного групуванн¤ або модель анал≥тичного групуванн¤.

ѕобудова ≥ анал≥з ћј√ передбачаЇ вир≥шенн¤ таких завдань:

а) теоретичне обгрунтуванн¤ модел≥;

б) оц≥нка л≥н≥њ регрес≥њ;

в) вим≥рюванн¤ т≥сноти звТ¤зку;

г) перев≥рка звТ¤зку.

ќбгрунтувати модель Ц це значить зд≥йснити глибокий теоретичний анал≥з сут≥ ¤вища, що вивчаЇтьс¤ ≥ визначити таким чином основн≥ факторн≥ ознаки, що можуть впливати на певну результативну ознаку, ¤ка ц≥кавить досл≥дника.

Ќа цьому етап≥ визначаЇтьс¤ к≥льк≥сть груп та розм≥р ≥нтервалу.

—л≥д мати на уваз≥, що анал≥тичне групуванн¤ зд≥йснюЇтьс¤ завжди за факторною ознакою.

ќц≥нити л≥н≥ю регрес≥њ Ц це значить обчислити середнЇ значенн¤ результативноњ ознаки по кожн≥й з в≥докремлених груп за факторною ознакою.

ћј√ може бути одно-, дво-, три-факторною.

”¤в≥мо соб≥, що метою нашого досл≥дженн¤ Ї вивченн¤ залежност≥ середнього доходу на кожного члена с≥мТњ в с≥мТ¤х службовц≥в в залежност≥ в≥д њх розм≥ру

÷≥лком очевидно, що середньодушовий доход в певн≥й м≥р≥ залежить в≥д числа член≥в с≥мТњ.

“аким чином перша з названих ознак результативна, друга Ц факторна. «асобом, що дозволить довести це припущенн¤ про на¤вн≥сть залежност≥ Ї модель анал≥тичного групуванн¤. –озгл¤немо схему вивченн¤ ц≥Ї залежност≥ на приклад≥ даних, що отриман≥ в результат≥ виб≥ркового опитуванн¤ 50-ти с≥мей службовц≥в одного з рег≥он≥в (с≥чень 1997 р.).

 

N с≥мТњ

„исло член≥в с≥мТњ (x)

—ередньодушовий доход, грн.)

1

3

102

2

1

130

3

3

98

4

5

75

5

2

1 15

:

:

:

:

:

:

50

4

72

 

ƒле того, щоб ви¤вити чи ≥снюЇ залежн≥сть м≥ж обраними ознаками, сл≥д побудувати анал≥тичн≥ групуванн¤.

як бачимо, значенн¤ факторноњ ознаки x1=1, x2=2, ..., x5=5. ¬ цьому випадку беззаперечно Ї розпод≥л (обТЇднанн¤) елемент≥в сукупност≥ за факторною ознакою на 5 груп. ¬ид≥ливши 5 груп також обчислити середн≥ значенн¤ р≥вн≥ результативн≥ ознаки по кожн≥й з вид≥лених груп:

 

–езультати занесемо в таблицю.

 

“аблиц¤

«алежн≥сть середньодушового доходу в≥д розм≥ру с≥мТњ.

–озм≥р с≥мТњ (x)

 ≥льк≥сть с≥мей (fI)

—ередньодушовий доход по групах тис. грн. ()

1

8

124

2

10

113

3

14

90

4

11

68

5

7

52

–азом

50

 

як бачимо, дан≥ цього анал≥тичного групуванн¤ п≥дтверджують г≥потезу про на¤вн≥сть звТ¤зку м≥ж досл≥джуваними ознаками: чим б≥льша с≥мТ¤, тим нищий середньодушовий доход на 1 члена с≥мТњ.

«образимо цю залежн≥сть граф≥чно.

Ћ≥н≥¤ регрес≥њ в цьому конкретному випадку характеризуЇ залежн≥сть середн≥х значень доходу в розрахунку на члена с≥мТњ в≥д к≥лькост≥ член≥в с≥мТњ в окремих точках.

¬она не описуЇ в повн≥й м≥р≥ обТЇктивний звТ¤зок,але чим б≥льше ФnФ, тим точн≥ша ц¤ оц≥нка.

“рет≥м етапом вим≥рюванн¤ звТ¤зку Ї оц≥нка т≥сноти звТ¤зку.

ќбчисленн¤ характеристики, що дозвол¤Ї оц≥нити т≥сноту звТ¤зку базуЇтьс¤ на математичному правил≥ складанн¤ дисперс≥й абовар≥ац≥й.

÷е правило можна записати так:

–озгл¤немо економ≥чний зм≥ст кожноњ з цих дисперс≥й

«агальна дисперс≥¤ () характеризуЇ м≥ру вар≥ац≥њ (в≥дхилень ≥ндив≥дуальних значень результативноњ ознаки в≥д середнього значенн¤ по сукупност≥) результативноњ ознаки УyФ, що повТ¤зана (зпричинена)ус≥ма без вин¤тку факторами, що могли вплинути на, вар≥ац≥ю результативноњ ознаки. ќбчислюЇтьс¤ за формулами

;††

ƒл¤ нашого прикладу ц¤ дисперс≥¤ становить =1875.†††††††

«агальна середн¤ результативноњ ознаки, тобто середньодушовий доход за 50 с≥мТ¤х вц≥лому становить =90 грн. «агальна дисперс≥¤ 1875 характеризуЇ м≥ру вар≥ац≥њ середньодушового доходу, спричинену впливом таких фактор≥в, ¤к розм≥р с≥мТњ, к≥льк≥сть працюючих, посади працюючих, осв≥та тощо.

якщож обчислити дисперс≥ю по кожн≥йз груп, то отримаЇмо характеристики м≥ри вар≥ац≥њ результативноњ ознаки на ¤ку не впливаЇ групувальна ознака або обраний дл¤ вивченн¤ фактор (розм≥р с≥мТњ).

√рупов≥ дисперс≥њ обчислюютьс¤ за формулою

деyi Ц ≥ндив≥дуальн≥ значенн¤ результуючоњ ознаки по кожн≥й з груп;

Ц середн≥ значенн¤ результуючоњ ознаки по кожн≥й з груп.

”загальнюючою характеристикою цих дисперс≥й Ї середнЇ з них

середн¤ з групових:

¬ипадкова або залишкова дисперс≥¤, бо вона характеризуЇ м≥ру вар≥ац≥њ результуючоњ ознаки, спричинену рештою фактор≥в, кр≥м головного фактору, покладеного в основу груповань.

ћ≥ру вар≥ац≥њ результуючоњ ознаки, спричинену головним фактором ФxФ характеризуЇ так звана м≥жгрупова дисперс≥¤:

†††††††††††††††††††††

Ц середн¤ по сукупност≥ в ц≥лому (=90 грн.)

¬ар≥ац≥ю результивноњ ознаки, обумовлену ви¤вом головного фактора часто називають систематичною або факторною.

ќбчилимо м≥жгрупову дисперс≥ю за даними наведеного вище анал≥тичного групованн¤

—п≥вв≥дношенн¤ м≥жгруповоњ ≥ загальноњ дисперс≥Їю харакрактеризуЇ т≥сноту коре뤤ц≥йного звТ¤зку ≥ називаЇтьс¤ корел¤ц≥йним в≥дношенн¤м.

.

¬исновок: “аким чином вар≥ац≥¤ середньодушового доходу по обстежених 50-ти с≥мТ¤х на 32 % спричиненавар≥ац≥Їю числа членв с≥мТњ

корел¤ц≥йний звТ¤зок в≥дсутн≥й функц≥ональний звТ¤зок

¬ажливим етапом вивченн¤ корел¤ц≥ного звТ¤зку Ї перев≥рка суттЇвост≥ (≥стотност≥) звТ¤зку. ѕерев≥рити ≥стотн≥сть звТ¤зку Ц це значить переконатись, що корел¤ц≥йна залежн≥сть ви¤влена на основ≥ анал≥тичного групуванн¤ не Ї випадковою фактичне значенн¤ корел¤ц≥йного в≥дношенн¤ з критичним цього показника.

 ритичне значенн¤ це таке його максимально можливе значенн¤, ¤ке могло виникнути при випадковому звТ¤зку м≥ж ознаками yx або при такому незначному звТ¤зку, ¤ким можна знехтувати.

 ритичн≥ значенн¤ , що Ї в спец≥альних таблиц¤х обчислен≥ дл¤ заданих р≥вн≥в ≥стотност≥ ≥ в≥дпов≥дних чисел ступен≥в свободи (k)

–≥вень ≥стотност≥ Ц ймов≥рн≥сть отриманн¤ значенн¤ б≥льшого за критичне при умов≥ в≥дсутност≥ звТ¤зку м≥ж ознаками.

якщо , то це значить, що дане табличне значенн¤ не зТ¤витьс¤ в пТ¤ти випадках ≥з ста, ≥ ¤кщо , то в одному випадку ≥з ста.

„ислом ступен≥ свободи називаЇтьс¤ число незалежних зм≥нних необх≥дних дл¤ обчисленн¤ того чи ≥ншого показника.

“ак дл¤ обчисленн¤ k=nЦ1 дл¤

x1=10; x2=12;x3=8 ††††††††††† =10

n Ц число елемент≥в сукупност≥.

„исло ступен≥в свободи дл¤ дисперс≥й обчислюЇтьс¤ так

k1=mЦ1 дл¤ (при в≥дсутност≥ звТ¤зку м≥ж признаками т≥льки в 5 випадках з 100б≥льше критичного значенн¤)

k2=nЦm дл¤ †††††† m Ц число груп анал≥тичного групуванн¤.

якщо критичне < фактичне, то корел¤ц≥йний звТ¤зок признаЇтьс¤ ≥стотним.

ѕерев≥римо ≥стотн≥сть звТ¤зку дл¤ наведеного вище прикладу. ѕерев≥римо його дл¤ р≥вн¤ ≥стотност≥ 0,05. ќбчислимо число ступен≥в свободи

k1=mЦ1 =5Ц1=4

k2=nЦm =50Ц5=45.

«находимо по таблиц≥ критичне значенн¤ при заданих умовах

критичне=0,207

‘актичне значенн¤ , тобто обчисленн¤ коли на основ≥ складенн¤ дисперс≥й становило 0,335. ѕор≥вн¤вши критичне з фактичне робимо висновок, що звТ¤зок м≥ж середньодушовим доходом ≥ розм≥ром с≥мТњ Ї ≥стотним.

ѕерев≥рку ≥стотност≥ звТ¤зку можна зд≥йснити також скориставшись ≥ншим показником, що що називаЇтьс¤ критер≥Їм ‘≥шера

Fкритер≥й=

F=.

«наченн¤ Fкритич. також Ї в спец≥альних таблиц¤х. ѕерев≥рка суттЇвост≥ за цим критер≥Їм аналог≥чна перев≥рц≥, що зд≥йснюЇтьс¤ з допомогою .

ћодель корел¤ц≥йно-регресивного анал≥зу

Ќа анал≥тичному зображенн≥ л≥н≥њ регрес≥њ базуЇтьс¤ метод корел¤ц≥йного регрес≥йного анал≥зу ( –ј). Ћ≥н≥¤ регрес≥њ описуЇтьс¤ з допомогою р≥вн¤нн¤ регрес≥њ такого виду:

Y=P(x), де Y Ц теоретичне значенн¤ результуючоъ ознаки УyФ, що обчислюЇтьс¤ за р≥вн¤нн¤м регрес≥њ.

“аким чином, завданн¤ регрес≥њ пол¤гаЇ в тому, щоб на¤вну залежн≥сть м≥ж ознаками yx в≥добразити к≥льк≥сно, тобто визначити наск≥льки в середньому зм≥нитьс¤ значенн¤результативноњ ознаки з≥ зм≥ною на певну величину значенн¤ факторноњ ознаки.

¬залежност≥ в≥д конкретних умов ≥ сум досл≥джуваних ¤вищ при вивченн≥ корел¤ц≥йних звТ¤зк≥в част≥ше ≥нших використовуютьс¤ так≥ функц≥њ

1) (л≥н≥йна)

2) (степенева)

3) (г≥пербола)

4) (парабола) ≥ т.д.

3а) ѕершим етапом  –ј Ї в≥дображенн¤ факторних ознак та виб≥р форми р≥вн¤нн¤ регрес≥њ. ‘актори обираютьс¤ на основ≥ глибокого теоретичного анал≥зу сут≥ ¤вищ що вивчаютьс¤. јнал≥зуючи ¤вища можна також вибрати ≥ вид р≥вн¤нн¤ регрес≥њ. ѕроте б≥льш над≥йним засобом, що дозвол¤Ї вибрати р≥вн¤нн¤ регрес≥њ Ї граф≥чний, тобто побудова так званого корел¤ц≥йного пол¤.

ѕ≥сл¤ того, ¤к вибрано р≥вн¤нн¤ регрес≥њ, що на думку досл≥дника може в≥добразити залежн≥сть ознаки y в≥д ознаки x сл≥д оц≥нити л≥н≥ю регрес≥њ. ќц≥нити л≥н≥ю регрес≥њ в  –ј Ц це значить обчислити теоретичн≥ значенн¤ результативноњ ознаки Y дл¤ кожного з значень факторноњ ознаки за даними р≥вн¤нн¤.

ƒл¤ цього необх≥дно перш за все обчислити параметри р≥вн¤нн¤.

”¤вимо соб≥, що залежн≥сть описуЇтьс¤ р≥вн¤нн¤м пр¤моњ: .

ѕараметри ab обчислюютьс¤ за способом найменших квадрат≥в, тобто прищоб . ÷ьому способу в≥дпов≥даЇ система таких двох нормальних р≥вн¤нь:

¬≥дшукавши параметри можна обчислити теоретичн≥ р≥вн≥ X.

ѕ≥сл¤ оц≥нки л≥н≥њ регрес≥њ сл≥д оц≥нити т≥сноту звТ¤зку. ÷е завданн¤ в≥р≥шуЇтьс¤ таким же чином, ¤к ≥ при досл≥дженн≥ звТ¤зку на основ≥ анал≥тичного групуванн¤.(ун≥версальним) т≥сноти звТ¤зку в  –ј Ї так званий коеф≥ц≥Їнт детерм≥нац≥њ, обчисленн¤ ¤кого базуЇтьс¤ на правил≥ складанн¤ дисперс≥й

залишкова

Ц загальна дисперс≥¤

Ц факторна дисперс≥¤, що характеризуЇ систематичну вар≥ац≥ю

залишкова Ц вар≥ац≥ю, обумовлену рештою фактор≥в.

 оеф≥ц≥Їнт детерм≥нац≥њ обчислюЇтьс¤ так

††††††

Ц звТ¤зок м≥ж ознаками x ≥ y в≥дсутн≥й.

Ц функц≥ональний звТ¤зок.

„асом використовуЇтьс¤ дл¤ оц≥нки т≥сноти звТ¤зку так званий ≥ндекс корел¤ц≥њ†† .  оеф≥ц≥Їнт детерм≥нац≥њ ¤к показник т≥сноти звТ¤зку використовуЇтьс¤ призалежност≥ (л≥н≥йна чи нел≥н≥йна). ƒисперс≥њ в  –ј обчислюютьс¤ за формулами:

†††††††††††††

÷¤ дисперс≥¤ характеризуЇ м≥ру вар≥ац≥њ ознаки y, обумовлену впливом вс≥х без вийн¤тку фактор≥в

÷¤ дисперс≥¤ характеризуЇ м≥ру вар≥ац≥њ ознаки y, обумовлену впливом саме ознаки x

залишкова=.

’арактеризуЇ м≥ру вар≥ац≥њ ознаки y, обумовлену впливом решти ознак, тобто за вийн¤тком впливу ознаки x.

ѕри вивченн≥ л≥н≥йноњ залежност≥ в окремих випадках користуютьс¤ таким показником т≥сноти звТ¤зку, ¤к л≥н≥йний коеф≥ц≥ент корел¤ц≥њ r

„им блищий цей показник до одиниц≥, тим т≥сн≥ше вважаЇтьс¤ звТ¤зок.

÷ей звТ¤зок находитьс¤ в межах:

якщо значенн¤ r в≥дТЇмне, це св≥дчить про те, що звТ¤зок м≥ж ознаками y ≥ x обернений. ѕри умов≥ л≥н≥йного звТ¤зку |r|=R

ѕерев≥рка ≥стотност≥ звС¤зку в  –ј аналог≥чна перев≥рц≥ в ћј√, проте число ступен≥в свободив  –ј залежить не в≥д числа груп ¤к в ћј√, а в≥д числа параметр≥в обраного р≥вн¤нн¤. ¬  –ј m Ц число параметр≥в.

ƒл¤ перев≥рки ≥стотност≥ фактичне чи Fфактичне сп≥вставити з критичним (табличним) значенн¤ми цих показник≥в

фактичнекриитчне

Fфактичне > F криитчне, то звТ¤зок визнаЇтьс¤ ≥стотним.

Hosted by uCoz