“ема 6: —татистичне вим≥рюванн¤ зв'¤зку
1. ¬иди взаЇмозвТ¤зк≥в.
2.
ћодель анал≥тичного групуванн¤.
а) теоретичне обгрунтуванн¤ модел≥;
б) оц≥нка л≥н≥њ регресс≥њ;
в) вим≥рюванн¤ т≥сноти звТ¤зку;
г) перев≥рка суттЇвост≥ звТ¤зку.
3. –егрес≥йна модель.
а) теоретичне обгрунтуванн¤ однофакторноњ регрес≥йноњ
модел≥;
б) оц≥нка л≥н≥њ регресс≥њ;
в) вим≥рюванн¤ т≥сноти звТ¤зку;
г) перев≥рка суттЇвост≥ звТ¤зку.
1.
¬иди взаЇмозвТ¤зк≥в
¬с≥ ¤вища в природ≥ ≥ сусп≥льств≥ взаЇмоповТ¤зан≥ ≥
взаЇмообумовлен≥.
¬ажлив≥шою
особлив≥стю такого всеб≥чного зв'¤зку Ї причина залежн≥сть. ¬с≥ ¤вища
соц≥ально-економ≥чного житт¤ Ї результатом впливу р¤ду причин, ¤к≥ в свою чергу
Ї результатом ≥нших причин.
ѕри
статистичному вивченн≥ взаЇмозвТ¤зк≥в розр≥зн¤ють факторн≥ ознаки (причини) ≥
результативн≥ ознаки (насл≥дки).
≤ндив≥дуальн≥
значенн¤ факторних ознак при¤н¤то позначати через х1, х2, хn; ≥ндив≥дуальн≥ значенн¤ результативноњ Ц y1, y2, yn.
–озгл¤немо приклад взаЇмозвТ¤зк≥в окремих статистичних
показник≥в.
‘ондоозброЇн≥сть прац≥ (причина) Ц продуктивн≥сть прац≥ (насл≥док);
продуктивн≥сть прац≥ (причина) Ц
соб≥варт≥сть продукц≥њ (насл≥док);
соб≥варт≥сть одиниц≥
продукц≥њ (причина) Ц прибуток (насл≥док) тощо.
¬ажливим
завданн¤м статистики Ї ви¤вленн¤ ≥ вим≥рюванн¤ причинних залежностей.
–озр≥зн¤ють
так≥ види залежностей:
1)
функ≥ональна
2)
стохастична ("ймов≥рний").
‘унк≥ональна Ц
така залежн≥сть м≥ж ознакою "y"
≥ ознакою "x", коли кожному
≥ндив≥дуальному значенню ознаки x
в≥дпов≥даЇ строго визначене значенн¤ ознаки y.
“ак,
наприклад, за виготовленн¤ одиниц≥ вироба незалежно в≥д ≥нших
умов виплачуЇтьс¤ 3грн. “од≥ залежн≥сть оплати в≥д к≥лькост≥
виробленоњ продукц≥њ можна записати так
y = 3 x
y 3 = 9 грн.
‘ункц≥ональна залежн≥сть однозначна, тобто знаючи
≥ндив≥дуальне
значенн¤ x, можна ч≥тко вказати на
значенн¤† y.
ѕроте така залежн≥сть в сусп≥льно-економ≥чному житт≥
зустр≥чаЇтьс¤
дуже р≥дко.
—тохастична
залежн≥сть про¤вл¤Їтьс¤ в тому, що при зм≥н≥ значень факторноњ ознаки,
зм≥нюЇтьс¤ розпод≥л одиниць сукупност≥ за результативною ознакою.
“аким
чином, умовн≥ розпод≥ли при р≥зних значенн¤х факторноњ ознаки неоднаков≥.
”мовним
називаЇтьс¤ розпод≥л одиниць сукупност≥ за одн≥Їю ознакою при ф≥ксованому
значенн≥ ≥ншоњ ознаки.
ѕриклад стохастичноњ залежност≥.
–озпод≥л роб≥тник≥в за системами оплати прац≥ та
зм≥нним вироботком.
—истема |
„исло
роб≥тник≥в з вироб≥тником деталей (шт.) |
|||||
оплати
прац≥ |
13 |
14 |
15 |
16 |
17 |
разом |
почасова |
3 |
5 |
1 |
1 |
Ц |
10 |
в≥др¤дна |
Ц |
2 |
4 |
16 |
8 |
30 |
разом |
3 |
7 |
5 |
17 |
8 |
40 |
як бачимо з таблиц≥, при в≥др¤дн≥й оплат≥ прац≥ част≥ше
зустр≥чаЇтьс¤
роб≥тник≥ з б≥льш високим р≥внем вироб≥тку.
—аме
цей фактор дозвол¤Ї висунути г≥потезу про на¤вн≥сть звТ¤зку м≥ж системою оплати
прац≥ ≥ к≥льк≥стю виготовленн¤ деталей одним роб≥тником
ќкремим випадком стохастичноњ залежност≥ Ї корел¤ц≥йна
залежн≥сть.
ѕри корел¤ц≥йн≥й залежност≥ середн≥ значенн¤ результуючоњ ознаки по кожному з
умовних розпод≥л≥в р≥зн≥. «≥ зм≥ною значень факторноњ ознаки при на¤вност≥
корел¤ц≥йноњ залежност≥ спостер≥гаЇтьс¤ законом≥рна зм≥на середн≥х значень
результивноњ ознаки.
¬изначемо,
наприклад, середн≥й вироб≥ток деталей за даними таблиц≥, що наведена вище.
†дет.
†дет.
—ередн≥й
вироб≥ток при в≥др¤дн≥й б≥льший.
¬
под≥бних випадках мова йде про корел¤ц≥йну залежн≥сть. ÷¤ залежн≥сть неоднозначна,
бо кр≥м обраного фактору x на
результативну ознаку
мають вплив ≥нш≥ причини. “ому говоримо, що корел¤ц≥йна залежн≥сть про¤вл¤Їтьс¤
лише в середньому ≥ про¤витись вона може лише при умов≥ значноњ чисельност≥
елемент≥в сукупност≥, тобто на масових даних.
—уть
корел¤ц≥йноњ залежност≥ пол¤гаЇ в тому, що з≥ зм≥ною ≥ндив≥дуальних значень ознаки Ђxї законом≥рно, систематично зм≥нюЇтьс¤ середнЇ значенн¤
ознаки Ђyї.
2. ћодель анал≥тичного групуванн¤ (ћј√)
¬ажлив≥шою
к≥льк≥сною характеристикою корел¤ц≥йного звТ¤зку Ї так звана л≥н≥¤ регрес≥њ. Ћ≥н≥Їю
регрес≥њ ФyФ на ФxФ називаЇтьс¤ функц≥¤, що
звТ¤зуЇ умовн≥ середн≥ значенн¤ результативноњ ознаки з ≥ндив≥дуаль-ними
значенн¤ми факторноњ ознаки.
Ћ≥н≥¤
регрес≥њ ¤к ≥ функц≥¤ може мати 3 зображенн¤:
1)
граф≥чне;
2)
таблиичне;
3)
анал≥тичне.
√раф≥чне зображенн¤ самост≥йноњ рол≥ у вивченн≥
взаЇмозвТ¤зк≥в немаЇ.
Ќа табличному зображенн≥ базуЇтьс¤ метод анал≥тичного
групуванн¤
або модель анал≥тичного групуванн¤.
ѕобудова
≥ анал≥з ћј√ передбачаЇ вир≥шенн¤ таких завдань:
а)
теоретичне обгрунтуванн¤ модел≥;
б)
оц≥нка л≥н≥њ регрес≥њ;
в)
вим≥рюванн¤ т≥сноти звТ¤зку;
г)
перев≥рка звТ¤зку.
ќбгрунтувати
модель Ц це значить зд≥йснити глибокий теоретичний анал≥з сут≥ ¤вища, що
вивчаЇтьс¤ ≥ визначити таким чином основн≥ факторн≥ ознаки, що можуть впливати
на певну результативну ознаку, ¤ка ц≥кавить досл≥дника.
Ќа
цьому етап≥ визначаЇтьс¤ к≥льк≥сть груп та розм≥р ≥нтервалу.
—л≥д
мати на уваз≥, що анал≥тичне групуванн¤ зд≥йснюЇтьс¤ завжди за факторною
ознакою.
ќц≥нити
л≥н≥ю регрес≥њ Ц це значить обчислити середнЇ значенн¤ результативноњ ознаки по
кожн≥й з в≥докремлених груп за факторною ознакою.
ћј√
може бути одно-, дво-, три-факторною.
”¤в≥мо
соб≥, що метою нашого досл≥дженн¤ Ї вивченн¤ залежност≥ середнього доходу на кожного члена с≥мТњ в с≥мТ¤х службовц≥в в залежност≥ в≥д њх розм≥ру
÷≥лком
очевидно, що середньодушовий доход в певн≥й м≥р≥ залежить в≥д числа член≥в
с≥мТњ.
“аким
чином перша з названих ознак результативна, друга Ц факторна. «асобом, що
дозволить довести це припущенн¤ про на¤вн≥сть залежност≥ Ї модель анал≥тичного
групуванн¤. –озгл¤немо схему вивченн¤ ц≥Ї залежност≥ на приклад≥ даних, що
отриман≥ в результат≥ виб≥ркового опитуванн¤ 50-ти с≥мей службовц≥в одного з
рег≥он≥в (с≥чень 1997 р.).
N с≥мТњ |
„исло член≥в с≥мТњ (x) |
—ередньодушовий доход, грн. (у) |
1 |
3 |
102 |
2 |
1 |
130 |
3 |
3 |
98 |
4 |
5 |
75 |
5 |
2 |
1 15 |
: |
: |
: |
: |
: |
: |
50 |
4 |
72 |
ƒле
того, щоб ви¤вити чи ≥снюЇ залежн≥сть м≥ж обраними ознаками, сл≥д побудувати
анал≥тичн≥ групуванн¤.
як
бачимо, значенн¤ факторноњ ознаки x1=1, x2=2, ..., x5=5. ¬ цьому
випадку беззаперечно Ї розпод≥л (обТЇднанн¤) елемент≥в сукупност≥ за факторною
ознакою на 5 груп. ¬ид≥ливши 5 груп також обчислити середн≥ значенн¤ р≥вн≥
результативн≥ ознаки по кожн≥й з вид≥лених груп:
–езультати
занесемо в таблицю.
“аблиц¤
«алежн≥сть
середньодушового доходу в≥д розм≥ру с≥мТњ.
–озм≥р с≥мТњ (x) |
≥льк≥сть с≥мей (fI) |
—ередньодушовий доход по групах тис.
грн. () |
1 |
8 |
124 |
2 |
10 |
113 |
3 |
14 |
90 |
4 |
11 |
68 |
5 |
7 |
52 |
–азом |
50 |
’ |
як
бачимо, дан≥ цього анал≥тичного групуванн¤ п≥дтверджують
г≥потезу про на¤вн≥сть звТ¤зку м≥ж досл≥джуваними
ознаками: чим б≥льша с≥мТ¤, тим нищий середньодушовий доход на 1 члена с≥мТњ.
«образимо
цю залежн≥сть граф≥чно.
Ћ≥н≥¤ регрес≥њ в цьому конкретному випадку характеризуЇ
залежн≥сть
середн≥х значень доходу в розрахунку на члена с≥мТњ в≥д к≥лькост≥ член≥в с≥мТњ
в окремих точках.
¬она
не описуЇ в повн≥й м≥р≥ обТЇктивний звТ¤зок,†
але чим б≥льше ФnФ, тим
точн≥ша ц¤ оц≥нка.
“рет≥м
етапом вим≥рюванн¤ звТ¤зку Ї оц≥нка т≥сноти звТ¤зку.
ќбчисленн¤
характеристики, що дозвол¤Ї оц≥нити т≥сноту звТ¤зку базуЇтьс¤ на математичному правил≥ складанн¤ дисперс≥й або† вар≥ац≥й.
÷е правило можна записати так:
–озгл¤немо
економ≥чний зм≥ст кожноњ з цих дисперс≥й
«агальна
дисперс≥¤ () характеризуЇ м≥ру вар≥ац≥њ (в≥дхилень
≥ндив≥дуальних значень результативноњ ознаки в≥д середнього значенн¤ по
сукупност≥) результативноњ ознаки УyФ,
що повТ¤зана (зпричинена)† ус≥ма без вин¤тку факторами, що могли
вплинути на, вар≥ац≥ю результативноњ ознаки. ќбчислюЇтьс¤ за формулами
;††
ƒл¤
нашого прикладу ц¤ дисперс≥¤ становить =1875.†††††††
«агальна
середн¤ результативноњ ознаки, тобто
середньодушовий доход за 50 с≥мТ¤х
вц≥лому становить =90 грн. «агальна
дисперс≥¤ 1875 характеризуЇ м≥ру вар≥ац≥њ середньодушового доходу, спричинену
впливом таких фактор≥в, ¤к розм≥р с≥мТњ, к≥льк≥сть
працюючих, посади працюючих, осв≥та тощо.
якщож
обчислити дисперс≥ю по кожн≥й† з груп, то
отримаЇмо характеристики м≥ри
вар≥ац≥њ результативноњ ознаки на ¤ку не впливаЇ групувальна ознака або обраний
дл¤ вивченн¤ фактор (розм≥р с≥мТњ).
√рупов≥ дисперс≥њ обчислюютьс¤ за формулою
де† yi Ц ≥ндив≥дуальн≥ значенн¤ результуючоњ ознаки по кожн≥й з
груп;
†Ц середн≥ значенн¤
результуючоњ ознаки по кожн≥й з груп.
”загальнюючою характеристикою цих дисперс≥й Ї
середнЇ з них
середн¤
з групових:
¬ипадкова
або залишкова дисперс≥¤, бо вона характеризуЇ м≥ру вар≥ац≥њ результуючоњ
ознаки, спричинену рештою фактор≥в, кр≥м головного фактору, покладеного в
основу груповань.
ћ≥ру
вар≥ац≥њ результуючоњ ознаки, спричинену головним фактором ФxФ характеризуЇ так звана м≥жгрупова
дисперс≥¤:
††††††††††††††††††††† †
Ц середн¤ по сукупност≥ в ц≥лому (=90 грн.)
¬ар≥ац≥ю
результивноњ ознаки, обумовлену ви¤вом головного фактора часто називають
систематичною або факторною.
ќбчилимо
м≥жгрупову дисперс≥ю за даними наведеного вище анал≥тичного групованн¤
—п≥вв≥дношенн¤ м≥жгруповоњ ≥ загальноњ дисперс≥Їю
харакрактеризуЇ т≥сноту
коре뤤ц≥йного звТ¤зку ≥ називаЇтьс¤ корел¤ц≥йним в≥дношенн¤м.
.
¬исновок:
“аким чином вар≥ац≥¤ середньодушового доходу по обстежених 50-ти с≥мТ¤х на 32 % спричинена† вар≥ац≥Їю числа членв с≥мТњ
†корел¤ц≥йний
звТ¤зок в≥дсутн≥й функц≥ональний звТ¤зок
¬ажливим
етапом вивченн¤ корел¤ц≥ного звТ¤зку Ї перев≥рка суттЇвост≥ (≥стотност≥)
звТ¤зку. ѕерев≥рити ≥стотн≥сть звТ¤зку Ц це значить переконатись, що
корел¤ц≥йна залежн≥сть ви¤влена на основ≥ анал≥тичного групуванн¤ не Ї
випадковою фактичне значенн¤ корел¤ц≥йного в≥дношенн¤ з критичним цього
показника.
ритичне
значенн¤ †це таке його
максимально можливе значенн¤, ¤ке могло виникнути при випадковому звТ¤зку м≥ж
ознаками y ≥ x або при такому незначному звТ¤зку, ¤ким можна знехтувати.
ритичн≥
значенн¤ , що Ї в спец≥альних таблиц¤х обчислен≥ дл¤ заданих
р≥вн≥в ≥стотност≥ ≥ в≥дпов≥дних чисел ступен≥в свободи (k)
–≥вень
≥стотност≥ Ц ймов≥рн≥сть отриманн¤ значенн¤ †б≥льшого за
критичне при умов≥ в≥дсутност≥ звТ¤зку м≥ж ознаками.
якщо
, то це значить, що дане табличне значенн¤ †не зТ¤витьс¤
в пТ¤ти випадках ≥з ста, ≥ ¤кщо , то в одному випадку ≥з ста.
„ислом
ступен≥ свободи називаЇтьс¤ число незалежних зм≥нних необх≥дних дл¤ обчисленн¤
того чи ≥ншого показника.
“ак
дл¤ обчисленн¤ †k=nЦ1 дл¤
x1=10; x2=12;† x3=8 ††††††††††† =10
n Ц число
елемент≥в сукупност≥.
„исло
ступен≥в свободи дл¤ дисперс≥й обчислюЇтьс¤ так
k1=mЦ1 дл¤ †(при
в≥дсутност≥ звТ¤зку м≥ж признаками т≥льки в 5 випадках з 100† †б≥льше
критичного значенн¤† )
k2=nЦm дл¤ †††††† m Ц
число груп анал≥тичного групуванн¤.
якщо
критичне < фактичне, то корел¤ц≥йний звТ¤зок признаЇтьс¤
≥стотним.
ѕерев≥римо
≥стотн≥сть звТ¤зку дл¤ наведеного вище прикладу. ѕерев≥римо його дл¤ р≥вн¤
≥стотност≥ 0,05. ќбчислимо число ступен≥в свободи
k1=mЦ1 =5Ц1=4
k2=nЦm =50Ц5=45.
«находимо
по таблиц≥ критичне значенн¤ †при заданих
умовах
критичне=0,207
‘актичне
значенн¤ , тобто обчисленн¤ коли на основ≥ складенн¤
дисперс≥й становило 0,335. ѕор≥вн¤вши критичне з фактичне робимо висновок, що звТ¤зок м≥ж середньодушовим
доходом ≥ розм≥ром с≥мТњ Ї ≥стотним.
ѕерев≥рку
≥стотност≥ звТ¤зку можна зд≥йснити також скориставшись ≥ншим показником, що що
називаЇтьс¤ критер≥Їм ‘≥шера
Fкритер≥й=
F=.
«наченн¤
Fкритич. також Ї в спец≥альних таблиц¤х. ѕерев≥рка суттЇвост≥ за цим критер≥Їм
аналог≥чна перев≥рц≥, що зд≥йснюЇтьс¤ з допомогою .
ћодель
корел¤ц≥йно-регресивного анал≥зу
Ќа
анал≥тичному зображенн≥ л≥н≥њ регрес≥њ базуЇтьс¤ метод корел¤ц≥йного
регрес≥йного анал≥зу ( –ј). Ћ≥н≥¤ регрес≥њ описуЇтьс¤ з допомогою р≥вн¤нн¤
регрес≥њ такого виду:
Y=P(x), де Y Ц теоретичне значенн¤ результуючоъ ознаки УyФ, що обчислюЇтьс¤ за р≥вн¤нн¤м регрес≥њ.
“аким
чином, завданн¤ регрес≥њ пол¤гаЇ в тому, щоб на¤вну залежн≥сть м≥ж ознаками y ≥ x
в≥добразити к≥льк≥сно, тобто визначити наск≥льки в середньому зм≥нитьс¤
значенн¤† результативноњ ознаки з≥ зм≥ною
на певну величину значенн¤ факторноњ ознаки.
¬залежност≥
в≥д конкретних умов ≥ сум досл≥джуваних ¤вищ при вивченн≥ корел¤ц≥йних звТ¤зк≥в
част≥ше ≥нших використовуютьс¤ так≥ функц≥њ
1)
†(л≥н≥йна)
2)
†(степенева)
3)
†(г≥пербола)
4)
†(парабола) ≥ т.д.
3а)
ѕершим етапом –ј Ї в≥дображенн¤ факторних ознак та виб≥р форми р≥вн¤нн¤
регрес≥њ. ‘актори обираютьс¤ на основ≥ глибокого теоретичного анал≥зу сут≥ ¤вищ
що вивчаютьс¤. јнал≥зуючи ¤вища можна також вибрати ≥ вид р≥вн¤нн¤ регрес≥њ.
ѕроте б≥льш над≥йним засобом, що дозвол¤Ї вибрати р≥вн¤нн¤ регрес≥њ Ї граф≥чний,
тобто побудова так званого корел¤ц≥йного пол¤.
ѕ≥сл¤
того, ¤к вибрано р≥вн¤нн¤ регрес≥њ, що на думку досл≥дника може в≥добразити
залежн≥сть ознаки y в≥д ознаки x сл≥д оц≥нити л≥н≥ю регрес≥њ. ќц≥нити л≥н≥ю
регрес≥њ в –ј Ц це значить обчислити теоретичн≥ значенн¤ результативноњ ознаки
Y дл¤ кожного з значень факторноњ ознаки за даними р≥вн¤нн¤.
ƒл¤
цього необх≥дно перш за все обчислити параметри р≥вн¤нн¤.
”¤вимо
соб≥, що залежн≥сть описуЇтьс¤ р≥вн¤нн¤м пр¤моњ: .
ѕараметри
a ≥ b обчислюютьс¤ за способом найменших квадрат≥в, тобто при† щоб . ÷ьому способу в≥дпов≥даЇ система таких двох нормальних
р≥вн¤нь:
¬≥дшукавши
параметри можна обчислити теоретичн≥ р≥вн≥ X.
ѕ≥сл¤
оц≥нки л≥н≥њ регрес≥њ сл≥д оц≥нити т≥сноту звТ¤зку. ÷е завданн¤ в≥р≥шуЇтьс¤
таким же чином, ¤к ≥ при досл≥дженн≥ звТ¤зку на основ≥ анал≥тичного
групуванн¤.† (ун≥версальним) т≥сноти
звТ¤зку в –ј Ї так званий коеф≥ц≥Їнт детерм≥нац≥њ, обчисленн¤ ¤кого базуЇтьс¤
на правил≥ складанн¤ дисперс≥й
залишкова
Ц загальна дисперс≥¤
Ц факторна дисперс≥¤, що характеризуЇ систематичну вар≥ац≥ю
залишкова Ц вар≥ац≥ю, обумовлену рештою фактор≥в.
оеф≥ц≥Їнт
детерм≥нац≥њ обчислюЇтьс¤ так
††††††
†Ц звТ¤зок м≥ж ознаками
x ≥ y в≥дсутн≥й.
†Ц функц≥ональний
звТ¤зок.
„асом
використовуЇтьс¤ дл¤ оц≥нки т≥сноти звТ¤зку так званий ≥ндекс корел¤ц≥њ†† . оеф≥ц≥Їнт детерм≥нац≥њ ¤к показник т≥сноти звТ¤зку
використовуЇтьс¤ при† залежност≥ (л≥н≥йна
чи нел≥н≥йна). ƒисперс≥њ в –ј обчислюютьс¤ за формулами:
†††††††††††††
÷¤
дисперс≥¤ характеризуЇ м≥ру вар≥ац≥њ ознаки y, обумовлену впливом вс≥х без
вийн¤тку фактор≥в
÷¤
дисперс≥¤ характеризуЇ м≥ру вар≥ац≥њ ознаки y, обумовлену впливом саме ознаки x
залишкова=.
’арактеризуЇ
м≥ру вар≥ац≥њ ознаки y, обумовлену впливом решти ознак, тобто за вийн¤тком
впливу ознаки x.
ѕри
вивченн≥ л≥н≥йноњ залежност≥ в окремих випадках користуютьс¤ таким показником
т≥сноти звТ¤зку, ¤к л≥н≥йний коеф≥ц≥ент корел¤ц≥њ r
„им блищий цей показник до одиниц≥, тим т≥сн≥ше
вважаЇтьс¤ звТ¤зок.
÷ей
звТ¤зок находитьс¤ в межах:
якщо
значенн¤ r в≥дТЇмне, це св≥дчить про те, що звТ¤зок м≥ж ознаками y ≥ x обернений.
ѕри умов≥ л≥н≥йного звТ¤зку |r|=R
ѕерев≥рка
≥стотност≥ звС¤зку в –ј аналог≥чна перев≥рц≥ в ћј√, проте число ступен≥в
свободив –ј залежить не в≥д числа груп ¤к в ћј√, а в≥д числа параметр≥в
обраного р≥вн¤нн¤. ¬ –ј m Ц число
параметр≥в.
ƒл¤
перев≥рки ≥стотност≥ фактичне чи Fфактичне сп≥вставити з критичним (табличним) значенн¤ми
цих показник≥в
фактичне† криитчне
Fфактичне
> F криитчне, то звТ¤зок визнаЇтьс¤ ≥стотним.