Як використовувати фіктивні змінні в регресії Excel

Завантажте інструмент аналізу даних із надбудов Excel, які входять до всіх версій Excel. Ви повинні зробити це, щоб провести регресію або будь-який інший тип аналізу даних. Натиснувши «Інструменти», відкриється спадне меню. Виберіть «Надбудови» і в меню, що відкриється, поставте прапорець «Пакет інструментів аналізу» та натисніть «ОК». «Аналіз даних» має з’явитися у вашому меню «Інструменти».

Введіть дані, які ви будете використовувати для регресії, у робочий аркуш Excel, закодуючи будь-які фіктивні змінні значенням 1 або 0, залежно від того, чи має суб’єкт відповідну характеристику. Стать є прикладом фіктивної змінної, оскільки суб’єктами дослідження можуть бути тільки чоловіки або жінки. Дослідження результатів вступних іспитів до коледжу, які включали стать предметів, наприклад, може кодувати студенток 1. Використання фіктивних змінних серед ваших незалежних змінних не потребує спеціальних функцій у Excel. Пам’ятайте, що якщо фіктивна змінна має лише дві категорії (наприклад, чоловіки чи жінки), для представлення двох категорій потрібна лише одна змінна.

Кодуйте категоріальні змінні з більш ніж двома категоріями як кількома фіктивними змінними, переконавшись, що кількість змінних на одиницю менша за кількість категорій (n-1, у статистичних термінах). Наприклад, категорія етнічності, виражена як п’ять рівнів (білий, чорний, іспаномовний, азіатський, американський індіанець), потребує чотирьох окремих фіктивних змінних. Наприклад, якщо ви вивчали результати вступних іспитів до коледжу, ви можете створити наступний манекен змінні: чорні, латиноамериканці, азіатські та американські індіанці, кожна з яких кодується 1, якщо студент, про який йде мова, відповідає цій етніці категорія.

Розширте можливості Excel для регресії за допомогою фіктивних змінних за допомогою надбудови, яка дозволить програмі проводити регресії з фіктивними залежними змінними. Однією з таких програм є XLStat, доступна для покупки та завантаження від виробника Addinsoft. Такі програми, як ця, дозволяють проводити регресії, в яких залежна змінна приймає значення або 1, або 0.

Увага

Поширеною помилкою новачків є використання стільки фіктивних змінних, скільки існує категорій (наприклад, дві фіктивні змінні для чоловіків і жінок). Такий підхід створить мультиколінеарність, при якій дві незалежні змінні сильно корелюють, що робить майже неможливим визначення їх окремого впливу на залежну змінну. Пам’ятайте, що кількість фіктивних змінних завжди повинна бути на одиницю меншою за кількість категорій.