Jak korzystać ze zmiennych fikcyjnych w regresji programu Excel

Załaduj narzędzie do analizy danych z dodatków programu Excel, zawartych we wszystkich wersjach programu Excel. Musisz to zrobić, aby przeprowadzić regresję lub inny rodzaj analizy danych. Kliknięcie „Narzędzia” otwiera menu rozwijane. Wybierz „Dodatki” iz otwartego menu zaznacz „Analysis ToolPak” i kliknij „OK”. W menu Narzędzia powinna pojawić się „Analiza danych”.

Wprowadź dane, których użyjesz do swojej regresji, do arkusza programu Excel, kodując dowolne zmienne fikcyjne o wartości 1 lub 0, w zależności od tego, czy temat ma daną cechę. Płeć jest przykładem zmiennej fikcyjnej, ponieważ przedmiotem badania mogą być tylko mężczyźni lub kobiety. Na przykład badanie wyników egzaminów wstępnych na studia, które obejmowały płeć badanych, może zakodować studentki z 1. Korzystanie ze zmiennych fikcyjnych wśród zmiennych niezależnych nie wymaga żadnych specjalnych funkcji w programie Excel. Pamiętaj, że jeśli zmienna fikcyjna ma tylko dwie kategorie (np. męska lub żeńska), do reprezentowania tych dwóch kategorii potrzebna jest tylko jedna zmienna.

Zakoduj zmienne kategorialne z więcej niż dwiema kategoriami jako wiele zmiennych fikcyjnych, upewniając się, że liczba zmiennych jest o jeden mniejsza niż liczba kategorii (n-1, w kategoriach statystycznych). Na przykład przynależność etniczna kategorii wyrażona jako pięć poziomów (biały, czarny, latynoska, azjatycka, indyjska) wymagałaby czterech oddzielnych fikcyjnych zmiennych. Na przykład, jeśli studiowałeś wyniki egzaminów wstępnych na studia, możesz utworzyć następujący manekin zmienne: czarna, latynoska, azjatycka i indyjska, kodując każdy jako 1, jeśli dany uczeń pasuje do tej grupy etnicznej Kategoria.

Rozszerz możliwości programu Excel w zakresie regresji z fikcyjnymi zmiennymi za pomocą dodatku, który umożliwi programowi przeprowadzanie regresji z fikcyjnymi zmiennymi zależnymi. Jednym z takich programów jest XLStat, który można kupić i pobrać od producenta Addinsoft. Programy takie jak ten umożliwiają przeprowadzanie regresji, w których zmienna zależna przyjmuje wartości 1 lub 0.

Ostrzeżenie

Częstym błędem wśród początkujących jest używanie tylu fikcyjnych zmiennych, ile jest kategorii (takich jak na przykład dwie obojętne zmienne dla mężczyzny i kobiety). Takie podejście stworzyłoby wielowspółliniowość, w której dwie zmienne niezależne są silnie skorelowane, co sprawia, że ​​prawie niemożliwe jest określenie ich oddzielnego wpływu na zmienną zależną. Pamiętaj, że liczba zmiennych fikcyjnych powinna być zawsze o jeden mniejsza od liczby kategorii.