Загрузите инструмент анализа данных из надстроек Excel, включенных во все версии Excel. Вы должны сделать это, чтобы провести регрессию или любой другой тип анализа данных. При нажатии на «Инструменты» открывается раскрывающееся меню. Выберите «Надстройки» и в открывшемся меню отметьте «Пакет инструментов анализа» и нажмите «ОК». «Анализ данных» должен появиться в меню «Инструменты».
Введите данные, которые вы будете использовать для регрессии, в лист Excel, кодируя любые фиктивные переменные значением 1 или 0, в зависимости от того, имеет ли субъект рассматриваемую характеристику. Пол - это пример фиктивной переменной, поскольку испытуемыми могут быть только мужчины или женщины. Например, при изучении результатов вступительных экзаменов в колледж, включающих пол предмета, студенткам может быть присвоено значение 1. Использование фиктивных переменных среди ваших независимых переменных не требует специальных функций в Excel. Помните, что если фиктивная переменная имеет только две категории (например, мужскую или женскую), для представления этих двух категорий требуется только одна переменная.
Кодируйте категориальные переменные с более чем двумя категориями как несколько фиктивных переменных, убедившись, что количество переменных на единицу меньше количества категорий (n-1, в статистических терминах). Например, категория этнической принадлежности, выраженная в пяти уровнях (белый, черный, латиноамериканец, азиат, индеец), потребует четырех отдельных фиктивных переменных. Например, если вы изучали результаты вступительных экзаменов в колледж, вы можете создать следующий макет переменные: темнокожие, латиноамериканцы, азиатские и американские индейцы, каждому присваивается 1 балл, если рассматриваемый ученик подходит к этому этническому категория.
Расширьте возможности Excel для регрессии с помощью фиктивных переменных с помощью надстройки, которая позволит программе проводить регрессии с фиктивными зависимыми переменными. Одной из таких программ является XLStat, которую можно приобрести и загрузить у производителя, Addinsoft. Такие программы, как эта, позволяют проводить регрессии, в которых зависимая переменная принимает значения либо 1, либо 0.
Предупреждение
Распространенная ошибка новичков - использовать столько фиктивных переменных, сколько существует категорий (например, две фиктивные переменные для мужчин и женщин). Такой подход создал бы мультиколлинеарность, при которой две независимые переменные сильно коррелированы, что делает практически невозможным определение их отдельного воздействия на зависимую переменную. Помните, что количество фиктивных переменных всегда должно быть на единицу меньше количества категорий.