모든 Excel 버전에 포함된 Excel 추가 기능에서 데이터 분석 도구를 로드합니다. 회귀 또는 다른 유형의 데이터 분석을 수행하려면 이 작업을 수행해야 합니다. "도구"를 클릭하면 드롭다운 메뉴가 열립니다. "추가 기능"을 선택하고 열리는 메뉴에서 "Analysis ToolPak"을 선택하고 "확인"을 클릭하십시오. 도구 메뉴에 "데이터 분석"이 표시되어야 합니다.
회귀에 사용할 데이터를 Excel 워크시트에 입력하고 주제에 해당 특성이 있는지 여부에 따라 값 1 또는 0으로 더미 변수를 코딩합니다. 연구의 주제는 남성 또는 여성일 수 있으므로 성별은 더미 변수의 예입니다. 예를 들어, 과목의 성별을 포함하는 대학 입학 시험 점수에 대한 연구는 여학생을 1로 코딩할 수 있습니다. 독립 변수 중에서 더미 변수를 사용하려면 Excel에서 특별한 기능이 필요하지 않습니다. 더미 변수에 두 개의 범주(예: 남성 또는 여성)만 있는 경우 두 범주를 나타내는 데 하나의 변수만 필요하다는 것을 기억하십시오.
범주가 3개 이상인 범주형 변수를 다중 더미 변수로 코딩하여 변수 수가 범주 수보다 1개 적은지 확인합니다(통계적 용어로 n-1). 예를 들어, 5개 수준(백인, 흑인, 히스패닉, 아시아인, 아메리칸 인디언)으로 표현된 범주 민족성은 4개의 개별 더미 변수가 필요합니다. 예를 들어, 대학 입학 시험 점수를 공부하는 경우 다음 더미를 만들 수 있습니다. 변수: 흑인, 히스패닉, 아시아 및 아메리칸 인디언, 해당 학생이 해당 민족에 맞는 경우 각각 1로 코딩 범주.
프로그램이 더미 종속 변수를 사용하여 회귀를 수행할 수 있도록 하는 추가 기능을 사용하여 더미 변수를 사용한 회귀에 대한 Excel의 용량을 확장합니다. 그러한 프로그램 중 하나는 XLStat이며 제조업체인 Addinsoft에서 구입 및 다운로드할 수 있습니다. 이와 같은 프로그램을 사용하면 종속 변수가 값 또는 1 또는 0을 취하는 회귀를 수행할 수 있습니다.
경고
초보자들 사이에서 흔히 저지르는 실수는 범주가 있는 만큼 많은 더미 변수를 사용하는 것입니다(예: 남성과 여성에 대한 두 개의 더미 변수). 이러한 접근 방식은 두 개의 독립 변수가 높은 상관 관계를 갖는 다중 공선성을 생성하여 종속 변수에 대한 개별 효과를 결정하는 것이 거의 불가능합니다. 더미 변수의 수는 항상 범주 수보다 하나 적어야 합니다.