วิธีการใช้การถดถอยพหุคูณใน Excel
เครดิตรูปภาพ: fizkes/iStock/GettyImages
Excel เป็นเครื่องมือที่มีประสิทธิภาพสำหรับการวิเคราะห์ข้อมูล ไม่ว่าคุณจะทำงานกับความสัมพันธ์ง่ายๆ ระหว่าง ตัวแปรอิสระหนึ่งตัวและตัวแปรตามหรือมีหลายตัวแปรอิสระถึง พิจารณา. การเรียนรู้เกี่ยวกับวิธีการวิเคราะห์หลายตัวแปรใน Excel ในรูปแบบของการถดถอยพหุคูณ และการตีความผลลัพธ์เป็นสิ่งสำคัญ หากคุณมีข้อมูลที่ซับซ้อนที่ต้องดำเนินการ ข่าวดีก็คือ Excel ได้รับการตั้งค่ามาอย่างดีเพื่อจัดการกับงานเหล่านี้ และคุณจำเป็นต้องเรียนรู้วิธีทำงานเพียงฟังก์ชันเดียวเพื่อเริ่มทำความเข้าใจข้อมูลของคุณ
การถดถอยพหุคูณคืออะไร?
การถดถอยพหุคูณเป็นวิธีเชื่อมโยงตัวแปรอิสระหลายตัวกับตัวแปรตามตัวเดียวโดยการค้นหาสมการที่อธิบายว่าตัวแปรในคำถามเปลี่ยนแปลงอย่างไรกับแต่ละตัว เครื่องมือพื้นฐานแต่คล้ายคลึงกันคือการถดถอยเชิงเส้น ซึ่งมีจุดมุ่งหมายเพื่อตรวจสอบความเชื่อมโยงระหว่างอิสระ ตัวแปร เช่น โรคอ้วน ตัวแปรตาม เช่น ความเสี่ยงของโรคมะเร็ง แต่สิ่งต่างๆ มักไม่ค่อยเป็นแบบนี้ ตรงไปตรงมา ต่อจากตัวอย่าง จำนวนบุหรี่ที่สูบต่อวันยังสัมพันธ์กับความเสี่ยงมะเร็ง เช่นเดียวกับปริมาณแอลกอฮอล์ที่คุณดื่ม หากต้องการคาดการณ์ความเสี่ยงมะเร็งในแต่ละคนได้อย่างแม่นยำ คุณจะต้องคำนึงถึงปัจจัยเหล่านี้ทั้งหมด (และอื่นๆ)
วิดีโอประจำวันนี้
รูปแบบทั่วไปของสมการที่ใช้สำหรับการถดถอยพหุคูณคือ:
Y^ = NS + NS1x1 + NS2x2 + NS3x3 …
ดังนั้น Y^ คือค่าที่คาดหวังสำหรับการสังเกต, the NS1 และอื่นๆ แทนความชันของความสัมพันธ์แบบเส้นตรงระหว่าง x1 และ Y^ และ x1 และตัวแปรอื่นๆ ที่รวมอยู่ในการวิเคราะห์ ดิ NS บอกคุณประเด็นของ y-สกัดกั้น การถดถอยพหุคูณเกี่ยวข้องกับการเลือกค่าสัมประสิทธิ์ (NS1 เป็นต้น) ที่ลดความแตกต่างระหว่างค่าที่คาดหวังให้น้อยที่สุด Y^ และค่าที่สังเกตได้ Yทำให้คุณมีความเหมาะสมที่สุดระหว่างแบบจำลองและข้อมูล
การถดถอยพหุคูณบอกอะไรคุณได้บ้าง?
การถดถอยพหุคูณใส่ค่าตัวเลขบนความสัมพันธ์ระหว่างตัวแปรจำนวนหนึ่งกับผลลัพธ์ ดังนั้นคุณสามารถใช้สำหรับการคาดคะเน สำหรับการประมาณค่า การมีส่วนร่วมสัมพัทธ์ของตัวแปรต่างๆ กับผลลัพธ์ หรือเพื่อวัตถุประสงค์อื่นๆ เช่น การเลือกตัวแปรที่เกี่ยวข้องมากที่สุดเพื่อใช้ในทางคณิตศาสตร์ แบบอย่าง.
ตัวอย่างเช่น สมมติว่าคุณมีข้อมูลเกี่ยวกับราคาบ้านในบางเมือง (ตัวแปรตามของคุณ) พร้อมด้วยข้อมูลเช่น ไม่ว่าจะเป็นสระว่ายน้ำ พื้นที่กี่ตารางฟุต มีห้องนอนกี่ห้อง มีห้องน้ำกี่ห้อง และโรงจอดรถกี่คัน มี. การถดถอยพหุคูณจะทำให้คุณสามารถดูได้ว่าปัจจัยแต่ละอย่างเหล่านี้เกี่ยวข้องกับราคาบ้านอย่างไร ดังนั้น – หลัง คุณดูว่ามันเกี่ยวข้องกับราคาอย่างไร – คุณสามารถใช้สมการของคุณเพื่อทำนายราคาบ้านตามคะแนนเหล่านี้ ตามลำพัง.
คุณยังสามารถใช้การวิเคราะห์การถดถอยประเภทนี้ใน Excel เพื่อดูว่าปัจจัยเฉพาะของหลาย ๆ ตัวเป็นอย่างไร เช่น บ้านมีสระว่ายน้ำหรือไม่ – ส่งผลกระทบต่อตัวแปรตาม (ราคาบ้าน) หากตัวแปรอื่น ๆ ยังคงอยู่ คงที่. หากคุณแปลงสัมประสิทธิ์ (เรียกว่า "สัมประสิทธิ์การถดถอยบางส่วน") เป็นค่าสัมประสิทธิ์การถดถอยบางส่วนมาตรฐาน ซึ่งแสดงถึงจำนวนเบี่ยงเบนมาตรฐาน Y จะเปลี่ยนโดยถ้าคุณเปลี่ยนตัวแปรที่สอดคล้องกันโดยค่าเบี่ยงเบนมาตรฐานหนึ่งค่า สมการก็จะบอกคุณด้วยว่าปัจจัยใดมีความสำคัญมากกว่าในการกำหนดผลลัพธ์
วิธีการถดถอยพหุคูณใน Excel
คุณสามารถทำการถดถอยหลายตัวแปรใน Excel ได้โดยใช้ฟังก์ชันในตัวที่สามารถเข้าถึงได้ผ่านทาง การวิเคราะห์ข้อมูล เครื่องมือภายใต้ ข้อมูล แท็บและ การวิเคราะห์ กลุ่ม. คลิก การวิเคราะห์ข้อมูล และหาตัวเลือกสำหรับ การถดถอย ในหน้าต่างที่ปรากฏขึ้น ไฮไลต์แล้วคลิก ตกลง. คลิกที่ เลือกเซลล์ ไอคอนข้าง อินพุต Y ช่วง ฟิลด์ จากนั้นเลือกคอลัมน์ที่มีผลลัพธ์สำหรับตัวแปรตามของคุณ จากนั้นทำเช่นเดียวกันสำหรับ อินพุต X ช่วง แต่ให้เลือกหลายคอลัมน์สำหรับตัวแปรอิสระของคุณ คอลัมน์เหล่านี้ต้องอยู่ติดกัน ดังนั้นถ้าไม่ใช่ คุณต้องย้ายคอลัมน์เหล่านี้ก่อนสร้างการถดถอย
หน้าต่างการถดถอยมีตัวเลือกเพิ่มเติมมากมายให้คุณเลือกเพื่อปรับแต่งกระบวนการให้เหมาะกับความต้องการของคุณ ตัวอย่างเช่น คุณสามารถตั้งค่าระดับความมั่นใจอื่นที่ไม่ใช่ 95 เปอร์เซ็นต์ได้หากต้องการ เลือกแสดงค่าคงเหลือและระบุตำแหน่งที่จะวางผลลัพธ์ในเวิร์กบุ๊กของคุณ ตัวเลือกสุดท้ายนี้ถูกตั้งค่าโดยอัตโนมัติเป็น แผ่นงานใหม่ เพื่อให้ผลลัพธ์แสดงบนแผ่นงานใหม่ แต่คุณสามารถเปลี่ยนตัวเลือกนี้หรือตัวเลือกอื่นเพื่อให้เหมาะกับความต้องการของคุณได้ นอกจากนี้ ให้ตรวจสอบ ป้าย กล่องถ้าคอลัมน์สำหรับตัวแปรอิสระของคุณมีป้ายกำกับที่ด้านบน ดังนั้นสิ่งเหล่านี้จึงแสดงในผลลัพธ์
คลิก ตกลง เพื่อสร้างการวิเคราะห์การถดถอยของคุณใน Excel และนำไปที่แผ่นงานใหม่
ผลลัพธ์การถดถอยจาก Excel
มีสามส่วนหลักในผลลัพธ์ที่คุณได้รับหลังจากทำการถดถอยพหุคูณใน Excel: สถิติการถดถอย ANOVA และรายละเอียดเกี่ยวกับเส้นการถดถอยโดยประมาณ สถิติการถดถอยประกอบด้วยสัมประสิทธิ์สหสัมพันธ์พหุคูณ ("หลาย R") ซึ่งแสดงทิศทางและความแรงของสหสัมพันธ์จาก -1 ถึง +1 สัมประสิทธิ์ของการกำหนด "R Square" จะบอกคุณว่าเปอร์เซ็นต์ (ในรูปทศนิยม) ของการแปรผันในตัวแปรตามได้รับการอธิบายโดยตัวแปรอิสระ "Adjusted R Square" บ่งบอกถึงพลังในการอธิบาย แต่การตีความไม่ตรงไปตรงมา และ "ข้อผิดพลาดมาตรฐาน" ช่วยให้คุณวัดความผันแปรระหว่างผลลัพธ์ที่สังเกตได้กับการถดถอยของคุณ ไลน์.
ส่วน ANOVA ประกอบด้วยข้อมูลทางสถิติเกี่ยวกับจำนวนรูปแบบที่อธิบายโดยเส้นการถดถอย ด้วย "SS Regression" บอกจำนวนเงินที่อธิบายในบรรทัดและ "SS Residual" แทนจำนวนเงินที่ไม่ อธิบาย ส่วน "MS" ย่อมาจาก "Mean Square" และ "F Statistic" คือสถิติการทดสอบที่ใช้ในการทดสอบผลลัพธ์ที่มีนัยสำคัญ โดยส่วน "Significance F" จะให้ค่า P แก่คุณ
สุดท้าย ส่วนสุดท้ายจะบอกคุณเกี่ยวกับลักษณะของเส้นการถดถอยโดยประมาณ โดยเฉพาะค่าของ สัมประสิทธิ์ ไม่ว่าจะเชื่อมโยงกับตัวแปรตามอย่างมีนัยสำคัญหรือไม่ และปริมาณของความแปรผันที่อาจมีอยู่ในนั้น ค่าสัมประสิทธิ์เชิงบวกแสดงความสัมพันธ์เชิงบวกระหว่างตัวแปรที่เป็นปัญหากับตัวแปรตาม ดังนั้นเมื่อตัวหนึ่งเพิ่มขึ้น อีกตัวหนึ่งก็ทำเช่นกัน ค่าลบหมายถึงตัวแปรตามลดลงเมื่อตัวแปรอิสระเพิ่มขึ้น ดังนั้น หากสัมประสิทธิ์ "ตารางฟุต" ของราคาบ้านที่มีการถดถอยพหุคูณคือ 300 หมายความว่าพื้นที่เพิ่มเติมตารางฟุตจะเพิ่มค่าใช้จ่ายของบ้านโดยเฉลี่ย 300 ดอลลาร์
สมมติฐานและข้อจำกัดของการถดถอยพหุคูณ
สิ่งสำคัญคือต้องจำไว้ว่าการถดถอยพหุคูณเป็นเพียงเครื่องมือ และเช่นเดียวกับเครื่องมือส่วนใหญ่ คุณสามารถใช้ได้ในบางกรณีเท่านั้น และมีบางสิ่งที่ไม่สามารถทำได้
ข้อ จำกัด ที่สำคัญที่สุดประการหนึ่งคือการสรุปเวรกรรมบนพื้นฐานของผลลัพธ์นั้นยาก ตัวอย่างเช่น หากคุณมีการถดถอยพหุคูณกับความเสียหายที่เกิดจากไฟไหม้และอาจเป็นไปได้มาก ปัจจัยที่เกี่ยวข้อง คุณน่าจะพบความเชื่อมโยงที่สำคัญระหว่างจำนวนนักผจญเพลิงที่มีอยู่กับ ความเสียหายที่ทำ นี่ไม่ได้หมายความว่านักผจญเพลิง ซึ่งก่อให้เกิด ความเสียหายเนื่องจากปัจจัยอื่นเช่นขนาดของไฟที่ไม่รวมอยู่ในแบบจำลองสามารถอธิบายข้อสังเกตทั้งสองนี้ได้
สมมติฐานที่สำคัญสองข้อของการวิเคราะห์หลายตัวแปรใน Excel ประเภทนี้คือสมมติฐานเกี่ยวกับความเป็นเส้นตรงและภาวะปกติ คุณกำลังสมมติว่ามีความสัมพันธ์เชิงเส้นตรงระหว่างตัวแปรตามและตัวแปรอิสระ ดังนั้นคุณควรตรวจสอบว่าสิ่งนี้น่าจะถูกต้องก่อนทำการวิเคราะห์ คุณสามารถดูความสัมพันธ์ระหว่างตัวแปรแต่ละตัวเพื่อตรวจสอบได้ แต่นี่ไม่ใช่กลยุทธ์ที่สมบูรณ์แบบ ในทำนองเดียวกัน การทดสอบถือว่าตัวแปรมีการแจกแจงแบบปกติ ดังนั้นคุณควรตรวจสอบผลลัพธ์สำหรับค่าปกติของตัวแปรแต่ละตัวก่อนทำการทดสอบ