Hur man använder Excel för att beräkna ett konfidensintervall

Leende ung kvinnlig entreprenör som arbetar på en bärbar dator hemma

Hur man använder Excel för att beräkna ett konfidensintervall

Bildkredit: FlamingoImages/iStock/GettyImages

Excel är ett kraftfullt verktyg för att hantera stora datamängder, såväl som för att automatisera vissa bitar av matematik som du helst inte behöver gå igenom för hand. Att hitta konfidensintervallet för ett medelvärde av vissa data är en av de uppgifter som du kan göra för hand, men – såvida du inte är en frossare för straff – du kommer gärna att lära dig att du kan få Excel att hantera mycket av det svåra arbete. Lär dig att räkna ut ett konfidensintervall i Excel och spara tid och ansträngning.

Konfidensintervall: Grunderna

Ett konfidensintervall talar om intervallet av värden där det sanna medelvärdet (genomsnittet) för en population bör falla baserat på ett urval. Konfidensintervall är ett sätt att erkänna osäkerheten i dina data på ett strukturerat och vetenskapligt sätt. I de flesta fall använder människor ett 95-procentigt konfidensintervall, vilket betyder att om du upprepade experimentet 20 gånger skulle det sanna medelvärdet ligga inom intervallet för 19 av dem.

Dagens video

När du beräknar ett konfidensintervall använder du resultatet för att presentera ditt medelvärde tillsammans med din osäkerhetsnivå. Till exempel kan du ha ett medelvärde på 130 pund och skriva 130 ± 12 pund, vilket indikerar att det sanna medelvärdet är någonstans mellan 118 och 142, eller 130 pund (CI: 118 till 142 pund), där den CI står för konfidensintervall.

Du behöver dock inte alltid använda ett 95-procentigt konfidensintervall. Värdet du väljer kallas din konfidensnivå, och andra vanliga konfidensnivåer inkluderar 99 procent och 90 procent. Processen som beskrivs här kan också kallas att hitta felmarginalen i Excel.

Hitta standardavvikelsen

Du behöver några olika saker för att hitta ett konfidensintervall i Excel. Den första är lätt, den betyda av dina uppgifter. Du kan beräkna detta genom att lägga till alla dina datapunkter och dividera svaret med antalet datapunkter, eller använd Excel Genomsnitt funktion genom att skriva =MEDEL([cellintervall]) i en tom cell, och antingen manuellt mata in värdeintervallet på platsen där det står intervall av celler eller markera med musen för att välja dem.

Du behöver också antal datapunkter i ditt prov, kallas n i statistiska sammanhang. Du kan räkna cellerna eller använda Excel Räkna funktion för att hitta detta. Endera typen =COUNT([cellintervall]) med intervallet av celler som innehåller dina data där det står intervall av celler eller genom att klicka och markera dem med musen – eller helt enkelt skriv in värdet i en tom cell.

Den mest utmanande delen av denna process är att hitta standardavvikelse av dina uppgifter. Du kan dock göra detta med hjälp av en inbyggd Excel-funktion. Stiga på =STDEV([cellintervall]) för att hitta standardavvikelsen för dina data. Till exempel, om du har data som körs från cell A2 till A21, skriv =STDEV(A2:A1) för att hitta standardavvikelsen för data.

Som i de tidigare exemplen kan du också skriva =STDEV( och använd sedan musen för att välja intervallet av celler som innehåller dina data. Med alla dessa tre informationsbitar i tre separata celler är du redo att hitta konfidensintervallet i Excel.

Konfidensintervall Excel-funktionen

Det finns en Excel-funktion speciellt utformad för att hjälpa dig hitta konfidensintervallet för ett medelvärde. Det här är den enklaste metoden du kan använda för att hitta ett konfidensintervall, men det gör inte allt du behöver för att beräkna ett konfidensintervall åt dig. Men med informationen i föregående avsnitt och lite ytterligare vägledning kommer du inte ha några problem att avsluta processen.

De Förtroende funktion i Excel är speciellt utformad för denna uppgift, och den har tre argument (delen inom parentes) som du måste fylla i. Formatet är =KONFIDENS(alfa; sigma; n) var alfa representerar den valda signifikansnivån, sigma är standardavvikelsen och n är antalet datapunkter.

För att hitta alfavärdet, subtrahera din valda signifikansnivå (som en decimal) från 1, så att en 95 procents konfidensnivå i Excel har en alfa på 0,05, en konfidensnivå på 99 procent har en alfa på 0,01, och för 90 procent är den 0,1. Sigmavärdet är helt enkelt resultatet av de STDEV fältet för dina uppgifter och n värde är resultatet av Räkna funktion eller räkningen du genomförde för hand.

Använda funktionen

Använd konfidensfunktionen enligt formatet i det sista avsnittet. Först, skriv =KONFIDENS( och ange sedan ett lämpligt alfavärde. Om du till exempel beräknar ett 95 procents konfidensintervall, skriv =KONFIDENS(0,05, och klicka sedan på cellen (eller skriv dess kod) som innehåller din standardavvikelse följt av ytterligare ett kommatecken. Ange slutligen värdet för n efter det sista kommatecken och stäng sedan parenteserna.

Så, till exempel, om du vill ha ett 95 procents konfidensvärde, ditt n värdet finns i cell B4 och din standardavvikelse finns i cell B5, typ =KONFIDENS(0,05;B5;B4) i en tom cell för att returnera värdet. Detta värde är inte själva intervallet, men du kan använda det för att skapa intervallet.

För att producera konfidensintervallet i Excel, ta detta värde och lägg till det till medelvärdet i en cell och subtrahera det sedan från medelvärdet i en annan cell. Intervallet mellan dessa två extremvärden är konfidensintervallet för medelvärdet.

Använda konfidensintervallsformeln

Det finns ett annat sätt att använda Excel för att beräkna ett konfidensintervall: med en formel. Konfidensintervallsformeln är inte så komplicerad att förstå, och fördelen med att lära sig hur man använder den är att du inte är beroende av Excel varje gång du behöver beräkna en. Den grundläggande formeln för ett 95 procents konfidensintervall är: medelvärde ± 1,96 × (standardavvikelse / √n).

Detta är lätt att beräkna utifrån den information du redan har. Skriv i en tom cell =[medelvärde]+(1,96*([standardavvikelse]/SQRT([n]))) för att få svaret för den övre gränsen. Observera att värdena inom hakparenteser – [_medelvärde_], [_standardavvikelse_] och [n] – måste ersättas med cellreferenser för den specifika informationsbiten, utan hakparenteser. Alla de böjda fästena måste hållas på plats.

Den andra delen av formeln innebär samma beräkning men subtraherad från medelvärdet. Så typ =[medelvärde]−(1,96*([standardavvikelse]/SQRT([n]))) för att hitta den nedre gränsen. Konfidensintervallet är mellan detta värde och det ovan. För ett 99 procents konfidensintervall, använd 2,576 istället för 1,96, och för ett 90 procents konfidensintervall, använd 1,645.

Konfidensintervallformel Fullständigt exempel

Du kan använda formeln för att beräkna konfidensintervallet i ett stort steg. Du behöver dock en cell för den nedre gränsen för konfidensintervallet och en för den övre gränsen.

Föreställ dig att du har data från cellerna A1 till A20, skriv:

=MEDEL(A1:A20)−(1,96*(STDEV(A1:A20)/SQRT(ANTAL(A1:A20))))

in i den första cellen för att hitta den nedre gränsen till 95 procent.

Skriv sedan:

=MEDEL(A1:A20)+(1,96*(STDEV(A1:A20)/SQRT(ANTAL(A1:A20))))

in i den andra cellen för att hitta den övre gränsen. Du kan byta ut A1:A20 med intervallet för dina specifika data. Till exempel, om din data körs från cellerna B20 till B50, skriv B20:B50 på dessa platser istället.