Slik bruker du Excel til å beregne et konfidensintervall
Bildekreditt: FlamingoImages/iStock/GettyImages
Excel er et kraftig verktøy for håndtering av store datamengder, samt for å automatisere noen matematiske biter som du helst ikke trenger å gå gjennom for hånd. Å finne konfidensintervallet for et gjennomsnitt av noen data er en av oppgavene du kan gjøre for hånd, men – med mindre du er en fråtser for straff – vil du gjerne lære at du kan få Excel til å håndtere mye av det vanskelige arbeid. Lær å regne ut et konfidensintervall i Excel og spar tid og krefter.
Konfidensintervaller: Det grunnleggende
Et konfidensintervall forteller deg rekkevidden av verdier der det sanne gjennomsnittet (gjennomsnittet) for en populasjon skal falle basert på et utvalg. Konfidensintervaller er en måte å erkjenne usikkerheten i dataene dine på en strukturert og vitenskapelig måte. I de fleste tilfeller bruker folk et 95 prosent konfidensintervall, som betyr at hvis du gjentok eksperimentet 20 ganger, ville det sanne gjennomsnittet være innenfor intervallet for 19 av dem.
Dagens video
Når du beregner et konfidensintervall, bruker du resultatet til å presentere gjennomsnittsverdien sammen med nivået av usikkerhet. For eksempel kan du ha et gjennomsnitt på 130 pund og skrive 130 ± 12 pund, som indikerer at den sanne middelverdien er et sted mellom 118 og 142, eller 130 pund (CI: 118 til 142 pund), hvor i CI står for konfidensintervall.
Du trenger imidlertid ikke alltid bruke et 95 prosent konfidensintervall. Verdien du velger kalles ditt konfidensnivå, og andre vanlige konfidensnivåer inkluderer 99 prosent og 90 prosent. Prosessen beskrevet her kan også kalles å finne feilmarginen i Excel.
Finne standardavviket
Du trenger noen forskjellige ting for å finne et konfidensintervall i Excel. Den første er enkel, den mener av dine data. Du kan beregne dette ved å legge til alle datapunktene dine og dele svaret på antall datapunkter, eller bruke Excel Gjennomsnitt funksjon, ved å skrive =GJENNOMSNITT([celleområde]) inn i en tom celle, og enten manuelt legge inn verdiområdet på stedet der det står rekkevidde av celler eller markere med musen for å velge dem.
Du trenger også antall datapunkter i prøven din, kalt n i statistiske sammenhenger. Du kan telle cellene eller bruke Excel Telle funksjon for å finne dette. Enten type =COUNT([celleområde]) med celleområdet som inneholder dataene dine der det står rekkevidde av celler eller ved å klikke og utheve dem med musen – eller bare angi verdien i en tom celle.
Den mest utfordrende delen av denne prosessen er å finne standardavvik av dine data. Du kan imidlertid gjøre dette ved å bruke en innebygd Excel-funksjon. Tast inn =STDEV([celleområde]) for å finne standardavviket til dataene dine. For eksempel, hvis du har data som kjører fra celle A2 til A21, skriv =STDEV(A2:A1) for å finne standardavviket til dataene.
Som i de foregående eksemplene kan du også skrive =STDEV( og bruk deretter musen til å velge celleområdet som inneholder dataene dine. Med alle disse tre informasjonsbitene i tre separate celler, er du klar til å finne konfidensintervallet i Excel.
Konfidensintervall Excel-funksjonen
Det er en Excel-funksjon spesielt utviklet for å hjelpe deg med å finne konfidensintervallet for et gjennomsnitt. Dette er den enkleste metoden du kan bruke for å finne et konfidensintervall, men det gjør ikke absolutt alt du trenger for å beregne et konfidensintervall for deg. Men med informasjonen i forrige seksjon og litt ekstra veiledning, vil du ikke ha noe problem med å fullføre prosessen.
De Tillit funksjonen i Excel er spesielt utviklet for denne oppgaven, og den har tre argumenter (delen innenfor parentes) du må fylle ut. Formatet er =TILLIT(alfa; sigma; n) hvor alfa representerer det valgte signifikansnivået, sigma er standardavviket og n er antall datapunkter.
For å finne alfaverdien, trekk ditt valgte signifikansnivå (som en desimal) fra 1, slik at et 95 prosent konfidensnivå i Excel har en alfa på 0,05, et 99 prosent konfidensnivå har en alfa på 0,01, og for 90 prosent er det 0,1. Sigma-verdien er ganske enkelt utdata av de STDEV feltet for dataene dine, og n verdi er utgangen av Telle funksjon eller tellingen du fullførte for hånd.
Bruke funksjonen
Bruk konfidensfunksjonen i henhold til formatet i den siste delen. Skriv først =TILLIT( og skriv deretter inn en passende alfaverdi. Hvis du for eksempel beregner et 95 prosent konfidensintervall, skriv inn =TILLIT(0,05, og klikk deretter på cellen (eller skriv inn koden) som inneholder standardavviket ditt etterfulgt av et annet komma. Til slutt skriver du inn verdien for n etter siste komma og lukk deretter parentesen.
Så, for eksempel, hvis du ønsker en 95 prosent konfidensverdi, din n verdien er i celle B4 og standardavviket er i celle B5, type =TILLIT(0,05;B5;B4) inn i en tom celle for å returnere verdien. Denne verdien er ikke selve intervallet, men du kan bruke den til å lage intervallet.
For å produsere konfidensintervallet i Excel, ta denne verdien og legg den til middelverdien i en celle, og trekk den fra middelverdien i en annen celle. Området mellom disse to ekstreme verdiene er konfidensintervallet for gjennomsnittet.
Bruke konfidensintervallformelen
Det er en annen måte du kan bruke Excel til å beregne et konfidensintervall: med en formel. Konfidensintervallformelen er ikke så komplisert å forstå, og fordelen med å lære å bruke den er at du ikke er avhengig av Excel hver gang du skal beregne en. Den grunnleggende formelen for et 95 prosent konfidensintervall er: gjennomsnitt ± 1,96 × (standardavvik / √n).
Dette er enkelt å beregne basert på informasjonen du allerede har. Skriv inn i en tom celle =[gjennomsnitt]+(1,96*([standardavvik]/SQRT([n]))) for å få svaret for den øvre grensen. Merk at verdiene i hakeparenteser – [_mean_], [_standard deviation_] og [n] – må erstattes med cellereferanser for den spesifikke informasjonsbiten, uten hakeparenteser. Alle de buede brakettene må holdes på plass.
Den andre delen av formelen innebærer den samme beregningen, men trukket fra gjennomsnittet. Så type =[gjennomsnitt]-(1,96*([standardavvik]/SQRT([n]))) for å finne den nedre grensen. Konfidensintervallet er mellom denne verdien og den ovenfor. For et 99 prosent konfidensintervall, bruk 2,576 i stedet for 1,96, og for et 90 prosent konfidensintervall, bruk 1,645.
Konfidensintervallformel Fullstendig eksempel
Du kan bruke formelen til å beregne konfidensintervallet i ett stort trinn. Du trenger imidlertid én celle for den nedre grensen av konfidensintervallet og én for den øvre grensen.
Tenk deg at du har data fra cellene A1 til A20, skriv inn:
=GJENNOMSNITT(A1:A20)−(1,96*(STDEV(A1:A20)/SQRT(ANTALL(A1:A20))))
inn i den første cellen for å finne den nedre grensen ved 95 prosent.
Skriv deretter:
=GJENNOMSNITT(A1:A20)+(1,96*(STDEV(A1:A20)/SQRT(ANTALL(A1:A20))))
inn i den andre cellen for å finne den øvre grensen. Du kan erstatte A1:A20 med rekkevidden for dine spesifikke data. For eksempel, hvis dataene dine kjører fra cellene B20 til B50, skriv B20:B50 på disse stedene i stedet.