Как да използвате Excel за изчисляване на доверителен интервал
Кредит на изображението: FlamingoImages/iStock/GettyImages
Excel е мощен инструмент за работа с големи количества данни, както и за автоматизиране на някои части от математиката, които предпочитате да не се налага да преглеждате на ръка. Намирането на доверителния интервал за средна стойност на някои данни е една от онези задачи, които бихте могли да направите на ръка, но – освен ако не сте лакомник за наказание – ще се радвате да научите, че можете да накарате Excel да се справи с голяма част от трудното работа. Научете се да изработвате интервал на доверие в Excel и си спестете време и усилия.
Интервали на доверие: основите
Доверителният интервал ви казва диапазона от стойности, където истинската средна стойност (средната стойност) за популация трябва да пада въз основа на извадка. Интервалите на доверие са начин да се признае несигурността във вашите данни по структуриран и научен начин. В повечето случаи хората използват 95% доверителен интервал, което означава, че ако повторите експеримента 20 пъти, истинската средна стойност ще бъде в интервала за 19 от тях.
Видео на деня
Когато изчислявате доверителен интервал, използвате резултата, за да представите средната си стойност заедно с нивото на несигурност. Например, може да имате средно 130 паунда и да пишете 130 ± 12 паунда, което показва, че истинската средна стойност е някъде между 118 и 142, или 130 паунда (CI: 118 до 142 паунда), където CI означава доверителен интервал.
Не винаги е нужно да използвате доверителен интервал от 95 процента. Избраната от вас стойност се нарича вашето ниво на доверие, а други често срещани нива на доверие включват 99 процента и 90 процента. Описаният тук процес може също да се нарече намиране на границата на грешка в Excel.
Намиране на стандартното отклонение
Имате нужда от няколко различни неща, за да намерите интервал на доверие в Excel. Първото е лесно, означава на вашите данни. Можете да изчислите това, като добавите всичките си точки от данни и разделите отговора на броя на точките от данни или използвате Excel Средно аритметично функция чрез въвеждане =СРЕДНО([диапазон от клетки]) в празна клетка и ръчно въвеждане на диапазона от стойности на мястото, където пише гама от клетки или маркиране с мишката, за да ги изберете.
Вие също се нуждаете от брой точки от данни във вашата извадка, наречена н в статистически контекст. Можете да преброите клетките или да използвате Excel Броя функция за намиране на това. И двата вида =БРОЙ([диапазон от клетки]) с диапазона от клетки, съдържащи вашите данни, където пише гама от клетки или като ги щракнете и маркирате с мишката си – или просто въведете стойността в празна клетка.
Най-трудната част от този процес е намирането на стандартно отклонение на вашите данни. Можете обаче да направите това с помощта на вградена функция на Excel. Въведете =STDEV([диапазон от клетки]) за да намерите стандартното отклонение на вашите данни. Например, ако имате данни, които се изпълняват от клетка A2 до A21, въведете =STDEV(A2:A1) за намиране на стандартното отклонение на данните.
Както в предишните примери, можете също да пишете =STDEV( и след това използвайте мишката, за да изберете диапазона от клетки, съдържащи вашите данни. С всички тези три бита информация в три отделни клетки, вие сте готови да намерите доверителния интервал в Excel.
Функцията на Excel за интервал на доверие
Има функция на Excel, специално проектирана да ви помогне да намерите доверителния интервал за средна стойност. Това е най-лесният метод, който можете да използвате, за да намерите доверителен интервал, но той не прави абсолютно всичко необходимо, за да изчислите доверителния интервал за вас. Въпреки това, с информацията в предишния раздел и някои допълнителни насоки, няма да имате проблем да завършите процеса.
В Увереност функцията в Excel е специално проектирана за тази задача и има три аргумента (частта в скобите), които трябва да попълните. Форматът е =ДОВЕРЕНОСТ(алфа, сигма, n) където алфа представлява избраното ниво на значимост, сигма е стандартното отклонение и н е броят на точките с данни.
За да намерите алфа стойността, извадете избраното от вас ниво на значимост (като десетичен знак) от 1, така че 95-процентово ниво на доверие в Excel има алфа от 0,05, ниво на доверие от 99 процента има алфа от 0,01, а за 90 процента това е 0,1. Стойността на сигма е просто резултатът от на STDEV поле за вашите данни и н стойността е изходът на Броя функция или преброяването, което сте попълнили на ръка.
Използване на функцията
Използвайте функцията Confidence според формата в последния раздел. Първо, напишете =ДОВЕРЕНОСТ( и след това въведете подходяща алфа стойност. Например, ако изчислявате 95% доверителен интервал, въведете =ДОВЕРЕНОСТ(0,05, и след това щракнете върху клетката (или въведете нейния код), съдържаща вашето стандартно отклонение, последвано от друга запетая. Накрая въведете стойността за н след последната запетая и след това затворете скобите.
Така че, например, ако искате 95 процента стойност на доверие, вашата н стойността е в клетка B4 и вашето стандартно отклонение е в клетка B5, тип =ДОВЕРЕНОСТ(0,05,B5,B4) в празна клетка, за да върнете стойността. Тази стойност не е самият интервал, но можете да я използвате, за да създадете интервала.
За да създадете доверителния интервал в Excel, вземете тази стойност и я добавете към средната стойност в една клетка и след това я извадете от средната стойност в друга клетка. Диапазонът между тези две екстремни стойности е доверителният интервал за средната стойност.
Използване на формулата на доверителния интервал
Има и друг начин, по който можете да използвате Excel за изчисляване на доверителен интервал: с формула. Формулата на доверителния интервал не е толкова сложна за разбиране и ползата от това да се научите как да я използвате е, че не сте зависими от Excel всеки път, когато трябва да го изчислите. Основната формула за 95% доверителен интервал е: средно ± 1,96 × (стандартно отклонение / √н).
Това е лесно да се изчисли въз основа на информацията, която вече имате. В празна клетка въведете =[средно]+(1,96*([стандартно отклонение]/SQRT([n]))) за да получите отговора за горната граница. Имайте предвид, че стойностите в квадратни скоби – [_средно_], [_стандартно отклонение_] и [н] – трябва да се заменят с препратки към клетки за този специфичен бит информация, без квадратните скоби. Всички извити скоби трябва да се държат на място.
Другата част от формулата включва същото изчисление, но се изважда от средната стойност. Така че напишете =[средно]−(1,96*([стандартно отклонение]/SQRT([n]))) за намиране на долната граница. Доверителният интервал е между тази стойност и горната. За 99% доверителен интервал използвайте 2,576 вместо 1,96, а за 90% доверителен интервал използвайте 1,645.
Пълен пример за формула на доверителния интервал
Можете да използвате формулата, за да изчислите доверителния интервал в една огромна стъпка. Ще ви трябва една клетка за долната граница на доверителния интервал и една за горната граница.
Представете си, че имате данни от клетки A1 до A20, въведете:
=СРЕДНО(A1:A20)−(1,96*(STDEV(A1:A20)/SQRT(БРОЙ(A1:A20))))
в първата клетка, за да намерите долната граница на 95 процента.
След това напишете:
=СРЕДНО(A1:A20)+(1,96*(STDEV(A1:A20)/SQRT(БРОЙ(A1:A20))))
във втората клетка, за да намерите горната граница. Можете да замените A1:A20 с диапазона за вашите конкретни данни. Например, ако вашите данни се изпълняват от клетки B20 до B50, въведете B20:B50 вместо това на тези места.