Hoe genormaliseerde gegevens in Excel te berekenen

Zakenman Werken Financiën Data Planning Concept

Afbeelding tegoed: Rawpixel/iStock/GettyImages

Excel is een krachtig hulpmiddel voor het analyseren van gegevens, maar de gegevens waarmee u werkt, zijn misschien niet in de ideale vorm. Als er veel variatie is, kan het moeilijk zijn om een ​​bepaalde waarde te relateren aan het gemiddelde van de hele dataset en de standaarddeviatie. Een genormaliseerde (of gestandaardiseerde) dataset maakt dit veel gemakkelijker om te doen. Uitzoeken hoe u gegevens in Excel kunt normaliseren, is een vaardigheid van onschatbare waarde in situaties als deze.

Wat zijn genormaliseerde gegevens?

Genormaliseerde gegevens zijn een los gedefinieerde term, maar in de meeste gevallen verwijst het naar gestandaardiseerde gegevens, waarbij de gegevens worden getransformeerd met behulp van het gemiddelde en de standaarddeviatie voor de hele set, zodat het eindigt in een standaardverdeling met een gemiddelde van 0 en een variantie van 1. Wanneer u naar een genormaliseerde gegevensset kijkt, vertegenwoordigen de positieve waarden waarden boven het gemiddelde, en de negatieve waarden vertegenwoordigen waarden onder het gemiddelde. Een resultaat van +1 betekent dat een bepaalde waarde één standaarddeviatie boven het gemiddelde ligt, en −1 betekent dat het één standaarddeviatie onder het gemiddelde ligt.

Video van de dag

Wat u nodig heeft voor normalisatie

Als u een set gegevens wilt normaliseren, heeft u twee aanvullende gegevens nodig. Stel je voor dat er wat gegevens lopen van cel A2 naar cel A51. Voordat u gegevens in Excel normaliseert, heeft u het gemiddelde (of 'rekenkundig gemiddelde') en de standaarddeviatie van de gegevens nodig. Zoek het gemiddelde van de gegevens door een lege cel te kiezen, die u in een aangrenzende cel kunt labelen als 'Gemiddelde' en '= GEMIDDELDE (A2:A51)' zonder aanhalingstekens in te voeren.

Merk op dat dit de voorbeeldgegevens gebruikt die lopen van cel A2 tot A51. Wijzig deze twee nummers zodat ze passen bij uw specifieke dataset. Als uw gegevens bijvoorbeeld van B4 tot B55 lopen, typt u in plaats daarvan "=GEMIDDELDE(B4:B55)".

Zoek de standaarddeviatie door een andere lege cel te kiezen, een label in een aangrenzende cel toe te voegen zoals eerder, zoals "Standaarddeviatie", en daarin "=STDEV(A2:A51)" te typen. Pas de celcoördinaten aan uw dataset aan.

Stel je voor de rest van de voorbeelden voor dat je je gemiddelde hebt toegevoegd aan cel C2 en je standaarddeviatie in cel D2. Vervang deze getallen in volgende formules door de cellen die uw gemiddelde en standaarddeviatie bevatten.

Gegevens normaliseren in Excel

De laatste fase van het normaliseren van gegevens in Excel omvat de functie Standaardiseren. Deze functie heeft drie "argumenten" of stukjes informatie met het formaat: STANDARDIZE(waarde, gemiddelde, standaarddeviatie).

Typ "Genormaliseerde gegevens" of een ander label in cel B1 of de kolom naast uw gegevens of een andere handige plaats, zodat de rijen overeenkomen. Typ in cel B2 "=STANDARDIZE(A2, $C$2, $D$2)" om Excel te vertellen het gegevenspunt in cel A2 te normaliseren met behulp van het gemiddelde in cel C2 en de standaarddeviatie in cel D2. De "$"-tekens maken het gemakkelijker om dezelfde formule in de volgende stap naar beneden te slepen.

Beweeg uw muisaanwijzer over de rechterbenedenhoek van de cel die u zojuist hebt ingevuld, zodat de cursor verandert in een dun zwart kruis. Klik op de hoek en houd de muisknop ingedrukt voordat u deze helemaal naar beneden in de kolom sleept, zodat deze op één lijn ligt met de laatste cel van uw gegevens. In het voorbeeld zou u de hoek naar cel B51 slepen. Dit dupliceert de formule in elke cel, waardoor de locatie van de invoergegevens kan worden gewijzigd om overeen te komen met de rij van de cel, maar Excel vertelt dat het nog steeds het gemiddelde en de standaarddeviatie van dezelfde plaats moet nemen.