Parfois, il est utile de sélectionner une ligne aléatoire ou un ensemble aléatoire de lignes dans une feuille de calcul Microsoft Excel.
Crédit d'image : damircudic/iStock/GettyImages
Parfois, il est utile de sélectionner une ligne aléatoire ou un ensemble aléatoire de lignes dans une feuille de calcul Microsoft Excel. Cela peut être utile si vous souhaitez échantillonner au hasard à partir d'un ensemble de données, comme une liste d'employés ou de clients, afin de tester efficacement certaines propriétés. Cela peut également être utile pour des situations telles que des jeux et des tombolas où vous souhaiterez peut-être sélectionner une option ou un joueur au hasard. Excel propose plusieurs façons d'échantillonner des données de manière aléatoire et de générer des nombres aléatoires.
Prendre un échantillon aléatoire dans Excel
Il n'y a pas d'outil d'échantillonnage Excel intégré capable de générer automatiquement un échantillon aléatoire à partir d'une liste de lignes ou de données. Vous pouvez cependant utiliser la fonction d'Excel pour générer un nombre aléatoire afin de générer un échantillon aléatoire.
Vidéo du jour
La fonction de nombre aléatoire d'Excel est appelée RAND, et il génère un nombre aléatoire qui est garanti d'être supérieur ou égal à zéro et inférieur à un. Pour l'utiliser, tapez simplement la formule =RAND() dans une cellule de votre choix, et un nombre aléatoire sera placé dans cette cellule de la feuille de calcul par le générateur.
Si vous souhaitez utiliser le générateur de nombres aléatoires dans Excel pour échantillonner au hasard un ensemble de lignes, ajoutez une colonne à la fin de la feuille de calcul. Ensuite, dans la cellule supérieure de cette colonne sous les lignes d'en-tête de feuille de calcul, tapez =RAND() pour générer un nombre aléatoire. Faites glisser ou copiez la formule dans les cellules inférieures de la même colonne afin d'ajouter un nombre généré aléatoirement à chaque ligne de la feuille de calcul.
Ensuite, demandez à Excel de trier la feuille de calcul dans l'ordre croissant des nombres aléatoires. Prenez les premières lignes jusqu'au nombre de lignes que vous souhaitez, et elles constitueront un échantillon aléatoire de vos données.
Modifications de l'ordre de tri
N'oubliez pas que vous perdrez tout ordre de tri précédent ou autre ordre, donc si vous avez besoin de reconstituer cette commande dans votre échantillon ou dans la feuille de calcul en général, vous devez vous assurer que vous avez une colonne que vous pouvez trier afin de restaurer la feuille de calcul à son origine ordre.
Si vous ne le faites pas, avant de trier la feuille par colonne aléatoire, ajoutez une autre colonne et tapez le numéro 1 dans la première ligne après les lignes d'en-tête. Tapez 2 et 3 dans les lignes suivantes et, en supposant que vous ayez plus de 3 lignes, mettez ces nombres en surbrillance et faites-les glisser vers le bas de la feuille de calcul pour remplir la colonne avec des nombres croissants commençant par 1. Ensuite, vous pouvez trier la feuille de calcul ou certaines lignes de celle-ci par cette nouvelle colonne pour restaurer l'ordre d'origine.
Échantillonnage un par un
Dans certains cas, vous souhaiterez peut-être échantillonner les lignes une par une. Cela peut avoir un effet dramatique si vous effectuez un dessin ou simplement pour vous assurer que vous êtes en mesure d'inspecter chaque ligne que vous ajoutez à votre échantillon pour vous assurer qu'elle est valide.
Quelle que soit la raison, vous pouvez le faire en utilisant une formule impliquant RAND pour générer des nombres compris dans une certaine plage. N'oubliez pas que RAND génère toujours des nombres supérieurs ou égaux à zéro et inférieurs à un. Cela signifie que si vous multipliez le résultat de RAND par un nombre entier m, vous obtiendrez toujours un résultat aléatoire supérieur ou égal à zéro et inférieur à n.
Cela signifie que si vous avez n lignes dans votre feuille de calcul, vous pouvez utiliser la formule =PLAFOND(RAND()*n, 1) pour générer un nombre de 1 à n, inclus, que vous pouvez utiliser pour choisir une ligne au hasard dans votre feuille de calcul. Cela fonctionne parce que PLAFOND est une fonction qui arrondit son premier argument au prochain multiple le plus élevé de son deuxième argument. Si vous utilisez 1 comme deuxième argument, il arrondira au nombre entier suivant.
Bien sûr, vous voudrez remplacer n par le nombre de lignes de votre feuille, en soustrayant toutes les lignes d'en-tête que vous ne souhaitez pas échantillonner.