Pliki CSV są przydatne ze względu na swoją prostotę i przenośność, są nieskuteczne w wyświetlaniu lub analizowaniu dużych ilości danych; jednak nie pokazują danych wizualnie.
Źródło obrazu: SARINYAPINNGAM/iStock/GettyImages
Większość aplikacji baz danych i arkuszy kalkulacyjnych może wygodnie wyprowadzać dane tabeli w postaci plików CSV (wartości rozdzielane przecinkami). Chociaż pliki CSV są przydatne ze względu na ich prostotę i przenośność, nie nadają się do wyświetlania ani analizowania dużych ilości danych. Aby przezwyciężyć to ograniczenie, programista może użyć języka programowania Python i matplotlib do kreślenia dane z pliku CSV i stworzyć czytelny, atrakcyjny wizualnie wykres nadający się do internetu lub druku publikacja.
Przygotowanie do kreślenia danych CSV
Zanim zaczniesz rysować plik CSV w Pythonie, upewnij się, że masz wszystkie niezbędne narzędzia i utwórz plik testowy. Obejmuje to zainstalowanie Pythona i niezbędnych bibliotek, a także posiadanie pliku CSV zawierającego dwie kolumny danych liczbowych.
Wideo dnia
Krok 1: Utwórz plik testowy
Najpierw otwórz edytor tekstu i utwórz prosty plik CSV do testowania. Przykład może wyglądać tak:
1,2 2,3 3,8 4,13 5,18 6,21 7,13 7.5,4 2.5,4.3
Krok 2: Importuj niezbędne biblioteki
Teraz możesz zaimportować niezbędne biblioteki Pythona do pliku kodu za pomocą tego wiersza kodu:
import matplotlib.pyplot jako plt import csv import sys
Wykres wykresu w Pythonie z CSV
Po zakończeniu przygotowań możesz teraz zacząć używać Pythona do rysowania wykresu z pliku CSV.
Krok 1: Utwórz obiekt czytnika
Otwórz plik CSV i utwórz z niego obiekt czytnika. Zadeklaruj zmienne, aby zdefiniować górną i dolną granicę dla wartości osi x i y wykresu:
csv_reader = csv.reader (open('test.csv')) bigx = float(-sys.maxint -1) bigy = float(-sys.maxint -1) smallx = float (sys.maxint) smally = float (sys .maxint)
Krok 2: Iteruj po wierszach
Iteruj po każdym wierszu zawartym w obiekcie czytnika, przechowując każdy wiersz jako wierzchołek w tablicy wierzchołków. W tej samej pętli porównaj wartości x i y, aby zapisać ich górną i dolną granicę. Posortuj tablicę wierzchołków, a następnie przejdź przez nią ponownie. Tym razem przechowuj posortowane wartości x i y w osobnych tablicach:
verts = [] for row in csv_reader: verts.append (row) if float (row[0]) > bigx: bigx = float (row[0]) if float (row[1]) > bigy: bigy = float ( row[1]) if float (row[0]) < smallx: smallx = float (row[0]) if float (row[1]) < smally: smally = float (row[1]) verts.sort() x_arr = [] y_arr = [] for vert in verts: x_arr .append (vert[0]) y_arr.append (wiersz [1])
Krok 3: Stwórz obiekt FigureCanvas
Utwórz obiekt FigureCanvas za pomocą zaimportowanego obiektu pyplot matplotlib. Dodaj osie wykresu do FigureCanvas, wywołując funkcję add_axes i przekazując jej tablicę wartości w postaci: left, bottom, width, height. Te wartości określają, gdzie na kanwie znajduje się wykres — mogą się mieścić w zakresie od 0,0 do 1,0:
fig = plt.figure() topór = fig.add_axes([0,1, 0,1, 0,8, 0,8])
Krok 4: Sformatuj wykres
Sformatuj wykres, dodając etykiety i określając minimalne i maksymalne wartości dla każdej osi:
ax.set_xlabel('x dane') ax.set_ylabel('y dane') ax.set_xlim (małyx, dużyx) ax.set_ylim (mały, duży)
Krok 5: Sporządź wykres
Sporządź wykres, przekazując dwie tablice zawierające wartości x i y pobrane z pliku CSV. Dostosuj wykres liniowy, przekazując opcjonalne wartości, takie jak kolor linii (kolor) lub szerokość linii (lw). Wyświetl gotowy wykres, wywołując metodę show, aby otworzyć okno i zapisać obraz, wywołując savefig, aby utworzyć plik bitmapy na dysku:
ax.plot (x_arr, y_arr, color='blue', lw=2) plt.show() fig.savefig('test.png')
Ważne uwagi dotyczące plików
Aby utworzyć pliki, które może odczytać interpreter Pythona, musisz użyć edytora tekstu lub kodu ascii, który tworzy tylko pliki tekstowe. Możesz przechowywać obrazy wykresów w wielu różnych formatach graficznych, w tym: png, pdf, ps i svg.
Zapoznaj się z dokumentacją Matplotlib
Niektóre aspekty instalacji i funkcjonalności biblioteki matplotlib różnią się na różnych platformach komputerowych. Przeczytaj uważnie dokumentację. Biblioteka może wyświetlać informacje numeryczne na wiele sposobów i może być precyzyjnie dostosowywana. Do osiągnięcia biegłości niezbędne będzie dokładne zapoznanie się z dokumentacją.