Як перетворити файл CSV на графік на Python

click fraud protection
Програміст-розробник Team Development Дизайн веб-сайту та технології кодування, що працює в офісі компанії-розробника

Файли CSV зручні через їхню простоту та переносимість, вони неефективні для відображення або аналізу великих обсягів даних; однак вони візуально не відображають дані.

Авторство зображення: SARINYAPINNGAM/iStock/GettyImages

Більшість програм для баз даних і електронних таблиць можуть зручно виводити дані таблиці у вигляді файлів CSV (значення, розділені комами). Хоча файли CSV зручні через їхню простоту та переносимість, вони неефективні для відображення або аналізу великих обсягів даних. Щоб подолати це обмеження, програміст може використовувати мову програмування Python і matplotlib для створення графіка даних із файлу CSV та створіть читабельний, візуально привабливий графік, придатний для веб- чи друку публікації.

Підготовка до графіка даних CSV

Перш ніж побудувати файл CSV на Python, вам потрібно переконатися, що у вас є всі необхідні інструменти, і створити тестовий файл. Це включає в себе встановлення Python і необхідних бібліотек, а також наявність файлу CSV, який містить два стовпці числових даних.

Відео дня

Крок 1: Створіть тестовий файл

Спочатку відкрийте текстовий редактор і створіть простий файл CSV для тестування. Зразок може виглядати так:

1,2 2,3 3,8 4,13 5,18 6,21 7,13 7.5,4 2.5,4.3

Крок 2. Імпортуйте необхідні бібліотеки

Тепер ви готові імпортувати необхідні бібліотеки Python у свій файл коду за допомогою цього рядка коду:

import matplotlib.pyplot як plt import csv import sys

Побудуйте графік на Python із CSV

Після завершення підготовки ви можете розпочати використання Python для малювання графіка з файлу CSV.

Крок 1: Створіть об'єкт Reader

Відкрийте файл CSV і створіть з нього об’єкт читання. Оголосити змінні для визначення верхньої та нижньої меж для значень осі x і y графіка:

csv_reader = csv.reader (open('test.csv')) bigx = float(-sys.maxint -1) bigy = float(-sys.maxint -1) smallx = float (sys.maxint) smally = float (sys .maxint)

Крок 2: Ітерація над рядками

Перебирайте кожен рядок, що міститься в об’єкті зчитувача, зберігаючи кожен рядок як вершину в масиві вершин. У цьому ж циклі порівняйте значення x і y, щоб зберегти їх верхню та нижню межі. Відсортуйте масив вершин, а потім перегляньте його знову. Цього разу зберігайте відсортовані значення x і y в окремих масивах:

verts = [] для рядка в csv_reader: verts.append (рядок) якщо float (рядок[0]) > bigx: bigx = float (рядок[0]), якщо float (рядок[1]) > bigy: bigy = float ( рядок[1]), якщо float (рядок[0]) < smallx: smallx = float (рядок[0]), якщо float (рядок[1]) < smally: smally = float (рядок[1]) verts.sort() x_arr = [] y_arr = [] для vert in verts: x_arr .append (vert[0]) y_arr.append (верт[1])

Крок 3: Створіть об'єкт FigureCanvas

Створіть об’єкт FigureCanvas за допомогою імпортованого об’єкта pyplot matplotlib. Додайте осі графіка до FigureCanvas, викликавши функцію add_axes і передавши їй масив значень у вигляді: left, bottom, width, height. Ці значення визначають місце розташування графіка на полотні — вони можуть варіюватися від 0,0 до 1,0:

fig = plt.figure() ax = fig.add_axes([0.1, 0.1, 0.8, 0.8])

Крок 4: Відформатуйте графік

Відформатуйте графік, додавши мітки та визначивши мінімальне та максимальне значення для кожної осі:

ax.set_xlabel('x data') ax.set_ylabel('y data') ax.set_xlim (smallx, bigx) ax.set_ylim (маленький, великий)

Крок 5: Побудуйте графік

Побудуйте графік, передавши два масиви, що містять значення x і y, отримані з файлу CSV. Налаштуйте лінійний графік, передаючи додаткові значення, такі як колір лінії (колір) або ширина лінії (lw). Відобразіть готовий графік, викликавши метод show, щоб відкрити вікно та зберегти зображення, викликавши savefig, щоб створити файл растрового зображення на диску:

ax.plot (x_arr, y_arr, color='blue', lw=2) plt.show() fig.savefig('test.png')

Важливі зауваження щодо файлів

Щоб створити файли, які може прочитати інтерпретатор Python, ви повинні використовувати текстовий редактор ascii або редактор коду, який створює лише текстові файли. Ви можете зберігати зображення графіків у багатьох різних форматах зображень, включаючи png, pdf, ps і svg.

Зверніться до документації Matplotlib

Деякі аспекти встановлення та функціональності бібліотеки matplotlib відрізняються на різних комп’ютерних платформах. Уважно прочитайте документацію. Бібліотека може відображати числову інформацію величезною кількістю способів і може бути точно налаштована. Щоб стати кваліфікованим, необхідно ретельно ознайомитися з документацією.