Saya pertama kali mulai bekerja dengan file CSV saat mengambil bagian backend dari kurikulum bootcamp rekayasa perangkat lunak saya. Baru setelah saya mulai mempelajari lebih dalam bagian ilmu data dari pembelajaran lanjutan saya, saya mulai menggunakannya secara teratur
CSV adalah singkatan dari nilai yang dipisahkan koma, dan file yang berisi ekstensi .csv
berisi kumpulan nilai yang dipisahkan koma yang digunakan untuk menyimpan data
Dalam tutorial ini kita akan menggunakan kumpulan data ________16______ publik yang disimpan dalam file bwq.csv
. Anda dapat memperoleh file dengan mengunduhnya dari Kaggle, namun, Anda harus dapat membaca file csv apa pun dengan mengikuti petunjuk di bawah ini
Baca File CSV Menggunakan Python
Ada dua cara umum untuk membaca file .csv
saat menggunakan Python. Yang pertama dengan menggunakan pustaka csv
, dan yang kedua dengan menggunakan pustaka pandas
1. Menggunakan Perpustakaan CSV
import csv
with open["./bwq.csv", 'r'] as file:
csvreader = csv.reader[file]
for row in csvreader:
print[row]
Di sini kami mengimpor pustaka csv
untuk menggunakan metode
import pandas as pd
data = pd.read_csv["bwq.csv"]
data
1 yang ada di dalamnya untuk membantu kami membaca file csv
Kata kunci
import pandas as pd
data = pd.read_csv["bwq.csv"]
data
3 memungkinkan kita untuk membuka dan menutup file tanpa harus menutupnya secara eksplisitMetode
import pandas as pd
data = pd.read_csv["bwq.csv"]
data
4 membutuhkan dua argumen bertipe import pandas as pd
data = pd.read_csv["bwq.csv"]
data
5. Pertama nama file, dan kedua argumen mode. Kami menggunakan import pandas as pd
data = pd.read_csv["bwq.csv"]
data
_6 untuk membaca, namun ini dapat dihilangkan karena import pandas as pd
data = pd.read_csv["bwq.csv"]
data
6 diasumsikan secara defaultKami kemudian mengulangi semua baris
Anda harus mengharapkan output di terminal terlihat seperti ini
2. Menggunakan Perpustakaan Panda
import pandas as pd
data = pd.read_csv["bwq.csv"]
data
_Di sini kami mengimpor Pandas, pustaka Python yang digunakan untuk melakukan manipulasi dan analisis data. Ini berisi metode
import pandas as pd
data = pd.read_csv["bwq.csv"]
data
_8 yang kita butuhkan untuk membaca file csv
kitaAnda harus mengharapkan hasilnya terlihat seperti ini
Kemungkinan Masalah Pembatas
Sebagian besar csv
file dipisahkan dengan koma, namun, ada beberapa yang dipisahkan oleh karakter lain, seperti titik dua misalnya, yang dapat menampilkan hasil yang aneh di Python
Solusi Untuk Pembatas Menggunakan Perpustakaan CSV
Untuk mengubah pembatas menggunakan pustaka csv
, cukup berikan argumen
import csv
with open["./fileWithColonDelimeter.csv", 'r'] as file:
csvreader = csv.reader[file, delimiter=':']
for row in csvreader:
print[row]
2 dalam metode import csv
with open["./fileWithColonDelimeter.csv", 'r'] as file:
csvreader = csv.reader[file, delimiter=':']
for row in csvreader:
print[row]
3 seperti ituimport csv
with open["./fileWithColonDelimeter.csv", 'r'] as file:
csvreader = csv.reader[file, delimiter=':']
for row in csvreader:
print[row]
_Untuk kasus edge lainnya dalam membaca file csv
_ menggunakan pustaka csv
, lihat halaman ini di dokumen Python
Solusi Untuk Pembatas Menggunakan Pustaka Pandas
Untuk mengubah pembatas menggunakan pustaka pandas
, cukup berikan argumen
import csv
with open["./fileWithColonDelimeter.csv", 'r'] as file:
csvreader = csv.reader[file, delimiter=':']
for row in csvreader:
print[row]
2 dalam metode import csv
with open["./fileWithColonDelimeter.csv", 'r'] as file:
csvreader = csv.reader[file, delimiter=':']
for row in csvreader:
print[row]
8 seperti ituimport pandas as pd
data = pd.read_csv["fileWithColonDelimeter.csv", delimiter= ':']
data
Untuk kasus edge lainnya dalam membaca file csv
_ menggunakan perpustakaan Pandas, lihat halaman ini dokumen Pandas
Berikutnya
Untuk tutorial lebih mendalam tentang apa yang dapat Anda lakukan setelah membaca file csv
, lihat Plotting Precipitation with Python, Pandas and Matplotlib oleh Alex Couture-Beil