Cara menggunakan DF.TO_JSON pada Python

Seperti yang dapat kita lihat, data tersebut dipisahkan oleh koma, jadi ini termasuk jenis file CSV (Comma Separated Values) sehingga kita dapat menggunakan method read_csv() untuk import data.

Baca juga: Pengenalan Library Python Untuk Data Science

Di Python, untuk mengimport data ke jupyter notebook cukup mudah yaitu hanya dengan tiga langkah.

  1. Import pandas
  2. Definisikan variabel untuk menyimpan path url atau file dataset
  3. Gunakan method read_csv untuk mengimport data
import pandas as pd

url = "https://archive.ics.uci.edu/ml/machine-learning-databases/autos/imports-85.data"
df = pd.read_csv(url)

Jika menggunakan file dari komputer lokal, kita harus menentukan lokasi file tersebut tersimpan.

import pandas as pd

path = "dataset/imports-85.data"
df = pd.read_csv(path)

Kita bisa melihat dataset tersebut dalam bentuk dataframe dengan method head() untk melihat data teratas.

df.head()

Atau tail() untuk melihat data terbawah.

df.tail()

Default dari method head() dan tail() di atas adalah menampilkan 5 baris data teratas ataupun terbawah. Namun, jika kita ingin menentukan jumlah yang spesifik bisa dilakukan dengan memberikan sebuah angka di dalam tanda kurung.

Misalnya :

df.head(10)

atau

df.tail(20)

Baca juga: Cara Mengecek Tipe dan Distribusi Data di Pandas Python

Method read_csv() mengasumsikan setiap data yang dibaca telah mengandung header, sehingga jika ternyata dataset tersebut belum mengandung header seperti dataset automobiles yang kita gunakan, maka otomatis baris pertama dataset tersebut akan dijadikan header seperti terlihat di bawah ini.

Cara menggunakan DF.TO_JSON pada Python

Publish on Feb 22, 2022 by Alfin F

CSV adalah tipe file khusus yang dapat Anda buat  di aplkasi office seperti microsoft office, google sheet dan aplikasi sejenis lainya.

File .CSV menyimpan informasi yang dipisahkan oleh koma(,) bukan kolom, ini yang yang menjadikan file .CSV mudah di baca oleh berbagai bahasa program.

Di tutorial sebelumnya kita telah membahas tentang pengolahan data type file .XLSX dengan pandas.

Kode dan cara pemanggilan fungsinya hampir sama, yang membedakan hanya pemanggilan tipe filenya saja pd.read_excel() di ganti ke pd.read_csv(). untuk mengikuti tutorial ini download file .csv nya bisa kamu dapatkan di sini.

Perhatikan kode di bawah ini:
import pandas as pd
df = pd.read_csv("excels.csv")

for i in df.index:
print("Kota: "+df['Kota'][i])
print("Jumlah Penduduk: "+df['Jumlah_Penduduk'][i])
print("Pendapatan Harian: "+df['Pendapatan_Harian'][i])

Dari kode diatas dapat kita lihat bahwa perbedaanya dengan pengolahan data type .XLSX dan .CSV hanya terdapat pada cara pemanggilan type filenya saja.

A) CSV to Dict

Selanjutnya kita akan mengubah data csv kedalam bentuk dictionary, caranya sama dengan tutorial sebelumnya, buat terlebih dahulu variable lst dengan type list data. 

Perhatikan kode di bawah ini :
import pandas as pd
df = pd.read_csv("excels.csv")

lst = []
for i in df.index:
data = {}
data['kota'] = df['Kota'][i]
data['jumlah_penduduk'] = df['Jumlah_Penduduk'][i]
data['pendapatan_harian'] = df['Pendapatan_Harian'][i]
lst.append(data)
print(lst)

Output :
Pendapatan Harian: 100 ribu
[{'kota': 'jakarta', 'jumlah_penduduk': '15 juta', 'pendapatan_harian': '500 ribu'}, {'kota': 'tangerang', 'jumlah_penduduk': '10 juta', 'pendapatan_harian': '300 ribu'}, {'kota': 'serang', 'jumlah_penduduk': '7 juta', 'pendapatan_harian': '200 ribu'}, {'kota': 'pandegelang', 'jumlah_penduduk': '3 juta', 'pendapatan_harian':'100 ribu'}]

B) Dict to Json

Selanjutnya kita akan mengubah dictionary kedalam bentuk json dengan menggunakan library json, kemudian panggil terlebih dahulu package json dengan cara

import json

Kemudian gunakan json.dumps() untuk mengubah bentuk dictionary ke bentuk json.

Perhatikan kode di bawah ini :
import pandas as pd
import json
df = pd.read_csv("excels.csv")

lst = []
for i in df.index:
data = {}
data['kota'] = df['Kota'][i]
data['jumlah_penduduk'] = df['Jumlah_Penduduk'][i]
data['pendapatan_harian'] = df['Pendapatan_Harian'][i]
lst.append(data)

print(json.dumps(lst))

Output :
[{"kota": "jakarta", "jumlah_penduduk": "15 juta", "pendapatan_harian": "500 ribu"}, {"kota": "tangerang", "jumlah_penduduk": "10 juta", "pendapatan_harian": "300 ribu"}, {"kota": "serang", "jumlah_penduduk": "7 juta", "pendapatan_harian": "200 ribu"}, {"kota": "pandegelang", "jumlah_penduduk": "3 juta", "pendapatan_harian":"100 ribu"}]

Kita sudah mempelajari tentang pengolahan file type .XLSX dan .CSV serta JSON dengan menggunakan pandas.

Diharapkan Anda sekarang sudah bisa menggunakan pandas untuk mempermudah pengolahan data.

Demo:


Baca artikel lainya :


  • Data frame dengan pandas dan SQLAlchemy

  • Sample join data CSV di python menggunakan pandas

  • Menggunakan redis PUB/SUB untuk aplikasi python

  • Mengenal obligasi kekurangan dan kelebihanya

  • Benarkan tapering the fed mempengaruhi harga crypto ?

  • Bear coin cuan 3x saat harga bitcoin turun

  • Implementasi blockchain ethereum pada industri real estate

  • Mengenal NFT investasi aset crypto cara baru

  • Djed stablecoin hasil kolaborasi cardano dan coti

  • Airdrop tempat komunitas berbagi coin gratis

  • Apa itu UNISWAP dan bagaimana cara kerjanya

  • Mengenal mina protokol mini blockchain baru

  • Mengenal cardano crypto currency generasi ke-tiga

  • Apa yang kamu tau tentang gas ethereum ?

  • Memilih database : Cloud Firestore atau Realtime Database