Cara menggunakan memilih kolom di python

Dalam menganalisis data, terkadang kita perlu mengambil nama kolom di dataframe untuk melakukan operasi tertentu.

Jika data sedang kita analisis hanya memiliki sedikit kolom, tentunya kita akan dengan mudah mengetahui nama-nama kolom tersebut. Namun, jika dataframe tersebut memiliki puluhan bahkan mungkin ratusan kolom, itu akan cukup merepotkan, bukan?

Nah, pada tutorial kali ini, kita akan membahas bagaimana cara mengambil nama kolom di dataframe dengan Pandas Python.

Mari kita load dataset-nya terlebih dahulu ke dataframe Pandas menggunakan read_csv().

import pandas as pd

df = pd.read_csv("dataset/california_housing_prices.csv")
df.head()

Cara menggunakan memilih kolom di python

Menggunakan .columns

Cara yang pertama yaitu dengan menggunakan .columns. Ini merupakan cara yang banyak digunakan untuk mendapatkan nama kolom. Cara penggunaannya cukup mudah. Perhatikan contoh berikut.

Cara menggunakan memilih kolom di python

Kita juga dapat menambahkan .values untuk mengambilnya sebagai array seperti di bawah ini.

Cara menggunakan memilih kolom di python

Menggunakan keys()

Selain menggunakan .columns, kita juga dapat menggunakan keys() untuk mengambil nama kolom. Perhatikan contoh berikut.

Cara menggunakan memilih kolom di python

Mengambil nama kolom dengan iterasi

Kita juga dapat mengambil nama kolom dengan iterasi. Pada contoh ini kita menggunakan perulangan for.

for col in df.columns:
   print(col)

Cara menggunakan memilih kolom di python

Mengambil nama kolom sebagai list

Ada dua cara untuk mengambil nama kolom dan memasukkannya ke dalam list yaitu menggunakan method list() dan tolist(). Perhatikan cara penggunaannya sebagai berikut.

Pertama kita akan menggunakan list().

Cara menggunakan memilih kolom di python

Cara menggunakan memilih kolom di python

Selanjutnya kita coba menggunakan tolist().

print(df.columns.values.tolist())

Cara menggunakan memilih kolom di python

Mengambil nama kolom berdasarkan indeks tertentu

Selain mengambil keseluruhan nama kolom di dataframe seperti contoh-contoh di atas, kita juga dapat mengambil nama kolom tertentu di dataframe. Kita hanya perlu menuliskan nomor indeks kolom tersebut di dalam kurung siku dan ditempatkan setelah .columns. Perhatikan beberapa contoh berikut.

Cara menggunakan memilih kolom di python

Pada contoh di atas, kita mengambil nama kolom dengan indeks 2 atau kolom ke tiga, kolom dengan indeks 5 atau kolom ke enam, dan kolom paling akhir yang dapat kita tulis dengan indeks -1.

Itulah beberapa cara yang dapat Anda lakukan untuk mengambil nama kolom di dataframe.

Semoga bermanfaat..

Subset data itu apa?

Secara sederhana, data subsetting adalah suatu proses untuk mengambil beberapa bagian dataframe dan kemudian memindahkannya ke dataframe lain.

Function apa yang digunakan untuk melihat jumlah baris dan kolom dari suatu data frame?

info() info() digunakan untuk menampilkan informasi detail tentang dataframe, seperti jumlah baris data, nama-nama kolom berserta jumlah data dan tipe datanya, dan sebagainya.

Apa itu Pandas Dataframe?

Pandas DataFrame adalah struktur data 2 Dimensi. Data distrukturisasi seperti tabel yang berisi baris dan kolom, sehingga mudah untuk melakukan queri atau mengakses data tersebut. Baris merepresentasikan record dan kolom merepresentasikan field.

Apa itu Pandas pada Python?

Pandas adalah sebuah library di Python yang bersifat open source dengan lisensi BSD pandas biasa digunakan untuk menganalisis data, manipulasi data, mengubah dimensi data, mengecek data dan masih banyak lagi.