Cara menggunakan is na python

IF statement pada python pada dasarnya menjelaskan bahwa "jika if bernilai benar, maka jalankan kondisi yang sesuai dengan statement, dan jika kondisi tidak benar, maka jangan jalankan kondisi yang sesuai". IF statement berisi keyword yang dimulai dengan kata if, kemudian dilanjutkan dengan kondisi benar dan salah. IF statement dipisahkan dengan tanda kurung agar lebih mudah dibaca. Setelah itu dilanjutkan dengan titik dua yang memisahkan dua kondisi yang harus dijalankan, dan terakhir adalah body statement yang berisi kode yang akan dijalankan hanya jika kondisi mengarah ke logika TRUE.

IF biasa dikombinasikan dengan else. Statement IF else papa python berbunyi "ketika statement IF bernilai TRUE, maka jalankan kode berikutnya, tetapi jika statement bernilai FALSE maka jalankan kode yang mengikuti statement FALSE". Statement else adalah bagian dari statement IF, oleh karena itu, kode yang mengikutinya juga perlu diberi indentasi dengan empat spasi untuk menunjukkan bahwa statement else adalah bagian dari statement IF. Agar lebih mudah, pada artikel kali ini DQLab akan menjelaskan penggunaan IF dan else menggunakan contoh. Jadi tunggu apa lagi? Yuk simak artikel berikut sampai akhir!

1. Simbol yang Digunakan pada Statement IF Else Python

Sebelum mempelajari IF statement, ada beberapa simbol yang perlu kita pelajari sebagai berikut:

  • Equals (sama dengan): a == b

  • Not Equals (tidak sama dengan): a != b

  • Less than (kurang dari): a < b

  • Less than or equal to (kurang dari sama dengan): a <= b

  • Greater than (lebih dari): a > b

  • Greater than or equal to (lebih dari sama dengan): a >= b

Simbol-simbol ini bisa dikombinasikan sesuai kebutuhan kita.

Baca juga : Yuk Cari Tahu Perbedaan Python R dan SQL

2. IF Statement pada Python

Sebagai contoh, kita memiliki dua variabel a dan b dengan nilai a adalah 50 dan nilai b adalah 100. Jika kita ingin mencetak di layar bahwa b lebih besar dari pada a, maka kita bisa menuliskan sintaks berikut di python

Cara menggunakan is na python

Dari gambar di atas, setelah kita menuliskan sintaks dan me-run sintaks tersebut, akan muncul output yang mengatakan "b lebih besar dari a".

3. IF Else Statement pada Python

Else digunakan untuk menyatakan kondisi sebaliknya yang ada pada IF statement. Misalnya, Andi akan lulus ulangan matematika jika nilainya lebih dari 65. Nilai ulangan Andi adalah 80, maka untuk mengetahui apakah Andi lulus ulangan menggunakan IF else statement kita bisa menuliskan sintaks berikut 

Cara menggunakan is na python

4. IF Else Statement Singkat pada Python

Dari poin ketiga, kita membutuhkan beberapa baris untuk menulis if else statement. Namun, kita bisa menyingkat if else statement dengan sintaks berikut

Cara menggunakan is na python

Hasil pada gambar di atas sama dengan hasil pada poin ketiga, tetapi sintaks yang digunakan lebih singkat dan sederhana. Pada dasarnya kedua sintaks tersebut memiliki maksud yang sama, hanya saja model penulisannya berbeda. Kita bebas menggunakan sintaks pada poin ketiga atau ke empat.

Baca juga : Mengenal Perbedaan R Python dan SQL

5. Belajar Basic Python Bersama DQLab

Python merupakan bahasa pemrograman yang paling banyak digunakan saat ini. Meningkatnya popularitas python disebabkan karena tingginya rekrutmen profesional yang menguasai python. Fenomena ini diprediksi akan terus meningkat mengingat semakin tingginya pemanfaatan big data hampir di berbagai sektor industri. Yuk mulai belajar python bersama DQLab! Klik button di bawah ini dan mulai akses berbagai modul python dari DQLab sebagai langkah awal untuk belajar bahasa pemrograman Python. Selamat belajar!

Ketika memulai -pembuatan model Machine Learning atau suatu proyek Data Science, kita biasanya akan memulai EDA atau Exploratory Data Analysis dengan harapan menemukan pola dan wawasan yang menarik tentang data sebelum kita melanjutkan untuk mengekstrak fitur dan membangun model. Tetapi sangat umum untuk menemukan banyak nilai yang hilang (missing values) dalam data yang kita miliki. Nilai-nilai yang hilang atau Missing Values ini muncul karena banyak faktor yang berada di luar kendali kita seperti misalnya karena cara pengambilan data.

Dalam beberapa kasus, nilai tidak tersedia sama sekali untuk observasi. Meski demikian, kita tetap perlu menangani nilai-nilai yang hilang tersebut sebelum melangkah lebih jauh. Mari kita lihat cara melakukannya. Tidak ada satu teknik standar atau solusi umum untuk menangani nilai yang hilang, tetapi ada beberapa cara yang dapat kita gunakan bergantung pada kasus yang kita hadapi untuk menangani nilai yang hilang dalam data. Pada artikel ini. DQLab akan berbagi mengenai cara-cara penanganan data hilang, sebelum itu perlu untuk kita pahami apa saja jenis dari data hilang. Yuk simak penjelasannya!

1. Tipe-Tipe Missing Values / Data Hilang

Kita dapat mengklasifikasikan Missing Values dalam berbagai tipe. Setiap jenis nilai yang hilang memerlukan penanganan yang sedikit berbeda. Jenis utamanya adalah :

  1. Hilang Sepenuhnya Secara Acak (MCAR, Missing Completely At Random)

  2. Hilang Secara Acak (MAR, Missing At Random)

  3. Hilang Tidak Secara Acak (MNAR, Missing Not At Random)

Seperti namanya hilang sepenuhnya secara acak berarti bahwa tidak ada hubungan antara apakah titik data hilang dan nilai dalam kumpulan data, hilang atau diamati. Data yang hilang hanyalah subset acak dari data. Adapun hilang secara acak berarti bahwa kecenderungan nilai yang hilang memiliki hubungan sistematis dengan data yang diamati tetapi tidak dengan data yang hilang.

Artinya observasi yang hilang tidak ada sangkut pautnya dengan nilai yang hilang tetapi ada korelasi dengan variabel yang diamati. Misalnya jika Anda mengikuti survei tentang gangguan mental pada pria dan wanita, kemungkinan kecil pria akan melaporkan depresi mereka atau sebaliknya, tetapi itu tidak ada hubungannya dengan tingkat depresi mereka.Tidak ada secara acak berarti ada hubungan yang berbeda antara kecenderungan suatu nilai untuk hilang dan nilainya. Jadi dalam survei depresi kami, responden dengan nilai depresi yang lebih tinggi gagal mengisi survei karena tingkat depresi mereka.

Baca Juga : Implementasi Azure Machine Learning Studio untuk Simple Credit Approval Model using Decision Tree Bersama DQLab

2. Cara Penanganan Missing Values 1 : Menghapus Keseluruhan Baris (Row)

Cara termudah untuk menangani data hilang adalah dengan membuang kolom / baris yang datanya tidak tersedia. Perlu dicatat bahwa cara ini hanya berlaku dalam dua jenis data yang hilang pertama, MCAR dan MAR. Kedua jenis data ini secara umum, aman bagi kita untuk menghapus data dengan nilai yang hilang bergantung pada kemunculannya. sedangkan dalam kasus ketiga menghapus pengamatan dengan nilai yang hilang dapat menghasilkan bias dalam model. Perhatikan contoh penghapusan data hilang pada Melbourne Housing Dataset berikut :


Kedua pendekatan tersebut memiliki kelebihan dan kekurangan masing-masing dan kita harus menganalisis kasus yang terjadi untuk memutuskan apa yang perlu dilakukan. Jika kita menghapus baris, jumlah total poin data kita untuk melatih model kita akan turun yang dapat mengurangi kinerja model. Lakukan ini hanya jika kita memiliki banyak contoh pelatihan dan baris dengan data yang hilang jumlahnya tidak terlalu tinggi.

Menghapus kolom sama sekali akan menghapus fitur dari model kita, yaitu prediksi model tidak akan bergantung pada luas bangunan. Terkadang kita dapat menghapus variabel atau kolom jika datanya hilang untuk lebih dari 60% pengamatan tetapi hanya jika variabel itu tidak signifikan. Secara umum, menghapus data bukanlah pendekatan yang baik dalam banyak kasus karena kita kehilangan banyak informasi yang berpotensi berguna. Mari kita lihat pendekatan yang lebih baik untuk menangani data yang hilang.

3. Cara Penanganan Missing Values 2 : Menghitung Nilai Pengganti (Imputation)

Ada banyak cara untuk memperhitungkan nilai pengganti data, seperti :

  1. Nilai konstanta yang merupakan bagian dari kumpulan nilai yang mungkin dari variabel itu, seperti 0, berbeda dari semua nilai lainnya

  2. Nilai rata-rata, median, atau mode untuk kolom

  3. Nilai yang diperkirakan oleh model prediktif lain

  4. Beberapa Imputasi lain

Mari perhatikan dataset yang kita miliki tadi, dan kita akan mencoba cara ini seperti berikut :

Kode di atas akan menghasilkan dataset seperti ini

Cara menggunakan is na python

Seperti yang dapat kita lihat, kode di atas menghubungkan nilai kolom BuildingArea dengan nilai rata-rata kolom itu. Kita dapat menggunakan fungsi fillna untuk memasukkan nilai tetap, mean, median, dll.

Baca Juga : Mendalami Array Python Dengan Mempelajari Rotation

4. Yuk Pelajari Lebih Lanjut Mengenai Data Processing Bersama DQLab!

Ingin mempelajari Python lebih dalam? Ayo mulai belajar bersama DQLab secara GRATIS! Yuk, bergabung di DQLab! Kamu bisa membangun portofolio datamu dengan belajar data science di DQLab. Untuk kamu yang ingin mulai belajar data science atau siap berkarir jadi Data Analyst, Data Scientist, dan Data Engineer, persiapkan diri kamu dengan tepat sekarang. Tidak ada kata terlambat untuk belajar. Yuk #MulaiBelajarData di DQLab.

Dengan belajar di DQLab, kamu bisa:

  • Menerapkan teknik mengolah data kotor, hasilkan visualisasi data dan model prediksi dengan studi kasus Retail dan Finansial

    Apa itu NaN pada Python?

    Pada data yang kita gunakan, umumnya ada data yang tidak ada, alias kosong, alias null, atau None, atau umum ditandai dengan NaN pada Python.

    Bagaimana mengecek missing value?

    Untuk mengecek apakah dalam objek terdapat missing value dapat menggunakan fungsi is.na() . ouput dari fungsi tersebut adalah nilai Boolean. Jika terdapat Missing value, maka output yang dihasilkan akan memberikan nilai TRUE .

    Bagaimana cara menangani missing data?

    Salah satu cara yang dapat dilakukan untuk menangani missing data adalah dengan mengisi missing data dengan nilai-nilai yang mungkin berdasarkan informasi yang tersedia pada data atau dikenal dengan imputasi. Mean dan Algoritma K-Means merupakan metode yang dapat digunakan untuk imputasi missing data.

    Untuk mengecek apakah sebuah Dataframe mengandung nilai NaN perintah yang digunakan adalah?

    isna() digunakan untuk mengecek apakah ada nilai NaN pada dataframe. Function ini akan mengembalikan nilai Boolean, True atau False, untuk tiap elemen di dataframe. Kita juga dapat menambahkan function any() untuk mengecek nilai NaN berdasarkan kolom.