Cara menggunakan sql python excel
Pandas adalah library python yang bersifat open source yang dibuat terutama untuk bekerja dengan data relasional atau berlabel secara mudah. Library yang satu ini menyediakan berbagai struktur data dan operasi untuk memanipulasi data numerik dan deret waktu. Show Pandas dibangun di atas library NumPy. Salah satu kelebihan dari library pandas adalah lebih cepat dan memiliki kinerja serta produktivitas tinggi untuk berbagai pekerjaan pengolahan data. Pandas awalnya dikembangkan oleh Wes McKinney pada tahun 2008 saat dia bekerja di AQR Capital Management. Dia memperbolehkan AQR untuk membuka sumber Pandas. Karyawan AQR lainnya, Chang She, bergabung sebagai kontributor utama untuk membangun library ini pada tahun 2012. Seiring berjalannya waktu, banyak versi pandas yang telah dirilis. Versi terbaru pandas adalah 1.4.1. Pandas adalah salah satu library yang wajib dikuasai oleh seorang pemula karena library ini akan sangat berguna untuk berbagai tugas. Pada artikel kali ini kita akan belajar cara menggunakan library pandas khususnya untuk beginner. Jadi untuk kamu yang sedang belajar Data Science menggunakan Python, yuk simak artikel ini sampai akhir! 1. Install Library PandasLangkah pertama bekerja menggunakan pandas adalah memastikan library tersebut sudah terpasang di folder Python. Jika belum terinstall, maka kita perlu menginstalnya di sistem kita menggunakan perintah pip. Caranya gampang, kita bisa menggunakan python-pip. Cukup ketikkan script di bawah ini kemudian run, maka library akan terinstall dan bisa digunakan. Baca juga: Coding Python Simpel untuk Operasi Matematika 2. Mengimport Library PythonSetelah pandas diinstal ke dalam sistem, kita perlu mengimpor library ini agar bisa digunakan. Modul ini umumnya diimpor sebagai: Istilah pd disebut sebagai alias untuk Pandas. Namun, sebenarnya kita tidak perlu mengimpor perpustakaan menggunakan alias, itu hanya sebagai pembantu untuk mempermudah dalam menulis code yang lebih singkat. Alias ini juga bisa kita ubah sesuai keinginan kita. Pada umumnya, pandas bisa digunakan untuk manipulasi dua struktur data, yaitu series dan dataframe. 3. Series dengan PandasDi dunia nyata, Seri Pandas akan dibuat dengan memuat kumpulan data dari penyimpanan yang sudah ada. Penyimpanan ini dapat berupa database SQL, file CSV, file Excel, dan data storage lainnya. Series pandas dapat dibuat dari list, dictionary, dari nilai skalar, dan lain sebagainya. Berikut ini adalah cara untuk membuat series menggunakan pandas. 4. Dataframe dengan PandasPandas dataframe adalah struktur data tabular dua dimensi yang dapat berubah ukuran dan berpotensi heterogen dengan sumbu berlabel (baris dan kolom). Dataframe terdiri dari tiga komponen utama, yaitu data, baris, dan kolom. Gambar di bawah ini adalah salah satu cara untuk membuat data frame menggunakan pandas. Baca juga: Belajar Python: Mengenal Array pada Bahasa Pemrograman Python Ingin belajar fungsi dan kegunaan lain yang lebih kompleks menggunakan pandas python? Yuk belajar dengan berbagai modul data science bersama DQLab! Klik button di bawah ini atau sign up melalui DQLab.id untuk mengakses free modul dari DQLab ‘Introduction to Data Science’ dengan python dan R serta nikmati ebook gratis yang bisa diakses kapanpun dan dimanapun. Selamat belajar! Ceritanya tadi ada task untuk mengolah data sebuah file excel berisi 22970 baris data transfer-transferan. Inti tugasnya adalah menampilkan seluruh pengirim ( 0), penerima ( 1), dan transaksi ( 2) yang duplicated.Sebenarnya gampang, ya, tinggal klik-klik langsung filter di excel. Tapi data sebanyak 22970 ini cukup untuk membuat komputer gw ngos-ngosan. Terus kepikiran pengen buat macro di VBA Excel, nanti diquery pakai sql buat filternya. Tapi udah lupa cara bikin macro. Udah aja 1 jam berkutat belajar lagi macro terus menyerah pas gagal bikin koneksinya pakai ADODB (gak bisa create object kalau pakai macOS, ceunah). Tiba-tiba. Oh, kenapa gak pakai Python aja kalau mau diperlakukan sebagai sql? Kayaknya lebih cepat. Tapi sebenarnya gak cepat juga, karena gw pengennya data itu jadi tabel dalam sebuah db yang nantinya akan gw query dengan sql (entah mengapa ngotot banget pengen pake sql query). Sementara gw belum tau caranya convert excel ke db. Jadilah lama lagi nyari-nyari caranya. Tambah lagi udah buang waktu buat mencoba bikin macro. Kayaknya lebih cepat kalau bikin filter langsung di excel dari tadi, wkwkwk. DataFile excel-nya bisa didownload di sini. Catatan, data sudah dimodifikasi, baik isi maupun jumlah field, untuk kepentingan pembelajaran semata. Dataset terdiri dari 22970 baris dan 5 kolom ( 2, 4, 5, 0, dan 1).Pertama, seperti biasa import dulu library yang akan digunakan. 8 untuk membuat DataFrame, 9 untuk query sql, dan 0 untuk mengexport data dari excel ke db.
Kemudian, baca excel dan simpan di DataFame 1. Terus check shape hasilnya 2. Export dataframe ke DBPertama kita siapkan koneksi dulu. Database yang akan dibuat bernama 3.
Setelah itu export Dataframe ke tabel bernama 4. Di sini kita juga melakukan pengecekan, jika tabelnya sudah ada maka direplace. Bisa juga diganti dengan 5 kalau tidak mau 6 dengan db yang baru. Cek dokumentasinya di sini.
Proses di atas mengexport seluruh data dalam dataframe ke sebuah tabel. Jadi tidak perlu lagi mengcopy datanya satu-persatu. Setelah export selesai, tutup koneksinya. Query menggunakan SQLKita coba query sederhana dulu dengan memilih 5 record pertama. Inget, koneksinya ke db tapi pas select tetap ke tabel.
Jika tidak ada masalah maka outputnya adalah 5 baris pertama dari data. Kalau sudah OK, kita bisa mulai query yang sesungguhnya. Yang pertama adalah me-list semua 0 yang duplicated. Misal kita ingin mencari 0 yang duplicated dari 9 dan 0. Untuk menampilkan semua 0 yang duplicated, bisa dilakukan dengan 2 diikuti dengan select 3 yang lebih dari 1.
Contoh ke dua masih seperti yang pertama, tapi kali ini kita tambahkan kriterianya. Selain 0 yang duplicated, kita juga ingin melist 1 yang duplicated.
Contoh ke-tiga, tambah lagi dengan kriteria 2 yang duplicated.
Terakhir, simpan hasilnya di file excel.
That’s all. Kalau ada saran untuk meringkas query-nya, boleh di komen, hehe. Jupyter notebook untuk latihan ini bisa didownload di sini. Thank you. Apa itu SQL python?Berdasarkan penjabaran di atas, SQL adalah bahasa permintaan standar yang memungkinkan Anda untuk mengakses dan memanipulasi data dari database. Sementara itu, Python adalah bahasa pemrograman multifungsi yang digunakan untuk mengembangkan aplikasi web, software, dan lain sebagainya.
Apa itu SQL Programming?SQL (Structured Query Language) adalah bahasa pemrograman yang ditujukan untuk memudahkan manajemen data khususnya relational database, manipulasi data, hingga kemudahan akses untuk keperluan analisis. Ada lagi NoSQL yaitu istilah yang digunakan untuk database non relational.
SQL dibaca apa?SQL, dibaca es. kiu.el atau sikuel merupakan singkatan dari Structured Query Language merupakan bahasa komputer standar untuk berinteraksi dengan suatu sistem database atau lebih tepatnya suatu sistem manajemen database relasional.
|