Apa perbedaan uji normalitas kolmogorov smirnov dan Shapiro Wilk?

Pilihan Uji Normalitas Univariate

Jenis Uji Normalitas

Uji normalitas univariate banyak sekali macamnya, baik berdasarkan grafik atau angka. Berdasarkan grafik antara lain: Normal PP Plot, Normal QQ Plot, Normal Detrend QQ Plot, Histogram, Boxplot dan Stem-leaf. Sedangkan berdasarkan angka antara lain: Jarque Bera, Skewness Kurtosis, Shapiro Wilk, Shapiro Francia, Ryan Joiner, Lilliefors, Cramer Von Mises, Anderson Darling, Kolmogorov Smirnov dan banyak lainnya. Karena banyak pilihan uji normalitas itulah, dalam kesempatan ini kita akan membahas tentang pilihan uji normalitas yang tepat.

Begitu banyaknya uji yang tersedia, kadang kita kesulitan untuk memilih uji normalitas apa yang tepat dalam penelitian atau kasus statistik yang kita alami. Tentunya tidak ada salahnya jika kita mencoba untuk mempelajari uji apa yang kiranya paling tepat atau paling valid.

Uji Coba Normalitas

Berikut akan kita bahas, uji coba atau studi kasus berbagai uji normalitas dalam berbagai kasus. Dalam bahasan ini kita menggunakan hasil uji coba yang dilakukan oleh Nornadiah Mohd Razali dan Yap Bee Wah dalam Journal berjudul “Power Comparisons of Shapiro-wilk, Klomogorov Smirnov, Lilliefors And Anderson Darling-Tests. Faculty of Computer and Mathematical Science, University Teknologi MARA, 40450 Shah Alam, Selangor, Malaysia.”

Grafik Uji Normalitas pada Platykurtic Distributions

Grafik Uji Normalitas pada Paltykurtic Distributions

Grafik di atas menunjukkan simulasi hasil 4 macam uji normalitas (SW: Shapiro Wilk, KS: Kolmogorov Smirnov, LF: Lilliefors, AD: Anderson Darling) dengan Alfa 5% pada Distribusi Tidak Normal Simetris dengan nilai Kurtosis kurang dari 3 atau yang disebut dengan distribusi Platykurtic.

Probabilitas Shapiro Wilk

Shapiro Wilk beda dari pada yang lain hingga jumlah sampel 30 dan tetap stabil hingga 50 sampel, namun mendadak probabilitasnya meningkat tajam setelah 50 sampel sampai 200 sampel kemudian cenderung stagnan pada probabilitas 1 mulai sampel 300 sampai 2000. Anderson Darling sedikit menyerupai Shapiro Wilk, meningkat tajam setelah 50 sampel dan stagnan pada probabilitas 1 sejak sampel 400.

Probabilitas Lilliefors

Lilliefors Meningkat tajam mulai sampel 50 kemudian meningkat lebih tajam lagi pada sampel 100 dan probabilitasnya mendekati 1 setelah sampel 200 kemudian stagnan pada probabilitas 1 sejak sampel 1000. Sedangkan kolmogorov smirnov mulai menunjukkan peningkatan sejak sampel 100 dan meningkat lebih tajam sejak sampel 500 kemudian mencapai probabilitas 1 sejak sampel 2000.

Grafik Uji Normalitas pada Leptokurtic Distributions

Grafik Uji Normalitas pada Leptokurtic Distributions

Grafik di atas menunjukkan Shapiro Wilk, Anderson Darling dan Lilliefors secara berurutan probabilitasnya meningkat tajam sejak sampel 50. Pada sampel 200 mendekati probabilitas 1 dan mencapai probabilitas 1 pada sampel 300 kemudian stagnan sampai sampel 2000. Sedangkan kolmogorov smirnov meningkat tajam sejak sampel 100 dan selanjutnya mencapai probabilitas 1 sejak sampel 1000 dan terus stagnan sampai sampel 2000.

Berdasarkan hasil uji coba pada kedua distribusi simetris tidak normal di atas, uji shapiro wilk menunjukkan performa paling bagus pada sampel kecil di bawah 50 diikuti anderson darling dan lilliefors. Sedangkan kolmogorov smirnov berada diurutan berikutnya namun dapat bertahan kemampuannya sampai sampai sampel 1000.

Grafik Uji Normalitas pada Distribusi Asimetris Gamma (4,5).

Grafik Uji Normalitas pada Distribusi Asimetris Gamma (4,5)

Grafik di atas menunjukkan bahwa pada distribusi asimetris gamma (4,5) dengan skewness 1 dan kurtosis 4,5, shapiro wilk kemudian diikuti anderson darling dan lilliefors meningkat tajam sejak sampel 10 kemudian mencapai probabilitas 1 pada sampel 200. Khusus lilliefors masih dapat bertahan hingga sampel 300, namun pada sampel 200 sudah mendekati probabilitas 1. Sedangkan kolmogorov smirnov meningkat secara tajam sejak sampel 100 dan mencapai probabilitas 1 pada sampel 1000.

Grafik Uji Normalitas pada Distribusi Asimetris Gamma (1,5).

Grafik Uji Normalitas pada Distribusi Asimetris Gamma (1,5)

Grafik di atas menunjukkan bahwa pada distribusi asimetris gamma (1,5) dengan skewness 2 dan kurtosis 9, shapiro wilk kemudian diikuti anderson darling meningkat tajam sejak sampel 10 kemudian mencapai probabilitas 1 pada sampel 50. Khusus lilliefors masih dapat bertahan hingga sampel 100. Sedangkan kolmogorov smirnov meningkat secara tajam sejak sampel 50 dan mencapai probabilitas 1 pada sampel 100.

Kesimpulan Uji Normalitas Pada Distribusi Asimetris

Dari kedua distribusi asimetris di atas, menunjukkan bahwa sebaiknya shapiro wilk dan anderson darling digunakan pada sampel 50 atau kurang. Sedangkan Uji lilliefors dan kolmogorov smirnov sebaiknya digunakan pada sampel kurang dari 100.

Peringkat Uji Normalitas Pada Berbagai DistribusiPeringkat Uji Normalitas Pada Semua Distribusi

Berdasarkan kedua tabel di atas, peringkat pertama kekuatan uji normalitas ditempati oleh uji shapiro wilk kemudian secara berurutan diikuti anderson darling, lilliefors dan kolmogorov smirnov.

Probabilitas Uji Normalitas Berdasarkan Software

Selanjutnya kita bahas lebih jauh tentang uji normalitas di atas serta beberapa uji lainnya. Kita akan menggunakan hasil uji coba yang dilakukan oleh “Park, Hun Myoung. 2008. Univariate Analysis and Normality Test Using SAS, Stata, and SPSS. Working Paper. The University Information Technology Services (UITS) Center for Statistical and Mathematical Computing, Indiana University.”

Sumber Data Uji Coba Pilihan Uji Normalitas

Data yang digunakan didapatkan secara acak dari distribusi standard normal dengan sebuah seed dari 1.234.567 dalam aplikasi SAS dengan setiap peningkatan jumlah sampel, nilai mean, median skewness dan kurtosis mendekati 0 dan standard deviasi tetap bernilai 1.

Uji normalitas pada 10000 sampel

Semua tabel di atas menunjukkan bahwa semua uji normalitas (jarque bera, skewness kurtosis, shapiro wilk, shapiro francia, lilliefors, cramer von mises dan anderson darling) tidak ada yang menolak H0 dari normalitas dalam berapapun jumlah sampel. Namun uji shapiro wilk sudah tidak reliabel pada jumlah sampel 2000 dan uji shapiro francia sudah tidak reliabel pada jumlah sampel mencapai 5000. Sedangkan Jarque Bera dan Skewness Kurtosis terus menunjukkan performa yang konsisten pada berbagai jumlah sampel.

Catatan: Kolmogorov smirnov di dalam tabel adalah uji Lilliefors yang merupakan koreksi dari uji kolmogorov smirnov.

Spesikasi Uji Normalitas Berdasarkan Jumlah Sampel

Berikut beberapa aplikasi statistik yang mendukung uji normalitas:

Kemampuan Software Dalam Pilihan Uji Normalitas

Di atas adalah tabel pilihan uji normalitas berdasarkan kemampuan atau validitas software statistik terhadap jumlah sampel yang digunakan. Tabel di atas menunjukkan bahwa Jarque Bera dan Skewness Kurtosis menggunakan distribusi chi-square pada degree of freedom 2. Jarque Bera dapat kita hitung secara manual sedangkan skewness kurtosis dengan aplikasi STATA. Skewness kurtosis valid pada jumlah sampel lebih atau sama dengan 9. Uji shapiro wilk valid pada jumlah sampel 7 sd 2000 dan dapat kita gunakan pada aplikasi SAS, STATA dan SPSS. Mirip dengan shapiro wilk, uji ryan joiner dapat kita gunakan pada aplikasi minitab.

Sedangkan shapiro francia yang merupakan koreksi dari shapiro wilk, valid pada sampel 5 sd 5000 sampel dan dapat digunakan pada aplikasi STATA. Uji lilliefors, cramer von mises, anderson darling dan kolmogorov smirnov menggunakan Empirical Distribution Function (EDF). Lilliefors terdapat pada aplikasi SAS, SPSS dan minitab. Cramer Von Mises pada aplikasi SAS. Anderson darling pada aplikasi SAS dan minitab. Sedangkan kolmogorov smirnov terdapat pada aplikasi SPSS.

Catatan: Fungsi kolmogorov pada STATA tidak digunakan untuk uji normalitas.

Spesifikasi Uji Normalitas Berdasarkan Jumlah Sampel Oleh Para Pakar

Berdasar berbagai pandangan para pakar statistik beserta berbagai uji coba, berikut penulis sampaikan uji normalitas yang sebaiknya digunakan pada berbagai jumlah sampel.

Validitas Pilihan Uji Normalitas Pada Berbagai Jumlah Sampel

Keterangan:
v : Valid digunakan
v(T) : Pilihan yang baik digunakan
v(T)* : Pilihan yang terbaik.

Prioritas Pilihan Uji Normalitas Berdasarkan Berbagai Jumlah Sampel

Untuk sampel 3 sd 4, jarque bera yang harus digunakan. Sampel 5 sd 6 seharusnya menggunakan shapiro francia. Pada sampel 7 sd 50 sebaiknya menggunakan shapiro wilk atau shapiro francia.  Untuk sampel 51 sd 200 sebaiknya menggunakan uji lilliefors. Sedangkan untuk sampel yang lebih besar dari 200 sebaiknya menggunakan uji skewness kurtosis atau jarque bera karena kedua uji tersebut terus konsisten performanya pada berapapun jumlah sampel. Uji shapiro wilk dan ryan joiner hanya valid sampai 2000 sampel, sedangkan uji shapiro francia valid hingga 5000 sampel.

Prioritas Pilihan Uji Normalitas Berdasarkan Ketersediaan Software

Apabila anda hanya memiliki aplikasi SPSS, sebaiknya menggunakan uji shapiro wilk pada sampel 7 sd 50, menggunakan uji lilliefors pada sampel 51 sd 200 dan menggunakan uji kolmogorov smirnov jika sampel lebih dari 200.

Apabila anda hanya memiliki aplikasi SAS, untuk sampel kecil 7 sd 50 anda bisa menggunakan uji shapiro wilk dan anderson darling. pada sampel 51 sd 200 sebaiknya menggunakan lilliefors. Untuk sampel lebih dari 200 anda bisa menggunakan cramer von mises.

Apabila hanya memiliki aplikasi STATA, untuk sampel 5 sd 50 anda bisa menggunakan shapiro francia, bila sampel 7 sd 50 anda bisa memilih shapiro wilk atau shapiro francia. Sedangkan untuk sampel lebih dari 50 anda gunakan uji skewness kurtosis.

Apabila hanya memiliki aplikasi minitab, anda bisa menggunakan uji ryan joiner dan anderson darling pada sampel 7 sd 50. Untuk sampel yang lebih besar anda gunakan uji lilliefors.

Demikian penjelasan kami perihal pilihan uji normalitas univariate. Semoga artikel yang membahas tentang Pilihan Uji Normalitas berdasarkan berbagai pertimbangan ini akan bermanfaat untuk para peneliti atau mahasiswa.

By Anwar Hidayat

Apa perbedaan analisis normalitas kolmogorov smirnov dan Shapiro Wilk?

Shapiro-Wilk memiliki perbedaan dengan uji normalitas Kolmogorov-Smirnov. Kolmogorov-Smirnov digunakan untuk menguji normalitas pada sampel yang jumlahnya banyak (>100), sementara Shapiro-Wilk untuk sampel yang jumlahnya sedikit (<100).

Kapan uji Kolmogorov Smirnov dan Uji Shapiro Wilk bisa digunakan?

Perbedaan penggunaan keduanya adalah pada banyaknya sampel yang digunakan. Jika sampelnya kurang dari 50, maka Shapiro Wilk lebih cocok untuk digunakan dalam uji normalitas. Sementara untuk sampel besar yang lebih dari 50, gunakan Kolmogorov-Smirnov agar hasilnya lebih akurat.

Mengapa menggunakan uji Kolmogorov Smirnov?

Uji Kolmogorov smirnov memiliki kelebihan yaitu tidak timbul banyak persepsi antar pengamat dimana hal ini banyak terjadi pada uji normalitas berbasis grafik. Selain itu, pengujian dengan menggunakan uji ini juga terbilang sederhana.

Kenapa menggunakan uji Shapiro Wilk?

Uji normalitas menggunakan Shapiro Wilk, alasan peneliti menggunakan uji Shapiro Wilk adalah karena data yang diambil oleh Page 9 28 peneliti kurang dari 30. Data dikatakan berdistribusi normal dan memiliki varian sama apabila nilai signifikan lebih besar dari 0,05 (p > 0,05).