Manakah yang lebih baik standar deviasi kecil atau besar

Suara.com - Standar deviasi dalam buku Statistika Hospitalitas diartikan sebagai ukuran sebaran data dalam disiplin statistik yang juga dikenal sebagai simpangan baku. Standar deviasi juga bisa diartikan sebagai akar varian sebaran data.

Sementara itu, Investopedia menyebutkan, standar deviasi adalah nilai statistik yang digunakan untuk menentukan kedekatan sampel statistik dengan rata-rata sebuah data. Semakin tinggi nilai standar deviasi maka semakin lebar pula rentang variasi datanya.

Dengan demikian, standar deviasi bisa memberikan gambaran gap antara nilai sampel terhadap rata-ratanya. Rumus standar deviasi dipakai untuk menanalisis apakah sampel bisa mewakili populasi dalam penelitian. Standar deviasi juga bisa menggambarkan kualitas data sampel yang didapatkan.

Rumus standar deviasi biasa disebut dengan simpangan baku atau dengan simbol σ maupun S. Untuk menentukan standar deviasi diawali dengan menghitung nilai rata-rata dari semua titik data.

Baca Juga: Denda Jual dan Konsumsi Ikan Belida, Akademisi: Picu Kriminalisasi Nelayan

Nilai rata-rata dihitung dengan menjumlahkan semua nilai di dalam kumpulan data lalu dibagi dengan jumlah data tersebut.

Langkah kedua adalah menghitung penyimpangan pada setiap titik data dengan cara mengurangkan nilai dari nilai rata-rata. Devuasi dari setiap tutuk dikuadratkan untuk dicari penyimpangan kuadrat individu rata-rata.

Nilai yang dihasilkan dari proses tersebut disebut dengan varians. Sementara itu, standar deviasi adalah akar kuadrat dari varian tersebut. Standar deviasi menjadi cerminan dari rata-rata penyimpangan data mean. Apabila standar deviasi lebih besar dari mean, itu berarti nilai mean merepresentasikan yang lebih buruk daripada keseluruhan data.

Sebaliknya, jika standar deviasi lebih kecil dari mean, hal ini mengindikasikan bahwa data terlalu bersifat homogen. Data yang homogen bisa berarti penarikannya mengandung kesalahan karena tidak mewakili populasi yang diteliti.

Untuk menghitung standar deviasi harus diketahui dahulu keseluruhan nilai yang ingin dihitung. Dengan demikian, langkah pertama untuk menghitung nilai rata-ratanya bisa dilakukan. Sebagai contoh apabila sampel memiliki sepuluh nilai yang berbeda maka perlu dihitung dahulu rata-rata kesepuluh nilai tersebut.

Baca Juga: Bilangan Asli: Pengertian, Sejarah, dan Contohnya

Langkah berikutnya adalah mengkuadratkan seluruh data yang ada dan jumlahkan seluruh kuadrat tersebut. Standar deviasi adalah akar dari jumlah masing-masing data yang dikuadratkan dikurangi dengan kuadrat dari jumlah seluruh data pada perhitungan awal yang dibagi dengan banyaknya data.

  • At July 05, 2012
  • By Yori Yuliandra
  • In Blog, Research Things, Think Student

Pertanyaan ini mungkin sering menjadi keraguan dalam pengolahan dan penyajian data hasil penelitian, yaitu perihal standar mana yang lebih tepat digunakan untuk menyatakan penyimpangan data: standard deviasi [simpangan baku] atau standard error [kesalahan baku]. Kita mungkin akan menemukan penggunaan standar deviasi [SD] maupun standar error [SEM “lengkapnya Standard Error of Mean”] pada artikel-artikel ilmiah semisal jurnal penelitian. Tidak hanya sekedar keraguan, perihal ini juga sering menjadi perdebatan. Namun, sebelum menjatuhkan pilihan, mari kita lihat siapa mereka sebenarnya dan untuk apa mereka ada.

Contoh Kasus

Mari berimajinasi dan bayangkan bahwa kita mempunyai puluhan ekor kelinci percobaan dan kita akan mengambil 15 ekor di antaranya. Hal yang akan kita lakukan terhadap 15 ekor kelinci ini adalah mengukur panjang telinga mereka masing-masing [Kelincinya nggak diapa-apain kok. Nggak digorok, nggak dipukul, dan nggak disuntik macem-macem. So everyone’s happy]. Dari hasil pengukuran diperoleh data sebagai berikut:

Setelah dihitung, kita akan mendapatkan nilai rata-rata panjang telinga dari kelinci percobaan, yaitu 11,19 cm. Nilai ini kita sebut mean.

Pertanyaan yang muncul adalah: apakah nilai rata-rata [mean] yang kita peroleh adalah betul-betul representasi dari panjang telinga semua kelinci percobaan yang kita miliki? Atau pertanyaan berikutnya

Seperti apakah bervariasinya data yang kita peroleh?

Untuk menjawab pertanyaan tersebut, maka kita akan menarik selisih masing-masing data dengan nilai mean yang ditampilkan pada kolom berikutnya. Nilai selisih ini kita sebut dengan deviasi [penyimpangan]. Barangkali, nilai deviasi ini akan membantu kita untuk menentukan apakah nilai rata-rata yang kita peroleh adalah representatif. Kita dapat berasumsi bahwa nilai deviasi yang kecil merupakan indikasi bahwa data kita adalah representatif. So, mari kita tarik selisihnya…

Kemudian, kita jumlahkan total selisih dari 15 data yang kita peroleh. Maka diperoleh hasil sebagai berikut.

Lho, ternyata jumlah dari total selisih tadi bernilai nol. Tidaaaak… Mana mungkin kita dapat menentukan sifat representatif data jika hasil perhitungannya nol??? Lantas bagaimana caranya supaya niainya bukan nol? Hmm… sederhana saja. Masalah nol ini dapat diatasi dengan meng-kuadratkan nilai dari masing-masing selisih tadi. Maka nilainya pasti positif. Hasilnya adalah sebagai berikut.

Nah, sekarang kita punya angka yang jauh lebih bermakna dibandingkan dengan nol, yaitu 19,88 yang merupakan jumlah dari kuadrat deviasi data.

READ ALSO:  Minuman antioksidan dari gambir

So, what’s next?

So, jika nilai 19,88 tersebut kita bagi dengan 15 [15 merupakan jumlah data, biasa disimbolkan dengan n], maka kita akan memperoleh nilai 3.976. Tapi tunggu dulu, para ahli statistik berpendapat bahwa nilai ini akan menjadi lebih representatif jika dibagi dengan nilai n-1 dibandingkan dengan n [kata ahlinya sih begitu, kita mah nurut aja]. Dengan demikian,

19,88 / [15-1] = 1,42

Eits, tunggu sebentar. Jangan lupa bahwa tadi kita meng-kuadratkan masing-masing nilai deviasi untuk mengatasi masalah nol. Oleh karena itu data ini tidak tepat dipakai. So, bagaimana caranya??? Sederhana juga, nilai ini kita akarkan kembali. Iya kan? Maka nilai akhir yang kita peroleh adalah:

√1,42 = 1,191

Well, kita tadi ngitung apaan sih???

  1. Tadi kita sudah menghitung nilai varian [variance]. Itu tuh yang nilainya 1,42. Simbol yang biasa dipakai untuk nilai ini adalah s2.
  2. Kita juga sudah menghitung nilai akar dari variance yaitu 1,19. Nilai inilah yang kita sebut dengan STANDAR DEVIASI atau penyimpangan baku [standard deviation]. Simbol yang digunakan untuk nilai ini adalah s.

Dengan demikian standard deviation [SD] memang merupakan cerminan dari rata-rata penyimpangan data dari mean. SD dapat menggambarkan seberapa jauh bervariasinya data. Jika nilai SD jauh lebih besar dibandingkan nilai mean, maka nilai mean  merupakan representasi yang buruk dari keseluruhan data. Sedangkan jika nilai SD sangat kecil dibandingkan nilai mean, maka nilai mean dapat digunakan sebagai representasi dari keseluruhan data [yang dalam hal contoh kasus kita adalah panjang telinga kelinci percobaan].

SD biasanya disajikan sebagai “mean±SD” dimana dalam contoh kasus yang kita pelajari di atas nilainya adalah 11,19±1,191. Mengapa tanda “±” digunakan dalam hal ini? Ya, jawabannya adalah karena kita menemukan nilai [+] dan juga nilai [-] pada nilai deviasi [selisih data dengan nilai mean].

Oh ya, satu hal lagi, nilai mean [11,19] ditulis dengan 2 desimal sedangkan nilai SD [1,191] ditulis dengan 3 desimal. Mengapa berbeda? Hmm… kebiasaannya sih emang begitu. Nilai SD dinyatakan dengan satu jumlah desimal yang lebih banyak dibandingkan dengan nilai mean.

STANDARD ERROR. Makhluk apa pula ini?

Selain SD, kita juga mengenal istilah standard error [SE] atau kesalahan baku. SE merupakan nilai yang mengukur seberapa tepat kah nilai mean yang kita peroleh. Dengan kata lain, SE menjawab pertanyaan “seberapa dekatkah nilai rata-rata panjang telinga 15 ekor kelinci yang kita punya dibandingkan dengan rata-rata panjang telinga semua kelinci yang kita miliki?” Nilai SE dapat diketahui dengan perhitungan sederhana berikut:

READ ALSO:  Menginap semalam

SE = adalah akar dari nilai variance yang sudah dibagi dengan n. Ingat, dibagi dengan nilai n, bukan nilai [n-1]. Jadi, jika perhitungan kita di atas dilanjutkan, maka nilai SE adalah

SE = √[variance/n] = √[1,42/15] = 0,307

Dengan demikian, data yang kita peroleh dapat disajikan menjadi 11,19±0,307. Hmm… kalau diperhatikan secara cermat, ternyata nilai SE ini berasal dari nilai SD yang dibagi dengan akar n. SE = SD/√n. Coba buktikan! Betul kan?

Kabar Gembira: Microsoft Excel bersedia membantu

Pada bagian di atas, kita sudah menghitung dan melihat perbedaan antara SD dengan SE. Tidak terlalu rumit bukan? Apa? Masih rumit? Oke deh, tapi setidaknya sudah paham kan apa beda SD dengan SE. Untungnya, perhitungan SD dan SE ini bisa dilakukan dengan mudah dengan bantuan Microsoft Excel.

Caranya: setelah data yang akan diolah tersusun dengan rapi seperti gambar, maka pada tool bar di bagian atas pilih tab “Data” dan pilih “Data Analysis” yang terdapat pada  bagian kanan. Maka akan muncul kotak dialog gambar berikut:

Pada kotak dialog “Descriptive Statistics” yang muncul, blok keseluruhan data panjang telinga yang akan kita olah dan opsi sesuai dengan gambar berikut.

Terakhir, tekan “OK”, maka akan muncul halaman [sheet] baru yang berisi statistik deskriptif dari data yang kita olah, seperti gambar berikut.

SD atau SE?

READ ALSO:  Black Panther and intergalactic to shock predatory journals

Oh ya, terakhir, ada pertanyaan klasik. Standard mana yang diguanakan? SD atau SE? Hmm… ini sepertinya pertanyaan rumit. Keduanya bisa digunakan untuk tujuan yang sama, tergantung preferensi masing-masing. Ada yang lebih suka menggunakan SE karena nilai SE lebih kecil daripada SD [iya kan?]. Trus, saya pilih yang mana? Hmm… I am not telling…

Berikut rumus-rumus yang sudah kita bahas di atas:

_____________________

Buat yang mau mencoba, File Excel-nya [.xls] bisa diunduh di sini. Selamat mencoba. Mudah-mudahan bisa dipahami

Video yang berhubungan

Bài mới nhất

Chủ Đề