Mengapa perlu dilakukan analisis butir soal secara kuantitatif

Analisis soal – Soal yang diberikan oleh guru pada peserta didik yang berguna untuk mengukur kemampuan siswa bukan hanya untuk sekedar dikerjakan lalu selesai. Lebih dari itu, sebuah butir-butir soal yang disajikan kepada peserta didik perlu dilakukan analisis kembali untuk mengetahui apakah soal yang dibuat tersebut sudah tepat untuk mengukur kemampuan siswa. 

Dalam pembuatan soal tujuan utamanya sudah pasti adalah untuk mengukur hasil pembelajaran yang telah dilakukan oleh peserta didik. Dari hasil ujian yang telah dilakukan tersebut maka akan diketahui tingkat pemahaman siswa terhadap satu materi pelajaran tertentu yang diujikan. Lalu setelah itu dapat dilakukan evaluasi kembali. 

Namun sebenarnya yang perlu dievaluasi bukan hanya kompetensi siswa. Butir-butir soal yang disajikan kepada siswa pun perlu dilakukan analisis untuk mengetahui efektivitas soal tersebut. Sebab, pengukuran terhadap kompetensi siswa bisa jadi tidak akurat karena soal-soal yang digunakan untuk mengukur tersebut kurang tepat. 

Analisis terhadap soal dapat dilakukan setelah soal-soal diujikan. Kemudian terdapat dua metode untuk melakukan analisis soal yaitu menggunakan metode kualitatif dan kuantitatif. 

Metode analisis soal menggunakan cara kualitatif berarti dilakukan untuk mengetahui bentuk soal sehingga analisis tersebut akan banyak berkaitan dengan validitas isi soal dan kontruksi soal itu sendiri. Sedangkan metode kuantitatif digunakan untuk mengetahui ciri-ciri statistik soal meliputi reliabilitas, tingkat kesukaran, daya beda, dan lain sebagainya. 

Nah, melakukan analisis pada butir-butir soal ini sangat penting. Setidaknya terdapat tiga tujuan yang ingin tercapai. 

Pertama adalah untuk menguji kembali soal-soal yang telah dibuat dan disajikan pada siswa. Soal tersebut perlu dilihat kembali apakah soal yang dibuat tersebut sudah memenuhi standar mutu atau belum. 

Soal memang harus dibuat dengan kualitas yang baik. Jika butir-butir soal sendiri tidak baik, maka akan gagal mendapat gambaran yang tepat terkait kemampuan siswa melalui soal-soal yang disajikan tersebut. 

Kedua, setelah dilakukan peninjauan kembali harapannya soal-soal yang tidak valid perlu disingkirkan. Karena untuk apa menyajikan sesuatu yang tidak memiliki manfaat dalam sebuah proses penilaian kepada siswa. 

Ketiga, jika kualitas soal sudah baik maka akan didapatkan gambaran kemampuan siswa secara akurat. Oleh sebab itulah melakukan evaluasi pada butir-butir soal sangat penting dilakukan oleh guru sebagai pembimbing proses belajar peserta didik. 

Untuk melakukan analisis terhadap butir-butir soal dapat dilakukan menggunakan sebuah aplikasi bernama aplikasi TAP. Pengetahuan tentang penggunaan aplikasi tersebut sangat penting bagi guru karena menyangkut upaya peningkatan kualitas pendidikan. 

Mengapa perlu dilakukan analisis butir soal secara kuantitatif

Daftar pelatihan di atas dapat dilakukan melalui link berikut: 

DAFTAR 

Daftarkan diri Anda sebagai member e-Guru.id untuk mendapatkan pelatihan gratis setiap bulan melalui link berikut ini: 

DAFTAR MEMBER

Silakan hubungi kontak berikut ini jika terdapat pertanyaan: 

Whatsapp

Telegram

A.    PENDAHULUAN

1.      LATAR BELAKANG

Bagi seorang guru kegiatan  evaluasi sangatlah menjadi tuntutan, dimana seorang guru harus mengetahui hasil belajar siswanya dengan serangkaian tes yang berupa soal-soal serta berupa percobaan-percobaan kepada anak didik. Utuk memudahkan guru dalam menilai hasil tes tersebut dibuatlah analisis butir soal. Untuk itu penulis mencoba untuk memaparkan analisis butir soal kepada kita semua. Semoga apa yang akan di bahas dalam makalah ini berguna untuk semua yang mempelajarinya.

2.      RUMUSAN MASALAH

a.       Apakah pengertian analisis butis soal tersebut?

b.      Apa saja Teknik penganalisisan item tes hasil belajar?

B.     PEMBAHASAN

1.      PENGERTIAN ANALISIS BUTIR SOAL

Analisis butir soal (item) adalah suatu istilah yang digunakan untuk menentukan perhitungan dan pengukuran respons subjek terhadap suatu item (Crocker & Algina,1986). Secara umum, analisis item bertujuan untuk menentukan apakah suatu item merupakan item yang baik atau buruk sebagai suatu alat ukur, sehingga memungkinkan kita untuk memperpendek atau memperpanjang suatu tes sekaligus meningkatkan validitas dan reliabilitasnya. Analisis item dapat dilakukan secara kualitatif maupun kuantitatif. Secara kualitatif dilakukan analisis mengenai isi (content validity item-item soal) dan bentuk (apakah item-item ditulis dalam bentuk tertentu yang efektif untuk mencapai sasaran), yaitu dengan menghadirkan expert judgement sedangkan secara kuantitatif dilakukan analisis menggunakan berbagai teknik statistik. Teknik statistik yang paling umum digunakan dalam analisis item adalah dengan mengukur indeks kesukaran item dan indeks diskriminasi item. Item-item dalam tes ini tidak bervariasi derajat kesukarannya (dan tidak perlu diurutkan berdasarkan derajat kesukarannya), sehingga tidak diukur indeks kesukaran item-nya.[[1]] Analisis soal pada dasarnya terbagi menjadi dua kategori yaitu analisis soal secara kualitatif dan secara kuantitatif. Analisis butir soal secara kuantitatif menekankan pada analisis karakteristik internal tes melalui data yang diperoleh secara empirik. Karakteristik internal yang dimaksud meliputi parameter butir soal tingkat kesukaran dandaya pembeda soal. Analisis tingkat kesukaran soal artinya mengkaji soal-soal tes dari tingkat kesulitannya sehingga diperoleh soal-soal mana yang termasuk mudah, sedang dan sukar. Sedangkan analisis daya pembeda artinya mengkaji soal-soal tes dari segi kesanggupan tes tersebut dalam membedakan siswa yang memiliki kemampuan rendah dengan siswa yang memiliki kemampuan tinggi. Surapranata (2004) menyatakan bahwa salah satu tujuan dilakukannya analisis adalah untuk meningkatkan kualitas soal, yaitu apakah suatu soal :

a.       Dapat diterima karena telah didukung oleh data statistik yang memadai

b.      Diperbaiki karena terbukti terdapat beberapa kelemahan

c.       Tidak digunakan sama sekali karena terbukti secara empiris tidak berfungsi sama sekali.

Analisis Kualitatif. Yaitu berupa penelaahan yang dimaksudkan untuk menganalisis soal ditinjau dari segi teknis, isi, dan editorial. Analisis secara teknis dimaksudkan sebagai penelaahan soal berdasarkan prinsip-prinsip pengukuran dan format penulisan soal. Analisis secara isi dimaksudkan sebagai penelaahan khusus yang berkaitan dengan kelayakan pengetahuan yang ditanyakan. Analisis secara editorial dimaksudkan sebagai penelaahan yang khususnya berkaitan dengan keseluruhan format dan keajegan editorial dari soal yang satu ke soal yang lainnya. Analisis kualitatif lainnya dapat juga dikategorikan dari segi materi, konstruksi, dan bahasa. Analisis materi dimaksudkan sebagai penelaahan yang berkaitan dengan substansi keilmuan yang ditanyakan dalam soal serta tingkat kemampuan yang sesuai dengan soal. Analisis konstruksi dimaksudkan sebagai penelaahan yang umumnya berkaitan dengan teknik penulisan soal. Analisis bahasa dimaksudkan sebagai penelaahan soal yang berkaitan dengan penggunaan bahasa Indonesia yang baik dan benar menurut EYD.[[2]]

Analisis Kuantitatif. Digunakan untuk mengetahui sejauh mana soal dapat membedakan antara peserta tes yang kemampuannya tinggi dalam hal yang didefinisikan oleh kriteria dengan peserta tes yang kemampuannya rendah (melalui analisis statistik).Analisis kuantitatif menekankan pada analisis karakteristik internal tes melalui data yang diperoleh secara empiris. Karakteristik internal secara kuantitatif dimaksudkan meliputi parameter soal tingkat kesukaran, daya pembeda, dan reliabilitas. Khusus soal-soal pilihan ganda, dua tambahan parameter yaitu dilihat dari peluang untuk menebak atau menjawab soal dengan benar dan berfungsi tidaknya pilihan jawaban, yaitu penyebaran semua alternatif jawaban dari subyek-subyek yang dites.

 Untuk menganalisis secara kuantitatif, terutama untuk jenis soal (1). Gabungan antara soal pilihan ganda dan Uraian, atau (2) soal uraian saja, maka dalam proses penghitungannya kita dapat menggunakan kalkulator, atau memanfaatkan kelebihan dari program computer. Program computer yang sudah dikenal secara umum, seperti  EXCEL, SPSS, atau program khusus seperti ITEMAN, RASCAL, ASCAL, BILOG, FACETS tentunya dapat kita manfaatkan sebesar-besarnya. Akan tetapi, dari sekian program computer yang ada, ternyata program excel yang paling banyak digunakan oleh sebagian besar guru, karena sudah memasyarakat dikalangan guru.[[3]]

2.      TEKNIK PENGANALISISAN ITEM TES HASIL BELAJAR

Beberapa hal yang diperlu digali dalam analisis butir tes adalah:

a.       Teknik Analisis Derajat Kesukaran Item

Bermutu atau tidaknya butir-butir item tes hasil belajar pertama-tama dapat dilihat dari derajat kesukaran atau taraf kesulitan yang dimiliki masing-masing butir item. Angka yang dapat memberikan petunjuk mengenai tingkat  kesukaran item itu dikenal dengan difficulty index, yang dalam dunia evaluasi hasil belajar umumnya dilambangkan dengan huruf P, yaitu singkatan dari proportion. Menurut Witherington , angka indek kesukaran item itu besarnya berkisar antara 0,00 sampai dengan 1,00. Artinya, indek kesukaran itu paling rendah adalah 0,00, dan yang paling tinggi adalah 1,00. Angka indek kesukaran item dapat diperoleh dengan menggunakan rumus yang dikemukakan oleh Du Bios, yaitu:

Dimana:

P= proportion = proporsi = angka indek kesukaran item.

Nр =  banyaknya testee yang dapat menjawab dengan benar.

N = jumlah testee yang mengikuti tes.

Rumus yang lainya adalah:

Dimana:

P= proportion = proporsi = angka indek kesukaran item.

B = banyaknya testee yang dapat menjawab dengan benar.

JS = banyaknya testee yang dapat menjawab dengan benar.

Mengenai bagai mana cara menberikan penafsiran terhadap angka kesukaran item , Robert L. Thorndike dan Elizabert Hegen dalam bukunya berjudul Measurement and Evaluation in Psychology and Education mengemukakan sebagai berikut:

Besarnya P

interpelasi

Kurang dari 0,30

Terlalu sulit

0,300-0,70

Cukup (sedang)

Lebih dari 0,70

Terlalu mudah

Sedangkan menurut Witherington  dalam bukunya yang berjudul Psyichological Education adalaha sebagai berikut:

Besarnya P

interpelasi

Kurang dari 0,25

Terlalu sulit

0,25-0,75

Cukup (sedang)

Lebih dari 0,75

Terlalu mudah

Contoh aplikasi indek kesukaran butir soal

testee

Skor yang dicapai oleh testee untuk butir item nomor

1

2

3

4

5

A

1

1

0

1

1

B

0

0

1

0

1

C

1

0

0

0

1

D

1

0

0

0

1

E

0

1

0

1

0

5=N=JS

3= Nр= B

2= Nр= B

1= Nр= B

2= Nр=B

4= Nр= B

dari data diatas dapat kita ketahui derajat kesukaran sebagai berikut:

Butir item soal

Angka indek kesukaran item (p)

interpelasi

1

 =   ==0,6

Cukup (sedang)

2

 =   ==0,4

Cukup (sedang)

3

 =   ==0,2

Terlalu sulit

4

 =   ==0,4

Cukup (sedang)

5

 =   ==0,8

Terlalu mudah

b.      Teknik Analisis Daya Pembeda Item

Daya pembeda item adalah kemampuan suat butir item tes hasil belajar untuk dapat membedakan (mendiskriminasi) antara testee yang berkemampuan tinggi (pandai), dengan testee yang kemampuannya rendah (dodoh) dengan sedemikian rupa sehingga sebagian besar testee yang memiliki kemampuan tinggi untuk menjawab butir item tersebut lebih banya yang menjawab betul, sementara testee yang kemampuannya rendah untuk menjawab item tersebut sebagiaan besar menjawab salah. Daya pembeda item itu dapat diketahui melalui besar-kecilnya angka indek diskriminasi item. Angka indek kiskriminasi item adalah sebuah angka atau bilangan yang menunjukkan besar kecilnya daya pembeda yang dimiliki oleh sebutir item.

Indek diskriminasi item itu pada umumnya diberi lambang dengan huruf D, dan seperti halnya angka  indek kesukaran item , maka indek diskriminasi item ini besarannya berkisar antara 0,00 sampai dengan 1,00. Namun antara keduanya memiliki perbedaan yang mendasar, yaitu: jika indek kesukaran item tidak mungkin memiliki angka minus maka dalam  indek daya pembeda dapat bertanda minus.

Dalam hubungan ini, jika sebutir item memiliki angka indek diskriminasi item dengan tanda plus (positif) hal ini merupakan petunjuk bahwa butir item tersebut sudah memiliki daya pembeda, dalam artian testee yang termasuk kategori pandai lebih banyak menjawab dengan benar, sedangkan yang termasuk testee dalam kategori kurang lebih banyak menjawab dengan salah.

Adapun apabila angka indek diskriminasi item dari sebutir item bertanda minus ( negati), maka pengertiannya yang terkandung didalamnya adalah, bahwa butir iatem yang bersangkut lebih banyak dijawab betul oleh testee kelompok bawah (kurang pandai) ketimbang testee yang dikategorikan pandai.

Patokan yang pada umumnya dipegangi dalam daya beda atau indek diskriminasi item soal adalah sebagai berikut:

Besarnya angka diskriminasi item (D)

Klasifikasi

Interpelasi

Kurang dari 0,20

por

butir item yang bersangkutan daya pembedanya lemah sekali.

0,20 – 0,40

Stasfactory

 Butir item yang bersangkutan daya pembedanya cukup

0,40 – 0,70

God

Butir item  yang bersangkutan daya pembedanya baik

0,70- 1,00

excellent

Butir item yang bersangkutan daya pembedanya baik sekali

Bertanda negatif

-

Butir item yang bersangkutan daya pembedanya jelek sekali (negatif)

Untuk mengetahui besar kecilnya angka indek diskriminasi item dapat dipergunakan dua macam rumus berikut ini:

Rumus pertama:

    D = PA  - PB  atau

    D = Pң - PL                      

Dimana :

D = Discriminatory power.

PA atau Pң = proporsi testee kelompok atas yang dapat menjawab dengan betul butir yang bersangkutan.

PA atau Pң dapat diperoleh dengan rumus

PA = Pң  =        

Dimana :

BA                  = banyaknya testee kelompok atas yang dapat menjawab dengan betul butir item yang bersangkutan.

JA                   = jumlah testee yang termasuk dalam kelompok atas.

PB atau PL = proporsi testee kelompok bawah yang dapat menjawab dengan betul butir soal yang bersangkutan.

PB atau PL Ini dapat diperoleh dengan rumus:

Dimana :

BB = banyaknya testee kelompok bawah yang dapat menjawab dengan benar item soal yang bersangkutan

JB = jumlah testee yang termasuk dalam kelompok bawah

Contoh aplikasi rumus:

Dari 10 orang testee mengikuti tes pendidikan agama Islam       dengan 10 soal tiap soal diberi bobot 1 jika dijawab benar dan 0 untuk yang menjawab salah.

membagi testee antara kelas atas dan kelas bawah

Testee

Skor untuk butir item nomor

Total

1

2

3

4

5

6

7

8

9

10

A

0

1

0

1

0

1

0

1

0

1

5

B

1

1

1

1

1

1

1

1

1

1

10

C

1

1

0

0

0

1

1

1

1

1

7

D

1

1

0

1

0

0

0

0

0

0

3

E

0

1

1

1

1

1

0

1

1

0

7

F

0

1

0

1

1

0

1

0

0

0

4

G

0

1

0

1

0

1

1

1

1

1

7

H

1

1

0

1

1

1

1

1

1

1

9

I

0

1

0

0

1

1

0

0

0

1

4

J

1

0

0

1

1

1

0

0

1

0

6

10= N

5

9

2

8

6

8

5

6

6

6

61

Kelompok atas                                                    kelompok bawah                                        

Testee

Skor

B

10

H

9

C

7

G

7

E

7

JA = 5

-

Testee

Skor

A

5

J

5

I

4

F

4

D

3

JB = 5

-

Mencari BA , BB, PA, PB dan D untuk 10 item soal.

Hasil perhitungannya:

Nomor butir soal

PA=

D= PA-

1

3

2

5

5

0,60

0,40

0,20

2

5

4

5

5

1,00

0,80

0,20

3

2

0

5

5

0,40

0,00

0,40

4

4

4

5

5

0,80

0,80

0,00

5

3

3

5

5

0,60

0,60

0,00

6

5

3

5

5

1,00

0,60

0,40

7

4

1

5

5

0,80

0,20

0,60

8

5

1

5

5

1,00

0,20

0,80

9

5

1

5

5

1,00

0,20

0,80

10

4

2

5

5

0,80

0,4

0,40

Pemberian interpelasi  D

Nomor butir item

Besarnya D

klasifikasi

interpelasi

8 dan 9

0, 80

Excelent

Baik sekali

7

0, 60

Good

Baik

3, 6 dan 10

0,40

Satisfactory

Cukup

1 dan 2

0, 20

Poor

Jelek

4 dan 5

0,00

Poor

jelek

c.       Teknik Analisis Fungsi Distraktor

Pada saat membicarakan tentang tes obyektif bentuk pilihan ganda, item telah dikemukakan bahwa pada tes obyektif tesebut telah dilengkapi dengan beberapa kemungkinan jawaban  atau yang dikenal dengan alternatif. Altenatif jawaban itu jumlahnya berkisar antara 3- 5 buah, dan dari kemungkinan jawaban yang terpasang pada setiap butir item terpasang sebuah jawaban dan sisanya sebagai pengecoh (disrtactor).

Bagai mana cara distractor dapat menjalankan fungsinya dengan baik, kelajiman yang berlaku dalam dunia evaluasi hasil belajar ialah, bahwa distractor itu sekurang-kurangnya dipilih oleh 5% peserta tes. Berikut cara menganalisis fungsi distractor:

Dari sebuah item soal yang dilengkapi dengan altenatif jawaban A, B, C, D, dan E di ikuti oleh 20 peserta tes, dengan hasil sebagai berikut:

Item soal

Alternatif jawaban

keterangan

A

B

C

D

E

1

5

1

8

6

0

C (kunci jawaban)

Dari data diatas dapat kita berikan sebuah kesimpulan yaitu:

Pengecoh A dipilih oleh 5 orang teste yang berarti: 5/20X 100%=25%, pengecoh sudah berjalan dengan baik karena telah melebihi 5%.

Pengecoh B dipilih oleh 1 orang testee yang berarti : 1/20X100%= 5%, pengecoh sudah berjalan karena telah mencapai 5% .

Pengecoh D dipilih oleh 4 orang testee yang berarti: 6/20X100%= 30%, pengecoh berjalan dengan baik karena telah melebihi 5%.

Pengecoh E tidak dipilih oleh peserta testee yang berarti: 0/20X100%= 0, pengecoh tidak berjalan.[[4]]

C.    PENUTUP

1.      KESIMPULAN

Analisis butir soal (item) adalah suatu istilah yang digunakan untuk menentukan perhitungan dan pengukuran respons subjek terhadap suatu item (Crocker & Algina,1986).

Teknik dalam penganalisisan butir soal yaitu:

1)       Teknik Analisis Derajat Kesukaran Item

2)      Teknik Analisis Daya Pembeda Item

3)      Teknik Analisis Fungsi Distraktor

2.      KRITIK DAN SARAN

Penulis menyadari bahwa dalam penulisan makalah ini masih banyak terdapat kesalahan dalam penulisan maupun penyusunanya. Hal tersebut dikarenakan penulis masih dalam tahap belajar, jadi perlu untuk dibimbing agar nantinya dapat membuat makalah yang lebih baik lagi.

DAFTAR PUSTAKA

SudirjoAnas, Pengantar Evaluasi Pendidikan, Jakarta: PT. Raja Grafindo Persada



[4] SudirjoAnas, Pengantar Evaluasi Pendidikan, Jakarta: PT. Raja Grafindo Persada

Mengapa perlu dilakukan analisis butir soal?

Peran penting analisis butir soal adalah untuk mengetahui kualitas soal serta dilakukan tindakan lebih lanjut untuk merevisi soal jika terjadi kekurangan.

Apa yang dimaksud dengan analisis butir secara kuantitatif dan apa saja yang termasuk dalam hal ini?

Analisis butir soal secara kuantitatif adalah kegiatan menganalisis butir soal yang didasarkan pada data empirik dari butir soal yang diperoleh dari soal yang telah diujikan.

Apa perbedaan analisis butir soal secara kuantitatif dan kualitatif?

Analisis soal secara kualitatif dilakukan sebelum soal diberikan, yaitu dilakukan oleh dua validator yang mencakup tiga aspek, yakni: materi, konstruk, dan bahasa. Sedangkan analisis soal secara kuantitatif mencakup 5 aspek, yaitu : validitas, reliabilitas, tingkat kesukaran, daya beda dan fungsi pengecoh.

Aspek apa saja yang perlu diperhatikan dalam menganalisis butir soal jelaskan?

Aspek yang perlu diperhatikan dalam analisis butir soal secara klasik adalah setiap butir soal ditelaah dari segi tingkat kemudahan butir, daya pembeda butir, dan penyebaran pilihan jawaban (untuk soal bentuk obyektif) atau frekuensi jawaban pada setiap pilihan jawaban.