Pertanyaan tentang analisis dan perbaikan instrumen

Amongguru.com. Analisis butir soal perlu dilakukan guru sebagai bagian dari rangkaian pelaksanaan evaluasi pembelajaran.

Melalui kegiatan analisis butir soal, guru akan dapat mengkaji dan mengidentifikasi kualitas soal sebagai instrumen penilaian pembelajaran.

Identifikasit terhadap setiap butir soal perlu dilakukan untuk menghasilkan informasi yang berharga terhadap mutu soal yang dijadikan sebagai alat ukur pembelajaran.

Kegiatan analisis butir soal pada dasarnya sebagai umpan balik (feed back) terhadap kualitas soal untuk selanjutnya dilakukan perbaikan dan penyempurnaan kembali terhadap butir-butir soal.

Soal-soal yang disempurnakan tersebut pada masa mendatang diharapkan benar-benar dapat menjalankan fungsinya sebagai alat ukur pembelajaran.

Seperti halnya instrumen lainnya, soal yang diteskan ke peserta didik juga harus memenuhi kriteria baik. antara lain yaitu memiliki validitas dan reliabilitas.

Validitas suatu alat ukur adalah sejauhmana alat ukur itu mampu mengukur apa yang seharusnya diukur. Suatu ter memiliki validitas tinggi apabila tes tersebut mampu menjalankan fungsi ukurnya atau memberikan hasil ukur ukur yang akurat.

Untuk tes hasil belajar, yang utama adalah validitas isi, yakni butirbutir soal yang ditanyakan kepada peserta didik sesuai dan mewakili kompetensi yang harus dicapai oleh peserta didik.

Reliabiitas dapat diartikan sebagai keajegan atau kestabilan hasil pengukuran. Alat ukur yang reliabel adalah alat ukur yang mampu membuahkan hasil pengukuran yang stabil.

Suatu alat ukur dikatakan memiliki reliabilitas tinggi jika digunakan untuk mengukur hal yang sama pada waktu berbeda hasilnya sama atau mendekati  sama.

Pengertian Analisis Butir Soal

Pertanyaan tentang analisis dan perbaikan instrumen

Analisis butir soal (item analysis) merupakan suatu kegiatan dalam menentukan tingkat kebaikan butir-butir soal suatu tes. Informasi yang diperoleh dari kegiatan analisis butir soal dapat digunakan untuk memperbaiki butir soal yang sudah dibuat.

Analisis butir soal dapat dilakukan apabila suatu tes telah selesai dilaksanakan dan diperoleh jawaban terhadap butir-butir soal yang diteskan.

Soal yang bermutu adalah soal yang dapat memberikan informasi sejelas-jelasnya tentang peserta didik yang sudah dan yang  belum menguasai materi pembelajaran.

Baca :

  • Teknik Analisis Butir Soal (Kualitatif dan Kuantitatif)
  • Perbedaan Validitas Isi dan Validitas Konstruk dalam Analisis Butir Soal

Analisis butir soal dapat dilakukan secara kualitatif dan kuantitatif. Analisis secara kualitatif berkaitan dengan isi dan bentuk soal (validitas isi dan validitas konstruk).

Sedangkan analisis kuantitatif berhubungan dengan ciri-ciri statistiknya (pengukuran validitas, reliabilitas, daya beda, dan tingkat kesukaran butir soal).

Tujuan Analisis Butir Soal

Analisis butir soal merupakan kegiatan penting yang harus dilakukan guru dalam menyusun soal agar diperoleh soal dengan kualitas baik.

Soal yang bermutu adalah soal yang dapat memberikan informasi setepat-tepatnya tentang penguasan materi peserta didik.

Berikut ini adalah beberapa tujuan dari kegiatan analisis butir soal.

1. Mengkaji dan menelaah setiap butir soal agar diperoleh soal yang bermutu,

2. Meningkatkan kualitas butir tes melalui revisi atau membuang soal yang tidak efektif (tidak valid),

3. Mengetahui informasi diagnostik pada peserta didik tentang pemahaman materi yang diajarkan.

Manfaat Kegiatan Analisis Butir Soal

Analisis butir soal memiliki banyak manfaat, antara lain sebagai berikut.

1. Membantu pengguna tes dalam mengevaluasi kualitas tes yang digunakan,

2. Sesuai untuk penyusunan tes informal, seperti tes yang disiapkan guru untuk peserta didik.

3. Mendukung penulisan soal yang efektif dan berkualitas.

4. Meningkatkan validitas dan reliabilitas soal sehingga tercipta soal yang berkualitas.

Melalui kegiatan analisis butir soal, guru akan dapat menentukan soal-soal yang baik dan soal-soal yang cacat atau tidak berfungsi dengan baik.

Selain itu, guru dapat merevisi soal-soal yang sudah tidak relevan dengan materi yang diajarkan dengan melihat banyaknya peserta didik yang tidak mampu menjawab butir soal tertentu.

Demikian pengertian analisis butir soal, tujuan, dan manfaatnya dalam evaluasi hasil belajar. Semoga bermanfaat,

Dengan melakukan analisis butir soal

Dengan melakukan analisis butir soal dapat diperoleh banyak informasi yang bermanfaat, baik untukdapat diperoleh banyak informasi yang bermanfaat, baik untuk guru, siswa maupun proses pembelajaran itu sendiri. Menganalisis butir soal dilakukan dengan harapan guru, siswa maupun proses pembelajaran itu sendiri. Menganalisis butir soal dilakukan dengan harapan dapat meningkatkan kualitas butir soal tersebut. Menurut Nitko (1983), analisis

dapat meningkatkan kualitas butir soal tersebut. Menurut Nitko (1983), analisis butir soalbutir soal menggambarkan suatu proses pengambilan data dan penggunaan informasi tentang butir

menggambarkan suatu proses pengambilan data dan penggunaan informasi tentang butir-butir soal,-butir soal, terutama informasi tentang respon siswa terhadap setiap butir soal. Lebih

terutama informasi tentang respon siswa terhadap setiap butir soal. Lebih lanjut penggunaan analisislanjut penggunaan analisis butir soal adalah sebagai berikut:

butir soal adalah sebagai berikut:

1. Untuk mengetahui apakah butir-butir soal yang

1. Untuk mengetahui apakah butir-butir soal yang disusun sudah berfungsi sesuai dengan apa disusun sudah berfungsi sesuai dengan apa yangyang dikehendaki oleh penyusun soal. Untuk itu perlu diperhatikan hal-hal sebagai berikut:

dikehendaki oleh penyusun soal. Untuk itu perlu diperhatikan hal-hal sebagai berikut: a.

a. Apakah soal-soal yang disusun sudah sesuai Apakah soal-soal yang disusun sudah sesuai untuk mengukur perubahan tingkah laku sepertiuntuk mengukur perubahan tingkah laku seperti telah dirumuskan dalam tujuan pembelajaran khusus?

telah dirumuskan dalam tujuan pembelajaran khusus? b.

b. Apakah tingkat kesukaran soal sudah diperhitungkan?Apakah tingkat kesukaran soal sudah diperhitungkan? c.

c. Apakah soal tersebut sudah mampu membedakan antara siswa Apakah soal tersebut sudah mampu membedakan antara siswa yang pandai dengan siswa yangyang pandai dengan siswa yang kurang pandai?

kurang pandai? d.

d. Apakah kunci soal sudah sesuai dengan maksud soal?Apakah kunci soal sudah sesuai dengan maksud soal? e.

e. Jika digunakan tes pilihan Jika digunakan tes pilihan ganda, apakah pengecoh (distractor) yang dipilih sudah berfungsiganda, apakah pengecoh (distractor) yang dipilih sudah berfungsi dengan baik?

dengan baik? f.

f. Apakah soal tersebut masih dapat ditafsirkan ganda atau Apakah soal tersebut masih dapat ditafsirkan ganda atau tidak?tidak? 2. Sebagai umpan balik ba

2. Sebagai umpan balik bagi siswa untuk mengetahui kemampuan mereka dalam menguasai suatugi siswa untuk mengetahui kemampuan mereka dalam menguasai suatu materi.

materi.

3. Sebagai umpan balik bagi guru untuk mengetahui kesulitan-kesulitan yang dialami siswa dalam 3. Sebagai umpan balik bagi guru untuk mengetahui kesulitan-kesulitan yang dialami siswa dalam

memahami suatu materi. memahami suatu materi.

4. Sebagai acuan untuk merevisi soal. 4. Sebagai acuan untuk merevisi soal.

5. Untuk memperbaiki (meningkatkan) kemampuan guru dalam menulis soal. 5. Untuk memperbaiki (meningkatkan) kemampuan guru dalam menulis soal.

B. Kapan Analisis Butir Soal Dilakukan?

B. Kapan Analisis Butir Soal Dilakukan?

Pada saat guru mengujikan suatu set soal

Pada saat guru mengujikan suatu set soal untuk mengambil keputusan penting tentang hasil belajuntuk mengambil keputusan penting tentang hasil belajarar siswa, maka idealnya guru harus yakin bahwa set soal tersebut adalah valid dan reliabel. Validitas set siswa, maka idealnya guru harus yakin bahwa set soal tersebut adalah valid dan reliabel. Validitas set soal dapat diketahui dari kisi-kisi soal sedangkan reliabilitas soal baru dapat diketahui setelah uji coba. soal dapat diketahui dari kisi-kisi soal sedangkan reliabilitas soal baru dapat diketahui setelah uji coba. Sehingga untuk mengetahui reliabilitas set soal dilakukanlah analisis butir soal.

Sehingga untuk mengetahui reliabilitas set soal dilakukanlah analisis butir soal. 1. Tingkat Kesukaran (P)

1. Tingkat Kesukaran (P)

Tingkat kesukaran suatu butir soal merupakan salah satu

Tingkat kesukaran suatu butir soal merupakan salah satu yang dapat menunjukkan kualitas butir soalyang dapat menunjukkan kualitas butir soal tersebut (mudah, sedang, sukar). Suatu butir soal dikatakan mudah jika

tersebut (mudah, sedang, sukar). Suatu butir soal dikatakan mudah jika sebagian besar siswa dapatsebagian besar siswa dapat menjawab dengan benar dan dikatakan sukar jika sebagian besar siswa tidak dapat menjawab dengan menjawab dengan benar dan dikatakan sukar jika sebagian besar siswa tidak dapat menjawab dengan benar. Besarnya tingkat kesukaran butir soal dapat dihitung

(2)

yang menjawab benar terhadap setiap butir soal, dalam hal ini dapat dihitung dengan menggunakan rumus:

P = B / N Keterangan:

P adalah indeks tingkat kesukaran butir soal

B adalah jumlah peserta tes yang menjawab benar N adalah jumlah seluruh peserta tes

Contoh:

Jika butir soal nomor 1 yang Anda ujikan dapat dijawab dengan benar oleh 10 dari 40 siswa, maka indeks tingkat kesukaran butir soal tersebut adalah:

P = 10 / 40 = 0,25

Indeks tingkat kesukaran butir soal bergerak antara 0,00 sampai dengan 1,00. Indeks tingkat

kesukaran suatu butir soal (P) = 0,00 akan tercapai apabila seluruh peserta tes tidak ada yang menjawab dengan benar dan indeks tingkat kesukaran suatu butir soal (P) = 1,00 akan tercapai apabila seluruh peserta tes dapat menjawab dengan benar. Jadi butir soal yang mudah akan mempunyai P mendekati 1,00 dan butir soal yang sukar akan mempunyai P mendekati 0,00.

Menurut Fernandes (1984) kategori indeks tingkat kesukaran butir soal adalah sebagai berikut: P >= 0,76 : mudah

0,25 P 0,75 : sedang P 0,24 : sukar

Butir soal yang dianggap sangat bermanfaat (useful) adalah butir soal yang mempunyai indeks tingkat kesukaran dalam kategori sedang.

2. Daya Pembeda (D)

Daya pembeda butir soal memiliki pengertian seberapa jauh butir soal tersebut dapat membedakan kemampuan individu peserta tes. Butir soal yang didukung oleh potensi daya pembeda yang baik akan mampu membedakan peserta tes (peserta didik) yang memiliki kemampuan tinggi (pandai) dengan peserta didik yang memiliki kemampuan rendah (kurang pandai).

Indeks daya pembeda butir soal dapat dihitung dengan menggunakan rumus: D = PA – PB

Keterangan:

D adalah indeks daya pembeda butir soal

PA adalah proporsi kelompok atas yang menjawab benar PB adalah proporsi kelompok bawah yang menjawab benar Contoh:

Dalam menjawab butir soal nomor 2, diperoleh 6 dari 10 siswa yang termasuk dalam kelompok atas dapat menjawab benar dan 2 dari 10 siswa yang termasuk kelompok bawah dapat menjawab benar, maka indeks daya pembeda butir soal tersebut adalah:

D = (6/10) – (2/10) = 4/10 = 0,4

Yang dimaksud siswa kelompok atas adalah kelompok siswa yang memperoleh skor tinggi

sedangkan yang dimaksud dengan siswa kelompok bawah adalah kelompok siswa yang memperoleh skor rendah setelah mengerjakan satu set suatu mata pelajaran.

(3)

Nilai indeks daya pembeda butir soal bergerak dari –1 sampai 1. Semakin tinggi indeks daya

pembeda menunjukkan bahwa butir soal tersebut semakin dapat membedakan antara siswa yang pandai dengan siswa yang kurang pandai.

Secara teoritis indeks daya pembeda soal (D) = 1 akan tercapai apabila semua siswa kelompok atas dapat menjawab benar dan semua siswa kelompok bawah menjawab salah. Indeks daya pembeda soal (D) = – 1 akan tercapai apabila semua siswa dalam kelompok atas menjawab salah dan semua siswa kelompok bawah dapat menjawab benar.

Sedangkan indeks daya pembeda soal (D) = 0 tercapai apabila proporsi siswa yang menjawab benar dalam kelompok atas dan kelompok bawah adalah sama.

Butir soal yang mempunyai indeks daya pembeda negatif adalah butir soal yang kurang baik karena soal tersebut tidak bisa membedakan siswa yang pandai dengan siswa yang kurang pandai, di mana siswa yang kurang pandai justru lebih banyak menjawab benar daripada siswa yang pandai.

Butir soal mempunyai daya pembeda yang baik jika kunci (jawaban soal) mempunyai daya pembeda positif dan pengecohnya mempunyai daya pembeda negatif. Menurut Fernandes (1984) kategori indeks daya pembeda butir soal adalah sebagai berikut:

D 0,40 : sangat baik 0,30 D 0,39 : baik 0,20 D 0,29 : sedang D <= 0,19 : tidak baik

C. Bagaimana Cara Melakukan Analisis Secara Sederhana?

Untuk melakukan analisis butir soal secara sederhana, berikut ini disajikan langkah-langkah yang diperlukan:

1. Hitunglah jumlah jawaban yang benar untuk seluruh siswa.

2. Berdasarkan jumlah jawaban yang benar dari seluruh siswa tersebut susunlah skor siswa mulai skor tertinggi ke skor terendah.

3. Berdasarkan urutan skor tersebut tentukan siswa yang termasuk dalam kelompok atas dan siswa dalam kelompok bawah. Untuk menentukan berapa persen siswa yang termasuk kelompok atas dan berapa persen yang masuk kelompok bawah gunakan rambu-rambu sebagai berikut:

a. Jika jumlah siswa <= 20, maka jumlah kelompok atas dan kelompok bawah masing-masing 50%. b. Jika jumlah siswa 21 – 40 , maka jumlah kelompok atas dan kelompok bawah masing-masing

33,3%.

c. Jika jumlah siswa 41, maka jumlah kelompok atas dan kelompok bawah masing-masing 27%. 4. Hitunglah jumlah siswa dalam kelompok atas yang memilih tiap-tiap alternatif jawaban yang

disediakan.

5. Dengan cara yang sama hitunglah jumlah siswa dalam kelompok bawah yang memilih tiap-tiap alternatif jawaban yang disediakan.

6. Hitung jumlah seluruh peserta tes (kelompok atas, tengah, bawah) yang menjawab benar.

7. Tentukanlah tingkat kesukaran dan daya pembeda butir soal dengan menggunakan rumus yang telah disediakan.

(4)

Contoh:

Perhatikan jawaban 100 siswa terhadap butir soal nomor 1 berikut:

Kelompok Alternatif Jawaban Jumlah

A B* C D E Atas Tengah Bawah 5 3 15 25 7 0 12 0 0 7 5 27 27

Catatan: * (kunci jawaban)

Indeks tingkat kesukaran butir soal di atas adalah: P = B / N = (15 + 25 + 7)/100 = 47/100 = 0,47 Indeks daya pembeda butir soal di atas adalah : D = PA – PB = (15/27) – (7/27) = 0,30

D. Bagaimana Memperbaiki Butir Tes?

Beberapa hal yang perlu diperhatikan dalam memperbaiki butir soal adalah sebagai berikut: 1. Perhatikan tingkat kesukaran butir soal. Butir soal dianggap baik jika mempunyai indeks tingkat

kesukaran (P) antara 0,25 sampai dengan 0,75 atau yang mendekati angka tersebut.

2. Perhatikan daya pembeda butir soal. Butir soal dianggap baik jika kunci (jawaban soal) mempunyai indeks daya pembeda positif tinggi dan pengecohnya mempunyai indeks daya pembeda negatif. 3. Perhatikan stem atau pokok soalnya sebab stem yang ambigius akan membingungkan peserta ujian

untuk menentukan jawabannya

FORMAT PENELAAHAN BUTIR SOAL BENTUK URAIAN, PILIHAN GANDA, INSTRUMEN PERBUATAN DAN INSTRUMEN NON-TES

A. Analisis Butir Soal Secara Kualitatif dan Kuantitatif 

Menurut Kamus Besar Bahasa Indonesia (2002) analisis adalah penguraian suatu pokok atas berbagai bagiannya dan penelaahan bagian itu sendiri serta hubungan antar bagian untuk memperoleh pengertian yang tepat dan pemahaman arti keseluruhan.Analisis butir soal yang dalam bahasa inggris disebut item analiysis dilakukan terhadap empirik. Maksudnya, analisis itu  baru dapat dilakukan apabila suatu tes telah dilaksanakan dan hasil jawaban terhadap butir-butir

soal telah kita peroleh. Analisis butir soal adalah suatu kegiatan analisis untuk menentukan tingkat kebaikan butir-butir soal yang terdapat dalam suatu tes sehingga informasi yang dihasilkan dapat kita pergunakan untuk memperbaiki butir soal dan tes tersebut.

Identifikasi terhadap setiap butir item soal dilakukan dengan harapan akan menghasilkan  berbagai informasi berharga, yang pada dasarnya akan merupakan umpan balik (feed back) guna

(5)

sehingga pada masa-masa yang akan yang akan dating tes hasil belajar yang disusun atau dirancang oleh guru itu betul-betul dapat menjalankan fungsinya sebagai alat pengukur hasil belajar yang memiliki kualitas yang tinggi.

Aiken dalam Suprananto (2012) berpendapat bahwa kegiatan analisis butir soal merupakan kegiatan penting dalam penyusunan soal agar diperoleh butir soal yang bermutu. Tujuan kegiatan ini adalah:

1. Mengkaji dan menelaah setiap butir soal agar diperoleh soal yang bermutu sebelum digunakan, 2. meningkatkan kualitas butir tes melalui revisi atau membuang soal yang tidak efektif,

3. mengetahui informasi diagnostik pada siswa apakah mereka telah memahami materi yang telah diajarkan.

Soal yang bermutu adalah soal yang dapat memberikan informasi setepat-tepatnya tentang siswa mana yang telah menguasai materi dan siswa mana yang belum menguasai materi. Selanjutnya menurut Anastasia dan Urbina (1997) dalam Suprananto (2012), analisis butir soal dapat dilakukan secara kualitatif (berkaitan dengan isi dan bentuknya) dan kuantitatif (berkaitan dengan ciri-ciri statistiknya). Analisis kualitatif mencakup pertimbangan validitas isi dan konstruksi, sedangkan analisis kuantitatif mencakup pengukuran validitas dan reliabilitas butir soal, kesulitan butir soal serta diskriminasi soal. Kedua teknik ini masing-masing memiliki keunggulan dan kelemahan, oleh karena itu teknik terbaik adalah menggunakan atau memadukan keduanya.

Pada prinsipnya analisis butir soal secara kualitatif dilaksanakan berdasarkan kaida  penulisan soal (tes tertulis, perbuatan, dan sikap). Penelaahan ini biasanya dilakukan sebelum soal

digunakan atau diujikan. Aspek yang diperhatikan di dalam penelaahan secara kualitatif ini adalah setiap soal ditelaah dari segi materi, konstruksi, bahasa atau budaya, dan kunci jawaban atau  pedoman penskorannya. Dalam menganalisis butir soal, terdapat dua teknik. Yaitu teknik

kualitatifdan teknik kuantitatif.

1.Teknik Analisis Secara Kualitatif 

Ada beberapa teknik yang dapat digunakan untuk menganalisis butir soal secara kualitatif, diantaranya adalah teknik moderator dan teknik panel.

a. Teknik moderator

Teknik moderator merupakan teknik berdiskusi yang di dalamnya terdapat satu orang sebagai penengah. Berdasarkan teknik ini, setiap butir soal didiskusikan secara bersama-sama dengan beberapa ahli seperti guru yang mengajarkan materi, ahli materi, penyusun atau  pengembangkurikulum, ahli penilaian, ahli bahasa, berlatar belakang psikologi.Teknik ini sangat  baik karena setiap butir soal dilihat secara bersama-sama berdasarkan kaidah penulisannya. Di samping itu, para penelaah dipersilakan mengomentari berdasarkan kompetensinya masing-masing. Setiap komentar atau masukan dari peserta diskusi dicatat. Setiap butir soa ldapat dituntaskan secara bersama-sama, perbaikannya seperti apa. Namun, kelemahan teknik ini memiliki kelemahan karena memerlukan waktu lama untuk rnendiskusikan setiap satu butir soal.Teknik berikutnya adalah

(6)

Teknik panel merupakan suatu teknik menelaah butir soal yang setiap butir soalnya ditelaah berdasarkan kaidah penulisan butir soal, yaitu ditelaah dari segi materi, konstruksi,  bahasa/budaya, kebenaran kunci jawaban/pedoman penskorannya yang dilakukan oleh beberapa  penelaah. Caranya adalah beberapa penelaah diberikan: butir-butir soal yang akan ditelaah, format penelaahan, dan pedoman penilaian/ penelaahannya. Pada tahap awal para  penelaah diberikan pengarahan, kemudian tahap berikutnya para penelaah berkerja sendiri-sendiri di tempat yang tidak sama. Penalaah dipersilakan memperbaiki langsung pada teks soal dan memberikan nilai pada setiap butir soalnya yang kriterianya adalah : baik, diperbaiki, atau di ganti. Secara ideal penelaah butiran soal di samping memiliki latar belakang materi yang diujikan,  beberapa penelaah yang diminta untuk menelaah butir soal memiliki ketrampilan, seperti guru

yang mengajarkan materi itu,

ahlimateri, ahli pengembang kurikulum, ahli penilaian, psikolog, ahli bahasa, ahli kebijakan  pendidikan, atau lainnya.

2. Analisis Butir Soal Secara Kuantitatif 

Penelaahan soal secara kuantitatif adalah penelaahan butir soal didasarkan pada bukti empirik. Salah satu tujuan utama pengujian butir-butir soal secara emperik adalah untuk mengetahui sejauh mana masing-masing butir soal membedakan antara mereka yang tinggi kemampuannya dalam hal yang didefinisikan oleh kriteria dari mereka yang rendah kemampuannya.

Data empirik ini diperoleh dari soal yang telah diujikan . Ada dua pendekatan dalam analisis secara kuantitatif yaitu pendekatan secara klasik dan modern.

a. Analisis butir soal secara klasik 

Analisa butir soal secara klasik adalah proses pene laahan butir soal melalui informasi dari  jawaban peserta tes guna meningkatkan mutu butir soal yang bersangkutan dengan menggunakan

teori tes klasik. Pada teori tes klasik, analisis item tes dilakukan dengan memperhitungkan kedudukan item dalam suatu kelas atau kelompok. Karakteristik atau kualitas item sangat tergantung pada kelompok dimana diujicobakan sehingga kualitas item terikat pada sampel responden atau peserta tes yang memberikan respons (sample bounded).

Ada beberapa kelebihan analisis butir soal secara klasik adalah murah, sederhana, familiar, dapat dilaksanakan sehari-hari dengan cepat menggunakan komputer dan dapat menggunakan  beberapa data dari peserta tes.

b. Analisis butir soal secara moderen

Analisa butir soal secara moderen adalah penelaahan butir soal dengan menggunakan teori respon butir atau item response theory. Teori ini merupakan suatu teori yang menggunakan fungsi matematika untuk menghubungkan antara peluang menjawab benar suatu butir dengan kemampuan siswa.

Teori ini muncul karena adanya beberapa keterbatasan pada analisis secara klasik, yaitu:

1) Tingkat kemampuan dalam teori klasik adalah true score. Artin ya, jika suatu tes sulit maka tingkat kemampuan peserta tes akan rendah. sebaliknya, jika suatu tes mudah maka tingkat kemampuan  peserta tes tinggi.

(7)

2) Tingkat kesukaran butir soal didefinisikan sebagai proporsi peserta tes yang menjawab benar. Mudah atau sulitnya butir soal tergantung pada kemampuan peserta tes. Daya pembeda, reliabilitas, dan validitas tes tergantung pada kondisi peserta tes.

A. Analisis Butir Soal

Pedoman penskoran. Caranya beberapa penelaah diberikan butir-butir soal yang akan ditelaah, format penelaahan, dan pedoman penilaian atau penelaahan. Pada tahap awal, semua orang yang terlibat dalam kegiatan penelaahan disamakan persepsinya, kemudian mereka terlibat berkerja sendiri-sendiri di tempat berbeda. Para penelaah dipersilakan memperbaiki langsung pada teks soal dan memberikan komentarnya serta memberikan nilai pada setiap butir soal dengan kriteria: soal baik, perlu diperbaiki, atau diganti.Dalam menganalisis butir soal secara kualitatif, penggunaan format penelaahan soal akan sangat membantu dan mempermudah prosedur pelaksanaannya. Format penelaahan soal digunaka sebagai dasar untuk menganalisis setiap butir soal. Format penelaahan soal yang dimaksud adalah format penelaahan  butir soal: uraian, pilihan ganda, tes perbuatan dan instrumen non-tes. Berikut disajikan keempat

format penelaahan butir soal.

a. Format Penelaahan Butir Soal Bentuk Uraian

FORMAT PENELAAHAN SOAL BENTUK URAIAN Mata pelajaran :

Kelas/semester : Penelaah :

No. Aspek yang ditelaah

NomorSoal 1 2 3 4 5 6 7 8 9 ... A. 1 2 3 4 B 5 6 Materi

Soal sesuai dengan indikator(menuntuttes tertulis untuk  bentuk Uraian)

Batasan pertanyaandan jawaban yang diharapkan sudah sesuai

Materi yang ditanyakan sesuai dengankompetensi (urgensi, relevasi, kontinyuitas, keterpakaian sehari- hari tinggi) Isi materi yang ditanyakan sesuai dengan jenjang jenis sekolah atau tingkatkelas

Konstruksi

Menggunakan kata tanya atau perintahyang menuntut awaban uraian

Ada petunjukyang jelas tentangcara mengerjakan soal Ada pedoman penskorannya

Tabel, gambar, grafik, peta,atau yang sejenisnya disajikan dengan jelas dan terbaca

(8)

7 8

No. Aspek yang ditelaah

NomorSoal 1 2 3 4 5 6 7 8 9 ... C. 9 10 11 12 13 Bahasa/Budaya

Rumusan kalimat coal komunikatif  Butir soal menggunakan bahasa Indonesia yang baku

Tidak menggunakan kata/ungkapan yang menimbulkan  penafsiran ganda atau salah pengertian

Tidak menggunakan bahasa yang berlaku setempat/tabu Rumusan soal tidak mengandung

Keterangan : Berilah tanda (V) bila tidak sesuai dengan aspek yangditelaah !

b. Format Penelaahan untuk Instrumen pilihan ganda

FORMAT PENELAAHAN SOAL BENTUK PILIHAN GANDA Mata Pelajaran :...

Kelas/semester:... Penelaah:...

(9)

N

o. Aspek yang ditelaah

Nomor S oal 1 2 3 4 5 .. . A. 1 2. 3. 4. B. 5. 6. 7. 8 9. 10 . 11 . 12 . 13 . 14 . Materi

Soal sesuai dengan indikator (menuntuttes tertulis untuk bentuk pilihan ganda

Materi yang ditanyakan sesuai dengan kompetensi

(urgensi,relevasi, kontinyuitas, keterpakaian sehari- hari tinggi) Pilihan jawaban homogen dan logis

Hanya ada satu kunci jawaban Konstruksi

Pokok soal dirumuskan dengansingkat,jelas,dan tegas

Rumusan pokok soal dan pilihan jawaban merupakan pernyataan yang diperlukan saja

Pokok soal tidak memberi petunjuk kunci jawaban

Pokok soal bebas dan pernyataan yang bersifat negatif ganda Pilihan jawaban homogen dan logis ditinjau dari segi materi Gambar, grafik, tabel, diagram, atausejenisnya

elas dan berfungsi

Panjang pilihan jawaban relatif sama

Pilihan jawaban tidak menggunakan pernyataan "semua jawaban di atas salah/benar"dan sejenisnya

Pilihan jawaban yang berbentuk angka/waktu disusun berdasarkan urutan  besar kecilnya angka atau kronologisnya

(10)

C. 15 . 16 . 17 . 18 . Bahasa/Budaya

Menggunakan bahasa yang sesuai dengankaidah bahasa Indonesia Menggunakan bahasa yang komunikatif 

Tidak menggunakan bahasa yangberlakusetempat/tabu

Pilihan jawaban tidak mengulangkata/kelompok kata yang sama,kecualimerup akan satu kesatuan pengertian

Keterangan: Berilah tanda (V) bila tidak sesuai dengan aspek yang ditelaah!

c. Fo rmat Penelaahan untuk Instrumen Perbuatan

FORMAT PENELAAHAN SOAL TES PERBUATAN Mata Pelajaran:...

Kelas/semester: ... Penelaah :...

No. Aspek yang ditelaah

Nomor Soal 1 2 3 ... . 1. 2. 3. 4. B. 5. 6. 7. 8. C. 9. 10. 11. Materi

Soal sudah sesuai dengan indikator (menuntut tes  perbuatan: kinerja, hasil karya, atau penugasan)

Pertanyaan dan jawaban yang diharapkan sudah sesuai Materi sesuai dengan tuntutan kompetensi (urgensi, relevansi, kontinyuitas, keterpakaian sehari-hari tinggi) Isi materi yang ditanyakan sesuai dengan jenjang jenis sekolah taua tingkat kelas

Konstruksi

Menggunakan kata tanya atau perintah yang menuntut awaban perbuatan/praktik

Ada petunjuk yang jelas tentang cara mengejakan soal Ada pedoman penskorannya

Tabel, peta, gambar, grafik, atau sejenisnya disajkian dengan jelas dan terbaca

Bahasa/Budaya

Rumussan soal komunikatif

Butir soal menggunakan bahasa Indonesia yang baku Tidak menggunakan kata /ungkapan yang menimbulkan  penafsiran ganda atau salah pengertian

(11)

12. 13.

Tidak menggunakan bahasa yang berlaku setempat/tabu Rumusan soal tidak mengandung kata/ungkatpan yang dapat menyinggung perasaan siswa

Keterangan: Berilah tanda (V) bila tidak sesuai d engan aspek yang ditelaah!

d. Format Penelaahan untuk Instrumen Non-Tes FORMAT PENELAAHAN SOAL NON-TE S

 Nama Tes :... Kelas/semester: ... Penelaah :...

No. Aspek yang ditelaah

Nomor Soal 1 2 3 ... A. 1. 2. B. 3. 4. 5. 6. 7. 8. 9. 10. 11. Materi

Pernyataan/soal sudah sesuai dengan rumusan indikator dalam kisi-kisi.

Aspek yang diukur pada setiap pernyataan sudah sesuai dengan tuntutan dalam kisi-kisi (misal untuk tes sikap: aspek koginisi, afeksi, atau konasinya dan pernyataan  positif atau negatifnya).

Konstruksi

Pernyataan dirumuskan dengan singkat (tidak melebihi 20 kata ) dan jelas.

Kalimatnya bebas dari pernyaatn yang tidak relevan objek yang dipersoalkan atau kalimatnya merupakan  pernyataan yang diperlukan saja.

Kalimatnya bebas dari pernyataan yang bersifat negati ganda.

Kalimatnya bebas dari pernyataan yang mengacu pada masa lalu.

Kalimatnya bebas dari pernyataan faktual atau dapat diinterpretasikan sebagai fakta.

Kalimatnya bebas dari pernyataan dapat diinterpretasikan lebih

Kalimatnya bebas dari pernyataan yang mungkin disetujui atau dikosongkan oleh hampir semua responden.

Setiap pernyataan hanya berisi satu gagasan secara lengkap.

Kalimatnya bebas dari pernyatan yang tidak pasti pasti seperti semua, selalu, kadang-kadang, tidak satupun, tidak pernah.

(12)

12. C. 13. 14. 15.

Jangan banyak menggunakan kata hanya, sekedar, semata-mata gunakan seperlunya.

Bahasa/Budaya

Bahsa soa harus komunikatif dan sesuai dengan jenjang  pendidikan siswa atau responden.

Soal harus menggunakan bahasa Indonesia baku. Soal tidak menggunakan bahasa yang berlaku

setempat/tabu.

Keterangan: Berilah tanda (V) bila tidak sesuai dengan aspek yang ditelaah!

B. Parameter Item Tes yang Baik 

Sebagaimana telah disebut sebelumnya, bahwa item tes yang baik adalah item yang memenuhi syarat sebagaimana kriteria atau karakteristik item tes yang baik. Karakteristik item yang dimaksud adalah tingkat kesulitan atau kesukaran, daya pembeda, dan efektivitas pengecoh.

1. Tingkat Kesulitan atau Kesukaran (

Difficulty level

)

Tingkat kesukaran soal adalah peluang menjawab benar suatu soal pada tingkat kemampuan tertentu yang biasanya dinyatakan dalam bentuk indeks. Tingkat kesukaran dinyatakan dalam indeks kesukaran (dificulty index), yaitu angka yang menunjukkan proporsi siswa yang menjawab benar soal tersebut. Semakin besar indeks tingkat kesukaran yang diperoleh dan hasil hitungan, berarti semakin mudah soal itu.

Dalam hal ini, item yang baik adalah item yang tingkat kesukarannya dapat diketahui, tidak terlalu sukar dan tidak terlalu mudah. Sebab, tingkat kesukaran item itu memiliki korelasi dengan daya pembeda. Bilamana item memiliki tingkat kesukaran yang maksimal, maka daya pembedanya akan rendah, demikian pula bila item itu terlalu mudah maka tidak akan memiliki daya pembeda.

Oleh karena itu, sebaiknya tingkat kesukaran soal itu dipertahankan dalam batas yang mampu memberikan daya pembeda. Namun, jika terdapat tujuan khusus dalam penyusunan tes, maka tingkat kesukaran itu bisa dipertimbangkan. Misalnya, tingkat kesukaran item untuk tes sumatif berbeda dengan tingkat kesukaran pada tes diagnostik.

Untuk menghitung taraf kesukaran soal dari suatu tes dipergunakan rumus sebagai berikut: TK = U + L

T Keterangan:

U = jumlah siswa yang termasuk kelompok pandai (upper group)yang menjawab benar untuk tiap soal. L = jumlah siswa yang termasuk kurang (lower group) yang menjawab benar untuk tiap soal.

(13)

Misalkan suatu tes yang terdiri atas N soal yang diberikan kepada 40 siswa. Dari hasil tes tersebut, tiap-tiap soal dianalisis taraf kesukarannya. mula-mula hasil tes itu kita susun kedalam  peringkat, kemudian kita ambil 25% (10 lembar jawaban siswa kelompok pandai), dan 10 lemb ar  jawaban siswa dari kelompok yang kurang pandai. Kemudian kita tabulasikan. Misalkan dari tabulasi soal kita peroleh hasil sebagai berikut: yang menjawab benar dari kelompok pand ai ada 9 siswa, dan yang menjawab benar dari kelompok kurang pandai ada 4 siswa.

Dengan menggunakan rumus diatas, maka taraf kesukaran atau TK dari soal adalah: TK = U + L = 9 + 4 = 0,65 atau 65%

T 20

Jadi dapat disimpilkan bahwa nilai dari TK atau tingkat kesukarannya adalah 65%.

Sedangkan dalam bukunya Drs. H. Daryanto, rumus untuk mencari taraf kesukaran atau indeks kesukaran adalah:

P = B JS Keterangan:

P = indeks kesukaran.

B = banyaknya siswa yang menjawab soal itu dengan benar. JS = jumlah seluruh siswa peserta tes.

Contoh:

Jumlah siswa peserta tes dalam suatu kelas ada 40 siswa. Dari 40 siswa tersebut terdapat 12 siswa yang mampu mengerjakan soal no. 1 dengan benar. Maka berapa indeks kesukarannya?

Jawab: P = B JS = 12 40 = 0,30

Menurut ketentuan yang sering diikuti, indeks kesukaran sering diklasifikasikan sebagai berikut: a. Soal dengan P 0,00 sampai 0,30 adalah soal sukar.

 b. Soal dengan P 0,30 sampai 0,70 adalah soal sedang. c. Soal dengan P 0,70 sampai 1,00 adalah soal mudah.

2. Daya Pembeda

Perhitungan daya pembeda adalah pengukuran sejauh mana suatu butir soal mampu membedakan peserta didik yang sudah menguasai kompetensi dengan peserta didik yang belum atau kurang menguasai kompetensi berdasarkan kriteria tertentu. Semakin tinggi koofisien daya  pembeda suatu butir soal, semakin mampu butir soal tersebut membedakan antara peerta didik

yang menguasai kompetensi dengan pesertan didik yang kurang menguasai kompetensi.

Angka yang menunjukkan besarnya daya pembeda disebut indeks diskriminasi. Daya pembeda suatu soal tes dapat dihitung dengan menggunakan rumus sebagai berikut:

DP = U

 – 

 L ½ T

(14)

Keterangan:

DP = indeks DP atau daya pembeda yang dicari.

U = jumlah siswa yang termasuk dalam kelompok pandai yang mampu menjawab benar untuk tiap

soal.

L = jumlah siswa yang termasuk kurang yang menjawab benar untuk tiap soal.

T = jumlah siswa keseluruhan.

Contoh:

Dari hasil tes lomba olimpiade IPS, jumlah siswa yang dites adalah 40 siswa, sedangkan tes tersebut terdiri dari 20 soal. Setelah hasil tes tersebut diperiksa, kemudian disusun kedalam  peringkat untuk menentukan 25% siswa yang termasuk kelompok pandai (upper group) dan 25%

siswa yang termasuk kelompok kurang (lower group).

Kemudian hasil tes tersebut ditabulasikan dengan menggunakan format tabulasi jawaban tes, kemudian hasil tabulasi dari kedua kelompok tersebut dimasukkan kedalam format analisis soal tes, sehingga kita dapat menghitung tingkat kesukaran dan daya pembeda tiap soal yang kita analisis.

Misalkan dari tabulasi soal no. 1 kita peroleh hasil sebagai berikut: yang menjawab benar dari kelompok pandai ada 10 siswa, dan yang menjawab benar dari kelompok kurang ada 9 siswa. Maka daya pembedanya adalah:

DP = U –  L ½ T = 10 –  9 ½ x (20) = 1 10 = 0,10

Jadi dapat disimpulkan bahwa indeks pembedanya adalah 0,10.

Dalam bukunya Prof. Dr. Suharsimi Arikunto, dijelaskan mengenai klasifikasi daya pembeda, yaitu:

D = 0,00 – 0,20 = jelek (poor).

D = 0,20 – 0,40 = cukup (satisfactory). D = 0,40 – 0,70 = baik (good).

D = 0,70 – 1,00 = baik sekali (excellent). 3. Analisis pengecoh (Efektifitas Distraktor )

Instrumen evaluasi yang berbentuk tes dan objektif, selain harus memenuhi syarat-syarat yang telah disebutkan terdahulu, harus mempunyai distraktor yang efektif. Yang disebut dengan distraktor atau pengecoh adalah opsi-opsi yang bukan merupakan kunci ja waban (jawaban benar). Butir soal yang baik pengecohnya akan dipilih secara merata oleh peserta didik yang menjawab salah. Sebaliknya, butir soal yang kurang baik, pengecohnya akan dipilih secara tidak merata. Pengecoh dianggap baik bila jumlah peserta didik yang memilih pengecoh itu sama atau mendek ati  jumlah ideal. Indeks pengecoh dihitung dengan rumus:

(15)

(N - B) (n - 1) Keterangan:

IP = indeks pengecoh

P = jumlah peserta didik yang memilih pengecoh  N = jumlah peserta didik yang ikut tes

B = jumlah peserta didik yang menjawab benar pada setiap soal n = jumlah alternatif jawaban

1= bilangan tetap Catatan:

Jika semua peserta didik menjawab benar pada butir soal tertentu (sesuai kunci jawaban), maka IP = 0 yang berarti soal tersebut jelek. Dengan demikian pengecoh tidak berfungsi.

Contoh:

50 orang peserta didik dites dengan 10 soal bentuk pilihan ganda. Tiap soal memiliki alternatif  jawaban (a, b, c, d, e). Kunci jawaban (jawaban yang benar) no. 8 adalah c. Setelah soal no.8

diperiksa untuk semua peserta didik, ternyata dari 50 orang peserta didik, 20 peserta didik menjawab benar dan 30 peserta didik menjawab salah. Idealnya, pengecoh dipilih secara merata.

Berikut ini adalah contoh soal no.8.

Alternatif jawaban A B C D E

Distribusi jawaban peserta didik  7 8 20 7 8 IP 93% 107%** 93% 107% Kualitas pengecoh ++ ++ ++ ++ ++ Keterangan: ** = kunci jawaban ++ = sangat baik  + = baik  = kurang baik   _ = jelek   _ _ = sangat jelek 

Pada contoh diatas, IP butir a, b, c, d, dan e adalah 93%, 107%, 93%, dan 107%. Semuanya dekat dengan angka 100%, sehingga digolongkan sangat baik sebab semua pengecoh itu berfungsi. Jika  pilihan jawaban peserta didik menumpuk pada satu alternatif jawaban, misalnya seperti berikut:

Alternatif jawaban A B C D E

Distribusi jawaban peserta didik  20 2 20 8 0

IP 267% 27% ** 107% 0%

(16)

Dengan demikian, dapat ditafsirkan pengecoh (d) yang terbaik, pengecoh (e) dan (b) tidak  berfungsi, pengecoh (a) menyesatkan, maka pengecoh (a) dan (e) perlu diganti karena termasuk  jelek, danpengecoh (b) perlu direvisikarena kurang baik. adapun kualitas pengecoh berdasar indeks  pengecoh adalah:

1) Sangat baik IP = 76% - 125%

2) Baik IP = 51% - 75% atau 126% - 150% 3) Kurang baik IP = 26% - 50% atau 151% - 175% 4) Jelek IP = 0% - 25% atau 176% - 200% 5) Sangat jelek IP = lebih dari 200%

D. Manfaat Kegiatan Menganalisis Butir Soal

Berdasarkan pendapat yang diungkapkan oleh Anastasia dan Urbina (1997) dalam Suprananto (2012), analisis butir soal memiliki banyak manfaat, diantaran ya yakni:

1) Membantu pengguna tes dalam mengevaluasi kualitas tes yang digunakan.

2) Relevan bagi penyusunan tes informal seperti tes yang disiapkan guru untuk siswa dikelas. 3) Mendukung penulisan butir soal yang efektif.

4) Secara materi dapat memperbaiki tes di kelas. 5) Meningkatkan validitas soal dan reliabilitas.

Linn dan Gronlund (1995) dalam Suprananto (2012: 163), menambahkan bahwa pelaksanaan kegiatan analisis butir soal, biasanya didesain untuk menjawab pertanyaan-pertanyaan berikut: 1) Apakah fungsi soal sudah tepat?

2) Apakah soal telah memiliki tingkat kesukaran yang tepat? 3) Apakah soal bebas dari hal-hal yang tidak relevan?

4) Apakah pilihan jawabannya efektif?

Selain itu, data hasil analisis butir soal juga sangat bermanfaat sebagai dasar untuk: 1) Diskusi tentang efisien hasil tes,

2) Kerja remedial

3) Peningkatan secara umum pembelajaran di kelas, 4) Peningkatan keterampilan pada kontruksi tes.

Berdasarkan uraian di atas menunjukkan bahwa analisis butir soal memberikan manfaat: 1) Menentukan soal-soal yang cacat atau tidak berfungsi dengan baik,

2) Meningkatkan butir soal melalui tiga komponen analisis yaitu, tingkat kesukaran, daya pembeda dan pengecoh soal,

3) Merevisi soal yang tidak relevan degan materi yang diajarkan, ditandai dengan banyaknya anak yang tidak dapat menjawab butir soal tertentu.

E. Kriteria Kualitas Butir Soal

Berdasarkan uraian di atas, menurut pandangan teori tes klasik secara empiris mutu butir soal ditentukan oleh statistik butir soal yang meliputi : tingkat kesukaran, daya beda dan efektifitas

(17)

distraktor. Menurut statistik butir, kualitas butir soal secara keseluruhan dapat dikategorikan sebagai berikut :

Klasifikasi Kualitas Butir Soal Kategori Kriteria Penilaian Baik Apabila

(1). Tingkat kesukaran 0,25 ≤ p ≤ 0,75.

(2). Korelasi biserial butir soal ≥ 0,40 dan

(3). Korelasi biserial alternatif jawaban (distraktor) bernialai n egatif. Revisi Apabila

(1). Tingkat kesukaran p < 0,25 atau p > 0,75 tetapi korelasi biserial butir≥ 0,40 dan korelasi biserial

distraktor bernilai negatif.

(2). Tingkat kesukaran 0,25≤ p≤ 0,75 dan korelasi biserial butir soal≥ 0,40 tetapi ada korelasi biserial

 pada distraktor yang bernilai positif 

(3). Tingkat kesukaran 0,25≤ p ≤ 0,75 dan korelasi biserial butir soal antara 0,20 sampai 0,30 tetapi

korelasi distraktor bernilai negatif selain kunci atau tidak ada yang lebih besar nilainya dari kunci  jawaban.

Tidak baik Apabila

(1). Tingkat kesukaran p < 0,25 atau p > 0,75 dan ada korelasi biserial pada distraktor bernilai positif  (2). Korelasi biserial butir soal < 0,20, (3). Korelasi biserial butir soal < 0,30 dan korelasi biserial

distraktor bernilai positif.10

F . Reliabilitas

Reliabilitas adalah suatu hal yang sangat penting pada alat pengukuran standar. Reliabilitas dihubungkan dengan pengertian adanya ketepatan tes dalam pengukurannya. Reliabilitas adalah kestabilan skor yang diperoleh peserta tes yang sama ketika diuji ulang dengan tes yang sama pada situasi yang berbeda atau dari suatu pengukuran ke pengukuran lainnya. Dengan kata lain reliabilitas merupakan tingkat konsistensi atau kemantapan hasil terhadap hasil dua pengukuran hal yang sama. Dapat juga diartikan sebagai tingkat kepercayaan dari

suatu alat ukur (Depdikbud : 1997). Hasil pengukuran diharapkan akan sama apabila pengukuran itu diulangi. Dengan perangkat tes yang reliabel, apabila tes itu diberikan dua kali pada peserta yang sama tetapi dalam selang waktu yang berbeda sepanjang tidak ada perubahan dalam kemampuan maka skor yang diperoleh akan konstan. Kriteria untuk menentukan tinggi rendahnya reliabilitas sebuah perangkat tes, menurut (Suharsimi Arikunto : 2001) dilihat pada rentangan koefesien korelasi sebagai berikut :

Mengapa instrumen penilaian perlu di analisis butir soalnya?

Analisis butir soal perlu dilakukan untuk mengetahui sejauh mana butir soal tersebut dapat digunakan dalam pengujian tes dan sebagai salah satu kontrol hasil prestasi belajar peserta didik.

Bagaimana cara melakukan analisis secara sederhana?

BAGAIMANA MELAKUKAN ANALISIS SECARA SEDERHANA.
Menghitung semua jumlah jawaban siswa yang benar..
Dari jawaban semua siswa yang benar, lakukan penskoran mulai dari tertinggi. ... .
Lakukan pengelompokan dari presentase atas dan presentase bawah dengan. ... .
Hitunglah jumlah siswa dalam kelompok atas yang memilih tiap tiap alternatif..

Bagaimana cara menganalisis tes uraian oleh Whitney dan sabers?

Cara menganalisis tes uraian oleh Whitney dan Sabers (Mehrens dan Lehmann, 1984) sebagai berikut : 1. Tentukan jumlah yang termasuk dalam kelompok atas (25%) dan kelompok bawah (25%) 2. Hitung jumlah skor kelompok atas dan jumlah skor kelompok bawah 3. Hitung tingkat kesukaran dan daya beda setiap butiran soal dengan ...

Kapan dilakukan analisis butir soal?

Analisis butir soal bisa dilakukan apabila suatu tes sudah selesai dilaksanakan dan didapatkan jawaban terhadap butir-butir soal yang diteskan.