MENGANALISIS HASIL TES
MAKALAH
Disusun Guna Memenuhi Tugas
Mata Kuliah Evaluasi Pendidikan
Dosen Pengampu : Devita Zuliati M.P.di
Disusun oleh:
Aneng fitriyah (15.11.00019)
PROGRAM STUDI PENDIDIKAN
BAHASA ARAB
FAKULTAS TARBIYAH
INSTITUT PESANTREN MATHALI’UL FALAH
PATI
2017
BAB I
PENDAHULUAN
A.
Latar Belajar
Pendidikan
merupakan salah satu sarana peningkat kualitas hidup manusia. Lembaga
pendidikan, sekolah misalnya memegang peranan yang cukup penting dalam proses
pendidikan. Guru sebagai pelaksana pendidikan juga berperan sebagai pendidik
sekaligus fasilitator yang mengarahkan siswanya untuk mencapai tujuan
pendidikan.
Untuk
mencapai tujuan pendidikan, seorang guru harus mengadakan evaluasi. Dengan
evaluasi, maka maju dan mundurnya kualitas pendidikan dapat diketahui, dan
dengan evaluasi pula, kita dapat mengetahui titik kelemahan serta mudah mencari
jalan keluar untuk berubah menjadi lebih baik ke depan Evaluasi pada dasarnya
sebagai dasar keputusan, menyusun kebijakan, maupun progam selanjutnya,
keputusan apakah akan dilanjutkan, diperbaiki atau dihentikan.
Pembahasan
kali ini akan mengupas bagaimana menganalisis hasil tes,seorang guru harus
menilai tes yang dibuat sendiri dan bagaimana seorang guru bisa menganalisis
butir-butir soal yang akan di ujikan kepada peserta didiknya.
Untuk
memperjelas pembahasan makalah ini akan mengupas lebih banyak tentang
menganalisis hasil tes.
B. Rumusan
Masalah
1. Bagaimana
menilai tes yang dibuat sendiri ?
2. Bagaimana
analisis butir soal ( Item Analysis ) ?
BAB II
PEMBAHASAN
A.
Menilai tes yang dibuat sendiri
Tes buatan guru
adalah tes yang dibuat seorang guru untuk merumuskan bahan dan tujuan khusus
untuk kelasnya sendiri dan masih dalam ruang lingkup sekolah tempat dia
mengajar.
Tidak ada usaha
guru yang lebih baik selain usaha untuk selalu meningkatkan mutu tes yang
disusun. Guru yang berpengalaman mengajar dan menyusun soal-soal tes yang akan
diberikan kepada siswa juga masih sukar menyadari bahwa tesnya masih belum
sempurna. Oleh karena itu, cara yang baik adalah secara jujur melihat hasil tes
yang diperoleh oleh siswa. Apabila keadaan setelah hasil tes dianalisis tidak
seperti yang diharapkan dalam kurva normal, maka tentu ada apa-apa dengan
tesnya.
Apabila hampir
seluruh siswa memperoleh skor jelek, berarti bhwa tes yang disusun mungkin
terlalu sukar. Sebaliknya jika seluruh siswa memperoleh skor baik, dapat
diartikan bahwa tesnya terlalu mudah. Tentu saja interprestasi terhadap soal
tes akan lain seandainya tes itu sudah disusun sebai-baiknya sehingga memenuhi
persyaratan sebagai tes. Dengan demikian maka apabila kita memperoleh
keterangan tentang hasil tes, akan membantu kita dalam mengadakan penilaian
secara objektif terhadap tes yang kita susun.[1]
Ø Cara untuk
menilai tes
1.
Cara pertama meneliti secara jujur soal-soal yang telah disusun,
kadang-kadang dapat diperoleh jawaban ketidak jelasan perintah dan bahasa,
taraf kesukaran, dan keadaan soal yang lainnya.
2.
Cara kedua adalah menga dakan
analisis soal. Analisis soal adalah suatu prosedur yang sistematis, yang akan
memberikan informasi-informasi yang sangat khusus terhadap butir tes yang kita
susun.
3.
Cara ketiga adalah mengadakan checking validitas. Validitas yang
paling penting dari tes buatan guru adalah validitas kurikuler. Untuk
mengadakan checking validitas kurikuler, kita harus merumuskan tujuan setiap
bagian pelajaran secara khusus dan jelas sehingga setiap soal dapat kita
jodohkan dengan setiap tujuan khusus tersebut.
4.
Cara keempat adalah mengadakan checking reliabilitas.
Salah
satu indikator untuk tes yang mempunyai reliabilitas yang tinggi adalah bahwa
kebanyakan dari soal-soal tes itu mempunyai daya pembeda yang tinggi.[2]
B.
Analisis Butir Soal ( Item Analysis)
Menurut thomdike dan hagen analisis terhadap soal-soal (items) tes yang
telah dijawab oleh murid mempunyai dua
tujuan yang penting.
Pertama,
jawaban-jawaban soal itu merupakan informasi diagnostik untuk meneliti
pelajaran dari kelas itu dan kegagalan-kegagalan belajarnya, serta selanjutnya
untuk membimbing ke arah cara balajar yang baik.
Kedua, jawaban-jawaban terhadap soal-soal yang terpisah dan
perbaikan (review) soal-soal yang didasarkan atas jawaban-jawaban itu merupakan
basis bagi penyiapan tes-tes yang lebih baik untuk tahun berikutnya.[3]
Jadi, tujuan khusus dari analisis soal tes ialah untuk mengadakan
identifikasi soal-soal yang baik, kurang baik, dan soal yang jelek. Dengan
menganalisis soal dapat diperoleh informasi tentang kejelekan sebuah soal dan
petunjuk untuk mengadakan perbaikan.[4]
Dengan membuat analisis soal sedikitnya kita akan mengetahui tiga
hal penting yang dapat diperoleh dari tiap soal, yaitu :
1.
Taraf kesukaran (difficulty level) soal
Soal yang baik
adalah soal yang tidak terlalu mudah atai tidak terlalu sukar, karna soal yang
terlalu mudah tidak akan meransang siswa untuk mempertinggi usaha
memecahkannya. Sebaliknya soal yang terlalu sukar akan menyebabkan siswa menjdi
putus asa dan tidak mempunyai semangat untuk mencoba lagi karena di luar
jangkauan. Soal yang baik adalah soal yang tidak terlalu mudah atai tidak
terlalu sukar, karna soal yang terlalu mudah tidak akan meransang siswa untuk
mempertinggi usaha memecahkannya. Sebaliknya soal yang terlalu sukar akan
menyebabkan siswa menjdi putus asa dan tidak mempunyai semangat untuk mencoba
lagi karena di luar jangkauan.[5]
Untuk
menghitung tingkat kesukaran dan daya pembeda tiap soal dari suatu tes kita
perlu terlebih dahulu mengelompokkan hasil tes tersebut menjadi tiga kelompok
berdasarkan peringkat dari keseluruhan skor yang kita peroleh.
Tiga kelompok
yang dimaksud adalah :
a)
Kelompok pandai atau upper group ( 25 % dari peringkat bagian atas
)
b)
Kelompok kurang atau lower group ( 25 % dari peringkat bagian bawah
)
c)
Kelompok sedang atau middle group ( 25 % dari peringkat bagian
tengah )
Menurut
ketentuan yang sering diikuti, indeks kesukaran sering diklasifikasikan sebagai
berikut :
v Soal dengan P
0,00 samapi 0,30 adalah soal sukar
v Soal dengan P
0,30 samapi 0,70 adalah soal sedang
v Soal dengan P
0,70 samapi 1,00 adalah soal mudah
Untuk menghintung taraf kesukaran soal dari suatu tes menggunakan
rumus sebagai berikut :
Keterangan
:
TK =
tingkat kesukaran yang dicari
U = jumlah siswa yang termasuk kelompok pandai
yang menjawab benar untuk setiap soal
L = jumlah siswa yang termasuk kelompok kurang
yang menjawab untuk setiap
soal
T
= jumlah siswa dari kelompok
pandai dan kelompok kelompok kurang
Contoh :
Misalkan suatu tes yang terdiri atas
40 soal dibagikan kepada 40 siswa, dari tes tersebut tiap – tiap soal kita
analisis taraf kesukarannya, mula-mula hasil tes kita susun ke dalam peringkat,
kemudian kita ambil 25% ( = 10 lembar jawaban siswa ) kelompok pandai, dan 25%
(= 10 lembar jawaban siswa) kolompok kurang. Kemudian kita tabulasikan.
Misalkan tabulasi soal no. 1 kita peroleh hasil sebagai berikut: yang menjawab
benar dari kelompok pandai = 9 orang siswa dan yang menjawab benar dari
kelompok kurang = 4 siswa. Dengan menggunakan rumus diatas nilai TK no. 1
adalah :
Sedangkan dalam bukunya Drs. H. Daryanto, rumus untuk mencari taraf
kesukaran atau indeks kesukaran adalah:
Keterangan:
P = Indeks kesukaran
B = banyaknya siswa yang
menjawab soal itu dengan benar.
JS = jumlah seluruh siswa peserta tes.
Contoh:
Jumlah siswa peserta tes dalam suatu kelas ada 40 siswa. Dari 40
siswa tersebut terdapat 12 siswa yang mampu mengerjakan soal no. 1 dengan
benar. Maka berapa indeks kesukarannya?
Jawab:
P
= B
JS
= 12
40
= 0,30[7]
Bagaimana
penafsiran baik atau buruknya suatu soal berdasarkan taraf kesukarannya, akan
diuraikan lebih lanjut setelah membicarakan daya pembeda setiap soal.
2.
Daya Pembeda (discriminating power)suatu soal
Daya
pembeda soal adalah kemampuan suatu butir soal dapat membedakan antara siswa
yang telah menguasai materi yang ditanyakan dan siswa yang tidak/kurang/belum
menguasai materi yang ditanyakan. Angka yang menunjukkan besarnya daya pembeda
disebut indeks diskriminasi di singkat D ( d besar ). Seperti indeks kesukaran,
indeks diskriminasi berkisar:
-1,00 0,00 1,00
Daya
pembeda daya pembeda daya pembeda
negatif rendah tinggi (positif)
bedanya indeks
kesukaran dengan indeks diskriminasi terletak pada kalau indeks kesukaran tidak
mengenal tanda negatif tetapi indeks
diskriminasi ada tanda negatif. Tanda negatif pada diskriminasi digunakan jika
suatu soal “terbalik” menunjukan kualitas testee. Yaitu anak pandai disebut
bodoh dan anak bodoh disebut pandai. Daya pembeda suatu soal tes dapat dihitung
dengan menggunakan rumus sebagai berikut :
Keterangan :
DP = indeks DP atau daya pembeda yang dicari
U, L, dan T
sama dengan keterangan yang diberikan pada rumus untuk taraf
“ kesukaran “
Untuk
mendapat gambaran yang lebih jelas bagaimana mencari daya pembeda soal-soal tes
yang sekaligus taraf kesukarannya, berikut ini dikemukakan sebuah contoh yang
diambil dari hasil tes psikologi di kelas II SPG. Dalam contoh ini jumlah siswa yang dites adalah 40
orang, sedangkan tes itu terdiri atas 20 soal.
Setelah
hasil tes itu diperiksa, kemudian disusun ke dalam peringkat untuk menentukan
25% siswa yang termasuk kelompok pandai(upper group) dan 25% siswa yang
termasuk kelompok kurang (lower group).
Kemudian
hasil tes dari kedua kelompok itu ditabulasikan dengan menggunakan Format
Tabulasi Jawaban Tes, dengan menggunakan hasil tabulasi dalam format dengan
mudah kita dapat menghitung taraf kesukaran dan daya pembeda masing-masing soal
dengan menggunakan rumus yang telah dikemukakan diatas.
FORMAT ANALISIS SOAL (ITEMS) TES PSIKOLOGI
KELAS : .................................... SPG
No.
Soal
|
Jumlah
Jawaban Benar Upper Group
(U)
|
Jumlah
Jawaban Benar Lower Group
(L)
|
Jumlah
(U + L)
|
Selisih (U – L)
|
Diff.
Level
(TK)
|
Disc.
Power
(DP)
|
Keterangan
|
(1)
|
(2)
|
(3)
|
(4)
|
(5)
|
(6)
|
(7)
|
(8)
|
1
|
10
|
8
|
18
|
2
|
0,90
|
0,20
|
revisi ─
|
2
|
9
|
4
|
13
|
5
|
0,65
|
0,50
|
─ ─
|
3
|
6
|
7
|
13
|
-1
|
0,65
|
-0,10
|
─ revisi
|
4
|
10
|
2
|
12
|
8
|
0,60
|
0,80
|
─ ─
|
5
|
8
|
5
|
13
|
3
|
0,65
|
0,30
|
─ ─
|
6
|
8
|
6
|
14
|
2
|
0,70
|
0,20
|
─ ─
|
7
|
9
|
6
|
15
|
3
|
0,75
|
0,30
|
─ ─
|
8
|
9
|
5
|
14
|
4
|
0,70
|
0,40
|
─ ─
|
9
|
8
|
3
|
11
|
5
|
0,55
|
0,50
|
─ ─
|
10
|
10
|
5
|
15
|
5
|
0,75
|
0,50
|
─ ─
|
11
|
6
|
2
|
8
|
4
|
0,40
|
0,40
|
─ ─
|
12
|
10
|
3
|
13
|
7
|
0,65
|
0,70
|
─ ─
|
13
|
7
|
4
|
11
|
3
|
0,55
|
0,30
|
─ ─
|
14
|
8
|
4
|
12
|
4
|
0,60
|
0,40
|
─ ─
|
15
|
10
|
2
|
12
|
8
|
0,60
|
0,80
|
─ ─
|
16
|
9
|
8
|
17
|
1
|
0,85
|
0,10
|
revisi ─
|
17
|
7
|
7
|
14
|
0
|
0,70
|
0
|
─ revisi
|
18
|
10
|
8
|
18
|
2
|
0,90
|
0,20
|
revisi ─
|
19
|
10
|
7
|
17
|
3
|
0,85
|
0,30
|
revisi ─
|
20
|
10
|
7
|
17
|
3
|
0,85
|
0,30
|
─ ─
|
Keterangan :
Dengan menggunakan rumus perhitungan taraf kesukaran dan rumus
perhitungan daya pembeda maka untuk item no. 1 misalnya dapat diketahui :
Taraf kesukaran :
Daya pembeda :
Demikian juga halnya untuk item no. 2 sampai
dengan no. 20.
3.
Pola jawaban soal
Pola yang
dimaksud pola jawaban disini adalah distribusi testee dalam hal menentukan
pilihan jawaban pada soal bentuk pilihan ganda. Pola jawaban soal soal
diperoleh dengan menghitung banyaknya testee yang memilih pilihan jawaban a, b,
c, atau d atau yang tidak memilih pilihan manapun (blangko). Dalam istilah
evaluasi disebut omit, disingkat O.
Dari pola
jawaban soal dapat ditentukan apakah pengecoh (discraktor) berfungsi sebagai
pengecoh dengan baik atau tidak. Pengecoh yang tidak dipilih sama sekali oleh testee
berarti bahwa pengecoh itu jelek, terlalu mencolok menyesatkan. Sebaliknya
sebuah distraktor ( pengecoh ) dapat dikatakan berfungsi dengan baik apabila
distraktor tersebut mempunyai daya tarik yang besar bagi pengikut-pengikut tes
yang kurang memahami konsep atau kurang menguasai bahan.
Dengan melihat
pola jawaban soal, dapat diketahui :
a)
Taraf kesukaran soal
b)
Daya pembeda soal
c)
Baik dan tidaknya distraktor
Sesuatu
distraktor dapat diperlakukan dengan 3 cara:
1)
Diterima, karena sudah baik
2)
Ditolak, karena tidak baik
3)
Ditulis kembali, karena kurang baik
Kekurangannya
mungkin terletak pada rumusan kalimatnya sehingga hanya perlu ditulis kembali,
dengan perubahan seperlunnya.
Menulis soal
adalah suatu pekerjaan yang sulit, sehingga apabila masih bisa diperbaiki
sebaiknya diperbaiki saja, tidak dibuang.
Suatu
distraktor dapat dikatakan berfungsi dengan baik jika paling sedikit dipilih
oleh 5% pengikut tes
v
Contoh perhitungan
Dari analisis
sebuah item polanya diketahui sebagai berikut :
Pilihan Jawaban
|
a
|
B
|
c*
|
d
|
o
|
Jumlah
|
Kelompok Atas
|
5
|
7
|
15
|
3
|
0
|
30
|
Kelompok Bawah
|
8
|
8
|
6
|
5
|
3
|
30
|
Jumlah
|
13
|
15
|
21
|
9
|
3
|
60
|
c, diberi tanda
(*) adalah kunci jawaban
dari pola
jawaban soal ini dapat dicari :
a.
b.
c. Distraktor : semua distraktornya sudah berfungsi dengan baik karena
sudah dipilih oleh lebih dari 5% pengikut tes.
d. Dilihat dari segi omit (kolom pilihan paling kanan) adalah baik. Sebuah
item dikatakan baik dikatakan baik jika omitnya tidak lebih dari 10% pengikut
tes. (5% dari pengikut tes = 5% ×60 orang = 3 orang)
Sebenarnya ketentuan ini hanya berlaku pada tes pilihan ganda sengan 5
alternatif dan P = 0,80 . tetapi demi praktisnya diperlakukan untuk semua.[8]
4.
Kriteria untuk menetukan soal yang baik dan tidak baik
Untuk
menentukan apakah suatu soal dikatakan baik atau tidak baik sehingga perlu
direvisi, digunakan kriteria sebagai berikut :
a.
Untuk soal yang berbentuk benar-salah (true-false)
v Jika tingkat
kesukarannya sama atau lebih kecil dari 0,16, dikategorikan soal yang sukar.
v Jika tingkat
kesukarannya sama atau lebih besar dari 0,85, dikategorikan soal yang mudah.
b.
Untuk soal yang berbentuk pilihan ganda (multiple choice)
v Untuk pilihan
ganda dengan option 3, jika tingkat
kesukarannya sama atau lebih kecil dari 0,21, dikategorikan soal yang sukar,
sedangkan jika tingkat kesukarannya sama atau lebih besar dari 0,79,
dikategorikan soal yang mudah.
v Untuk pilihan
ganda dengan option 4, jika tingkat kesukarannya sama atau lebih kecil dari
0,24, dikategorikan soal yang sukar, sedangkan jika tingkat kesukarannya sama
atau lebih besar dari 0,76, dikategorikan soal yang mudah.
c.
Jika soal pembeda soal itu adalah 0 (nol) atau negatif (minus),
maka soal itu perlu direvisi / diperbaiki.
Dengan melihat
kriteria tersebut dapat disimpulkan makin tinggi nilai TK suatu soal maka makin
mudah soal tersebut, dan makin rendah nilai TK maka makin sukar suatu soal
tersebut. Tingkat kesukaran suatu soal dikatakan baik jika nilai TK yang
diperoleh dari soal tersebut sekitar 0,50 atau 50%.
Umumnya dapat
dikatakan soal-soal yang mempunyai nilai ≤ 0,10 adalah soal-soal yang sukar,
dan soal-soal yang mempunyai nilai ≥ 0,90 adalah soal-soal yang terlampau
mudah.[9]
BAB III
PENUTUP
Kesimpulan
Tes buatan guru
adalah tes yang dibuat seorang guru untuk merumuskan bahan dan tujuan khusus
untuk kelasnya sendiri dan masih dalam ruang lingkup sekolah tempat dia
mengajar. Cara untuk menilai tes yaitu : cara pertama meneliti secara jujur
soal-soal yang telah disusun, cara kedua adalah menga dakan analisis soal, cara ketiga adalah mengadakan checking
validitas, cara keempat adalah mengadakan checking reliabilitas. Pada analisis
item ada dua yang harus dianalisis yaitu taraf kesukaran dan daya pembeda.
DAFTAR
PUSTAKA
Arikunto Suharsimi Dasar-dasar Evaluasi Pendidikan.Jakarta : Bumi
Aksara . 2006
Muly adi. Evaluasi Pendidikan. Malang : Maliki Press . 2010
Purwanto Ngalim. Prinsip-prinsip dan Teknik Evaluasi Pangajaran.Bandung : PT
Remaja Rosdakarya.2010
[1] http://dewit-barces.blogspot.co.id/2014/08/menganalisis-hasil-tes.html diakses pada
tanggal 11 November 2017 pukul 15.41
[2] Suharsimi
Arikunto, Dasar-dasar Evaluasi Pendidikan, (Jakarta : Bumi Aksara ,
2006) hlm. 205-206
[4] Suharmisi...hlm 207
[5] Ibid
[6] Ngalim Purwanton, Prinsip-prinsip dan Teknik Evaluasi Pangajaran,
(Bandung : PT Remaja Rosdakarya,2010),hlm. 119-120
[7] http://riskangeblog.blogspot.co.id/2015/05/analisis-butir-soal.html diakses pada
tanggal 29 November 2017 pukul 15.08
[8] Suharsimi Arikunto, dasar-dasar....hlm. 219-221
[9] Ngalim Purwanton, Prinsip-prinsip.....hlm. 120-124
No comments:
Post a Comment