Kriteria
Instrument pemilihan evaluasi pembelajaran
BAB
I
PENDAHULUAN
A. Latar Belakang
Sebagai alat untuk
mengukur prestasi belajar siswa tes dimaksudkan untuk mengukur tingkat
perkembangan atau kemajuan yang telah dicapai siswa setelah menempuh proses
belajar mengajar dalam waktu tertentu.
Analisis kualitas
tes merupakan suatu tahap yang harus ditempuh untuk mengetahui derajat kualitas
suatu tes, baik secara keseluruhan maupun butir soal yang menjadi bagian dari
tes tersebut. Dalam penilaian hasil belajar, tes diharapkan dapat menggambarkan
sempel perilaku dan menghasilkan nilai yang objektif serta akurat. Jika tes
yang digunakan guru kurang baik, maka hasil yang diperoleh pun tentunya kurang
baik. Hal ini dapat merugikan peserta didik itu sendiri. Artinya, hasil yang
diperoleh peserta didik menjadi tidak objektif
dan tidak adil. Oleh sebab itu, tes yang digunakan guru harus memiliki
kualitas yeng lebih baik dilihat dari berbagai segi. Tes hendaknya disusun
sesuai dengan prinsip dan prosedur penyusunan tes. Setelah digunakan perlu
diketahui apakah tes tersebut berkualitas baik atau kurang baik. Untuk
mengetahui apakah suatu tes yang digunakan termasuk baik atau kurang baik, maka
perlu dilakukan analisis kualitas tes. Yaitu dengan mengetahui criteria pemilihan
instrument Evaluasi.
B. Rumusan Masalah
1.
Bagaimanakah Kriteria pemilihan Instrumen pembelajaran itu?
2.
Dan jelaskan kriteria-kriteria yang di maksud !
C. Tujuan Masalah
1.
mengetahui Kriteria pemilihan Instrumen pembelajaran itu
2. Agar mengetahui dan paham akan
criteria-kriteria pemilihan Instrumen pembelajaran tersebut.
BAB
II
PEMBAHASAN
A. Kriteria Pemilihan Instrumen Evaluasi
Pada dasarnya
instrument dapat dibagi dua yaitu tes dan non tes. Secara umum tes diartikan sebagai alat yang dipergunakan untuk mengukur
pengetahuan atau penguasaan objek ukur terhadap seperangkat konten dan meteri
tertentu.
Dalam
proses evaluasi pembelajaran atau penilaian proses dan hasil belajar,guru
sering menggunakan instrumen tertentu baik tes maupun non tes
(Observasi,wawancara, skala sikap anket dan lain-lain) Intrumen mempunyai
fungsi dan peran yang sangat penting dalam rangka mengetahui keefektifan proses
pembelaran di sekolah. Mengingat pentingnya suatu instrumen dalam suatu
kegiatan evaluasi pembelajaran
maka suatu instrumen harus memliki syarat-syarat tertentu sekaligus menunjukan
karakterisitik instrumen. Juga agar kita bisa mengetahui analisa kualitas tes
tersebut.
Evaluasi
sangat berguna dalam meningkatkan kualitas sistem pembelajaran. bagi para
pembuat nilai, hendaknya instrumen evaluasi yang akan diterapkan, diharapkan
memenuhi beberapa kriteria agar meminimalisir bahkan mengilangkan kesalahan
yang tidak valid. sehingga penilaian yang diberikan bisa adil dan sesuai
kenyataan. karena sampai saat ini,terkadang masih banyak terjadi kekeliruan
dalam hal penilaian. bahasa gampangnya mah, terjadi ketidakadilan dalam
penilaian.[1]
Agar itu semua tidak terjadi perluanya diketahui dengan bagaiman kualitas tes
dengan analisa kualitas tes.
Analisis kualitas
tes berkaitan dengan pertanyaan apakah tes sebagai suatu alat ukur benar-benar
mengukur apa yang hendak dan seharusnya diukur? Sampai mana tes ersebut dapat
diandalkan dan berguna? Kedua pertanyaan ini sebenarnya menunjuk pada 2 hal
pokok, yaitu validitas dan reabilitas. Kedua hal ini sekaligus merupakan
karakteristik alat ukur yang baik.
Suharsimi Arikunto
(2008 : 57-62) menyatakan bahwa suatu tes dapat dikatakan baik apabila memenuhi
lima persyaratan, yaitu : validitas, reliabilitas, objektivitas,
praktikabilitas dan ekonomis. Untuk itu
diperlukanlah kaidah-kaidah instrumen yang mangarahkan dalam hal evaluasi.
adapun kaidah tersebut adalah:
1.
Validitas
Instrumen
evaluasi yang baik, hendaknya harus
memiliki validitas yang tinggi, artinya evaluasi yang di ukur haruslah sesuai
dengan apa yang diukur, sehingga hasil evaluasi dapat dipertanggung jawabkan.
paling tidak ada 3 yang harus di perhatikan yakni kognitif,afektif dan psikomotorik.[2]
Alat ukur dikatakan
valid apabila alat ukur itu dapat dengan tepat mengukur apa yang hendak diukur.
Dengan kata lain validitas berkaitan dengan “ketepatan” dengan alat ukur. Tes
sebagai salah satu alat ukur hasil belajar dapat dikatakan valid apabila tes
itu dapat tepat mengukur hasil belajar yang hendak diukur. Dengan tes yang
valid akan menghasilkan data hasil belajar yang valid pula.
Contoh :
Untuk mengukur tingkat
partisipasi siswa dalam proses pembelajaran, bukan diukur melalui skor nilai
yang diperoleh pada waktu ujian/ulangan, tetapi dilihat melalui :
a. Kehadiran
b. Terpusatnya
perhatian pada pelajaran
c. Ketepatan
menjawab pertanyaan-pertanyaan yang diajukan guru dalam arti relevan pada
permasalahannya.
Nilai yang diperoleh
pada waktu ulangan, bukan menggambarkan partisipasi, tetapi menggambarkan
prestasi belajar. Validitas isi sering digunakan dalam
penilaian hasil belajar. Tujuan utamanya adalah untuk mengetahui sejauh mana
peserta didik menguasai materi pelajaran yang telah disampaikan, dan perubahan-perubahan
psikologis apa yang timbul pada diri peserta didik tersebut setelah mengalami
proses pembelajaran tertentu. Jika dilihat dari segi kegunannya dalam penilaian
hasil belajar, validitas isi ini sering disebut juga validitas kurikuler dan validitas
perumusan.
Validitas kurikuler
berkenaan dengan pertanyaan apakah materi tes relevan dengan kurikulum yang
sudah ditentukan. Pertanyaan ini timbul karena sering terjadi materi tes tidak
mencakup keseluruhan aspek yang akan diukur, baik aspek kognitif, afektif,
maupun psikomotorik, tetapi hanya pengetahuan yang bersifat fakta-fakta
pelajaran tertentu. Diharapkan dengan validitas kurikuler ini timbul ketelitian
yang jelas dan totalitas dengan menjelajahi semua aspek yang tercakup dalam
kisi-kisi dan Rencana Pelaksanaan Pembelajaran (RPP) yang bersangkutan.
Validitas kurikuler ini dapat dilakukan dengan beberapa cara, antara lain
mencocokkan materi tes dengan silabus dan kisi-kisi, melakukan diskusi dengan
sesama pendidik, atau mencermati kembali substansi dari konsep yang akan
diukur.
Dalam literature
modern tentang evaluasi, banyak dikemukakan tentang jenis-jenis validitas,
antara lain validitas permukaan (face validity), validitas isi ( conten
validity), validity empiris (empirical validity), dan validitas konstruk
(construct validity), dan validitas factor ( factorial validity).
a. Validitas permukaan
Validitas ini
menggunakan kriteria yang sangat sederhana, karena hanya melihat dari sisi muka
atau tampang dari instrument itu sendiri. Artinya, jika suatu tes secara
sepintas telah dianggap baik untuk mengungkap fenomena yang akan diukur, maka
tes tersebut sudah dapat dikatakan memenuhi syarat validitas perukaan, sehingga
tidak perlu lagi adanya judgement yang mendalam.
b. Validitas isi
Validitas isi sering
digunakan dalam penilaian hasil belajar. Tujuan utamanya adalah untuk
mengetahui sejauh mana peserta didik menguasai materi pelajaran yang telah
disampaikan, dan perubahan-perubahan psikologis apa yang timbul pada diri
peserta didik tersebut setelah mengalami proses pembelajaran tertentu. Jika
dilihat dari segi kegunannya dalam penilaian hasil belajar, validitas isi ini
sering disebut juga validitas kurikuler dan validitas perumusan
Validitas kurikuler
berkenaan dengan pertanyaan apakah materi tes relevan dengan kurikulum yang
sudah ditentukan. Pertanyaan ini timbul karena sering terjadi materi tes tidak
mencakup keseluruhan aspek yang akan diukur, baik aspek kognitif, afektif,
maupun psikomotorik, tetapi hanya pengetahuan yang bersifat fakta-fakta pelajaran
tertentu. Diharapkan dengan validitas kurikuler ini timbul ketelitian yang
jelas dan totalitas dengan menjelajahi semua aspek yang tercakup dalam
kisi-kisi dan Rencana Pelaksanaan Pembelajaran (RPP) yang bersangkutan.
Validitas kurikuler ini dapat dilakukan dengan beberapa cara, antara lain
mencocokkan materi tes dengan silabus dan kisi-kisi, melakukan diskusi dengan
sesame pendidik, atau mencermati kembali substansi dari konsep yang akan
diukur.[3]
c. Validitas Empiris
Validitas ini
biasanya menggunakan teknik statistic, yaitu analisis korelasi. Hal ini
disebabkan validitas empiris mencari hubungan atara skor dengan suatu kriteria
tertentu yang merupakan suatu tolak ukur di luar tes yang bersangkutan. Namun,
kriteria itu harus relevan dengan dihubungkan dengan kriteria
(criterion-related validity) atau validitas statistic (statistical validity).
Ada tiga macam validitas empiris, yaitu:
1) Validitas prediktif (predictive validity)
2) Validitas kongkuren (concurrent validity)
3) Validitas sejenis (congruent validity)
Validitas prediktif
adalah jika kriteria standar yang digunakan adalah untuk meramalkan prestasi
belajar murid masa yang akan dating. Dengan kata lain, validitas prediktif
bermaksud melihat hingga mana suatu tes dapat memprakirakan perilaku peserta
didik pada masa yang akan dating, sedangkan validitas konkuren adalah
jika kriteria standarnya berlainan. Misalnya, skor tes dalam mata pelajaran
Bahasa Indonesia dikorelasikan dengan skor tes Bahasa Inggris. Sebaliknya, jika
kriteria standarnya sejenis, maka validitas tersebut disebut validitas
sejenis. Misalnya, Bahasa Indonesia dengan Bahasa Indonesia.
Dalam mengukur
validitas suatu tes hendaknya yang menjadi kriteria sudah betul-betul valid
sehingga dapat diandalkan keampuhannya dan dapat dianggap sebagai tes standar.
Sebaliknya, bila kriteria tidak valid, maka tes-tes lain yang akan divaliditasi
menjadi kurang atau tidak meyakinkan. Suatu tes akan mempunyai koefisien
validitas yang tinggi jika tes itu betul-betudl dapat mengukur apa yang hendak
diukur dari peserta didik tertentu.
Ada beberapa hal
yang harus diperhatikan dalam menginterprestasikan koefisien validitas, antara
lain data mengenai karakteritik sampel
validitas, prosedur-prosedur dalam pengukuran validitas, dan pola kriteria
khusus yang dikorelasikan dengan hasil tes itu. Sehubungan dengan khusus,
Anastasia dalam Conny Semiawan Stamboel,
mengemukakan ada delapan kriteria sebagai bahan bandingan untuk merumuskan apa
yang hendak diselidiki oleh suatu tes, yaitu “diferensiasi umur, kemajuan
akademis, kriteria dalam pelaksanaan latihan khusus, kriteria dalam pelaksanaan
kerja, penilaian, kelompok yang dipertentangkan, korelasi dengan tes lain, dan
konsisten internal”.
Untuk tes hasil
belajar, aspek validitas yang paling penting adalah validitas isi. Yang dimaksud
dengan validitas isi adalah ukuran yang menunjukkan sejauh mana skor dalam tes
berhubungan dengan penguasaan peserta tes dalam bidang studi yang diuji melalui
perangkat tes tersebut. Untuk mengetahui tingkat validitas isi tes, diperlukan
adanya penilaian ahli yang menguasai bidang studi tersebut. Jadi bersifat
analisis kualitatif. Orang yang tidak menguasai isi bidang studi yang dites
tentu saja tidak dapat melakukan penilaian tentang isi tes.
Kelompok
yang kurang berhasil. Soal-soal yang gagal menunujkkan perbedaan antara
kelompok yang berhasil dengan keelompok yang kurang berhasil harus diperbaiki,
atau dibuang. Kriteria konsistensi internalnal ini menghasilkan indeks
homoginitas soal, tetapi tidak dapat dianggap sepenuhnya sebagai pengganti validitas.
Untuk
menguji validitas empiris dapat digunakan jenis statistika korelasi product
moment, korelasi perbedaan peringkat, atau korelasi diagram pencar. Berikut
ini akan dikemukakan beberapa contoh perhitungan korelasi.
a.
Korelasi prduct moment dengan angka simpangan
Rumus rxy
Keterangan: r = koefisien korelasi
Σxy = jumlah produk x dan y
Contoh:
10
orang peserta didik kelas 11 SMA mendapat nilai dalam mata pelajaran Bahasa
Indonesia dan Bahasa Inggris seperti berikut:
Tabel 10.1
Nilai
Peserta Didik Kelas 11 SMA dalam
Mata Pelajaran
Bahasa Indonesia dan Bahasa Inggris
No.
|
Nama
|
B.
Indonesia
|
B.
Inggris
|
1.
|
A.
|
5
|
6
|
2.
|
B.
|
7
|
8
|
3.
|
C.
|
8
|
7
|
4.
|
D.
|
5
|
5
|
5.
|
E.
|
6
|
7
|
6.
|
F.
|
7
|
7
|
7.
|
G.
|
4
|
5
|
8.
|
H.
|
5
|
7
|
9.
|
I.
|
8
|
8
|
10.
|
J.
|
6
|
6
|
Langkah-langkah
penyelesaian:
1)
Membuat
tabel persiapan seperti berikut:
No.
|
X
|
Y
|
X
|
Y
|
x2
|
Y2
|
xy
|
|
|
|
|
|
|
|
|
2)
Masukkan
nilai masing-masing mata pelajaran, dimana nilai Bahasa Indonesia sebagai
variabel X dan nilai Bahasa Inggris sebagai variabel Y.
3)
Jumlahkan
semua nilai yang ada dalam variabel X dan variabel Y, kemudian hitung rata-rata
Y.
4)
Cari
nilai pada kolom x dengan jalan nilai tiap-tiap peserta didik dalam kolom X
dikurangi dengan rata-rata X.
5)
Cari
nilai pada kolom y dengan jalan nilai tiap-tiap peserta didik dalam kolom Y
dikurangi dengan rata-rata Y.
6)
Cari
nilai pada kolom x2 dengan jalan menguadratkan masing-masing nilai
dalam kolom x.
7)
Cari
nilai pada kolom y2 dengan jalan menguadratkan masing-masing nilai
dalam kolom y.
8)
Cari
nilai pada kolom xy dengan jalan mengalikan tiap-tiap nilai dalam kolom x
dengan nilai-nilai dalam kolom y.
Berdasarkan
langkah-langkah diatas dapat dihitung koefisien korelasi product moment sebagai
berikut.
Tabel 10.2
Perhitungan
Korelasi Product Moment dengan
Angka
Simpangan
No
|
Nilai
B.
Ind
(x)
|
Nilai
B.
Ing
(Y)
|
X
|
y
|
x2
|
y2
|
xy
|
1
2
3
4
5
6
7
8
9
10
|
5
7
8
5
6
7
4
5
8
6
|
6
8
7
5
7
7
5
7
8
6
|
-1,1
0,9
1,9
-1,1
-0,1
0,9
-2,1
-1,1
1,9
-0,1
|
-0,6
,4
0,4
-1,6
0,4
0,4
-1,6
0,4
1,4
-0,6
|
1,21
0,81
3,61
1,21
0,01
0,81
4,41
1,21
3,61
0,01
|
0,36
1,96
0,16
2,56
0,16
0,16
2,56
1,16
1,96
0,36
|
0,66
1,26
0,76
1,76
-0,04
0,36
3,36
-0,44
2,66
0,06
|
Σ
|
61
|
66
|
|
|
16,9
|
10,4
|
10,4
|
|
6,1
|
6,6
|
rxy
= 0,784
Rumus lain korelasi product moment,
yaitu:
r.xy =
2. Reliabilitas
Kata reliabilitas dalam
bahasa Indonesia diambil dari kata reliability dalam bahasa Inggris,
berasal dari kata asal reliable yang artinya dapat dipercaya. Reliabilitas
adalah tingkat derajat atau konsistensi dari suatu instrument.Reliabilitas tes
berkenaan dengan pertanyaan, apakah suatu tes teliti dan dapat dipercaya sesuai
dengan kriteria yang telah ditetapkan. Suatu tes bisa dikatakan reliabel jika
selalu memberikan hasil yang sama bila diteskan pada kelompok yang sama pada
waktu atau kesempatan yang diteskan berbeda.
Seseorang dikatakan
dapat dipercaya jika orang tersebut selalu bicara ajek (konsisten), tidak berubah-ubah
pembicaraannya dari waktu ke waktu. Demikian juga halnya dengan sebuah tes. Tes
tersebut dikatakan dapat dipercaya (reliable) jika memberikan hasil yang
tetap atau konsistenapabila diteskan berkali-kali. Jika kepada siswa diberikan
tes yang sama pada waktu yang berlainan, maka setiap siswa akan tetap berada
dalam urutan (rangking) yang sama atau konsisten dalam kelompoknya.
Yang
dimaksud dengan reabilitas disini adalah ketetapan, artinya ketetapan disini
bukanlah hasil evaluasi yang dilakukan kepada seseorang akan memiliki nilai
yang sama, tetapi akan mengikuti perkembangan. contohnya misal dilakukan sebuah
tes matematika kepada lee min ho, kemudian dia mendapatkan nilai 70. setelah
beberpa hari, dilakukan tes kembali maka nilainya tidak harus 70 juga, karena
dalam beberapa hari itu terjadi perkembangan pada diri peserta tes.
Ajek atau tetap tidak
selalu harus sama, tetapi mengikuti perubahan secara ajek. Jika keadaan A
mula-mula berada lebih rendah dibandingkan dengan B, maka jika diadakan
pengukuran ulang, si A tetap berada lebih rendah dari B. itulah yang dikatakan
ajek atau tetap, yaitu tetap dalam kedudukan siswa diantara anggota kelompok
yang lain. Jika dihubungkan dengan validitas maka validitas berhubungan dengan
ketepatan sedangkan reliabilitas berhubungan dengan ketetapan atau keajekan.
Menurut Kerlinger
(1986), reliabilitas dapat diukur dari tiga kriteria, yaitu stability (menunjukkan
keajegan suatu tes dalam mengukur gejala yang sama pada waktu tertentu),
dependability (menunjukkan kemantapan suatu tes atau seberapa jauh tes
dapat diandalkan), dan predictability (menunjukkan kemampuan tes
untuk meramalkan hasil pada pengukuran gejala selanjutnya. Untuk
menunjukkan relaibilitas suatu tes, antara lain dapat dilakukan dengan
memperbanyak butir soal.
Menurut Grounlund
(1985), Terdapa 4 faktor yang dapat mempengaruhi reliabilitas, yaitu:
1.
Panjang tes (length
of test). Panjang tes berarti banyaknya soal tes. Ada kecenderungan,
semakin panjang tes akan lebih tinggi reliabilitas suatu tes, karena semakin
banyak soal, maka akan semakin banyak sampel yang diukur dan proporsi jawaban
yang benar semakin banyak, sehingga factor tebakan (guessing) akan
semakin rendah.
2.
Sebaran skor (spread
of scores). Besarnya sebaran skor akan membuat tingkat reliabilitas menjadi
lebih tinggi, karena koefesien reliabilitas yang lebih besar diperoleh ketika
peserta didik tetap berada pada posisi yang relatif sama dalam satu kelompok
pengujian kepengujian berikutnya. Dengan kata lain, peluang selisih dari
perubahan posisi dalam kelompok dapat memperbesar koefisien reliabilitas.
3.
Tingkat
kesukaran (difficult indeks). Dalam penilaian yang menggunakan penilaian
acuan norma, baik untuk soal yang mudah maupun yang sukar, cenderung
menghasilkan tingkat reliabilitas yang rendah. Tingkat kesukaran tes yang ideal
untuk meningkatkan koefisien reliabilitas adalah soal yang menghasilkan sebaran
skor yang menghasilkan sebaran skor berbentuk genta atau kurva normal.
4.
Objektifitas (obyektivity).
Objektivitas disini menunjukkan skor tes kemampuan yang sama antara peserta
didik yang satu dengan lainnya. Peserta didik memperoleh hasil yang sama dalam
mengerjakan suatu tes. Jika peserta didik memiliki tingkat kemampuan yang sama,
maka akan memperoleh hasil tes yang sama. Objektivitas prosedur tes yang tinggi
akan memperoleh reliabilitas hasil tes yang tidak dipengaruhi oleh prosedur
penskoran.
Konsep reliabilitas
mendasari kesalahan pengukuran yang mungkin terjadi pada suatu proses
pengukuran atau pada nilai tunggal tertentu, sehingga menimbulkan perubahan
pada susunan kelompoknya (error of measurement). Misalna, guru mengetes
pserta didik dengan instrument tertentu dan mendapat nilai 70. Kemudian pada
kesempatan yang berbeda dengan instrument yang sama, guru melakukan tes
kembali, ternyata peserta didik tersebut mendapat nilai 75. Artinya, tes
tersebut tidak reliabel, karena terjadi kesalahan pengukuran. Tes yang reliabel
adalah apabila koefisien reliabilitasnya tinggi dan kesalahan baku
pengukurannya (standar error of measurement) rendah.
Menurut perhitungan product
moment dari Pearson, ada 3 macam reliabilitas, yaitu:
1. Koefisien Stabilitas
Koefisien
stabilitas(coefficient of stability) adalah jenis reliabilitas yang
menggunakan teknik test and re-test, yaitu memberikan tes kepada
sekelompok indvidu, kemudian diadakan pengulangan tes pada kelompok yang sama
dengan waktu yang berbeda. Cara memperoleh koefisien stabilitas adalah dengan
mengolerasikan hasil tes pertama dengan hasil tes kedua dari kelompok yang
sama, tes yang sama, pada waktu yang berbeda. Jika antara waktu tes pertama
dengan tes kedua cukup lama, kemudian diadakan latihan-latihan tambahan, maka
bisa jadi tes kedua akan lebih besar daripada tes pertama. Sebaliknya jika
antara waktu tes pertama dengan kedua relative pendek, maka nilai tes kedua
bisa jadi sama atau lebih besar daripada tes pertama karena soal dan jawaban
masih dapat diingat.
Kesalahan
teknis ini dapat bersumber dari berbagai factor, sehingga menebabkan peserta
didik mempunyai skor yang berbeda pada saat dua kali mengerjakan tes yang sama.
Bisa saja perubahan skor yang terjadi bukan disebabkan perubahan hal yang
diukur, tetapi memang karena situasi yang berbeda atau pengalaman dari peserta
didik pada saat mengikuti tes yang pertama, sehingga ketika mengerjakan tes
yang kedua, peserta didik lebih berhati-hati dan lebih baik hasilnya.
Keunggulan teknik ini adalah dapat memperkecil kemungkinan masukna sumber
kesalahan yang lain. Namun, patut juga dipertimbangkan bahwa penggunaan
kelompok yang sama dan tes ang sama dalam duakali tes akan mempengaruhi hasil
tes yang kedua, karena responden sudah memiliki pengalaman mengerjakan tes yang
pertama, hal ini sekaligus menunjukkan kelemahan teknik test and retest.
2.
Koefisien
Ekuivalen
Koefisien
Ekuivalen(coefficient of equivalence) adalah jika mengorelasikan dua
buah tes yang parallel pada kelompok dan waktu yang sama. Metode yang digunakan
untuk memperoleh koefisien ekuivalen adalah metode dengan menggunakan duabuah
bentuk tes yang pararel (equivalen) atau equivalence forms method atau
disebut juga parallel or alternative-forms method. Syarat-syarat yang
harus dipenuhi kedua tes paralel adalah kriteria yang dipakai pada kedua tes
yang sama, masing-masing tes dikontruksikan sendiri, jumlah item, isi dan corak
sama, tingkat kesukaran sama, petunjuk yang digunakan untuk mengerjakan tes,
dan contoh-contoh juga sama. Kemungkinan kesalahan pada teknik ini bersumber
dari derajat keseimbangan antara dua tes tersebut, serta kondisi tempat yang
mungkin berbeda pada kelompok tes pertama dengan kelompok tes kedua, meskipun
dilakukan pada waktu yang sama.
3.
Koefisien
Konsistensi Internal
Koefisien
konsistensi internal (coefficient of internal consistency)adalah
reliabilitas yang didapat dengan jalan mengolerasikan duabuah tes dari kelompok
yang sama, tetapi diambil dari butir-butir yang bernomor genap untuk tes yang
pertama dan butir-butir bernomor ganjil untuk tes yang kedua. Teknik ini sering
disebut spilt-half method. Spilt (membelah) dan half (setengah/separuh).
Jadi, spilt-half adalah tes yang dibagi menjadi dua bagian ang sama,
kemudian mengorelasikan butir soal yang yang bernomor ganjil dalam belahan
pertama (X) dan yang bernomor dua dalam belahan kedua (Y). untuk membagi tes
menjadi dua bagian dapat juga dilakukan dengan jalan mengambil nomor soal
secara acak, tetapi jumlahnya tetap harus sama untuk masing-masing kelompok.
Untuk
menghitung tiga koefisien diatas, dapat digunakan analisis korelasi seperti
pada penguji validitas.Khusus bagi perhitungan koefisien konsistensi internal,
korelasi tersebut baru sebagian dari seluruh tes. Untuk memperoleh koefisien
korelasi secara meneluruh dari tes tersebut harus dihitung dari nomor-nomor
kedua tes itu dengan rumus Spearman Brown:
rnn=
Keterangan: n = panjang
tes yang selalu sama dengan 2 karena seluruh tes = 2x
Contoh:
10 orang peserta didik
dites dalam mata pelajaran IPA dan IPS, jumlah soal masing-masing lima buah.
Dua buah nomor genap diambil dari hasil tes IPA dan tiga buah nomor ganjil
diambi; dari hasil tes IPS. Data diperoleh sebagai berikut:
Tabel 10.5
Nilai 10 Orang Peserta Didik
Dalam Mata Pelajaran IPA dan IPS
Nama
|
Skor IPA
No. Genap (2 dan 4)
|
Skor IPS
No. Ganjil (1,3, dan 5)
|
|||
A
B
C
D
E
F
G
H
I
J
|
8
7
5
8
5
4
5
7
7
9
|
6
7
6
6
6
7
9
5
8
5
|
8
6
6
7
5
4
7
8
5
9
|
7
7
6
6
5
6
5
5
9
9
|
10
5
6
9
5
6
5
4
7
4
|
Tabel 10.6
Perhitungan Koefisien
Konsistensi Internal
X
|
Y
|
X
|
Y
|
x2
|
Y2
|
xy
|
14
14
11
14
11
11
14
12
15
14
|
25
8
18
22
15
16
17
17
20
22
|
+1
+1
-2
+1
-2
-2
+1
-1
+2
+1
|
+6
-1
-1
+3
-4
-3
-2
-2
+1
+3
|
1
1
4
1
4
4
1
1
4
1
|
36
1
1
9
16
9
4
4
1
9
|
6
-1
2
3
8
6
-2
2
2
3
|
130
|
190
|
|
|
22
|
90
|
29
|
= 13
|
= 13
|
rxy
=
0,65
Untuk menghitung
seluruh tes itu, dapat digunakan rumus Spearman Brown sebagai berikut:
Rnn
=
=
=
=
0,787
Disamping itu, dapat
pula digunakan teknik Kuder-Richardson (dua orang ahli psikometri yang
merumuskan persamaan untuk mencari reliabilitas) yang lebih popular dengan
istilah KR20.Salah satu rumus Kr20 adalah sebagai
berikut:
rtt
=
Contoh:
10 orang peserta didik
dites dengan 10 butor soal bentuk objektif. Hasil perhitungan adalah sebagai
berikut:
Nama
|
Nomor Soal
|
X
|
X2
|
|||||||||
1
|
2
|
3
|
4
|
5
|
6
|
7
|
8
|
9
|
10
|
|||
A
|
0
|
0
|
1
|
1
|
1
|
1
|
1
|
1
|
0
|
1
|
7
|
49
|
B
|
0
|
1
|
1
|
1
|
1
|
0
|
1
|
1
|
1
|
1
|
8
|
64
|
C
|
1
|
1
|
0
|
1
|
1
|
1
|
1
|
1
|
1
|
1
|
9
|
81
|
D
|
1
|
1
|
1
|
1
|
0
|
0
|
0
|
0
|
1
|
1
|
6
|
36
|
E
|
1
|
0
|
1
|
0
|
1
|
1
|
0
|
1
|
1
|
1
|
7
|
49
|
F
|
1
|
1
|
1
|
1
|
1
|
0
|
0
|
0
|
0
|
0
|
5
|
25
|
G
|
1
|
1
|
0
|
0
|
0
|
0
|
1
|
1
|
1
|
1
|
6
|
36
|
H
|
0
|
1
|
1
|
1
|
1
|
1
|
1
|
1
|
0
|
0
|
7
|
49
|
I
|
1
|
0
|
1
|
0
|
0
|
0
|
0
|
0
|
1
|
1
|
4
|
16
|
J
|
1
|
1
|
1
|
0
|
0
|
0
|
0
|
0
|
0
|
0
|
3
|
9
|
Σ
|
7
|
7
|
8
|
6
|
6
|
4
|
5
|
6
|
6
|
7
|
6
2
|
41
4
|
Pp
|
00,7
|
00,7
|
00,8
|
00,6
|
00,6
|
00,4
|
00,5
|
00,6
|
00,6
|
0,7
|
||
2qq
|
00,3
|
00,3
|
00,2
|
00,4
|
00,4
|
00,6
|
00,5
|
00,4
|
00,4
|
0,3
|
||
ppq
|
00,2
|
00,2
|
00,1
|
00,2
|
00,2
|
00,2
|
00,2
|
00,2
|
00,2
|
0,2
|
Keterangan:
p = proporsi peserta
didik yang menjawab betul dari suatu butir soal
q = 1-p
S21 =
=
=
=
=
3,288
k = 10 (jumlah butir soal)
Σp.q = 2,24
KR20 =
=
=
= 1,11 (0,318) = 0,35
Teknik Kuder-Richardson
biasanya digunakan jika suatu instrument mengukur satu gejala psikologis
atau perilaku yang sama. Artinya, tes tersebut dapat dikatakan reliabel bila
terbukti ada konsistensi jawaban antara soal yang satu dengan yang lainnya.Jika
sifat dan tingkatan homogenitas antar soal tidak terpenuhi, maka tes tersebut
dianggap mengukur lebih dari satu variabel.Jika dalam suatu tes terdapat lebih
dari satu skala pengukuran atau mengukur lebih dari satu variabel dan setiap
variabel memiliki beberapa aspek, maka pengecekan reliabilitas dilakukan
terhadap masing-masing skala pengukuran.Teknik ini lebih cocok untuk tes yang
menggunakan soal dua pilihan dengan salah satu jawaban benar.
Teknik lain yang biasa
digunakan untuk menguji konsistensi internal dari suatu tes adalah Cronbach’s
Alpha atau Koefisien Alpha. Perbedaannya dengan teknik Kuder-Richardson adalah
teknik ini tidak hanya digunakan untuk tes dengan dua pilihan saja, tetapi
penerapannya lebih luaas, seperti menguji reliabilitas skala pengukuran sikap
dengan tiga, lima atau tujuh pilihan. Adapun rumus yang digunakan untuk
menghitung Koefisien Alpha adalah:
α =
Keterangan:
R = jumlah butir soal
σi2 =
varian butir soal.
σx2 =
varian skor total
Untuk butir soal yang
bersifat dikotomi seperti pilihan ganda, varian butir soal diperoleh dengan
rumus:
σx2 =
Piqi
3. Objektivitas
Objektif berarti tidak
adanya unsur pribadi yang mempengaruhinya. Lawan dari objektif adalah
subjektif, artinya terdapat unsur pribadi yang masuk mempengaruhi. Sebuah tes
dikatakan memiliki objektivitas apabila dalam melaksanakan tes tidak ada factor
subjektif yang mempengaruhi, terutama dalam system skoringnya.[4]
Ada dua factor yang
mempengaruhi subjektivitas dari suatu tes, yaitu : bentuk tes dan penilai.
Bentuk tes uraian akan memberi banyak kemungkinan kepada penilai untuk
memberikan penilaian menurut caranya sendiri. Dengan demikian maka hasil dari
seorang siswa yang mengerjakan soal dari sebuah tes, akan memperoleh skor yang
berbeda apabila dinilai oleh dua orang. Itulah sebabnya pada waktu sekarang ini
ada kecenderungan penggunaan tes objektif di berbagai bidang. Untuk menghindari
masuknya unsur subjektivitas dari penilai, maka system skoringnya dapat
dilakukan dengan sebaik-baiknya, antara lain dengan membuat pedoman scoring
terlebih dahulu.
Subjektivitas dari
penilai akan dapat masuk secara lebih leluasa terutama pada tes bentuk uraian.
Factor-faktor yang mempengaruhi subjektivitas penilai antara lain :
a.
Kesan penilai
terhadap siswa (halo effect)
b.
Bentuk tulisan
c.
Gaya bahasa yang
digunakan
d.
Peserta tes
e.
Waktu mengadakan
penilaian
f.
Kelelahan,dsb.
Untuk menghindari atau
mengurangi masuknya unsur subjektivitas dalam penilaian, maka penilaian harus
dilaksanakan :
a. Secara
kontinu (terus-menerus) sehingga akan diperoleh gambaran yang lebih jelas
tentang keadaan siswa. Tes yang diadakan secara on the spot dan hanya
satu kali (one shot) atau dua kali, tidak akan dapat memberikan hasil
yang objektif tentang keadaan siswa. Kalo misalnya ada seorang anak yang
sebetulnya pandai, tetapi pada waktu guru mengadakan tes dia sedang dalam
kondisi yang jelek, maka kemungkinan nilai tesnya juga jelek. Hal ini tidak
menggambarkan kemampuan anak yang sebenarnya.
b. Secara
komprehensif (menyeluruh), yaitu mencakup keseluruhan materi, mencakup berbagai
aspek berfikir (ingatan, pemahaman, analisis, aplikasi dan sebagainya), dan
melalui berbagai cara, yaitu : tes tertulis, tes lisan, tes perbuatan,
pengamatan dan sebagainya.
4. Praktikabilitas
Artinya
mudah di gunakan jika instrumen sudah memenuhi syarat-syarat tapi sukar di
gunakan, berarti tidak praktis, kepraktisan ini bukan hanya di lihat dari
penyusunan instrumen, tetapi juga bagi orang lain yang ingin menggunakan
instrumen tersebut.[5]
Kepraktisan merupakan
syarat suatu tes standar. Namun, kebanyakan orang membuat tes hanya untuk kepentingan
dirisendiri, tidak berpikir untuk orang lain. Akibatnya, ketika tes tersebut
digunkan orang lain, maka orang tersebut akan merasa kesulitan. Kepraktisan
mempunyai arti kemudahan suatu tes, baik dalam mempersiapkan, menggunakan,
mengolah dan menafsirkan, serta mengadministrasikannya.
Sebuah tes dikatakan
memiliki praktikabilitas yang tinggi apabila tes tersebut bersifat praktis,
mudah pengadministrasiannya. Tes yang praktis adalah tes yang :
a.
Mudah
dilaksanakan, artinya tidak menuntut peralatan yang banyak dan memberi
kebebasan kepada siswa untuk mengerjakan terlebih dahulu bagian yang dianggap
mudah oleh siswa
b.
Mudah
pemeriksaannya, artinya bahwa tes itu dilengkapi dengan kunci jawaban maupun
pedoman skoringnya. Untuk soal bentuk objektif, pemeriksaan akan lebih mudah
dilakukan jika dikerjakan oleh siswa dalam lembar jawaban.
c.
Dilengkapi
dengan petunjuk-petunjuk sehingga dapat diberikan oleh orang lain.
Dimyati dan Mudjiono (1994) mengemukakan
faktor-faktor yang mempengaruhi kepraktisan instrument evaluasi meliputi:
1.
Kemudahan
mengadministrasi
Jika instrumen
evaluasi diadministrasikan oleh guru atau orang lain dengan kemampuan yang
terbatas, kemudahan pengadministrasian adalah suatu kualitas penting yang
diminta dalam instrumen evaluasi. Untuk memberikan kemudahan instrument
evaluasi dapat dilakukan dengan jalan memberi petunjuk yang sederhana dan
jelas, subtessebaiknya relative sedikit, dan pengaturan tempo tes sebaiknya
tidak menimbulkan kesulitan. Kesalahan-kesalahan alat ukur atau instrumen
evaluasi akan menurunkan kepraktisannya, sehingga dapat menebabkan berkurangnya
validitas dan reliabilitas suatu alat ukur.
2.
Waktu
yang digunakan untuk melancarkan evaluasi
Kepraktisan
dipengaruhi oleh faktor waktu yang disediakan untuk melancarkan evaluasi.Waktu
antara 20-60 menit yang disediakan untuk melancarkan evaluasi merupakan waktu
yang cukuo memberikan kepraktisan.
3.
Kemudahan
menskor
Peskoran
merupakan hal yang paling membodankan dan mengganggu dalam melancarkan kegiatan
evaluasi.Untuk memberikan kemudahan penskoran diperlukan upaya perbaikan
petunjuk peskoran dan lebih memudahkan kunci penskoran, pemisahan lembar
jawaban dari lembar soal, dan peskoran menggunakan mesin.
4.
Kemudahan
interpretasi dan aplikasi
Dalam analisis
terakhir, keberhasilan atau kegagalan evaluasi ditentukan oleh penggunaan
evaluasi. Jika hasilnya ditafsirkan secara tepat dan diterapkan secara efektif,
maka hasil evaluasi akan mendukung pada pembelajaran yang lebih tepat, untuk
memudahkan interpretasi dan aplikasi hasil evaluasi diperlukan petunjuk yang
jelas.
5.
Tersedianya
bentuk instrument evaluasi yang ekuivalen atau sebanding.
Bentuk-bentuk
ekuivalen untuk tes yang sama seringkali diperlukan untuk berbagai kegunaan
pendidikan.Bentuk-bentuk ekuivalen dari sebuah tes mengukur aspek-aspek
perilaku melalui butir-butir tes yang memiliki kesamaan dalam isi, tingkat
kesulitan, dan karakteritik lainnya. Dengan demikian, satu bentuk tes dapat
menggantikan yang lain, sedangkan alat ukur atau instrument evaluasi yang
sebanding adalah instrument evaluasi yang memiliki kemungkinan dibandingkan
makna dari skala skor umum yang dimiliki, sehingga untuk tes berseri cukup menggunakan
satu skala skor. Adanya bentuk-bentuk yang ekuivalen atau sebanding dari
instrument akan mempraktiskan kegiatan evaluasi.
5. Ekonomis
Yang dimaksud dengan
ekonomis disini adalah bahwa pelaksanaan tes tersebut tidak membutuhkan biaya
yang mahal, tenaga yang banyak dan waktu yang lama.[6]
6. Relevan
Artinya
instrumen yang di gunakan harus sesaui dengan standart kpmpetensi, kompetensi
dasar, indikator,yang telah di tetpakan. Dalam konteks penilaian hasil
belajar,maka istrumen harus sesuai dengan domain hasil belajar, sepeti domain
kognitif, afektif dan psikomotorik. Jangan smapai mengukur domain kognitif
menggunakan instrumen non tes. Hal itu tentu tidak relevan.
7. Reprensentatif
Artinya
materi instrumen harus betul-betul mewakili seluruh instrumen yang di sampaikan
. Hal ini dapat di lakukan bila penyusunan instrumen menggunanakan silabus
sebagai acuan pemilihan materi tes. Guru juga harus memperhatikan proses
seleksi materi. Mana materi yang bersifat aplikatif dan mana yang tidak. Mana
yang penting dan mana yang tidak.[7]
8. Dekriminatif.
Artinya
instrumen itu harus di susun sedemikian rupa sehingga dapat menunjukan
perbedaan-perbedaan sekecil apapun. Semakin baik suatu instrumen maka semakin
mampu instrumen tersebut menunjukan perbedaan secara teliti. Untuk mengetahui
apakah instrumen cukup dekriminatif atau tidak, biasanya di lakukan uji daya
pembeda instrumen tersebut.
9. Spesisifik
Artinya
suatu instrumen disusun di gunakan khusus untuk obyek evaluasi . jika instrumen
tersebut menggunakan tes,maka jawaban tes jangan menimbulkan ambivalensi atau
spekulasi.
10.
Proporsional
Artinya
suatu instrumen harus memilik tingkat kesuliatan yang proporsional antara sulit
sedang dan mudah. Begitu juga ketika menentukan jenis instrumen.
Baik
tes ,maupun non tes dalam
buku Succesful teaching karangan J. Mursel yang di terjemahkjan dalam bahasa
indonesia oleh J. Mursel dan S. Nasution di kemukakan bahwa ciri-ciri evaluasi
baik adalah “evaluasi dan hasil langsung , evaluasi dan transfer dan evaluasi
langsung dari proses belajar”. Apa yang di kemukakn oleh J. Mursel sebenarya
lebih di khususkan pada ciri-ciri penilaian proses dan hasil belajar bukan
ciri-ciri evaluasi umum.
-
Evaluasi hasil langsung
Dalam
proses pembelajaran guru sering melakukan kegiatan evaluasi, Bik ketika proses
pembelajaran sedang berlangsung atau maupun proses pembelajaran sudah selesai ,
jika evaluasi pembelajaran sedang berlangsung maka guru ingi mengetahui
keefektifan dan kesesuaian strategi pembelajarn dengan tujuan yang ingin di
capai. Jika evaluasi di laukikan sesudah proses pembelajaran selesai berarti
guru ingin mengetahui hasil tatau prestasi belajar yang di peroleh peserta
didik.
-
Evaluasi dan transfer
Hal
penting dalam proses belajar adalah kemungkinan mentransfer hasil yang
dipelajari kedalam situasi yang fungsional. Dasar pemikiran ini merupakan asas
psikologis yang logis dan rasional. Peserta didik tidak di katakan telah
menguasai ilmu komputer (misalnya) jika ia blum dapat menggunakanya dalam
berbagai dalam bidang kehidupan sehari-hari.
Ada
dua sebab mengapa hasil belajar yang mengakibatkan dan berhubungan dengan
proses transfer menjadi penting artinya dalam proses evaluasi. Pertama. Hasil
belajar itu menyataka secara khusus dan sejelas-jelasnya kepada guru mengenai
apa yang sebenarnya terjadi maupun tidak terjadi, dan sampai dimana pula telah
tercapai hasil belajar yang penuh makna serta autentik sifatnya. Kedua . hasil
belajar sangat erat hubunganya denga tujuan peserta didik belajar, sehingga
mempunyai efek yang sangat kuat terhadap pembentukan pola dan karatkter belajar
yang di lakukan peserta didik.
-
Evaluasi langsung dari proses belajar
Di
samping harus mengetahui hasil belajar, guru juga harus menilai proses belajar.
Hal ini di maksudkan agar hasil belajar dapat di organisasi sedemikian rupa,
sehingga mencapai hasil yang optimal. Guru dapat mengetahui proses belajar apa
yang di lalui peserta didik dalam mempelajari sesuatu. Misalnya apakah peserta
ddik dalam mempelajari bahasa inggris cukup sekedar mempelajari dan menghafal
perbendaharaan kata ataukah dia mempelajari seluk beluk bahasa inggir untuk
memahami dan memecahkan msasalah-masalah kehidupan.
Seorang
peserta didik tidak dapat belajar dengan baik, karena dia tidak menggunakan
konteks yang baik. Dia tidak menggunakan bermacam-macam sumber dan tidak
menggunakan situsi-situasi yang konkret. Peserta didik tidak dapat belajar
dengan baik karena tidak mempunyai fokus tertentu misalnya tidak melihat
masalah-masalah pokok yang di pecahkan atau munkin pula tidak sesuai dengan
bakat dan minatnya (individualisasi) serta tidak menduiskusikannya dengan orang
lain( sosialiasasi). Jadi, dalam evaluasi pembelajaran , guru jangan terfokus
hasil belajar saja. Tapi juga harus memperhatikan transfer hasil belajar dan
proses belajar yang di jalani oleh peserta diidik.
BAB III
PENUTUP
A. Kesimpulan
Dalam
proses evaluasi pembelajaran atau penilaian proses dan hasil belajar,guru
sering menggunakan instrumen tertentu baik tes maupun non tes
(Observasi,wawancara, skala sikap anket dan lain-lain) Intrumen mempunyai
fungsi dan peran yang sangat penting dalam rangka mengetahui keefektifan proses
pembelaran di sekolah. Mengingat pentingnya suatu instrumen dalam suatu
kegiatan evaluasi pembelajaran
maka suatu instrumen harus memliki syarat-syarat tertentu sekaligus menunjukan
karakterisitik instrumen. Juga agar kita bisa mengetahui analisa kualitas tes
tersebut.
Evaluasi
sangat berguna dalam meningkatkan kualitas sistem pembelajaran. bagi para
pembuat nilai, hendaknya instrumen evaluasi yang akan diterapkan, diharapkan
memenuhi beberapa kriteria agar meminimalisir bahkan mengilangkan kesalahan
yang tidak valid. sehingga penilaian yang diberikan bisa adil dan sesuai
kenyataan. karena sampai saat ini,terkadang masih banyak terjadi kekeliruan
dalam hal penilaian
Suharsimi Arikunto
(2008 : 57-62) menyatakan bahwa suatu tes dapat dikatakan baik apabila memenuhi
lima persyaratan, yaitu : validitas, reliabilitas, objektivitas,
praktikabilitas dan ekonomis. Untuk itu
diperlukanlah kaidah-kaidah instrumen yang mangarahkan dalam hal evaluasi.
adapun kaidah tersebut adalah:
Validitas,
Realibitas, Objektivitas, Praktikabilitas, Ekonomis, Relevan, Representatif,
Deskriminatif, Spesifik, Porposional.
DAFTAR PUSTAKA
-
Zainal Arifin, Evaluasi
Pembelajaran, PT Rosdakarya, Bandung : 2012
-
Drs.M.Ngalim
Purwanto, Prinsip-Prinsip Dan Teknik Evaluasi Pengajaran, PT Remaja
Rosdakarya, Bandung : 2006
-
Eko putro
widoyoko. Evaluasi program pembelajaran. Pustaka Belajar, Yogyakarta : 2004.
-
Sukiman, S. Ag.,
M. Pd..Pengembangan sistem Evaluasi PAI. Yogyakarta: UIN Sunan Kalijaga
Yogyakarta : 2008
-
Prof. H. M.
Sukardi, MS., Ph.d.. Evaluasi pendidikan. Jakarta: Bumi Aksara. : 2009
-
Prof. Dr. Anas
Sudijono.Evaluasi Pendidikan. Jakarta: PT. Raja Grafindo Persada : 2006
[1] Zainal
Arifin, Evaluasi Pembelajaran, PT Rosdakarya, Bandung 2012 hal 122
[2]
Zainal Arifin, Evaluasi Pembelajaran, PT Rosdakarya, Bandung 2012 hal
135
[3]
Drs.M.Ngalim Purwanto, Prinsip-Prinsip Dan Teknik Evaluasi Pengajaran, PT
Remaja Rosdakarya, Bandung, 2006 hal 138
[4] Eko putro
widoyoko. Evaluasi program pembelajaran. Pustaka Belajar, Yogyakarta 2004. h Hal 258-265
[5] Eko putro
widoyoko. Evaluasi program pembelajaran. Pustaka Belajar, Yogyakarta 2004. h Hal 258-265
[7]
Zainal Arifin, Evaluasi Pembelajaran, Bandung, 2012 hal