Our Favorit Class,,,,,: Desember 2013

Kriteria Instrument pemilihan evaluasi pembelajaran

BAB I

PENDAHULUAN

A. Latar Belakang

Sebagai alat untuk mengukur prestasi belajar siswa tes dimaksudkan untuk mengukur tingkat perkembangan atau kemajuan yang telah dicapai siswa setelah menempuh proses belajar mengajar dalam waktu tertentu.

Analisis kualitas tes merupakan suatu tahap yang harus ditempuh untuk mengetahui derajat kualitas suatu tes, baik secara keseluruhan maupun butir soal yang menjadi bagian dari tes tersebut. Dalam penilaian hasil belajar, tes diharapkan dapat menggambarkan sempel perilaku dan menghasilkan nilai yang objektif serta akurat. Jika tes yang digunakan guru kurang baik, maka hasil yang diperoleh pun tentunya kurang baik. Hal ini dapat merugikan peserta didik itu sendiri. Artinya, hasil yang diperoleh peserta didik menjadi tidak objektif dan tidak adil. Oleh sebab itu, tes yang digunakan guru harus memiliki kualitas yeng lebih baik dilihat dari berbagai segi. Tes hendaknya disusun sesuai dengan prinsip dan prosedur penyusunan tes. Setelah digunakan perlu diketahui apakah tes tersebut berkualitas baik atau kurang baik. Untuk mengetahui apakah suatu tes yang digunakan termasuk baik atau kurang baik, maka perlu dilakukan analisis kualitas tes. Yaitu dengan mengetahui criteria pemilihan instrument Evaluasi.

B. Rumusan Masalah

1. Bagaimanakah Kriteria pemilihan Instrumen pembelajaran itu?

2. Dan jelaskan kriteria-kriteria yang di maksud !

C. Tujuan Masalah

1. mengetahui Kriteria pemilihan Instrumen pembelajaran itu

2. Agar mengetahui dan paham akan criteria-kriteria pemilihan Instrumen pembelajaran tersebut.

BAB II

PEMBAHASAN

A. Kriteria Pemilihan Instrumen Evaluasi

Pada dasarnya instrument dapat dibagi dua yaitu tes dan non tes. Secara umum tes diartikan sebagai alat yang dipergunakan untuk mengukur pengetahuan atau penguasaan objek ukur terhadap seperangkat konten dan meteri tertentu.

Dalam proses evaluasi pembelajaran atau penilaian proses dan hasil belajar,guru sering menggunakan instrumen tertentu baik tes maupun non tes (Observasi,wawancara, skala sikap anket dan lain-lain) Intrumen mempunyai fungsi dan peran yang sangat penting dalam rangka mengetahui keefektifan proses pembelaran di sekolah. Mengingat pentingnya suatu instrumen dalam suatu kegiatan evaluasi pembelajaran maka suatu instrumen harus memliki syarat-syarat tertentu sekaligus menunjukan karakterisitik instrumen. Juga agar kita bisa mengetahui analisa kualitas tes tersebut.

Evaluasi sangat berguna dalam meningkatkan kualitas sistem pembelajaran. bagi para pembuat nilai, hendaknya instrumen evaluasi yang akan diterapkan, diharapkan memenuhi beberapa kriteria agar meminimalisir bahkan mengilangkan kesalahan yang tidak valid. sehingga penilaian yang diberikan bisa adil dan sesuai kenyataan. karena sampai saat ini,terkadang masih banyak terjadi kekeliruan dalam hal penilaian. bahasa gampangnya mah, terjadi ketidakadilan dalam penilaian.[1] Agar itu semua tidak terjadi perluanya diketahui dengan bagaiman kualitas tes dengan analisa kualitas tes.

Analisis kualitas tes berkaitan dengan pertanyaan apakah tes sebagai suatu alat ukur benar-benar mengukur apa yang hendak dan seharusnya diukur? Sampai mana tes ersebut dapat diandalkan dan berguna? Kedua pertanyaan ini sebenarnya menunjuk pada 2 hal pokok, yaitu validitas dan reabilitas. Kedua hal ini sekaligus merupakan karakteristik alat ukur yang baik.

Suharsimi Arikunto (2008 : 57-62) menyatakan bahwa suatu tes dapat dikatakan baik apabila memenuhi lima persyaratan, yaitu : validitas, reliabilitas, objektivitas, praktikabilitas dan ekonomis. Untuk itu diperlukanlah kaidah-kaidah instrumen yang mangarahkan dalam hal evaluasi. adapun kaidah tersebut adalah:

1. Validitas

Instrumen evaluasi yang baik, hendaknya harus memiliki validitas yang tinggi, artinya evaluasi yang di ukur haruslah sesuai dengan apa yang diukur, sehingga hasil evaluasi dapat dipertanggung jawabkan. paling tidak ada 3 yang harus di perhatikan yakni kognitif,afektif dan psikomotorik.[2]

Alat ukur dikatakan valid apabila alat ukur itu dapat dengan tepat mengukur apa yang hendak diukur. Dengan kata lain validitas berkaitan dengan “ketepatan” dengan alat ukur. Tes sebagai salah satu alat ukur hasil belajar dapat dikatakan valid apabila tes itu dapat tepat mengukur hasil belajar yang hendak diukur. Dengan tes yang valid akan menghasilkan data hasil belajar yang valid pula.

Contoh :

Untuk mengukur tingkat partisipasi siswa dalam proses pembelajaran, bukan diukur melalui skor nilai yang diperoleh pada waktu ujian/ulangan, tetapi dilihat melalui :

a. Kehadiran

b. Terpusatnya perhatian pada pelajaran

c. Ketepatan menjawab pertanyaan-pertanyaan yang diajukan guru dalam arti relevan pada permasalahannya.

Nilai yang diperoleh pada waktu ulangan, bukan menggambarkan partisipasi, tetapi menggambarkan prestasi belajar. Validitas isi sering digunakan dalam penilaian hasil belajar. Tujuan utamanya adalah untuk mengetahui sejauh mana peserta didik menguasai materi pelajaran yang telah disampaikan, dan perubahan-perubahan psikologis apa yang timbul pada diri peserta didik tersebut setelah mengalami proses pembelajaran tertentu. Jika dilihat dari segi kegunannya dalam penilaian hasil belajar, validitas isi ini sering disebut juga validitas kurikuler dan validitas perumusan.

Validitas kurikuler berkenaan dengan pertanyaan apakah materi tes relevan dengan kurikulum yang sudah ditentukan. Pertanyaan ini timbul karena sering terjadi materi tes tidak mencakup keseluruhan aspek yang akan diukur, baik aspek kognitif, afektif, maupun psikomotorik, tetapi hanya pengetahuan yang bersifat fakta-fakta pelajaran tertentu. Diharapkan dengan validitas kurikuler ini timbul ketelitian yang jelas dan totalitas dengan menjelajahi semua aspek yang tercakup dalam kisi-kisi dan Rencana Pelaksanaan Pembelajaran (RPP) yang bersangkutan. Validitas kurikuler ini dapat dilakukan dengan beberapa cara, antara lain mencocokkan materi tes dengan silabus dan kisi-kisi, melakukan diskusi dengan sesama pendidik, atau mencermati kembali substansi dari konsep yang akan diukur.

Dalam literature modern tentang evaluasi, banyak dikemukakan tentang jenis-jenis validitas, antara lain validitas permukaan (face validity), validitas isi ( conten validity), validity empiris (empirical validity), dan validitas konstruk (construct validity), dan validitas factor ( factorial validity).

a. Validitas permukaan

Validitas ini menggunakan kriteria yang sangat sederhana, karena hanya melihat dari sisi muka atau tampang dari instrument itu sendiri. Artinya, jika suatu tes secara sepintas telah dianggap baik untuk mengungkap fenomena yang akan diukur, maka tes tersebut sudah dapat dikatakan memenuhi syarat validitas perukaan, sehingga tidak perlu lagi adanya judgement yang mendalam.

b. Validitas isi

Validitas isi sering digunakan dalam penilaian hasil belajar. Tujuan utamanya adalah untuk mengetahui sejauh mana peserta didik menguasai materi pelajaran yang telah disampaikan, dan perubahan-perubahan psikologis apa yang timbul pada diri peserta didik tersebut setelah mengalami proses pembelajaran tertentu. Jika dilihat dari segi kegunannya dalam penilaian hasil belajar, validitas isi ini sering disebut juga validitas kurikuler dan validitas perumusan

Validitas kurikuler berkenaan dengan pertanyaan apakah materi tes relevan dengan kurikulum yang sudah ditentukan. Pertanyaan ini timbul karena sering terjadi materi tes tidak mencakup keseluruhan aspek yang akan diukur, baik aspek kognitif, afektif, maupun psikomotorik, tetapi hanya pengetahuan yang bersifat fakta-fakta pelajaran tertentu. Diharapkan dengan validitas kurikuler ini timbul ketelitian yang jelas dan totalitas dengan menjelajahi semua aspek yang tercakup dalam kisi-kisi dan Rencana Pelaksanaan Pembelajaran (RPP) yang bersangkutan. Validitas kurikuler ini dapat dilakukan dengan beberapa cara, antara lain mencocokkan materi tes dengan silabus dan kisi-kisi, melakukan diskusi dengan sesame pendidik, atau mencermati kembali substansi dari konsep yang akan diukur.[3]

c. Validitas Empiris

Validitas ini biasanya menggunakan teknik statistic, yaitu analisis korelasi. Hal ini disebabkan validitas empiris mencari hubungan atara skor dengan suatu kriteria tertentu yang merupakan suatu tolak ukur di luar tes yang bersangkutan. Namun, kriteria itu harus relevan dengan dihubungkan dengan kriteria (criterion-related validity) atau validitas statistic (statistical validity). Ada tiga macam validitas empiris, yaitu:

1) Validitas prediktif (predictive validity)

2) Validitas kongkuren (concurrent validity)

3) Validitas sejenis (congruent validity)

Validitas prediktif adalah jika kriteria standar yang digunakan adalah untuk meramalkan prestasi belajar murid masa yang akan dating. Dengan kata lain, validitas prediktif bermaksud melihat hingga mana suatu tes dapat memprakirakan perilaku peserta didik pada masa yang akan dating, sedangkan validitas konkuren adalah jika kriteria standarnya berlainan. Misalnya, skor tes dalam mata pelajaran Bahasa Indonesia dikorelasikan dengan skor tes Bahasa Inggris. Sebaliknya, jika kriteria standarnya sejenis, maka validitas tersebut disebut validitas sejenis. Misalnya, Bahasa Indonesia dengan Bahasa Indonesia.

Dalam mengukur validitas suatu tes hendaknya yang menjadi kriteria sudah betul-betul valid sehingga dapat diandalkan keampuhannya dan dapat dianggap sebagai tes standar. Sebaliknya, bila kriteria tidak valid, maka tes-tes lain yang akan divaliditasi menjadi kurang atau tidak meyakinkan. Suatu tes akan mempunyai koefisien validitas yang tinggi jika tes itu betul-betudl dapat mengukur apa yang hendak diukur dari peserta didik tertentu.

Ada beberapa hal yang harus diperhatikan dalam menginterprestasikan koefisien validitas, antara lain data mengenai karakteritik sampel validitas, prosedur-prosedur dalam pengukuran validitas, dan pola kriteria khusus yang dikorelasikan dengan hasil tes itu. Sehubungan dengan khusus, Anastasia dalam Conny Semiawan Stamboel, mengemukakan ada delapan kriteria sebagai bahan bandingan untuk merumuskan apa yang hendak diselidiki oleh suatu tes, yaitu “diferensiasi umur, kemajuan akademis, kriteria dalam pelaksanaan latihan khusus, kriteria dalam pelaksanaan kerja, penilaian, kelompok yang dipertentangkan, korelasi dengan tes lain, dan konsisten internal”.

Untuk tes hasil belajar, aspek validitas yang paling penting adalah validitas isi. Yang dimaksud dengan validitas isi adalah ukuran yang menunjukkan sejauh mana skor dalam tes berhubungan dengan penguasaan peserta tes dalam bidang studi yang diuji melalui perangkat tes tersebut. Untuk mengetahui tingkat validitas isi tes, diperlukan adanya penilaian ahli yang menguasai bidang studi tersebut. Jadi bersifat analisis kualitatif. Orang yang tidak menguasai isi bidang studi yang dites tentu saja tidak dapat melakukan penilaian tentang isi tes.

Kelompok yang kurang berhasil. Soal-soal yang gagal menunujkkan perbedaan antara kelompok yang berhasil dengan keelompok yang kurang berhasil harus diperbaiki, atau dibuang. Kriteria konsistensi internalnal ini menghasilkan indeks homoginitas soal, tetapi tidak dapat dianggap sepenuhnya sebagai pengganti validitas.

Untuk menguji validitas empiris dapat digunakan jenis statistika korelasi product moment, korelasi perbedaan peringkat, atau korelasi diagram pencar. Berikut ini akan dikemukakan beberapa contoh perhitungan korelasi.

a. Korelasi prduct moment dengan angka simpangan

Rumus r_xy

Keterangan: r = koefisien korelasi

Σxy = jumlah produk x dan y

Contoh:

10 orang peserta didik kelas 11 SMA mendapat nilai dalam mata pelajaran Bahasa Indonesia dan Bahasa Inggris seperti berikut:

Tabel 10.1

Nilai Peserta Didik Kelas 11 SMA dalam

Mata Pelajaran Bahasa Indonesia dan Bahasa Inggris

No.	Nama	B. Indonesia	B. Inggris
1.	A.	5	6
2.	B.	7	8
3.	C.	8	7
4.	D.	5	5
5.	E.	6	7
6.	F.	7	7
7.	G.	4	5
8.	H.	5	7
9.	I.	8	8
10.	J.	6	6

Langkah-langkah penyelesaian:

1) Membuat tabel persiapan seperti berikut:

No.	X	Y	X	Y	x²	Y²	xy

2) Masukkan nilai masing-masing mata pelajaran, dimana nilai Bahasa Indonesia sebagai variabel X dan nilai Bahasa Inggris sebagai variabel Y.

3) Jumlahkan semua nilai yang ada dalam variabel X dan variabel Y, kemudian hitung rata-rata Y.

4) Cari nilai pada kolom x dengan jalan nilai tiap-tiap peserta didik dalam kolom X dikurangi dengan rata-rata X.

5) Cari nilai pada kolom y dengan jalan nilai tiap-tiap peserta didik dalam kolom Y dikurangi dengan rata-rata Y.

6) Cari nilai pada kolom x²dengan jalan menguadratkan masing-masing nilai dalam kolom x.

7) Cari nilai pada kolom y²dengan jalan menguadratkan masing-masing nilai dalam kolom y.

8) Cari nilai pada kolom xy dengan jalan mengalikan tiap-tiap nilai dalam kolom x dengan nilai-nilai dalam kolom y.

Berdasarkan langkah-langkah diatas dapat dihitung koefisien korelasi product moment sebagai berikut.

Tabel 10.2

Perhitungan Korelasi Product Moment dengan

Angka Simpangan

No	Nilai B. Ind (x)	Nilai B. Ing (Y)	X	y	x²	y²	xy
1 2 3 4 5 6 7 8 9 10	5 7 8 5 6 7 4 5 8 6	6 8 7 5 7 7 5 7 8 6	-1,1 0,9 1,9 -1,1 -0,1 0,9 -2,1 -1,1 1,9 -0,1	-0,6 ,4 0,4 -1,6 0,4 0,4 -1,6 0,4 1,4 -0,6	1,21 0,81 3,61 1,21 0,01 0,81 4,41 1,21 3,61 0,01	0,36 1,96 0,16 2,56 0,16 0,16 2,56 1,16 1,96 0,36	0,66 1,26 0,76 1,76 -0,04 0,36 3,36 -0,44 2,66 0,06
Σ	61	66			16,9	10,4	10,4
	6,1	6,6

r_xy = 0,784

Rumus lain korelasi product moment, yaitu:

r.xy =

2. Reliabilitas

Kata reliabilitas dalam bahasa Indonesia diambil dari kata reliability dalam bahasa Inggris, berasal dari kata asal reliable yang artinya dapat dipercaya. Reliabilitas adalah tingkat derajat atau konsistensi dari suatu instrument.Reliabilitas tes berkenaan dengan pertanyaan, apakah suatu tes teliti dan dapat dipercaya sesuai dengan kriteria yang telah ditetapkan. Suatu tes bisa dikatakan reliabel jika selalu memberikan hasil yang sama bila diteskan pada kelompok yang sama pada waktu atau kesempatan yang diteskan berbeda.

Seseorang dikatakan dapat dipercaya jika orang tersebut selalu bicara ajek (konsisten), tidak berubah-ubah pembicaraannya dari waktu ke waktu. Demikian juga halnya dengan sebuah tes. Tes tersebut dikatakan dapat dipercaya (reliable) jika memberikan hasil yang tetap atau konsistenapabila diteskan berkali-kali. Jika kepada siswa diberikan tes yang sama pada waktu yang berlainan, maka setiap siswa akan tetap berada dalam urutan (rangking) yang sama atau konsisten dalam kelompoknya.

Yang dimaksud dengan reabilitas disini adalah ketetapan, artinya ketetapan disini bukanlah hasil evaluasi yang dilakukan kepada seseorang akan memiliki nilai yang sama, tetapi akan mengikuti perkembangan. contohnya misal dilakukan sebuah tes matematika kepada lee min ho, kemudian dia mendapatkan nilai 70. setelah beberpa hari, dilakukan tes kembali maka nilainya tidak harus 70 juga, karena dalam beberapa hari itu terjadi perkembangan pada diri peserta tes.

Ajek atau tetap tidak selalu harus sama, tetapi mengikuti perubahan secara ajek. Jika keadaan A mula-mula berada lebih rendah dibandingkan dengan B, maka jika diadakan pengukuran ulang, si A tetap berada lebih rendah dari B. itulah yang dikatakan ajek atau tetap, yaitu tetap dalam kedudukan siswa diantara anggota kelompok yang lain. Jika dihubungkan dengan validitas maka validitas berhubungan dengan ketepatan sedangkan reliabilitas berhubungan dengan ketetapan atau keajekan.

Menurut Kerlinger (1986), reliabilitas dapat diukur dari tiga kriteria, yaitu stability (menunjukkan keajegan suatu tes dalam mengukur gejala yang sama pada waktu tertentu), dependability (menunjukkan kemantapan suatu tes atau seberapa jauh tes dapat diandalkan), dan predictability (menunjukkan kemampuan tes untuk meramalkan hasil pada pengukuran gejala selanjutnya. Untuk menunjukkan relaibilitas suatu tes, antara lain dapat dilakukan dengan memperbanyak butir soal.

Menurut Grounlund (1985), Terdapa 4 faktor yang dapat mempengaruhi reliabilitas, yaitu:

1. Panjang tes (length of test). Panjang tes berarti banyaknya soal tes. Ada kecenderungan, semakin panjang tes akan lebih tinggi reliabilitas suatu tes, karena semakin banyak soal, maka akan semakin banyak sampel yang diukur dan proporsi jawaban yang benar semakin banyak, sehingga factor tebakan (guessing) akan semakin rendah.

2. Sebaran skor (spread of scores). Besarnya sebaran skor akan membuat tingkat reliabilitas menjadi lebih tinggi, karena koefesien reliabilitas yang lebih besar diperoleh ketika peserta didik tetap berada pada posisi yang relatif sama dalam satu kelompok pengujian kepengujian berikutnya. Dengan kata lain, peluang selisih dari perubahan posisi dalam kelompok dapat memperbesar koefisien reliabilitas.

3. Tingkat kesukaran (difficult indeks). Dalam penilaian yang menggunakan penilaian acuan norma, baik untuk soal yang mudah maupun yang sukar, cenderung menghasilkan tingkat reliabilitas yang rendah. Tingkat kesukaran tes yang ideal untuk meningkatkan koefisien reliabilitas adalah soal yang menghasilkan sebaran skor yang menghasilkan sebaran skor berbentuk genta atau kurva normal.

4. Objektifitas (obyektivity). Objektivitas disini menunjukkan skor tes kemampuan yang sama antara peserta didik yang satu dengan lainnya. Peserta didik memperoleh hasil yang sama dalam mengerjakan suatu tes. Jika peserta didik memiliki tingkat kemampuan yang sama, maka akan memperoleh hasil tes yang sama. Objektivitas prosedur tes yang tinggi akan memperoleh reliabilitas hasil tes yang tidak dipengaruhi oleh prosedur penskoran.

Konsep reliabilitas mendasari kesalahan pengukuran yang mungkin terjadi pada suatu proses pengukuran atau pada nilai tunggal tertentu, sehingga menimbulkan perubahan pada susunan kelompoknya (error of measurement). Misalna, guru mengetes pserta didik dengan instrument tertentu dan mendapat nilai 70. Kemudian pada kesempatan yang berbeda dengan instrument yang sama, guru melakukan tes kembali, ternyata peserta didik tersebut mendapat nilai 75. Artinya, tes tersebut tidak reliabel, karena terjadi kesalahan pengukuran. Tes yang reliabel adalah apabila koefisien reliabilitasnya tinggi dan kesalahan baku pengukurannya (standar error of measurement) rendah.

Menurut perhitungan product moment dari Pearson, ada 3 macam reliabilitas, yaitu:

1. Koefisien Stabilitas

Koefisien stabilitas(coefficient of stability) adalah jenis reliabilitas yang menggunakan teknik test and re-test, yaitu memberikan tes kepada sekelompok indvidu, kemudian diadakan pengulangan tes pada kelompok yang sama dengan waktu yang berbeda. Cara memperoleh koefisien stabilitas adalah dengan mengolerasikan hasil tes pertama dengan hasil tes kedua dari kelompok yang sama, tes yang sama, pada waktu yang berbeda. Jika antara waktu tes pertama dengan tes kedua cukup lama, kemudian diadakan latihan-latihan tambahan, maka bisa jadi tes kedua akan lebih besar daripada tes pertama. Sebaliknya jika antara waktu tes pertama dengan kedua relative pendek, maka nilai tes kedua bisa jadi sama atau lebih besar daripada tes pertama karena soal dan jawaban masih dapat diingat.

Kesalahan teknis ini dapat bersumber dari berbagai factor, sehingga menebabkan peserta didik mempunyai skor yang berbeda pada saat dua kali mengerjakan tes yang sama. Bisa saja perubahan skor yang terjadi bukan disebabkan perubahan hal yang diukur, tetapi memang karena situasi yang berbeda atau pengalaman dari peserta didik pada saat mengikuti tes yang pertama, sehingga ketika mengerjakan tes yang kedua, peserta didik lebih berhati-hati dan lebih baik hasilnya. Keunggulan teknik ini adalah dapat memperkecil kemungkinan masukna sumber kesalahan yang lain. Namun, patut juga dipertimbangkan bahwa penggunaan kelompok yang sama dan tes ang sama dalam duakali tes akan mempengaruhi hasil tes yang kedua, karena responden sudah memiliki pengalaman mengerjakan tes yang pertama, hal ini sekaligus menunjukkan kelemahan teknik test and retest.

2. Koefisien Ekuivalen

Koefisien Ekuivalen(coefficient of equivalence) adalah jika mengorelasikan dua buah tes yang parallel pada kelompok dan waktu yang sama. Metode yang digunakan untuk memperoleh koefisien ekuivalen adalah metode dengan menggunakan duabuah bentuk tes yang pararel (equivalen) atau equivalence forms method atau disebut juga parallel or alternative-forms method. Syarat-syarat yang harus dipenuhi kedua tes paralel adalah kriteria yang dipakai pada kedua tes yang sama, masing-masing tes dikontruksikan sendiri, jumlah item, isi dan corak sama, tingkat kesukaran sama, petunjuk yang digunakan untuk mengerjakan tes, dan contoh-contoh juga sama. Kemungkinan kesalahan pada teknik ini bersumber dari derajat keseimbangan antara dua tes tersebut, serta kondisi tempat yang mungkin berbeda pada kelompok tes pertama dengan kelompok tes kedua, meskipun dilakukan pada waktu yang sama.

3. Koefisien Konsistensi Internal

Koefisien konsistensi internal (coefficient of internal consistency)adalah reliabilitas yang didapat dengan jalan mengolerasikan duabuah tes dari kelompok yang sama, tetapi diambil dari butir-butir yang bernomor genap untuk tes yang pertama dan butir-butir bernomor ganjil untuk tes yang kedua. Teknik ini sering disebut spilt-half method. Spilt (membelah) dan half (setengah/separuh). Jadi, spilt-half adalah tes yang dibagi menjadi dua bagian ang sama, kemudian mengorelasikan butir soal yang yang bernomor ganjil dalam belahan pertama (X) dan yang bernomor dua dalam belahan kedua (Y). untuk membagi tes menjadi dua bagian dapat juga dilakukan dengan jalan mengambil nomor soal secara acak, tetapi jumlahnya tetap harus sama untuk masing-masing kelompok.

Untuk menghitung tiga koefisien diatas, dapat digunakan analisis korelasi seperti pada penguji validitas.Khusus bagi perhitungan koefisien konsistensi internal, korelasi tersebut baru sebagian dari seluruh tes. Untuk memperoleh koefisien korelasi secara meneluruh dari tes tersebut harus dihitung dari nomor-nomor kedua tes itu dengan rumus Spearman Brown:

r_nn=

Keterangan: n = panjang tes yang selalu sama dengan 2 karena seluruh tes = 2x

Contoh:

10 orang peserta didik dites dalam mata pelajaran IPA dan IPS, jumlah soal masing-masing lima buah. Dua buah nomor genap diambil dari hasil tes IPA dan tiga buah nomor ganjil diambi; dari hasil tes IPS. Data diperoleh sebagai berikut:

Tabel 10.5

Nilai 10 Orang Peserta Didik

Dalam Mata Pelajaran IPA dan IPS

Nama	Skor IPA No. Genap (2 dan 4)		Skor IPS No. Ganjil (1,3, dan 5)
A B C D E F G H I J	8 7 5 8 5 4 5 7 7 9	6 7 6 6 6 7 9 5 8 5	8 6 6 7 5 4 7 8 5 9	7 7 6 6 5 6 5 5 9 9	10 5 6 9 5 6 5 4 7 4

Tabel 10.6

Perhitungan Koefisien Konsistensi Internal

X	Y	X	Y	x²	Y²	xy
14 14 11 14 11 11 14 12 15 14	25 8 18 22 15 16 17 17 20 22	+1 +1 -2 +1 -2 -2 +1 -1 +2 +1	+6 -1 -1 +3 -4 -3 -2 -2 +1 +3	1 1 4 1 4 4 1 1 4 1	36 1 1 9 16 9 4 4 1 9	6 -1 2 3 8 6 -2 2 2 3
130	190			22	90	29
= 13	= 13

r_xy = 0,65

Untuk menghitung seluruh tes itu, dapat digunakan rumus Spearman Brown sebagai berikut:

R_nn= = = = 0,787

Disamping itu, dapat pula digunakan teknik Kuder-Richardson (dua orang ahli psikometri yang merumuskan persamaan untuk mencari reliabilitas) yang lebih popular dengan istilah KR_20.Salah satu rumus Kr₂₀ adalah sebagai berikut:

r_tt =

Contoh:

10 orang peserta didik dites dengan 10 butor soal bentuk objektif. Hasil perhitungan adalah sebagai berikut:

Nama	Nomor Soal										X	X²
Nama	1	2	3	4	5	6	7	8	9	10	X	X²
A	0	0	1	1	1	1	1	1	0	1	7	49
B	0	1	1	1	1	0	1	1	1	1	8	64
C	1	1	0	1	1	1	1	1	1	1	9	81
D	1	1	1	1	0	0	0	0	1	1	6	36
E	1	0	1	0	1	1	0	1	1	1	7	49
F	1	1	1	1	1	0	0	0	0	0	5	25
G	1	1	0	0	0	0	1	1	1	1	6	36
H	0	1	1	1	1	1	1	1	0	0	7	49
I	1	0	1	0	0	0	0	0	1	1	4	16
J	1	1	1	0	0	0	0	0	0	0	3	9
Σ	7	7	8	6	6	4	5	6	6	7	6 2	41 4
Pp	00,7	00,7	00,8	00,6	00,6	00,4	00,5	00,6	00,6	0,7
2qq	00,3	00,3	00,2	00,4	00,4	00,6	00,5	00,4	00,4	0,3
ppq	00,2	00,2	00,1	00,2	00,2	00,2	00,2	00,2	00,2	0,2

Keterangan:

p = proporsi peserta didik yang menjawab betul dari suatu butir soal

q = 1-p

S²₁= = = = = 3,288

k = 10 (jumlah butir soal)

Σp.q = 2,24

KR₂₀= = =

= 1,11 (0,318) = 0,35

Teknik Kuder-Richardson biasanya digunakan jika suatu instrument mengukur satu gejala psikologis atau perilaku yang sama. Artinya, tes tersebut dapat dikatakan reliabel bila terbukti ada konsistensi jawaban antara soal yang satu dengan yang lainnya.Jika sifat dan tingkatan homogenitas antar soal tidak terpenuhi, maka tes tersebut dianggap mengukur lebih dari satu variabel.Jika dalam suatu tes terdapat lebih dari satu skala pengukuran atau mengukur lebih dari satu variabel dan setiap variabel memiliki beberapa aspek, maka pengecekan reliabilitas dilakukan terhadap masing-masing skala pengukuran.Teknik ini lebih cocok untuk tes yang menggunakan soal dua pilihan dengan salah satu jawaban benar.

Teknik lain yang biasa digunakan untuk menguji konsistensi internal dari suatu tes adalah Cronbach’s Alpha atau Koefisien Alpha. Perbedaannya dengan teknik Kuder-Richardson adalah teknik ini tidak hanya digunakan untuk tes dengan dua pilihan saja, tetapi penerapannya lebih luaas, seperti menguji reliabilitas skala pengukuran sikap dengan tiga, lima atau tujuh pilihan. Adapun rumus yang digunakan untuk menghitung Koefisien Alpha adalah:

α =

Keterangan:

R = jumlah butir soal

σ_i²= varian butir soal.

σ_x²= varian skor total

Untuk butir soal yang bersifat dikotomi seperti pilihan ganda, varian butir soal diperoleh dengan rumus:

σ_x²= P_iq_i

keterangan: P₁adalah tingkat kesukaran soal danq_iadalah (1-p_i)

3. Objektivitas

Objektif berarti tidak adanya unsur pribadi yang mempengaruhinya. Lawan dari objektif adalah subjektif, artinya terdapat unsur pribadi yang masuk mempengaruhi. Sebuah tes dikatakan memiliki objektivitas apabila dalam melaksanakan tes tidak ada factor subjektif yang mempengaruhi, terutama dalam system skoringnya.[4]

Ada dua factor yang mempengaruhi subjektivitas dari suatu tes, yaitu : bentuk tes dan penilai. Bentuk tes uraian akan memberi banyak kemungkinan kepada penilai untuk memberikan penilaian menurut caranya sendiri. Dengan demikian maka hasil dari seorang siswa yang mengerjakan soal dari sebuah tes, akan memperoleh skor yang berbeda apabila dinilai oleh dua orang. Itulah sebabnya pada waktu sekarang ini ada kecenderungan penggunaan tes objektif di berbagai bidang. Untuk menghindari masuknya unsur subjektivitas dari penilai, maka system skoringnya dapat dilakukan dengan sebaik-baiknya, antara lain dengan membuat pedoman scoring terlebih dahulu.

Subjektivitas dari penilai akan dapat masuk secara lebih leluasa terutama pada tes bentuk uraian. Factor-faktor yang mempengaruhi subjektivitas penilai antara lain :

a. Kesan penilai terhadap siswa (halo effect)

b. Bentuk tulisan

c. Gaya bahasa yang digunakan

d. Peserta tes

e. Waktu mengadakan penilaian

f. Kelelahan,dsb.

Untuk menghindari atau mengurangi masuknya unsur subjektivitas dalam penilaian, maka penilaian harus dilaksanakan :

a. Secara kontinu (terus-menerus) sehingga akan diperoleh gambaran yang lebih jelas tentang keadaan siswa. Tes yang diadakan secara on the spot dan hanya satu kali (one shot) atau dua kali, tidak akan dapat memberikan hasil yang objektif tentang keadaan siswa. Kalo misalnya ada seorang anak yang sebetulnya pandai, tetapi pada waktu guru mengadakan tes dia sedang dalam kondisi yang jelek, maka kemungkinan nilai tesnya juga jelek. Hal ini tidak menggambarkan kemampuan anak yang sebenarnya.

b. Secara komprehensif (menyeluruh), yaitu mencakup keseluruhan materi, mencakup berbagai aspek berfikir (ingatan, pemahaman, analisis, aplikasi dan sebagainya), dan melalui berbagai cara, yaitu : tes tertulis, tes lisan, tes perbuatan, pengamatan dan sebagainya.

4. Praktikabilitas

Artinya mudah di gunakan jika instrumen sudah memenuhi syarat-syarat tapi sukar di gunakan, berarti tidak praktis, kepraktisan ini bukan hanya di lihat dari penyusunan instrumen, tetapi juga bagi orang lain yang ingin menggunakan instrumen tersebut.[5]

Kepraktisan merupakan syarat suatu tes standar. Namun, kebanyakan orang membuat tes hanya untuk kepentingan dirisendiri, tidak berpikir untuk orang lain. Akibatnya, ketika tes tersebut digunkan orang lain, maka orang tersebut akan merasa kesulitan. Kepraktisan mempunyai arti kemudahan suatu tes, baik dalam mempersiapkan, menggunakan, mengolah dan menafsirkan, serta mengadministrasikannya.

Sebuah tes dikatakan memiliki praktikabilitas yang tinggi apabila tes tersebut bersifat praktis, mudah pengadministrasiannya. Tes yang praktis adalah tes yang :

a. Mudah dilaksanakan, artinya tidak menuntut peralatan yang banyak dan memberi kebebasan kepada siswa untuk mengerjakan terlebih dahulu bagian yang dianggap mudah oleh siswa

b. Mudah pemeriksaannya, artinya bahwa tes itu dilengkapi dengan kunci jawaban maupun pedoman skoringnya. Untuk soal bentuk objektif, pemeriksaan akan lebih mudah dilakukan jika dikerjakan oleh siswa dalam lembar jawaban.

c. Dilengkapi dengan petunjuk-petunjuk sehingga dapat diberikan oleh orang lain.

Dimyati dan Mudjiono (1994) mengemukakan faktor-faktor yang mempengaruhi kepraktisan instrument evaluasi meliputi:

1. Kemudahan mengadministrasi

Jika instrumen evaluasi diadministrasikan oleh guru atau orang lain dengan kemampuan yang terbatas, kemudahan pengadministrasian adalah suatu kualitas penting yang diminta dalam instrumen evaluasi. Untuk memberikan kemudahan instrument evaluasi dapat dilakukan dengan jalan memberi petunjuk yang sederhana dan jelas, subtessebaiknya relative sedikit, dan pengaturan tempo tes sebaiknya tidak menimbulkan kesulitan. Kesalahan-kesalahan alat ukur atau instrumen evaluasi akan menurunkan kepraktisannya, sehingga dapat menebabkan berkurangnya validitas dan reliabilitas suatu alat ukur.

2. Waktu yang digunakan untuk melancarkan evaluasi

Kepraktisan dipengaruhi oleh faktor waktu yang disediakan untuk melancarkan evaluasi.Waktu antara 20-60 menit yang disediakan untuk melancarkan evaluasi merupakan waktu yang cukuo memberikan kepraktisan.

3. Kemudahan menskor

Peskoran merupakan hal yang paling membodankan dan mengganggu dalam melancarkan kegiatan evaluasi.Untuk memberikan kemudahan penskoran diperlukan upaya perbaikan petunjuk peskoran dan lebih memudahkan kunci penskoran, pemisahan lembar jawaban dari lembar soal, dan peskoran menggunakan mesin.

4. Kemudahan interpretasi dan aplikasi

Dalam analisis terakhir, keberhasilan atau kegagalan evaluasi ditentukan oleh penggunaan evaluasi. Jika hasilnya ditafsirkan secara tepat dan diterapkan secara efektif, maka hasil evaluasi akan mendukung pada pembelajaran yang lebih tepat, untuk memudahkan interpretasi dan aplikasi hasil evaluasi diperlukan petunjuk yang jelas.

5. Tersedianya bentuk instrument evaluasi yang ekuivalen atau sebanding.

Bentuk-bentuk ekuivalen untuk tes yang sama seringkali diperlukan untuk berbagai kegunaan pendidikan.Bentuk-bentuk ekuivalen dari sebuah tes mengukur aspek-aspek perilaku melalui butir-butir tes yang memiliki kesamaan dalam isi, tingkat kesulitan, dan karakteritik lainnya. Dengan demikian, satu bentuk tes dapat menggantikan yang lain, sedangkan alat ukur atau instrument evaluasi yang sebanding adalah instrument evaluasi yang memiliki kemungkinan dibandingkan makna dari skala skor umum yang dimiliki, sehingga untuk tes berseri cukup menggunakan satu skala skor. Adanya bentuk-bentuk yang ekuivalen atau sebanding dari instrument akan mempraktiskan kegiatan evaluasi.

5. Ekonomis

Yang dimaksud dengan ekonomis disini adalah bahwa pelaksanaan tes tersebut tidak membutuhkan biaya yang mahal, tenaga yang banyak dan waktu yang lama.[6]

6. Relevan

Artinya instrumen yang di gunakan harus sesaui dengan standart kpmpetensi, kompetensi dasar, indikator,yang telah di tetpakan. Dalam konteks penilaian hasil belajar,maka istrumen harus sesuai dengan domain hasil belajar, sepeti domain kognitif, afektif dan psikomotorik. Jangan smapai mengukur domain kognitif menggunakan instrumen non tes. Hal itu tentu tidak relevan.

7. Reprensentatif

Artinya materi instrumen harus betul-betul mewakili seluruh instrumen yang di sampaikan . Hal ini dapat di lakukan bila penyusunan instrumen menggunanakan silabus sebagai acuan pemilihan materi tes. Guru juga harus memperhatikan proses seleksi materi. Mana materi yang bersifat aplikatif dan mana yang tidak. Mana yang penting dan mana yang tidak.[7]

8. Dekriminatif.

Artinya instrumen itu harus di susun sedemikian rupa sehingga dapat menunjukan perbedaan-perbedaan sekecil apapun. Semakin baik suatu instrumen maka semakin mampu instrumen tersebut menunjukan perbedaan secara teliti. Untuk mengetahui apakah instrumen cukup dekriminatif atau tidak, biasanya di lakukan uji daya pembeda instrumen tersebut.

9. Spesisifik

Artinya suatu instrumen disusun di gunakan khusus untuk obyek evaluasi . jika instrumen tersebut menggunakan tes,maka jawaban tes jangan menimbulkan ambivalensi atau spekulasi.

10. Proporsional

Artinya suatu instrumen harus memilik tingkat kesuliatan yang proporsional antara sulit sedang dan mudah. Begitu juga ketika menentukan jenis instrumen.

Baik tes ,maupun non tes dalam buku Succesful teaching karangan J. Mursel yang di terjemahkjan dalam bahasa indonesia oleh J. Mursel dan S. Nasution di kemukakan bahwa ciri-ciri evaluasi baik adalah “evaluasi dan hasil langsung , evaluasi dan transfer dan evaluasi langsung dari proses belajar”. Apa yang di kemukakn oleh J. Mursel sebenarya lebih di khususkan pada ciri-ciri penilaian proses dan hasil belajar bukan ciri-ciri evaluasi umum.

- Evaluasi hasil langsung

Dalam proses pembelajaran guru sering melakukan kegiatan evaluasi, Bik ketika proses pembelajaran sedang berlangsung atau maupun proses pembelajaran sudah selesai , jika evaluasi pembelajaran sedang berlangsung maka guru ingi mengetahui keefektifan dan kesesuaian strategi pembelajarn dengan tujuan yang ingin di capai. Jika evaluasi di laukikan sesudah proses pembelajaran selesai berarti guru ingin mengetahui hasil tatau prestasi belajar yang di peroleh peserta didik.

- Evaluasi dan transfer

Hal penting dalam proses belajar adalah kemungkinan mentransfer hasil yang dipelajari kedalam situasi yang fungsional. Dasar pemikiran ini merupakan asas psikologis yang logis dan rasional. Peserta didik tidak di katakan telah menguasai ilmu komputer (misalnya) jika ia blum dapat menggunakanya dalam berbagai dalam bidang kehidupan sehari-hari.

Ada dua sebab mengapa hasil belajar yang mengakibatkan dan berhubungan dengan proses transfer menjadi penting artinya dalam proses evaluasi. Pertama. Hasil belajar itu menyataka secara khusus dan sejelas-jelasnya kepada guru mengenai apa yang sebenarnya terjadi maupun tidak terjadi, dan sampai dimana pula telah tercapai hasil belajar yang penuh makna serta autentik sifatnya. Kedua . hasil belajar sangat erat hubunganya denga tujuan peserta didik belajar, sehingga mempunyai efek yang sangat kuat terhadap pembentukan pola dan karatkter belajar yang di lakukan peserta didik.

- Evaluasi langsung dari proses belajar

Di samping harus mengetahui hasil belajar, guru juga harus menilai proses belajar. Hal ini di maksudkan agar hasil belajar dapat di organisasi sedemikian rupa, sehingga mencapai hasil yang optimal. Guru dapat mengetahui proses belajar apa yang di lalui peserta didik dalam mempelajari sesuatu. Misalnya apakah peserta ddik dalam mempelajari bahasa inggris cukup sekedar mempelajari dan menghafal perbendaharaan kata ataukah dia mempelajari seluk beluk bahasa inggir untuk memahami dan memecahkan msasalah-masalah kehidupan.

Seorang peserta didik tidak dapat belajar dengan baik, karena dia tidak menggunakan konteks yang baik. Dia tidak menggunakan bermacam-macam sumber dan tidak menggunakan situsi-situasi yang konkret. Peserta didik tidak dapat belajar dengan baik karena tidak mempunyai fokus tertentu misalnya tidak melihat masalah-masalah pokok yang di pecahkan atau munkin pula tidak sesuai dengan bakat dan minatnya (individualisasi) serta tidak menduiskusikannya dengan orang lain( sosialiasasi). Jadi, dalam evaluasi pembelajaran , guru jangan terfokus hasil belajar saja. Tapi juga harus memperhatikan transfer hasil belajar dan proses belajar yang di jalani oleh peserta diidik.

BAB III

PENUTUP

A. Kesimpulan

Validitas, Realibitas, Objektivitas, Praktikabilitas, Ekonomis, Relevan, Representatif, Deskriminatif, Spesifik, Porposional.

DAFTAR PUSTAKA

- Zainal Arifin, Evaluasi Pembelajaran, PT Rosdakarya, Bandung : 2012

- Drs.M.Ngalim Purwanto, Prinsip-Prinsip Dan Teknik Evaluasi Pengajaran, PT Remaja Rosdakarya, Bandung : 2006

- Eko putro widoyoko. Evaluasi program pembelajaran. Pustaka Belajar, Yogyakarta : 2004.

- Sukiman, S. Ag., M. Pd..Pengembangan sistem Evaluasi PAI. Yogyakarta: UIN Sunan Kalijaga Yogyakarta : 2008

- Prof. H. M. Sukardi, MS., Ph.d.. Evaluasi pendidikan. Jakarta: Bumi Aksara. : 2009

- Prof. Dr. Anas Sudijono.Evaluasi Pendidikan. Jakarta: PT. Raja Grafindo Persada : 2006

[1] Zainal Arifin, Evaluasi Pembelajaran, PT Rosdakarya, Bandung 2012 hal 122

[2] Zainal Arifin, Evaluasi Pembelajaran, PT Rosdakarya, Bandung 2012 hal 135

[3] Drs.M.Ngalim Purwanto, Prinsip-Prinsip Dan Teknik Evaluasi Pengajaran, PT Remaja Rosdakarya, Bandung, 2006 hal 138

[4] Eko putro widoyoko. Evaluasi program pembelajaran. Pustaka Belajar, Yogyakarta 2004. h Hal 258-265

[5] Eko putro widoyoko. Evaluasi program pembelajaran. Pustaka Belajar, Yogyakarta 2004. h Hal 258-265

[6] Eko putro widoyoko. Evaluasi program pembelajaran . Pustaka Belajar, Yogyakarta 2004. h 98-102

[7] Zainal Arifin, Evaluasi Pembelajaran, Bandung, 2012 hal

Our Favorit Class,,,,,

Selasa, 31 Desember 2013

Kriteria Instrument pemilihan evaluasi pembelajaran

Latihan Soal Kelas X sem ganjil