Nur Sholeh

Belum menuliskan informasi profilenya.

Selengkapnya
Navigasi Web

Kualitas dan Ciri-Ciri Teknik Evaluasi Yang Baik

Kualitas dan Ciri-Ciri Teknik Evaluasi Yang Baik

Latar Belakang Masalah

Penganalisisan terhadap tes hasil belajar sebagai suatu totalitas dapat dilakukan dengan dua cara :Pertama, penganalisisan yang dilakukan dengan jalan berfikir secara rasional atau penganalisisan dengan menggunakan logika ( logical analysis ).Kedua, penganalisisan yang dilakukan dengan mendasarkan diri kepada kenyataan empiris, dimana penganalisisan dilaksanakan dengan menggunakan empirical analysis(Anas Sudijono:2009)

Untuk mengukur kesesuaian efisiensi dan kemantapan ( consistency ) suatu alat penilaian atau tes dipergunakan macam-macam alat seperti validitas, keandalan, obyektivitas, dan kepraktisan ( practicibility ). [1]

Validitas ( keshahihan ) adalah kualitas yang menunjukkan hubungan antara suatu pengukuran ( diagnosis ) dengan arti atau tujuan kriteria belajar atau tingkah laku. Beberapa kriteria dapat dipilih untuk memperlihatkan kefektifan terhadap peramalan performance yang akan datang ( yang akan terjadi ), kriteria yang lain untuk menunjukkan status yang muncul, kriteria yang lain lagi untuk meninbulkan sifat-sifat yang representatif dari luasnya isi atau tingkah laku, dan kriteria yang lain lagi untukmelengkapi penyediaan data penunjang atau menolak beberapa ikon psikologis.

Obyektivitas adalah kualitas yang menunjukkan identitas atau kesamaan dari skor-skor atau diagnosis yang diperoleh dari data yang sama dari penskor kompeten yang sama. Suatu norma melengkapi nilai rata-rata bagi suatu pengukuran atau diagnosis yan diperoleh dengan administrasi, alat ukur tes yaitu skor yang diperoleh dari suatu tes populasi tertentu baik individu atau kelompok dapat dibandingkan dengan nilai-nilai yang khas dari populasi normatif itu.

Kepraktisan ( practicibility ) adalah suatu kualitas yang menunjukkan kemungkinan dapat dijalankannya suatu kegunaan umum dari suatu teknik penilaian, dengan mendasarkannya pada beaya, waktu yang diperlukan untuk menyusun,kemudahan penyusunan tes dan mudahnya penscoran tes hasil belajar.

A. Validitas

1. Pengertian Validitas

Validitas merupakan syarat yang terpenting dalam suatu alat evaluasi. Validitas berasal dari kata “validity” yang mempunyai arti sejauh mana ketepatan dan kecermatan suatu instrumen pengukuran dalam melaksanakan fungsi ukurnya ( Saefudin Azwar, 2005).[2] Suatu alat evaluasi ( tes ) dikatakan mempunyai validitas yang tinggi ( disebut valid ) jika alat evaluasi atau tes itu dapat mengukur apa yang sebenarnya akan diukur atau memberikan hasil ukur yang tepat dan akurat sesuai dengan maksud dikenakannya tes tersebut. Cronbach: “How well a test or evaluative technique does the job that it is employed to do” ( Cronbach, L.J.,1970). Sedangkan suatu tes yang menghasilkan data yang tidak relevan dengan tujuan diadakannya pengukuran dikatakan sebagai tes yang memiliki validitas rendah.

2. Macam-macam Validitas

Macam-macam Validitas didalam buku Encyclopedia of educational evaluatin yang ditulis (Scarvia B. Anderson,1975) disebutkan: A test is valid if it measures what it purpose to measure”. Artinya sebuah tes dikatakan valid apabila tes tersebut mengukur apa yang hendak diukur, atau memiliki ketepatan (sahih) skornya.

Validitas sebuah tes dapat diketahui dari hasil pemikiran dan hasil pengalaman. Hal yang pertama akan diperoleh validitas logis ( logical validity ) dan hal yang kedua diperoleh validitas empiris ( empirical validity ). Dua hal inilah yang dijadikan dasar pengelompokan validitas tes. Secara garis besar ada dua macam validitas, yaitu validitas logis dan validitas empiris ( Suharsimi Arikunto, 2008 ).

Validitas adalah salahsatu ciri yang menandai tes hasil belajar yang baik dipandang dari segi tes itu sebagai totalitas yang memiliki keshihan dan terandalkan,[3] dan dapat menentukan apakah suatu tes memiliki validitas atau daya ketepatan mengukur jika dilakukan analisi dari segi itemnya sebagai bagian tak terpisahkan dari tes itu.

Instrumen yang valid berarti alat ukur yang digunakan untuk mendapatkan data (mengukur ) itu valid. Berarti instrumen tersebut dapat digunakan untuk mengukur apa yang hendak diukur, maka penelitian dengan instrumen yang valid dan reliabel dalam pengumpulan data, hasil data penelitian akan teruji validitas dan reabilitasnya, dengan pengujian reliabilitas instrumen tes ( mengukur hasil belajar ) dan non tes untuk mengukur sikap. Instrumen yang mempunyai validitas internal atau rasinal, bila kriteria yang ada secara teoritis ( rasional ) telah mencerminkan apa yang diukur, Instrument dengan validitas eksternal bila kriteria didalam instrumen disusun berdasar fakta-fakta empiris, misalnya akan mengukur kinerja ( performance ) dengan kriteria tolak ukur yang ditetapkan.

a. Pengujian Validitas Tes secara Rasional (Validitas Logis)

Validitas rasional adalah validitas yang diproleh atas dasar hasil pemikiran, validitas yang diproleh dengan berfikir secara logis. Instrumen tes memiliki validitas yang baik berdasarkan hasil penalaran, dirancang secara baik, disusun mengikuti teori dan ketentuan yang ada, dan secara logis sudah valid. Dengan demikian maka suatu tes hasil belajar dapat dikatakan telah memiliki validitas Rasional, apabila setelah dilakukan penganalisisan secara rasional ternyata bahwa tes hasil belajar itu memang ( secara rasional ) dengan tepat telah dapat mengukur apa yang seharusnya di ukur. Ada dua macam validitas logis yang dapat dicapai oleh sebuah instrumen, yaitu validitas isi ( Content Validity ) dan Validitas Konstruksi ( Construct Validity ). Validitas isi instrumen disusun berdasarkan isi materi pelajaran yang diprogramkan, Validitas konstrak sebuah instrumen disusun pada aspek psikologi dan aspek sosial yang dievaluasi.[4]

Untuk dapat menentukan apakah tes hasil belajar sudah memiliki validitas rasional apakah belum dapat dilakukan mulai dari dua segi :

1. Validitas Isi

Validitas isi suatu tes hasil belajar adalah validitas yang diperoleh setelah dilakukan penganalisisan, penelusuran atau pengujian terhadap isi yang terkandung dalam tes hasil belajar tersebut. Jadi validitas isi adalah validitas yang dilihat dari segi tes itu sendiri sebagi alat pengukur hasil belajar.

Sebuah tes dikatakan memiliki validitas isi apabila mengukur tujuan khusus tertentu yang sejajar dengan materi atau isi pembelajaran yang berikan

2. Validitas Konstruksi

Secara etimologi “konstuksi” mengandung arti susunan, kerangka atau rekaan. Adapun secara terminologi, suatu tes hasil belajar dapat diajarkan sebagai tes yang telah memiliki validitas konstruksi, apabila tes tersebut ditinjau dari segi susunan, kerangka atau kerangkaan nya telah dapat dengan secara tepat mencerrminkan suatu konstruksi daalam teori psikologi.

Sebuah tes dikatakan memiliki validitas kontruksi apabila butir-butir soal yang membangun tes tersebut mengukur setiap aspek berfikir seprti yang disebutkan dalam tujuan Intraksional Khusus ( Suharsimi Arikunto : 2007 ). Validitas konstruksi dapat diketahui dengan cara memerinci dan memasangkan setiap butir soal dengan setiap aspek kognitif dalam TIK dan pengerjaannya berdasarkan logika secara hirarki sepeti daya ingatan, pemahaman, aplikasi dsb. Bukan berdasrkan pengalaman menyusun tes.

Validitas kontruksi dari suatu tes hasil belajar dapat dilakukan penganalisisannya dengan jalan melakukan pencocokan terhadap aspek-aspek berfikir yang terkandung dalam tes hasil belajar tersebut.

3. Pengujian Validitas Tes Secara Empirik

Validitas empirik adalah kerapatan mengukur yang didasarkan pada hasil analisis yang bersifat empirik. Dengan kata lain validitas empirik adalah validitas yang bersumber pada atau diperoleh atas dasar pengamatan di lapangan.

Untuk dapat menentukan apakah tes hasil belajar sudah memiliki validitas empirik ataukah belum, dapat dilakukan penelusuran dari dua segi yaitu pertama, segi daya ketepatan meramalnya ( predictive validity) dan kedua dari segi daya ketepatan bandingannya (concurrent validity).

1) Validitas Ramalan

Validitas ramalan adalah suatu kondisi yang menunjukan seberapa jauhkah sebuah tes telah dapat dengan secara tepat menunjukan kemampuannya untuk meramalkan apa yang bakal terjadi pada masa mendatang.

Untuk mengetahui apakah suatu tes hasil belajar dapat dinyatakan sebagai tes yang telah memiliki validitas ramalan ataukah belum, dapat ditempuh dengan cara mencari korelasi antara tes hasil belajar yang sedang diuji validitas ramalannya dengan criteria tertentu, jika kedua variable tersebut terdapat korelasi positif yang signifikan maka, tes hasil belajar yang sedang diuji validitas ramalannya tersebut dapat dinyatakan sebagai tes hasil belajar yang telah memiliki daya ramalan yang tepat artinya apa yang diramalkan tersebut benar-benar terjadi secara nyata dalam praktek.

2) Validitas Bandingan

Validitas “ada sekarang” (Concurrent Validity ) atau validitas empiris, jika hasil uji tes sesuai dengan pengalaman atau fakta-fakta empiris. Suatu tes sebagai alat pengukur dikatakan telah memiliki validitas bandingan apabila tes tersebut dalam kurun waktu yang sama dengan secara tepat telah mampu menunjukan adanya hubungan searah antara tes pertama dengan tes berikutnya, Validitas bandingan juga dikenla dengan istilah sama saat validtas pengalaman atau validitas ada sekarang. Dikatakan validitas pengalaman karena, validitas tes tersebut ditentukan atas dasar pengalaman yang telah diperoleh sedangkan, dikatakan validitas ada sekarang, sebab validitas itu dikaitkan dengan hal-hal yang telah ada, sehingga data mengenai pengalaman masa lalu itu pada saat sekarang ini sudah berada ditangan.

Seperti halnya validitas ramalan, maka untuk dapat mengetahui ada atau tidaknya hubungan searah antara tes pertama dengan tes berikutnya, dapat digunakana teknik analisis korelasi product moment, jika korelasi variable X ( tes pertama dengan variable Y adalah positif maka, tes tersebut dapat dinyatakan sebagai tes yang telah memiliki validitas bandingan.

B. Tekhnik pengujian validitas item tes hasil belajar

a. Pengertian validitas item

validitas item dari sebuah tes adalah ketepatan mengukur yang dimiliki oleh sebutir item ( yang merupakan bagian yang tak terpisahkan dari tes bagian suatu totalitas ), dalam mengukur apa yang seharusnya diukur lewat butir item tersebut.

b. Tehknik Pengujian Validitas Item Tes Hasil Belajar

berdasarkan uraian diatas maka cukup jelas bahwa sebutir item dapat dikatakan telah memiliki validitas tinggi atau dapat dinyatakan valid, jika skor-skor pada butir item yang bersangkutan memiliki kesesuaian atau kesejajaran arah dengan skor totalnya, skor total disini berkedudukan sebagai variable terikat sedangkan variable item merupakan variable bebasnya.

Permasalahannya adalah bagaimana Memilih dan menentukan jenis tekhnik dalam rangka menguji validitas item itu. Seperti yang diketahui pada tes objektif maka hanya ada dua kemungkinan yaitu betul atau salah.

Setiap butir soal yang dapat dijawab dengan benar diberikan skor 1 ( satu ) sedangkan untuk setiap jawaban yang salah diberikan skor 0 ( nol ) jenis data seperti ini biasanya merupakan tes benar – salah, ya – tidak dan sejenisnya dalam ilmu statistic dikenal dengan disket murni atau data dikotomik. Sedangkan, skor total yang dimiliki oleh masing-masing testee adalah merupakan penjumlahan dari setiap skor itu merupakan data kontinyu.

Berdasarkan teori yang ada apabila variable 1 berupa data dikotomik sedangkan variable II data kontinyu maka, teknik korelasi yang tepat untuk digunakan dalam mencari korelasi dua variable adalah teknik korelasi point biserial, diman angka indeks korelasi diberi lambing rpbi dapat diperoleh dengan rumus :

Rpbi = Mp - Mt dibagi SDt dikali akar p/r

Dimana :

Rpbi = koefisien korelasi point berserial yang melambangkan kekuatan korelasi

antara variable I dan II yang dalam hal ini sebagai koefisien validitas item.

Mp = skor rata-rata hitung yang dimiliki oleh testee

Mt = skor rata-rata dari skor total

SDt = standar deviasi dari skor total

p = proporsi testee yang menjawab denagn benar terhadap butir item yang diuji

Validitasnya.

q = proporsi testee yang menjawab salah terhadap butir item yang diuji

validitasnya

Teknik yang kedua digunakan untuk mengetahui kesejajaran adalah teknik korelasi product moment oleh Pearson. Sebuah tes dikatakan memiliki validitas jika hasilnya sesuai dengan kriterium, memiliki tingkat kesejajaran antara hasil tes dengan kriterium. Rumus product moment ada dua macam, yaitu :

a. Korelasi simpangan

Rumusnya :

keterangan:

r = koefisien korelasi

∑xy = jumlah produk x dan y

Langkah-langkah penyelesaian:

- Membuat table persiapan

No.

X

Y

x

Y

x2

y2

Xy

- Memasukan nilai masing-masing mata pelajaran X dan Y

- Jumlahkan seluruh nilai dan hitung rata-rata masing-masing variable

- Isi kolom x dengan nilai tiap peserta pada mata pelajaran X dikurangi dengan nilai rata-rata mata pelajaran X

- Isi kolom x dengan nilai tiap peserta pada mata pelajaran Y dikurangi dengan nilai rata-rata mata pelajaran Y

- Cari x2 dengan mengkuadratkan nilai pada kolom x

- Cari y2 dengan mengkuadratkan nilai pada kolom y

- Hitung xy dengan mengalikan nilai pada kolom x dan nilai pada kolom y

b. Korelasi angka kasar

Korelasi product-moment juga dapat dilakukan dengan menggunakan angka kasar, dengan rumus:

2.) Korelasi Perbedaan Peringkat (Rank Differences Correlation)

keterangan:

r = koefisien korelasi

1 dan 6 = bilangan tetap

D = perbedaan antara dua peringkat atau rank

n = jumlah sampel

Langkah-langkah:

- Cari peringkat dari tiap-tiapmata pelajaran dengan mengurutkan nilai-nilai dari yang terbesar sampai yang terkecil.

- Jika terdapat nilai yang sama, maka jumlahkan nilai peringkat pertama dengan kedua lalu bagi dua, maka kedua orang tersebut memiliki peringkat yang sama.

- Cari perbedaan peringkat dengan mengurangkan peringkat mata pelajaran X dengan Y

- Perbedaan peringkat kemudian dikuadratkan.

3.) Teknik Diagram Pencar (Scatter Diagram)

Dalam statistika koefisien korelasi dinotasikan dengan “r” dimana -1,00 ≤ r ≥ 1,00, r = +1,00 artinya korelasi sempurna positif dan r = -1,00 artinya korelasi sempurna negative. Untuk menafsirkan koefisien korelasi dapat menggunakan criteria berikut:

0,81 – 1,00 = sangat tinggi

0,61 – 0,80 = tinggi

0,41 – 0,60 = cukup

0,21 – 0,40 = rendah

0,00 – 0,20 = sangat rendah

C. Reliabilitas: Pendekatan Tes Ulang

Reliabel berarti dapat dipercaya. Reliabilitas berarti dapat dipercayainya sesuatu. Tes yang reliabel berarti bahwa tes itu dapat dipercaya. Bagaimana dapat dipercayanya tes itu? Sesuatu tes dikatakan dapat terandalkan apabila hasil yang dicapai oleh tes itu konstan atau tetap, tidak menunjukkan perubahan-perubahan yang berarti.[5]

Reliabilitas diterjemahkan dari kata reliability. Menurut John M. Echols dan Hasan Shadily (2003: 475) reliabilitas adalah hal yang dapat dipercaya. Popham (1995: 21) menyatakan bahwa reliabilitas adalah "...the degree of which test score are free from error measurement". Dalam pandangan Brennan (2001: 295) reliabilitas merupakan karakteristik skor, bukan tentang tes ataupun bentuk tes. Menurut Sumadi Suryabrata (2004: 28) reliabilitas menunjukkan sejauhmana hasil pengukuran dengan alat tersebut dapat dipercaya. Hasil pengukuran harus reliabel dalam artian harus memiliki tingkat konsistensi dan kemantapan. Dalam pandangan Aiken (1987: 42) sebuah tes dikatakan reliabel jika skor yang diperoleh oleh peserta relatif sama meskipun dilakukan pengukuran berulang-ulang. Untuk memperoleh skor yang sama, maka tidak boleh ada kesalahan pengukuran. Dengan demikian, keandalan sebuah alat ukur dapat dilihat dari dua petunjuk yaitu kesalahan baku pengukuran dan koefisien reliabilitas. Kedua statistik tersebut masing-masing memiliki kelebihan dan keterbatasan (Feldt & Brennan, 1989: 105).

Suatu tes dapat pula memberikan hasil yang tidak dapat dipercaya ( unreliable ). Menurut Amir Daien ( 1998), bahwa un reliability suatu tes ini dapat disebabkan oleh dua macam faktor yaitu :

1. Situasi pada waktu testing berlangsung. Hal ini mencakup keadaan fisik dan psikologis anak misalnya :

a. Kesehatannya tidak dalam kondisi yang baik

b. Menghadapi tes dalam keadaan takut

c. Mengerjakan tes dalam keadaan terburu-buru atau gugup

d. Tidak mengerjakan tes dengan sepenuh hati

e. Dan sebagainya

2. Keadaan tes itu sendiri

Hal ini berhubungan dengan kualitas dari soal-soalnya atau item-itemnya, dan panjangnya tes tersebut. Mengenai kualitas tes yang tidak reliabel atau item soal misalnya dirumuskan :

a. Pertanyaan – pertanyaan tes tidak jelas apa yang dimaksud

b. Pertanyaan – pertanyaan yang brrsifat ambiguous, yaitu pertanyaan yang memungkinkan banyak multi tafsir dan banyak jawaban

c. Pertanyaan yang mungkin tidakdapat dijawab, sebab kurang memberikan keterangan-keterangan yang lengkap.

3. Untuk mengatasi permasalah tes yang kurang valid dan terandalkan maka langkah guru adalah sebagai berikut :

a. Seorang yang akan menyusun tes harus menguasai teknik-teknik bagaimana cara membuat soal-soal dan bahan cakupan materi yang akan diujikan dalam tes dengan mendalam dan sempurna

b. Penyusun tes sudah mahir dan menguasai teknik cara menyusun tes dan instrumen tes

c. Semakin panjang atau banyaknya tes item dapat dikatan menambah tinggi reliabilitas tes, tetapi banyaknya penambahan tes kadang terjadi kuarang terandalkan dan dikatakan pemborosan. Sehubungan dengan ini Spearman dan Brown mengajukan rumus tentang hubungan antara penambahan banyaknya item tes dengan besarnya reliabilitas yang diperoleh, disebut rumus Brown Propecy Formula, yaitu :

r nn = _nr_

1 + (n – 1 ) r

Keterangan :

r nn = besarnya reliabilitas

n = berapa kali item itu ditambah

r = besarnya reliabilitas sebelum itemnya ditambah

Contoh :

Suatu tes terdiri dari 50 item, dan memiliki reliabilitas 0.80, berapakah besarnya realibilitas itemnya jika ditambah menjadi 100 ? jawaban : item soal 100.berarti itemnya ditambahkan hingga menjadi duakali yang berati penambahan waktu, tenaga dan pikiran dengan perubahan besarnya reabilitas sebanyak 0,08. Jadi n = 2; r = 0.80 maka :

rnn = nr = 2 x 0.80 = 1.60 = 0,88

1 + (n -1 ) r 1+ (2-1)0.80 1.80

D. Menentukan Besarnya Reliabilitas Item Soal

Untuk menentukan besarnya reliabilitas ( r ) dari suatu tes, dipergunakan cara yang disebut teknik korelasi, angka yang menunjukkan besarnya hubungan itu koefisien korelasi yang dinyatakan dengan angka -1 s.d. +1. Besarnya korelasi dalam penelitian pendidikan umumnya selalu lebih kecil dari 1, bila angka korelasi telah mencapai 0.60 ke atas, maka dikatakan bahwa korelasi itu sudah cukup baik ( signifikan ), Untuk menentukan besarnya korelasi reabilitas tes ada tiga macam cara, yaitu : [6]

a. Self korelasi

b. Korelasi dari bentuk ekuivalen

c. Split halves korelasi

a. Self Korelasi

Cara Self Korelasi ini disebut self testing atau tes-retes. Dalam hal ini kita hanya mempergunakan sebuah tes, untuk diketahui reliabilitasnya. Adapun caranya sebagai berikut :

Tes yang akan kita cari reliabilitasnya itu kita berikan kepada sekelompok siswa, beberapa hari kemudian tes itu di berikan lagi kepada kelompok siswa yang sama, dari hasil tes pertama kita bandingkan dengan hasil tes yang kedua, dengan mencari angka korelasinya. Angka korelasi inilah yang akan menunjukkan besar kecilnya reliabilitas dari tes tersebut. Dan, angka ini disebut angka reliabilitas atau reliability coefficient.

Contoh tes, setelah diujicobakan pada sekelompok siswa sebanyak dua kali, hasilnya sebagai berikut :

Siswa

Score

Rank

Siswa

Score

Rank

A

57

4

A

60

4

B

65

2

B

70

2

C

50

5

C

53

5

D

73

1

D

74

1

E

62

3

E

65

3

F

34

7

F

45

6

G

36

6

G

40

7

Angka ( score ) pada tes kedua cenderung naik, bahwa naiknya angka – angka tersebut disebabkan oleh adanya practice effect,biarpun ternyata score-score pada tes kedua itu lebih baik, tetapi setelah diadakan ranking kebanyakan tetap, kecuali G turun ke -7, Rank adalah urutan tingkatan yang menyatakan kedudukan prestasi hasil belajar, diambil dari score tertinggi menuju score terendah. Setelah dihitung angka korelasinya cukup besar, dan tes tersebut mempunyai ( r ) yang tinggi.

b. Korelasi dari bentuk ekuivalen

Yang dimaksud bentuk ekuivalen disini adalah bentuk-bentuk sebanding, yaitu dua buah tes atau lebih yang mempunyai kualitet dan tingkat kesuakaran yang sama, diambil dari bahan yang sama, hanya saja seolah – olah item – itemnya dibuat berlainan.

Untuk mengetahui reliabilitas tes, kedua tes ini diberikan pada sekelompok siswa , testing dilaksanakan dalam satu hari, dalam situasi dan kondisi yang sama. Misalnya koefisien korelasinya = 0.40 maka berarti bahwa tes tersebut mempunyai reabilitas rendah, jika mencapai 0.75 berarti tes tersebut mempunyai reabilitas tinggi.

c. Split halves korelasi

Dengan menggunakan cara split halves korelasi, kita hanya mempergunakan sebuah tes saja, dan diberikan kepada sekelompok siswa satu kali saja, bila cara pertama dan kedua sulit dilaksanakan. Biarpun satu kali tes, tetapi waktu menscorenya diadakan splitting, yaitu tes tersebut kita bagi menjadi dua bagian, yaitu ditempuh dengan beberapa cara, diantaranya :

1. Membagi menjadi dua kelompok atas omor – nomor genap dan ganjil.

2. Membagi item-item yang equivalent, kemudian dikumpulkan sehingga tiap kelompok berjumlah seperdua dari keseluruhan tes.

3. Membagi kelompok – kelompok item menjadi dua bagian, dan bagian-bagian itu dibelah menjadi dua kelompok, misalnya soal 50 item, 10 item pertama dari bahan bab I, 10 item kedua dari bab II, dst lalu dipencar dalam beberapa bagian dan dibagi dua, Kelompok I terdiri 25 item soal, Kelompok II terdiri atas 25 item soal

Uji Reabilitas Instrumen

Reliabilitas instrumen adalah keadaan instrumen yang menunjukkan hasil pengukuran yang reliable (tidak berubah-ubah, konsisten). Instrumen yang reliable adalah instrumen yang apabila digunakan untuk mengukur subyek atau objek yang sama pada waktu yang berbeda dan pengukuran dilakukan oleh orang yang berbeda hasilnya tetap sama.

Beberapa faktor penting yang mempengaruhi reliabilitas suatu tes yaitu:

1. Kemampuan peserta tes atau subjek uji coba. Makin heterogen atau makin berbeda kemampuan peserta tes makin tinggi reliabilitas tes.

2. Semakin besar jumlah peserta tes semakin besar reliabilitas, karena semakin banyak peserta tes maka semakin beragam kemampuannya.

3. Panjang pendeknya tes. Jumlah item tes yang banyak dengan mengkaji beberapa tujuan akan lebih reliable dibandingkan dengan jumlah item yang sedikit, karena akan lebih representatif. Namun jumlah item tes yang terlalu banyak akan melelahkan dan mengganggu konsentrasi sehingga hasil yang diperoleh tidak tepat lagi.

4. Evaluasi yang subjektif juga akan menurunkan reliabilitas.

5. Hal yang berhubungan dengan penyelenggaraan tes.

Adanya hal-hal yang mempengaruhi hasil tes ini semua, secara tidak langsung akan mempengaruhi reliabilitas soal tes. Reliabilitas instrumen dinyatakan dengan koefisien reliabilitas. Instrumen yang reliable adalah instrumen yang memiliki koefisien reliabilitas minimal 0,70. Sebaiknya koefisien reliabilitas instrumen 0,80 atau lebih. Koefisien reliabilitas instrumen dihitung dengan menggunakan rumus tertentu.

Obyektivitas Tes

Suatu tes dikatakan Obyektif, bila pendapat atau pertimbangan dari pemeriksa tidak turut berpengaruh dalam proses penentuan angka atau proses scoring. Artinya, tidak ada unsur subyektif dari pihak pemeriksa didalam menentukan score dari jawaban tes. Dengan kata lain, diperiksa oleh siapapun juga tes itu, maka hasilnya akan sama ( Amir Daien, 1998).[7]

Didalam menyusun tes, kita berusaha agar membuat soal itu menjadi seobyektif mungkin, agar pemeriksa terhindarkan dari unsur subyektifitas, caranya adalah :

1. Merumuskan pertanyaan secara spesifik dan tepat. Pertanyaan – pertanyaan hendaknya jangan terlalu umum, dengan demikian jawabannya pun sudah pasti singkat, tegas dan jelas

2. Menghindari pertanyaan yang bersifat ambiguous, sehingga memungkinkan adanya berbagai ragam jawaban

3. Membuat tes yang hanya memerlukan jawaban pendek, tepat dan spesifik

4. Didalam memeriksa jawaban, menggunakan kunci jawaban dan analisis scoring yang telah disediakan sebelumnya

5. Dalam menentukan angka-angka, menggunakan kunci atau pedoman standar penilaian dalam memberikan scoring yang telah ditentukan. ( Tes yang distandarisasi hasilnya penskorannya sangat obyektif, Obyektivitasnya sangat tinggi, sedangkan tes dengan obyektivitas sedang adalah pandangan subyektif scor masih mungkin muncul dalam penilaian dan interpretasinya, Obyektivitas tes yang fleksibel, adalah beberapa jenis tes yang dipakai oleh keperluan konseling bersifat open end item questionnares).

Teknik Evaluasi Dalam Pendidikan Agama

A. Pengujian Reliabilitas Tes Bentuk Objektif

Pada tes belajar bentuk objektif, ada tiga macam metode yang dapat digunakan untuk menentukan taraf reliabilitas.

1. Metode atau teknik ulangan (test-retest method) atau single test-double trial method.

Instrumen penelitian test-retest dilakukan dengan cara mencobakan instrumen dua kali pada responden. Jadi dalam hal ini instrumennya sama, respondennya sama, dan waktunya yang berbeda. Reliabilitas diukur dari koefisien korelasi antara percobaan pertama dengan yang berikutnya. Bila koefisien korelasi positif dan signifikan maka instrumen tersebut reliable. Pengujian cara ini sering juga disebut stability, yaitu seberapa stabil skor yang diperoleh individu apabila dilakuakn pengujian dalam waktu yang berbeda. Rumus yang dapat digunakan untuk menentukan reliabiltas test dengan metode test-retest antara lain adalah Product Momen Correlation. Yaitu sebagai berikut:

Dimana:

X = skor test pertama

Y = skor test kedua

N = jumlah peserta tes

Cara lain yang dapat digunakan dengan teknik tes retes ini adalah tekinik korelasi rank- order dari Spearmen menggunakn rumus:

Dimana:

ρ = koefisien korelasi

D = difference (beda antara rank skor hasil tes I dengan rank skor hasil tes II)

= RI – RII

N = banyaknya peserta tes.

2. Metode Belah Dua (split-half method) atau Single Test Single Trial Method

Dalam menggunakan metode ini pendidik atau evaluator hanya menggunnakan sebuah tes dan dicobakan satu kali. Oleh sebab itu disebut juga singel-test-singel-trial method. Pada metode ini tes yang diberikan dibagi/dibelah menjadi dua bagian. Jumlah item yang diberikan harus genap sehingga dapat dibagi dua dan tiap kelompok memiliki jumlah item/butir soal yang sama jumlahnya.

Untuk menentukan reliabilitas seluruh tes dapat digunakan rumus Spearman-Brown sebagai berikut:

Rumus Spearman Brown:

Dimana:

korelasi antara skor-skor setiap belahan tes.

koefisien reliabilitas tes.

Cara lain yang juga dapat digunakan pada metode singel-test-singel-trial adalah formula Rulon, Flanagan, Kuder-Richardson, Hoyt.

3. Metode Bentuk Paralel atau Metode Double Test Double Trial

Pada metode ini dipergunakan dua buah tes yang mempunyai kesamaan tujuan, tingkat kesukaran, dan susunan, tetapi butir-butir soal berbeda. Pengujian reliabilitas dengan cara ini cukup dilakukan sekali, tetapi instrumennya dua, pada responden yang sama, waktu yang sama, instrumen berbeda. Reliabiltas instrumen dihitung dengan cara mengkorelasikan antara data instrumen yang satu dengan data instrumen yang dijadikan equivalen. Bila koefisien korelasi positif dan signifikan maka instrumen tersebut reliable.

Kelemahan dari metode ini adalah kesukaran dalam penyusunan item yang parallel dengan item pada tes pertama, selain itu juga membutuhkan biaya yang lebih mahal dan memakan waktu yang lebih lama.

Rumus yang dapat digunakan untuk menentukan reliabilitas dengan metode parallel ini adalah Product Moment Correlation dan Rank Order Correlation.

B. Pengujian Reliabilitas Tes Bentuk Uraian

Pengujian reliabilitas tes bentuk uraian tidak dapat dilakukan seperti contoh di atas. Butir soal uraian menghendaki gradualisasi penilaian. Barangkali butir soal nomor 1 penilaian terendah adalah 0 dan penilaian tertinggi adlah 10, tetapi soal nomor 2 mungkin diberi nilai tertinggi hanya 5 dan butir soal nomor 3 penilaian tertinggi misalnya 5 dan sebagainya.

Untuk keperluan mencari reliabilitas tes perlu juga dilakukan analisa item seperti halnya tes bentuk Obkektif. Skor untuk masing-masing item dicantumkan pada kolom item menurut apa adanya. Rumus yang digunakan adlah rumus alpha sebagai berikut.

Keterangan:

∑σ2i = jumlah varians skor tiap-tiap item

σ2t = varians total

E. Teknik Pemeriksaan Hasil tes Hasil Belajar

Dalam teknik pemeriksaan hasil belajar siswa dibagi menjadi dua (2) yaitu :

1. Teknik pemeriksaan hasil tes tertulis

Sebagai mana telah dibahas dalam materi sebelumnya bahwa tes hasil belajar yang diselenggarakan secara tertulis dapat dibedakan menjadi dua golongan yaitu tes hasil belajar tertulis bentuk uraian dan tes hasil belajar tertulis bentuk objektif, kedua bentuk tes hasil itu memiliki karakteristik yang berbeda.

2. Teknik pemeriksaan hasil tes hasil belajar bentuk uraian

Tenik ini dilakukan dengan begitu soal tes uraian selesai disusun hendaknya tester segera membuat kunci jawaban/pedoman jawaban, kunci jawaban ini digunakan sebagai pegangan atau patokan dalam pemeriksaan atau pengoreksian terhadap tes hasil tes uraian dengan cara membandingkan antara jawaban yang diberikan oleh teste dengan kunci jawaban yang dibuat oleh tester.

Dalam pelaksanaan pemeriksaan hasil – hasil tes hasil tes urain ini terdapat dua hal yang harus dipertimbangkan yaitu:

v Pengolahan dan penentuan nilai hasil tes hasil belajar

Artinya apabila nantinya pengolahan dan penentuan nilai hasil tes uraian itu didasarkan pada standar mutlak maka, prosedur pemeriksaannya adalah sebagai berikut :

· Membaca jawaban yang diberikan oleh teste dan membandingkannya dengan kunci jawaban yang sudah dibuat.

· Atas dasar hasil perbandingan antara jawaban teste dengan kunci jawaban tersebut, tester dapat memberikan skor untuk setiap butir soal dan menuliskan pada jawaban teste tersebut.

· Menjumlahkan skor-skor tersebut dalam pengolahan dan penentuan nilai lebih lanjut.

v Pengolahan dan penentuan nilai hasil tes subjektif itu didasarkan pada standar relative

Artinya apabila nantinya pengolahan dan penentuan niali didasarkan pada standar relative maka prosedur pemeriksaannya sebagai berikut :

· Memeriksa jawaban atas soal nomor satu misalnya yang diberikan oleh selurus teste sehingga diperoleh gambaran maka dapat diketahui mana teste yang lengkap,kurang lengkap dan tidak tepat sama sekali.

· Memberikan skor terhadap jawaban tersebut misalkan jawaban yang tepat diberi skor 5, kurang tepat 3.

· Setelah jawaban atas seluruh teste tersebut selesai maka dapat dilakukan penjumlahan skor yang nantinya dijadikan bahan untuk mengolah nilai.

b. Teknik pemeriksaan hasil tes hasil belajar bentuk objektif

Memeriksa atau mengoreksi jawaban atas soal tes objektif pada umumnya dilakukan dengan jalan menggunakan kunci jawaban, ada beberapa macam kunci jawaban yang dapat dipergunakan untuk mengoreksi jawaban soal tes objektif, yaitu sebagai berikut :

1) Kunci berdampingan ( strip keys )

Kunci jawaban berdamping ini terdiri dari jawaban – jawaban yang benar yang ditulis dalam satu kolom yang lurus dari atas kebawah, adapun cara menggunakannya adalah dengan meletakan kunci jawaban tersebut berjajar dengan lembar jawaban yang akan diperiksa kemudian cocokanlah dengan lembar jawaban yang diberikan oleh tested an apabila jawaban yang diberikan oleh teste benar maka diberi tanda ( + ) dan apabila salah diberi tanda ( - ).

2) Kunci system karbon ( carbon system key )

Pada kunci jawaban system ini teste diminta membubuhkan tanfda silang ( X ) pada salah satu jawaban yang mereka anggap benar kemudian kunci jawaban yang telah dibuat oleh teste tersebut diletakan diatas lembar jawaban teste yang sudah ditumpangi karbon kemudian tester memberikan lingkaran pada setiap jawaban yang benar sehingga ketika diangkat maka, dapat diketahui apabila jawaban teste yang berada diluar lingkaran berarti salah sedangkan yang berada didalam adalah benar.

3) Kunci system tusukan ( panprick system key )

Pada dasarnya kunci system tusukan adalah sama dengan kunci system karbon. Letak perbedaannya ialah pada kunci sitem ini, untuk jawaban yang benar diberi tusukan dengan paku atau alat penusuk lainnya sementara lembar jawaban teste berada dibawahnya, sehingga tusukan tadi menembus lembar jawaban yang ada dibawahnya. Jawaban yang benar akan tekena tusukan dsedangkan yang salah tidak.

4) Kunci berjendela ( window key )

Prosedur kunci berjendela ini adalah sebagai berikut :

a) Ambilah blanko lembar jawaban yang masih kosong

b) Pilihan jawaban yang benar dilubangi sehingga seolah – olah menyerupai jendela

c) Lembar jawaban teste diletakan dibawah kunci berjendela

d) Melalui lubang tersebut kita dapat membuat garis vertical dengan pencil warna sehingga jawaban yang terkena pencil warna tersebut berarti benar dan sebaliknya.

2. Teknik pemeriksaan dalam rangka menilai hasil tes lisan

Pemeriksaan atau koreksi yang dilaksanakan dalam rangka menilai jawaban – jawaban testee pada tes hasil belajar secara lisan, pada umumnya bersifat subjektif, sebab dalam tes lisan itu tester tidak berhadapan dengan lembar jawaban soal yang wujudnya adalah benda mati, melainkan berhadapan dengan individu atau makhluk hidup yang masing – masing mempunyai cirri dan karakteristik berbeda sehingga memungkinkan bagi tester untuk bertindak kurang atau bahkan tidak objektif.

Dalam hubungan ini, pemeriksaan terhadap jawaban testee hendaknya dikendalikan oleh pedoman yang pasti, misalnya sebagai berikut :

a) Kelengkapan jawaban yang diberikan oleh testee.

Pernyataan tersebut mengandung makna “ apakah jawaban yang diberikan oleh testee sudah memenuhi semua unsure yang seharusnya ada dan sesuai dengan pedoman/ kunci jawanban yang telah disusun oleh tester

b) Kelancaran testee dalam mengemukakan jawaban

Mencakup apakah dalam memberikan jawaban lisan atas soal – soal yang diajukan kepada testee itu cukup lancer sehingga mencerminkan tingkat pemahaman testee terhadap materi pertanyaan yang diajukan kepadanya

c) Kebenaran jawaban yang dikemukakan

Jawaban panjang yang dikemukakan oleh testee secara lancar dihadapan tester, belum tentu merupakan jawaban yang benar sehingga tester harus benar – benar memperhatikan jawaban testee tersebut, apakah jawaban testee itu mengandung kadar kebenaran yang tinggi atau sebaliknya.

d) Kemampuan testee dalam mempertahankan pendapatnya

Maksudnya, apakah jawaban yang diberikan dengan penuh kenyakinan akan kebenarannya atau tidak. Jawaban yang diberikan oleh testee secara ragu – ragu merupakan salah satu indicator bahwa testee kurang menguasai materi yang diajukan kepadanya tersebut.

Demikian seterusnya, penguji dapat menambahkan unsure lain yang dirasa perlu dijadikan bahan penilaian seperti : perilaku, kesopanan, kedisiplinan dalam menghadapi penguji ( tester )

3. Teknik pemeriksaan dalam rangka menilai hasil tes perbuatan

Dalam tes perbuatan ini pemeriksaan hasil – hasil tes nya dilakukan dengan menggunakan observasi ( pengamatan ). Sasaran yang perlu diamati adalah tingkah laku, perbuatan, sikap dan lain sebagainya. Untuk dapat menilai hasil tes perbuatan itu diperlukan adanya instrument tertentu dan setiap gejala yang muncul diberikan skor tertentu pula.

Contoh: misalkan instrument yang dipergunakan dalam mengamati calon guru yang melaksanakan praktek mengajar, aspek – aspek yang diamati meliputi 17 unsur dengan skor minimum 1 (satu) dan maksimum 5 (lima).

F. Teknik Pemberian Skor Hasil Tes Hasil Belajar

Pemberian skor (scoring) merupakan langkah pertama dalam proses pengolahan hasil tes yaitu proses pengubahan jawaban soal tes menjadi angka dengan kata lain, pemberian skor merupakan tindakan kuantifikasi terhadap jawaban yang diberikan oleh testee dalam suatu tes. Seterusnya angka – angka hasil tes tersebut diubah menjadi nilai melalui proses tertentu, penggunaan symbol untuk menyatakan nilai tersebut dapat dalam bentuk angka maupun huruf.

Cara pemberian skor terhadap hasil tes hasil belajar pada umumnya disesuaikan dengan bentuk soal yang dikeluarkan dalam tes tersebut baik tes uraian maupun objektif.

1. Pemberian skor pada tes uraian

Pada tes uraian ini, pemberian skor umumnya mendasar pada bobot soal yang diberikan pada setiap butir soal, atas dasar tingkat kesulitan atau banyak sedikitnya unsur yang harus terdapat dalam jawaban yang dianggap jawaban paling benar.

Sebagai contoh misalkan tes subyektif memberikan lima butir soal, pembuat soal (tester) telah menetapkan bahwa kelima butir dari soal tersebut mempunyai derajat kesukaran yang sama dan unsur yang terdapat pada setiap butir soal telah dibuat sama banyaknya, maka atas dasar itu tester dapat menetapkan bahwa setiap jawaban yang dijawab oleh tester benar diberikan skor maksimum 10 jika hanya benar setengahnya maka diberi 5 dan apa bila tidak menyangkut sama sekali diberi skor 0 dan seterusnya.

2. Pemberian skor pada tes obyektif

Pada tes obyektif, untuk memberikan skor pada umumnya digunakan rumus correction for guessing atau sering dikenal dengan istilah denda. Untuk pemberian skor pada tes obyektif ini dibagi menjadi 3 bentuk yaitu:

· Untuk tes obyektif ben true-false misalkan, setiap item diberi skor 1 (satu), apabila seorang tester menjawab dengan benar maka diberi skor 1 (satu) namun apabila dijawab salah maka skornya 0 (nihil).

Adapun cara untuk menghitung skor terakhir dari seluruh item bentuk ini, dapat digunakan dua macam rumus yaitu:

Ø Rumus yang memperhitungkan denda yaitu:

S = R - W dibagi o - 1

Dimana :

S = skor yang dicari

R = jumlah jawaban benar

W = jumlah jawaban salah

O = option, jawaban yang kemungkinan benar or salah

1 = bilangan konstan

Ø rumus yang tidak memperhitungkan denda yaitu :

S = R

· sedangkan untuk tes obyektif bentuk matching,fill in dan completion perhitungan skor akhir pada umumnya tidak memperhitungkan sanksi berupa denda sehingga rumus yang digunakan yaitu :

S = R

· adapun untuk tes obyektif bentuk multiple choice items dapat digunakan salah satu dari dua buah rumus yaitu rumus yang memperhitungkan denda dan rumus yang tidak memperhitungkan denda.

Ø Rumus perhitungan skor dengan memperhitungkan denda :

S = R - ( W dibagi o - 1 )

Ø Sedangkan untuk rumus yang mangabaikan denda yaitu:

S = R

Sumber referensi :

Prof. Dr.Arikunto, Suharsimi, 2008. Dasar-Dasar Evaluasi Pendidikan ( Edisi Revisi ), Jakarta: Bumi Aksara

Dr. Azwar, Syaefuddin, 2005. Tes Prestasi, Fungsi dan Pengembangan Pengukuran Prestasi Belajar, Yogyakarta: Pustaka Pelajar

Prof. Dr. H. Mulyadi,M.Pd.I., 2014. Evaluasi Pendidikan Pengembangan Model Evaluasi Pendidikan Agama di Sekolah, Malang: UIN-Maliki Press

Prof. Drs. Sudijono Anas,2007.Pengantar Evaluasi Pendidikan,Jakarta:PT Raja Grafindo Persada

Dr.Purwanto, Ngalim, 2008. Prinsip – prinsip dan Teknik Evaluasi Pengajaran, Bandung: PT Remaja Rosdakarya

Krath Wohl, David R.,1974. Taxonomy of Education Objectives, New York: David Mc, Kay Company

Thorndike,R.L., & Hagen,E.P., 1991. Measurement and Evaluation in Psychology and Education. New York : Macmillan Publishing Company

http://matematikawansejati.blogspot.co.id/2012/06/teknik-pengujian-validitas-tes-dan.html

[1] Mulyadi,2014. Evaluasi Pendidikan, Malang: UIN Maliki Press, hal. 35

[2] Dikutip oleh Mulyadi, Op.Cit. hal. 36-37. Azwar, Syaefuddin, Tes Prestasi, Fungsi dan Pengembangan Pengukuran Prestasi Belajar, 2005. Yogyakarta:Pustaka Pelajar

[3] Masrukhin,M.Pd., Evaluasi Pendidikan, STAIN Kudus Press, hal. 106-107

[4] Mulyadi, Op.Cit. hal. 38-41

[5] Prof.Dr. H.Mulyadi,M.Pd.I, Evaluasi Pendidikan.Op.Cit. hal. 42-43

[6] Dikuti Mulyadi dalam Amir daien, 1998. Op.Cit. hal. 47

[7][7] Mulyadi, Ibid, Hal. 51

DISCLAIMER
Konten pada website ini merupakan konten yang di tulis oleh user. Tanggung jawab isi adalah sepenuhnya oleh user/penulis. Pihak pengelola web tidak memiliki tanggung jawab apapun atas hal hal yang dapat ditimbulkan dari penerbitan artikel di website ini, namun setiap orang bisa mengirimkan surat aduan yang akan ditindak lanjuti oleh pengelola sebaik mungkin. Pengelola website berhak untuk membatalkan penayangan artikel, penghapusan artikel hingga penonaktifan akun penulis bila terdapat konten yang tidak seharusnya ditayangkan di web ini.

Laporkan Penyalahgunaan

Komentar




search

New Post