sumber : http://shahibul1628.wordpress.com/2012/04/09/reliabilitas-instrumen/
Menurut Kamus Besar Bahasa Indonesia
(2002), reliabilitas diartikan sebagai pola perihal sesuatu yang
bersifat reliabel (andal), keterandalan. Selanjutnya, Djaali (2008)
mengungkapkan bahwa reliabilitas yang berasal dari kata reliability berarti
sejauhmana hasil sebuah pengukuran dapat dipercaya. Suatu hasil
pengukuran dapat dipercaya apabila dalam beberapa kali pelaksanaan
pengukuran terhadap kelompok subjek yang sama diperoleh hasil pengukuran
yang relatif sama. Hal ini juga diungkapkan oleh Fraenkel, Wallen &
Hyun (2012) dalam bukunya “How to Design and Evaluate Research in Education” yang menyatakan bahwa, ”Reliability
refers to the consistency of scores or answers from one administration
of an instrument to another, and from one set of items to another”.
Dari beberapa pendapat tersebut, dapat
dikatakan bahwa reliabilitas suatu instrumen berhubungan dengan masalah
ketetapan hasil tes dari instrumen tersebut dan seberapa besar derajat
instrumen untuk mengukur secara konsisten sasaran yang diukur. Dengan
kata lain, reliabilitas adalah sejauh mana pengukuran dari suatu uji
coba yang dilakukan tetap memiliki hasil yang sama meskipun dilakukan
secara berulang-ulang terhadap subjek dan dalam kondisi yang sama. Oleh
sebab itu, uji reliabilitas bertujuan untuk melihat sejauh mana
konsistensi skor skor yang diberikan skorer satu dengan skorer lainnya
terhadap suatu instrumen.
Reliabilitas suatu instrumen erat kaitannya dengan validitas instrumen, adapun hubungan antara reliabilitas dan validitas dapat digambarkan pada papan panah berikut:
Pada gambar pertama menunjukkan bahwa
anak panah tidak mengarah dengan tepat pada sasaran, akan tetapi anah
panah cenderung tetap pada daerah tertentu. Ini mengilustrasikan bahwa
instrumen yang seperti itu adalah instrumen yang reliabel akan tetapi
tidak valid. Pada gambar kedua, anak panah tidak mengarah dengan tepat
dan tetap pada sasarannya sehingga instrumen yang seperti itu tidak
memiliki reliabilitas dan validitas. Pada gambar ketiga, anak panah
dengan tepat dan tetap mengarah pada sasaran sehingga instrumen yang
seperti itu memiliki validitas dan reliabilitas.
Instrumen yang valid cenderung reliabel,
akan tetapi instrumen yang reliabel belum tentu valid. Instrumen yang
baik itu seharusnya memiliki validitas dan reliabilitas (seperti
ilustrasi pada gambar ketiga). Untuk mendapatkan validitas dan
reliabilitas instrumen yang baik, pembuat instrumen harus berpedoman
kepada kisi-kisi dari instrumen tersebut.
Adapun jenis-jenis reliabilitas ada dua (Djaali, 2008):
1. Reliabilitas Konsistensi Tanggapan
Reliabilitas konsistensi tanggapan
responden mempersoalkan apakah tanggapan responden atau objek terhadap
tes tersebut sudah baik atau konsisten. Maksudnya adalah apabila kita
melakukan suatu pengukuran terhadap suatu objek kemudian dilakukan
pengukuran kembali terhadap objek yang sama maka apakah hasilnya masih
tetap sama dengan hasil yang diperoleh dari pengukuran sebelumnya.
Jika item-item dalam dua kali pengukuran
itu tidak sama atau tidak setara, maka tidak akan menemukan konsistensi
tanggapan terhadap dua hal yang jelas berbeda. Dan bukanlah merupakan
tujuan atau tugas pemeriksaan reliabilitas.
Ada tiga mekanisme untuk memeriksa atau menentukan reliabilitas tanggapan respon terhadap tes yaitu:
a. Metode test – retest
Test-retest adalah pengetesan
dua kali dengan menggunakan suatu test yang sama pada waktu yang
berbeda. Test seperti ini juga dikenal dengan istilah lain yaitu
single-test-double-trial method. Kemudian hasil dari kedua kali tes
tersebut dihitung korelasinya, nilai tersebut adalah reabilitas dari tes
tersebut.
b. Metode tes sejajar equivalen
Tes paralel atau tes equivalen adalah dua
buah tes yang mempunyai kesamaan tujuan, tingkat kesukaran, dan
susunan, tetapi butir-butir soalnya berbeda. Dalam menggunakan motode
tes ini, pembuat tes harus menyiapkan dua buah tes dan masing-masing
dicobakan pada kelompok siswa yang sama. Skor dari kedua kelompok tes
tersebut dikorelasikan untuk mendapatkan reliabilitas tes.
c. Metode tes tunggal (Single Test – Single Trial)
Metode tes tunggal dilihat dari
kepraktisannya lebih praktis dari pada dua metode sebelumnya. Metode ini
hanya melakukan sekali tes kepada sekelompok subjek. Dengan demikian
tidak perlu menunggu waktu maupun harus mempunyai data dari tes sejenis
untuk dapat menentukan reliabilitasnya. Koefisien reliabilitas dapat
diperoleh dengan cara membelah instrument menjadi dua, tiga, empat, atau
bahkan sebanyak butir yang dimiliki oleh instrumen tersebut. Teknik
perhitungannya tergantung pada banyaknya belahan, bentuk, serta sifat
alat ukurnya. Salah satu tehnik yang akan kita bahas dalam menghitung
koefisien reliabilitas adalah tehnik belah dua (split half)
Pada tehnik belah dua ini pengukuran
dilakukan dengan dua kelompok item yang setara pada saat yang sama.
Karena setiap kelompok item adalah separuh dari dari seluruh tes, maka
biasanya item-item pertama diambil dari item-item tes yang bernomor
ganjil dan kelompok item tes yang kedua diambil dari item-item tes yang
bernomor genap.
Ada dua cara membelah tes tersebut:
- Dengan membelah item-item tes yang bernomor ganjil dan genap, yang selanjutnya dikenal dengan belahan ganjil genap.
- Dengan membelah item tes menjadi dua bagian dari awal dan akhir, dikenal dengan istilah belahan awal dan akhir.
Rumus yang digunakan dalam hal ini adalah rumus Spearman-Brown (Arikunto, 2010):
di mana:
rnn = Besarnya koefisien reliabilitas sesudah tes tersebut ditambah butir soal baru.
n = berapa kali butir-butir soal itu ditambah
r = besarnya koefisien reliabilitas sebelum butir-butir soalnya ditambah
Selain rumus tersebut yang menggunakan rumus product moment,
ada beberapa rumus lain yang dapat digunakan untuk menghitung nilai
reliabilitas suatu tes atau instrumen dengan metode belah dua, yaitu:
- Penggunaan rumus Flanagan (untuk belahan ganjil genap)
Reliabilitas pada formula Flanagan tidak
didasarkan pada ada tidaknya korelasi antara belahan I dengan belahan
II. Dasar dari formula Flanagan adalah jumlah kuadrat deviasi (varians)
pada tes belahan I, jumlah kuadrat (varians) deviasi pada tes belahan
II, dan jumlah kuadrat deviasi (varians) skor total. Rumus yang
digunakan adalah sebagai berikut:
di mana:
r 11 = reliabilitas tes
S 12 = varians belahan pertama (1) yang dalam hal ini varians skor item ganjil
S 22 = varians belahan kedua (2) yaitu varians skor item genap
S t2 = varians total yaitu varians skor total
S = standar deviasi
x = simpangan X dari , yang dicari dari X -
N = banyaknya subjek yang ikut tes
- Penggunaan rumus Rulon (untuk belahan awal dan akhir)
Menurut Rulon reliabilitas dapat
dipandang dari adanya selisih skor yang diperoleh oleh responden pada
belahan pertama dengan belahan kedua. Selisih tersebut yang menjadi
sumber variasi error sehingga bila dibandingkan dengan variasi skor akan
dapat menjadi dasar untuk melakukan estimasi reliabilitas tes. Rumus
Rulon adalah sebagai berikut:
di mana:
r11 = reliabilitas tes
S d2 = varians beda (varians difference)
S t2 = varians total yaitu varians skor total
d = difference yaitu perbedaan antara skor belahan pertama (awal) dengan skor belahan kedua (akhir)
Namun bila banyaknya butir soal atau item
tidaklah genap, reliabilitas masih dapat ditentukan dengan menggunakan
rumus Kuder dan Richardos, yang sering dikenal deng rumus K-R 20 dan K-R
21. Kedua rumus ini banyak digunakan oleh orang-orang dalam menentukan
reliablitas dari suatu tes atau instrumen.
- Rumus K-R 20
Penggunaan rumus K-R20 ini menghasilkan
hasil yang lebih teliti, akan tetapi perhitungannya sedikit lebih rumit.
Adapun rumusnya adalah:
di mana:
r11 = reliabilitas tes secara keseluruhan
p = proporsi subjek yang menjawab item dengan benar
q = proporsi subjek yang menjawab item dengan salah (q = 1 – p)
∑pq = jumlah hasil perkalian p dan q
n = banyak item
S = standar deviasi dari tes (standar deviasi adalah akar varians)
- Rumus K-R 21
Rumus K-R 21 lebih sederhana dalam perhitungannya. Rumusnya adalah sebagai berikut:
di mana: M = mean atau rerata skor total
2. Reliabilitas Konsistensi Gabungan
Reabilitas konsistensi gabungan item
berkaitan dengan kemantapan atau konsistensi antara-antara suatu item.
Hal ini dapat diungkapkan apakah terhadap objek ukur yang sama, item
yang satu menunjukkan hasil ukur yang sama dengan hasil ukur yang lain?.
Koefisien reliabilitas konsistensi gabungan dapat dihitung dengan rumus
K-R 20 dan K-R 21, Hoyt dan Alpha Cronbach. Rumus Alpha Cronbach
digunakan untuk menghitung reliabilitas soal uraian (Arikunto, 2010).
Rumusnya adalah sebagai berikut:
di mana:
r11 = reliabilitas yang dicari
∑σ t2 = jumlah varians skor tiap-tiap item
σ t2 = varians total
Adapun interpretasi mengenai besarnya skala korelasi menurut Arikunto (2010) adalah:
- Antara 0,800 sampai dengan 1,00 : sangat tinggi
- Antara 0,600 sampai dengan 0,800 : tinggi
- Antara 0,400 sampai dengan 0,600 : cukup
- Antara 0,200 sampai dengan 0,400 : rendah
- Antara 0,000 sampai dengan 0,200 : sangat rendah
Referensi :
Arikunto, Suharsimi. (2010). Dasar-Dasar Evaluasi Pendidikan. Jakarta: Bumi Aksara.
Depdikbud. (2008). Kamus Besar Bahasa Indonesia. Jakarta: Balai Pustaka.
Djaali & Muljono, Pudji. (2008). Pengukuran dalam Bidang Pendidikan. Jakarta: Grasindo.
Fraenkel, Wallen & Hyun. (2012). How to Design and Evaluate Research in Education. Eight Edition. New York: McGraw-Hill.
Tidak ada komentar:
Posting Komentar