BAB I
PENDAHULUAN
A.
Latar Belakang
Evaluasi
memiliki arti penting dalam kegiatan belajar mengajar yang dilaksanakan oleh
seorang guru. Diantara tujuan dari evaluasi adalah untuk menilai ketercapaian
tujuan pendidikan oleh anak didik, sarana untuk mengetahui apa yang telah anak
didik ketahui dalam kegiatan belajar mengajar, dan memotivasi anak didik. Untuk
mengevaluasi hasil belajar dan proses belajar siswa, seorang guru menggunakan
berbagai macam alat atau instrumen evaluasi seperti tes tertulis, tes lisan,
ceklis-observasi, angket-wawancara, dan dokumentasi.
Keberhasilan
mengungkap hasil dan proses belajar ini sebagaimana adanya (objektivitas hasil
penilaian) sangat bergantung pada kualitas alat penilainya, di samping itu juga
yang tidak kalah pentingnya tergantung pada cara pelaksanaannya. Suatu alat
penilaian dikatakan mempunyai kualitas yang baik apabila alat tersebut memiliki
atau memenuhi dua hal, yaitu validitas (ketepatan) dan reliabilitas (ketetapan
atau keajegan) alat tes terjamin kualitasnya. Alat tes yang bagaimana dan
seperti apa yang dikatakan memiliki validitas dan reliabilias ini, selanjutnya
akan kita bahas dalam makalah ini berjudul “Reliabilitas dan Validitas
Tes” ini.
BAB II
PEMBAHASAN
A. Validitas
Menurut
Azwar (1986) Validitas berasal dari kata validity yang mempunyai arti sejauh
mana ketepatan dan kecermatan suatu alat ukur dalam melakukan fungsi ukurnya.
Suatu skala
atau instrumen pengukur dapat dikatakan mempunyai validitas yang tinggi apabila
instrumen tersebut menjalankan fungsi ukurnya, atau memberikan hasil ukur yang
sesuai dengan maksud dilakukannya pengukuran tersebut. Sedangkan tes yang
memiliki validitas rendah akan menghasilkan data yang tidak relevan dengan
tujuan pengukuran.[1]
Pada prinsipnya, meneliti adalah
melakukan pengukuran, oleh sebab itu dibutuhkan alat ukur atau instrumen
penelitian yang baik (telah teruji validitas dan reabilitasnya) agar
mendapatkan hasil penelitian yang valid dan reliabel. Perlu dibedakan antara
hasil penelitian yang valid dan reliabel dengan instrumen penelitian yang valid
dan reliabel. Hasil penelitian yang valid bila terdapat kesamaan antara data
yang terkumpul dengan data yang sesungguhnya. Terjadi pada obyek yang diteliti[2]
Validitas
merupakan derajat kemampuan suatu tes yang mengukur apa yang hendak diukur.
Secara tidak langsung itu meliputi tes dan skala yang terdiri atas sejumlah
tugas yang dipilih untuk berfungsi sebagai indikator hasil belajar. Validitas
berkenaan dengan ketetapan alat penilaian terhadap konsep yang dinilai sehingga
betul-betul menilai apa yang yang seharusnya dinilai. Sebagai contoh menilai
kemampuan siswa dalam matematika. Misalnya diberikan soal dengan kalimat yang
panjang dan berbelit-belit sehingga sukar ditangkap maknanya. Akhirnya siswa
tidak dapat menjawab karena tidak memahami pertanyaannya. Validitas tidak
berlaku universal sebab bergantung pada situasi dan tujuan penilaian. Alat
penilaian yang telah valid untuk suatu tujuan tertentu belum otomatis akan
valid untuk tujuan yang lain.
Dalam menggunakan
validitas suatu tes, ada beberapa hal yang perlu diperhatikan, yaitu :
a.
Mengacu pada
materi yang hendak diujikan.
b.
Mengacu pada
hasil dari suatu tes atau instrument evaluasi yang dikenakan pada sekelompok
individu.
c.
Berkaitan
dengan derajar dengan istilah validasi tinggi, sedang, rendah.
d.
Mengacu pada
penggunaan hasil evaluasi.
Validitas suatu instrumen evaluasi mempunyai beberapa
makna penting diantaranya adalah sebagai berikut:
a.
Validitas
berhubungan dengan ketepatan interpretasi hasil tes atau instrumen evaluasi
untuk grup individual dan bukan instrumen itu sendiri.
b.
Validitas
diartikan sebagai derajat yang menunjukkan kategori yang bisa mencakup kategori
yang bisa mencakup kategori rendah, menengah, dan tinggi.
c.
Prinsip
suatu tes valid, tidak universal. Validitas suatu tes yang perlu diperhatikan
oleh para peneliti adalah bahwa ia hanya valid untuk suatu tujuan saja.[3]
Ada dua unsur penting dalam validitas tes. Unsur
tersebut adalah sebagai berikut:
a.
Validitas
suatu tes harus menunjukkan suatu derajat tertentu, ada yang sempurna, ada yang
sedang, dan ada pula yang rendah.
b.
Validitas
selalu dihubungkan dengan suatu putusan atau tujuan spesifik. Sebagaimana
pendapat R. L Thorndike dan H. P Hagen bahwa “validiti is always in relation
to a specific decision or use”[4]
B.
Pengertian Reliabilitas
Walizer
(1987) menyebutkan pengertian Reliability (Reliabilitas) adalah keajegan
pengukuran. Menurut John M. Echols dan Hasan
Shadily (2003: 475) reliabilitas adalah hal yang dapat dipercaya. Popham (1995:
21) menyatakan bahwa reliabilitas adalah "...the degree of which test
score are free from error measurement"
Menurut
Masri Singarimbun, realibilitas adalah indeks yang menunjukkan sejauh mana
suatu alat ukur dapat dipercaya atau dapat diandalkan. Bila suatu alat pengukur
dipakai dua kali – untuk mengukur gejala yang sama dan hasil pengukuran yang
diperoleh relative konsisten, maka alat pengukur tersebut reliable.
Dengan kata lain, realibitas menunjukkan konsistensi suatu alat pengukur di dalam
pengukur gejala yang sama.
Menurut
Brennan (2001:295) reliabilitas merupakan karakteristik skor, bukan tentang tes
ataupun bentuk tes. Menurut Sumadi Suryabrata (2004:28)
reliabilitas menunjukkan sejauhmana
hasil pengukuran dengan alat tersebut dapat dipercaya. Hasil pengukuran harus
reliabel dalam artian harus memiliki tingkat konsistensi dan kemantapan.
Dalam
pandangan Aiken (1987: 42) sebuah tes dikatakan reliabel jika skor yang
diperoleh oleh peserta relatif sama meskipun dilakukan pengukuran
berulang-ulang. [5]
Reliabilitas
adalah karakter lain dari hasil evaluasi. Reliabilitas juga dapat diartikan
sama dengan konsistensi atau keajegan. Suatu instrumen evaluasi, dikatakan
mempunyai nilai reliabilitas yang tinggi apabila tes yang dibuat mempunyai
hasil yang konsisten dalam mengukur yang hendak diukur. Ini berarti semakin
reliabel suatu tes, semakin yakin kita dapat menyatakan bahwa dalam hasil
suatu tes mempunyai hasil yang sama dan bisa dipakai di suatu tempat
sekolah, ketika dilakukan tes tersebut.
Reliabilitas
soal merupakan ukuran yang menyatakan tingkat keajegan atau kekonsistenan suatu
tes soal. Untuk mengukur tingkat keajegan soal ini digunakan perhitungan Alpha
Cronbach. Rumus yang digunakan dinyatakan dengan:
R11
=
Keterangan:
n
= banyaknya butir soal
Si2
= jumlah varians tiap skor
St2
= varians skor total
Rumus untuk
mencari varians adalah:
Si2 =
Interpretasi
nilai r11 mengacu pada pendapat Guilford (Ruseffendi, 1991b: 191):
rii
<
0,20
reliabilitas sangat rendah
0,20
< rii 0,40
reliabilitas rendah
0,420 < rii
0,70
reliabilitas sedang
0,70
< rii
0,90
reliabilitas tinggi
C. Jenis-jenis
Validitas dan Reliabilitas
1.
Validitas
Secara garis
besar ada dua macam validitas, yaitu validitas logis dan validitas empiris.
a. Validitas Logis
Istilah
“validitas logis” mengandung kata “logis” berasal dari kata “logika” atau
validitas logis sering juga disebut sebagai analisis kualitatif yaitu berupa
penalaran atau penelaahan. Dengan makna demikian maka validitas logis untuk
sebuah instrumen yang memenuhi persyaratan valid berdasarkan hasil penalaran.
Kondisi valid tersebut dipandang terpenuhi karena instrumen yang bersangkutan
sudah dirancang secara baik, mengikuti teori dan ketentuan yang ada.
Sebagaimana pelaksanaan tugas lain misalnya membuat sebuah karangan, jika
penulisan sudah mengikuti aturan mengarang, tentu secara logis karangannya
sudah baik. Berdasarkan penjelasan tersebut maka instrumen yang sudah disusun
berdasarkan teori penyusunan instrumen, secara logis sudah valid. Dari penjelasan
tersebut dapat dipahami bahwa validitas logis dapat dicapai apabila instrumen
disusun mengikuti ketentuan yang ada. Dengan demikian, dapat disimpulkan bahwa
validitas logis tidak perlu diuji kondisinya tetapi langsung diperoleh sesudah
instrumen tersebut selesai disusun.
b.
Validitas
Empiris
Istilah
“validitas empiris” memuat kata “empiris” yang artinya “pengalaman”. Sebuah
instrumen dapat dikatakan memiliki validitas empiris apabila sudah diuji dari
pengalaman. Analisis soal secara kuantitatif menekankan pada analisis
karakteristik internal tes melalui data yang diperoleh secara empiris.
Karakteristik internal secara kuantitatif dimaksudkan meliputi parameter soal
tingkat kesukaran, daya pembeda dan reliabilitas. Khusus soal-soal pilihan
ganda, dua tambahan parameter yaitu dilihat dari peluang untuk menebak atau
menjawab soal benar dan berfungsi tidaknya pilihan jawaban, yaitu penyebaran
semua alternative jawaban dari subyek-subyek yang dites. Salah satu tujuan
dilakukannya analisis adalah untuk meningkatkan kualitas soal, yaitu apakah
suatu soal dapat diterima karena telah didukung oleh data statistik yang
memadai, diperbaiki karena terbukti terdapat beberapa kelemahan atau bahkan
tidak digunakan sama sekali karena terbukti secara empiris tidak berfungsi sama
sekali.
Ada tiga jenis
validitas yang sering digunakan, yakni:
a.
Validitas
isi (content validity)
Sebuah tes dikatakan memilki validitas isi apa bila mengukur
tujuan khusus tertentu yang sejajar dengan materi atau isis pelajaran yang
diberikan. Oleh karena materi yang diajarkan tertera dalam kurikulum maka
validitas isi ini sering juga disebut validitas kurikuler.
Validitas isi berkenaan dengan kesanggupan alat
penilaian data mengukur isi yang seharusnya. Artinya, tes tersebut mampu
mengungkapkan isi suatu konsep atau variabel yang hendak diukur. Misalnya tes
hasil belajar bidang studi IPS harus bisa mengungkapkan isi bidang studi
tersebut. Hal ini bisa dilakukan dengan cara menyusun tes yang bersumber dari
kurikulum bidang studi yang hendak diukur. Disamping kurikulum dapat juga
diperkaya dengan melihat atau mengkaji buku sumber.
b.
Validitas
konstruksi (construct validity)
Sebuah tes dikatakan memiliki validitas konstruksi
apabila butir-butir soal yang membangun tes tersebut mengukur setiap aspek
berfikir seperti yang disebutkan dalam tujuan instruksional khusus. Dengan kata
lain jika butir-butir soal mengukur aspek berfikir tersebut sudah sesuai dengan
aspek berfikir yang menjadi tujuan instruksional.
c.
Validitas
prediksi (predictive validity)
Memprediksi artinya meramal, dengan meramal selalu
mengenai hal yang akan datang jadi sekarang belum terjadi. Sebuah tes dikatakan
memiliki validitas prediksi atau validitas ramalan apabila mempunyai kemampuan
untuk meramalkan apa yang akan terjadi pada masa yang akan datang.
Sebagai alat pembanding validitas prediksi adalah
nilai-nilai yang diperoleh setelah peserta tes mengikuti pelajaran di Perguruan
Tinggi. Jika ternyata siapa yang memiliki nilai tes lebih tinggi gagal dalam
ujian semester 1 dibandingkan dengan yang dahulu nilai tesnya lebih rendah maka
tes masuk yang dimaksud tidak memiliki validitas prediksi.[7]
2.
Reliabilitas
Walizer (1987) menyebutkan bahwa ada
dua cara umum untuk mengukur reliabilitas, yaitu:
a.
Relibilitas stabilitas.
Menyangkut
usaha memperoleh nilai yang sama atau serupa untuk setiap orang atau setiap
unit yang diukur setiap saat anda mengukurnya. Reliabilitas ini menyangkut
penggunaan indicator yang sama, definisi operasional, dan prosedur pengumpulan
data setiap saat, dan mengukurnya pada waktu yang berbeda. Untuk dapat
memperoleh reliabilitas stabilitas setiap kali unit diukur skornya haruslah
sama atau hampir sama.
b.
Reliabilitas
ekivalen.
Menyangkut
usaha memperoleh nilai relatif yang sama dengan jenis ukuran yang berbeda pada
waktu yang sama. Definisi konseptual yang dipakai sama tetapi dengan satu atau
lebih indicator yang berbeda, batasan-batasan operasional, paeralatan
pengumpulan data, dan / atau pengamat-pengamat. Menguji reliabilitas dengan
menggunakan ukuran ekivalen pada waktu yang sama bias menempuh beberapa bentuk.
Bentuk yang paling umum disebut teknik belah-tengah. Cara ini seringkali
dipakai dalam survai.Apabila satu rangkaian pertanyaan yang mengukur satu
variable dimasukkan dalam kuesioner, maka pertanyaan-pertanyaan tersebut dibagi
dua bagian persis lewat cara tertentu. (Pengacakan atau pengubahan sering
digunakan untuk teknik belah tengah ini.) Hasil masing-masing bagian pertanyaan
diringkas ke dalam skor, lalu skor masing-masing bagian tersebiut dibandingkan.
Apabila dalam skor kemudian skor masing-masing bagian tersebut dibandingkan.
Apabila kedua skor itu relatif sama, dicapailah reliabilitas belah tengah.
Reliabilitas
ekivalen dapat juga diukur dengan menggunakan teknik pengukuan yang berbeda.
Kecemasan misalnya, telah diukur dengan laporan pulsa. Skor-skor relatif dari
satu indikator macam ini haruslah sesuai dengan skor yang lain. [8]
BAB III
PENUTUP
KESIMPULAN
Reliabilitas
adalah karakter lain dari hasil evaluasi. Reliabilitas juga dapat diartikan
sama dengan konsistensi atau keajegan.
Validitas
merupakan derajat kemampuan suatu tes yang mengukur apa yang hendak diukur.
Secara garis
besar ada dua macam validitas, yaitu validitas logis dan validitas empiris.
Ada empat
jenis validitas yang sering digunakan, yakni:
a)
Validitas isi (content validity)
b)
Validitas konstruksi (construct validity)
c)
Validitas “ada sekarang” (concurrent validity)
d) Validitas
prediksi (predictive validity)
Ada dua cara umum untuk mengukur reliabilitas, yaitu:
a)
Relibilitas stabilitas.
b)
Reliabilitas ekivalen
DAFTAR
PUSTAKA
Arifin. Zainal, Evaluasi Pembelajaran, Bandung: Remaja Rosdakarya, 2011
Idrus, Muhammad.2009. Metode Penelitian Ilmu Sosial
(Pendekatan Kualitatif dan Kuantitatif Edisi Kedua). Jakarta : Erlangga.
Jihad. Asep dan Haris. Abdul, Evaluasi
Pembelajaran, Yogyakarta: Multi Pressindo, 2008
Margono,S, 2007. Metedologi Penelitian Pendidikan.
Jakarta: PT Rineka Cipta
Nawawi, Hadari, 1983. Metedologi Penelitian
Bidang Sosial. Yogyakarta: UGM Press
Sudjana, Nana , Ibrahim, 1989. Penelitian dan
Penelitian Pendidikan. Bandung: Sinar Baru
Sukardi, Evaluasi pendidikan
Prinsip dan Operasionalnya, Jakarta: Bumi Aksara, 2009
Sugiyono, Metode
Penelitian Kuantitaif Kualitatif dan R&D Bandung: Alabeta, 2010
[1] http://merlitafutriana0.blogspot.com/p/validitas-dan-reliabilitas.html,
diakses pada tanggal 31April 2018
[2]
Sugiyono, Metode Penelitian
Kuantitaif Kualitatif dan R&D (Bandung: Alabeta, 2010), h. 121.
[3] Sukardi, Evaluasi
pendidikan Prinsip dan Operasionalnya, (Jakarta: Bumi Aksara, 2009), 31.
[4] Zainal Arifin, Evaluasi
Pembelajaran, (Bandung: Remaja Rosdakarya, 2011), hal.245
[5] http://merlitafutriana0.blogspot.com/p/validitas-dan-reliabilitas.html,
diakses pada tanggal 31 April 2018
[6] Asep Jihad dan Abdul Haris, Evaluasi
Pembelajaran (Yogyakarta: Multi Pressindo, 2008), 180-181
[7]
http://mathsamah1989.blogspot.com/2012/10/validitas-dan-reliabilitas-tes-hasil.html,
diakses pada tanggal 31 April 2018
[8]
http://merlitafutriana0.blogspot.com/p/validitas-dan-reliabilitas.html,
diakses pada tanggal 31 April 2018
0 komentar:
Posting Komentar