Menguji Ramadan
Menguji Pendidikan
Syamsir Alam ; Mantan Karyawan Pusat
Penilaian Pendidikan (Puspendik)
MEDIA
INDONESIA, 13 Agustus 2012
“ON no soul doth Allah place
a burden greater than it can bear. It gets every good that it earns, and it
suffers every ill that it earns,” (Al-Baqarah, ayat 286).
PADA bulan suci Ramadan ini kita sangat dianjurkan untuk dapat
dengan jujur dan genuine mengevaluasi
seluruh prilaku selama 11 bulan terakhir. Soal evaluasi dan refl eksi
individual, mungkin banyak yang sudah melakukannya, sebab jika sampai
terlupakan, ia akan memengaruhi kualitas ibadah puasa yang bersangkutan. Namun
dalam konteks kebijakan publik (domain pemerintah), refleksi dan evaluasi
terhadap efektivitas, termasuk collateral
effects kebijakan yang pernah dikeluarkan, itu semestinya juga menjadi
prioritas dan keniscayaan.
Dari sekian banyak kebijakan yang dikeluarkan pemerintah,
pemanfaatan rezim akuntabilitas pada sistem pendidikan melalui kebijakan
pengujian sejenis high-stake examinations
seperti ujian nasional (UN) dan uji kompetensi guru (UKG) sangat menyedot
perhatian publik. Kebijakan itu terus-menerus diperdebatkan sebagian masyarakat
karena dipandang kontroversial.
Karena itu, sudah sepantasnya para pemangku kebijakan yang
memiliki otoritas dalam meningkatkan kualitas pendidikan di Tanah Air sedikit
merefleksikan Ramadan untuk mengkaji dan mengkritisi kebijakan yang pernah
mereka buat. Menguji kepekaan kebijakan bukanlah suatu dosa, apa lagi dilakukan
di bulan suci.
Ujian Nasional
Degradasi dan deskripsi kualitas pada hampir semua jenjang dan
jenis pendidikan, sebagaimana diindikasikan dari laporan berbagai `survei'
internasional, seperti TIMSS, PIRLS, dan PISA, memaksa pemerintah mencari
solusi strategis, terukur, dan berjangka pendek. Pilihan rasional bagi pemerintah
saat ini ialah pemanfaatan instrumen kebijakan ujian (high-stake examinations). Kementerian Pendidikan dan Kebudayaan
sangat yakin bahwa instrumen kebijakan ujian (UN dan UKG) akan dapat mendorong
perubahan dan peningkatan mutu pendidikan. Karena itu, mereka tetap keukeuh
melaksanakan kedua jenis tes itu meskipun harus menuai kritik sangat tajam.
Ujian memang dimungkinkan dapat memengaruhi strategi dan motivasi
belajar siswa. Namun, peningkatan motivasi belajar itu bukan merupakan fungsi
tes. Peningkatan motivasi belajar siswa itu hanya dipandang sebagai sesuatu
yang terjadi tanpa disengaja (collateral
effects) dan ia bukan tujuan tes itu sendiri. Seandainya fungsi tes sebagai
peningkatan motivasi belajar siswa harus dipaksakan, para ahli testing tentunya
akan sangat sulit menemukan bukti-bukti validitasnya (validity evidence).
Secara umum, pengujian/penilaian pendidikan hanya mempunyai dua
fungsi utama, yakni digunakan untuk merekam hasil pengalaman belajar siswa yang
disebut dengan tes prestasi belajar (achievement
test) dan memprediksi kelayakan (potensi) individual kandidat apabila yang
bersangkutan diberi kesempatan untuk belajar, misalnya di program tertentu di
sebuah perguruan tinggi negeri atau ditempatkan pada suatu jenjang kelas atau
pekerjaan tertentu (predictive test).
Hal lain yang juga menarik untuk disimak dan diperhatikan dari
kebijakan pemerintah ialah menafsirkan hasil UN dengan menggunakan konsep norm referenced measurement dan criterion-referenced measurement secara
simultan. Kementerian Pendidikan dan Kebudayaan berulang-ulang mengatakan
tujuan UN untuk kepentingan pemetaan, di samping penentuan kelulusan.
UN, Kelulusan, dan Pemetaan
Untuk kepentingan kelulusan, pihak penyelenggara pastinya akan
menafsirkan hasil UN yang didasarkan pada konsep criterion-referenced measurement sehingga apabila diperoleh tingkat
kelulusan UN yang angkanya melebihi 99%, seperti yang sudah dilaporkan, kita
akan segera paham kenapa itu bisa terjadi. Keputusan kelulusan tersebut
didasarkan pada kriteria atau domain
skill yang terdapat pada kurikulum sehingga kemungkinan sebagian besar
siswa dapat lulus atau gagal secara teoretis bisa dijelaskan.
Keganjilan akan
timbul jika hasil UN (yang sama) juga akan digunakan untuk kepentingan
pemetaan, yang penafsiran skornya berbasiskan normreferenced measurement, tetapi tetap dipaksakan menjadi salah
satu tujuan diseleng garakannya UN.
Desain soal-soal tes pada ujian nasional yang akan difungsikan
untuk kepentingan pemeta an semestinya berbeda dengan yang akan digunakan untuk
kepentingan kelulusan (criterion referenced)
meskipun duplikasi pemanfaatan soal-soal tes itu masih dimungkinkan untuk
dilakukan untuk dilakukan (Nitko, 1996). Namun, menyusun soal-soal tes yang ber
fungsi sebagai penentu kelulusan dan pemetaan secara bersamaan sangatlah tidak
mudah dan penulis sangat meragukan Puspendik/BSNP (dengan berbagai konstrain
waktu dan minimnya tenaga ahli untuk meng-craft
soal-soal tes semacam itu) mampu melakukannya.
Untuk kepentingan pemetaan, soal-soal tes seharusnya on target. Artinya, desain soal-soal tes
itu harus dapat dengan tepat mengukur kemampuan kandidat sehingga hasilnya akan
dengan jelas dapat diperbandingkan antara kandidat yang sudah memiliki
kemampuan terhadap mata pelajaran yang ditempuh dan kandidat yang kemampuannya
masih kurang. Jadi sebagai fungsi pemetaan, instrumen tes yang digunakan
seharusnya mampu membedakan siswa dengan kinerja baik atau kurang dalam
belajar.
Setiap individu siswa akan dihargai sesuai dengan usahanya. Dalam
bahasa teknis, hal itu dapat dijelaskan sebagai berikut: tingkat kesukaran (TK)
soal-soal tes yang digunakan berkisar di antara 40-60. Artinya, soal-soal itu
dapat dikategorikan sebagai soal-soal yang tidak mudah, tapi juga tidak terlalu
sulit dan distribusi skornya mendekati bentuk kurva normal. Dengan demikian,
itu dimungkinkan untuk membandingkan skor perolehan siswa dari usaha keras
(baik) dan usaha yang kurang maksimal.
Kutipan ayat 286 Surah Al-Baqarah di awal tulisan ini menjadi
sangat relevan digunakan sebagai bahan refleksi bagi kita yang berkecimpung di
dunia pendidikan, khususnya dalam penilaian pendidikan. Allah SWT sangat adil
dalam memberikan ujian karena Allah Yang Mahakuasa sangat paham akan perbedaan
kemampuan setiap hamba-Nya. Allah SWT tidak memberikan ujian (spiritual) yang
bebannya melebihi kapasitas seorang hamba untuk memikulnya. Keadilan Ilahi
menyebabkan ada sebagian di antara hamba-Nya yang diberi penghargaan sesuai
dengan amal usahanya dan sebaliknya, di antara hamba-Nya itu ada juga yang harus
menerima hukuman karena kelalaiannya.
Jadi, kedudukan (attainment)
setiap hamba Allah SWT terefleksi dengan sangat jelas dari kualitas amal
usahanya. Ayat 286 Al-Baqarah melukiskan bagaimana praktik pengujian pendidikan
yang berkeadilan seharusnya dilakukan. Yang usaha belajarnya baik tentu harus
diberi penghargaan (certified).
Sebaliknya, yang usahanya minimal atau melalaikan tanggung jawab belajarnya
menerima risiko atas kelalaiannya itu (tidak lulus).
Fenomena lain yang menarik mengenai pendidikan ialah ditetapkannya
nilai sekolah (NS) sebagai penentu kelulusan meskipun bobotnya hanya sebesar
40%. Kebijakan itu dinilai tepat karena NS akan dapat melengkapi bukti
validitas (validity evidence) yang
dibutuhkan penyelenggara untuk menafsirkan dan menggunakan skor tes sesuai
dengan tujuan tes. Namun, otoritas yang diberikan kepada sekolah sayangnya
belum diikuti dengan bimbingan dan advokasi tentang bagaimana penilaian sekolah
itu seharusnya dirancang. Akibatnya duplikasi konsep materi dan domain skill
yang diujikan pada ujian sekolah dan UN sulit dihindari.
Puspendik dan BSNP sebenarnya dapat menerapkan konsep balanced assessment system (Khal, 2012)
agar konsep materi dan thinking skill
di kurikulum dapat didistribusikan secara tepat pada ujian sekolah dan UN.
Kompetensi yang lebih kompleks dan menuntut kemampuan high-order thinking skills diujikan melalui ujian sekolah,
sedangkan konsep penting tetapi membutuhkan kemampuan yang sedikit lebih
sederhana diujikan pada UN. Dengan demikian, jumlah konsep/materi dan domain skill kurikulum yang diujikan
dapat lebih luas dan tersebar.
Jika Puspendik/BSNP dapat mengeksekusi program penguatan kapasitas
guru/kepala sekolah dalam bidang penilai an dan konsep balanced assessment system, peningkatan kualitas pendidikan bukanlah
berupa wishful thinking. Lebih dari
itu, pendidikan bermutu (quality
education) akan menjadi kenyataan. Sebagaimana dikemukakan para ahli
testing, highstake examinations
(semacam UN dan UKG) tidak akan efektif jika penilaian pada tingkat sekolah
luput dari perhatian dan pembinaan. Gabungan rigorous high-stake exams dan ujian sekolah akan menciptakan
kualitas pendidikan yang genuine dan
berkelanjutan. ●
Tidak ada komentar:
Posting Komentar