Home

Sabtu, 07 April 2018

VALIDITAS & RELIABILITAS



BAB I
PENDAHULUAN

A.    Latar Belakang Masalah

Suatu eksperimen mempunyai kontribusi yang berarti bagi pengembangan pengetahuan, dimana dalam eksperimen dapat di ketahui apa yang terjadi dengan jalan melakukan suatu penelitian atas apa yang dijumpai dan atas apa yang didengar tentang issue- issue yang berkembang dalam masyarakat maupun tentang apa yang dilihat dalam fenomologi-fenomologi yang terjadi dalam masyarakat, misalnya tentang issue pendidikan yang berkembang dalam masyarakat  bahwa sekolah setinggi-tingginya sekarang tidak menjamin si anak akan sukses dengan baik.
Selanjutnya untuk menguji benar atau tidaknya issue yang berkembang dalam masyarakat tersebut, haruslah dilakukan suatu penelitian untuk membuktikan benar atau tidaknya issue tersebut. Hal-hal yang harus dilakukan adalah pengumpulan data-data dari sekolah-sekolah yang ada tentang bagaimana keseharian para siswa yang ada untuk menentukan ke suksesan dirinya. Tetapi untuk melakukan hal tersebut tidaklah mudah, dalam penelitian haruslah didapatkan data yang sebenar-benarnya valid.
Peneliti harus mencatat apa yang sesungguhnya dilihat dilapangan dan tidak memanipulasi demi kepentingan tertentu, karena data-data tersebut sering kali dijadikan acuan dalam penelitian-penelitian selanjutnya. Selain dari pada itu  data  dalam penelitian, haruslah memperhatiakan reliabilitasnya yang berkenaan tentang derajad konsistensi dan stabilitas data atau temuan. Suatu data dinyatakan reliabel apabila dua atau lebih peneliti dalam objek yang sama menghasilkan data yang sama atau peneliti yang sama dalam waktu yang berbeda menghasilkan data yang sama atau sekelompok data bila dibagi menjadi dua kelompok menunjukkan data yang tidak berbeda.
Jika peneliti satu menemukan suatu objek berwarna merah, maka peneliti yang lain juga demikian, misalnya dalam penelitian kualitatif antara peneliti satu dengan peneliti lain memperoleh kesamaan data. 



B.    Rumusan Masalah
Berdasarkan latar belakang masalah diatas, maka rumusan masalah yang akan dijelaskan dalam makalah ini adalah:
1.    Apa yang dimaksud Validitas?
2.    Apa yang dimaksud Reliabilitas?
3.    Bagaimana kreteria keabsahan data?

C.    Tujuan
Berdasarkan rumusan masalah diatas, maka tujuan penulisan makalah ini adalah:
1.    Untuk mengetahui arti validitas
2.    Untuk mengetahui arti reliabilitas
3.    Untuk mengetahui kreteria keabsahan data


BAB II
PEMBAHASAN

1.    Pengertian Validitas dan Reliabilitas
Uji keabsahan data dalam penelitian, sering hanya ditekankan pada uji validitas dan reliabilitas. Dalam penelitian kuantitatif, kriteria utama terhadap data hasil penelitian adalah valid, reliable, dan obyektif. Validitas merupakan derajad ketepatan antara data yang terjadi pada obyek penelitian dengan data yang dapat dilaporkan oleh peneliti.
Validitas adalah derajad ketepatan suatu alat ukur tentang pokok isi atau arti sebenarnya yang diukur. Dengan demikian data yang valid adalah data “yang tidak berbeda” antar data yang dilaporkan oleh peneliti dengan data yang sesungguhnya terjadi pada obyek penelitian. Kalau dalam obyek penelitian terdapat warna merah, maka peneliti akan melaporkan warna merah; kalau dalam obyek penelitian para pegawai bekerja dengan keras, maka peneliti melaporkan bahwa pegawai bekerja dengan keras. Bila peneliti membuat laporan yang tidak sesuai dengan apa yang terjadi pada obyek, maka data tersebut dapat dinyatakan tidak valid.
Terdapat dua macam validitas penelitian, yaitu validitas internal dan validitas eksternal. Validitas internal berkenaan dengan derajad akurasi desain penelitian dengan hasil yang dicapai. Jika dalam desain penelitian dirancang untuk meneliti etos kerja pegawai, maka data yang diperoleh seharusnya adalah data yang akurat tentang etos kerja pegawai. Penelitian menjadi tidak valid, apabila yang ditemukan adalah motivasi kerja pegawai.
Validitas eksternal berkenaan dengan derajad akurasi apakah hasil penelitian dapat digeneralisasikan atau diterapkan pada populasi dimana sampel tersebut diambil. Bila sampel penelitian representative, instrument penelitian valid dan reliable, cara mengumpulkan dan analisis data benar, maka penelitian akan memiliki validitas eksternal yang tinggi.
Dalam hal reliabilitas, Susan Stainback (1988) menyakan bahwa; reability is often defined as the consistency and stability of data or findings. From a positivistic perspective, reability typically is considered to be synonymous with the consistency of data produced by observations made by different researchers (e.g interrater reliability), by the same researcher at different times (e.g test retest), or by spilling a data set in two parts (split half). Reliabilitas berekenaan dengan derajad konsitensi dan stabilitas data atau temuan. “Definisi reliabilitas yang lebih komprehensif adalah derajad ketepatan dan ketelitian atau akurasi yang ditunjukan oleh instrument pengukuran. Istilah-istilah lain sehubungan dengan reliabilitas adalah stabilitas, dapat dipercaya dan dapat diramalkan”.
Dalam pandangan positivistic (kuantitatif), suatu data dinyatakan reliable apabila dua atau lebih peneliti dalam obyek yang sama menghasilkan data yang sama, atau peneliti sama dalam waktu yang berbeda menghasilkan data yang sama, atau sekelompok data bila dipecah menjadi dua menunjukan data yang tida berbeda. Kalau peneliti satu menemukan dalam obyek berwarna merah, maka peneliti yang lain juga demikian. Kalau seorang peneliti dalam obyek kemarin menemukan data berwarna merah, maka sekarang atau besok akan tetatp berwarna merah. Karena reliabilitas berkenaan dengan derajad konsistensi, maka bila ada peneliti lain mengulangi atau mereplikasi dalam penelitian pada obyek yang sam dengan metode yang sama maka akan menghilangkan data yang sama. Suatu data yang reliable atau konsisten akan cenderung valid, walaupun belum tentun valid. Orang yang berbohong secara konsisten akan terlihat valid, walaupun sebenarnya tidak valid.
Obyektivitas berkenaan dengan “derajad kesepekatan” atau interpersonal agreement antar banyak orang terhadap suatu data. Bila dari 100 orang terdapat dari 99 orang menyatakan bahwa terdapat warna merah dalam obyek penelitian itu, sedangkan yang satu orang menyatakan warna lain, maka data tersebut adalah data yang obyektif. Obyektif disini lawannya katanya subyektif. Data yang obyektif akan cenderung valid, walaupun belum tentu valid. Dapat terjedi suatu data yang disepakati banyak orang belum tentu valid, tetapi yang disepakati sedikit orang malah lebih valid. Sebagai contoh terdapat 99 orang menyatakan bahwa si A bukan pencuri (obyektif), dan satu orang menyatakan bahwa si A pencuri (subyektif). Ternyata yang betul adalah pernyataan satu orang, karena yang 99 orang tersebut teman-teman dari si A yang samasama pencuri, sehingga menyatakan si A bukan pencuri.
Dalam penelitian kuantitatif, untuk mendapatkan data yang valid, reliable dan obyektif, maka penelitian dilakukan dengan menggunakan instrument yang valid dan reliable, dan dilakukan pada sampel yang mendekati jumlah populasi dan pengumpulan serta analisis data dilakukan dengan cara yang benar. Dalam penelitian kuantitatif, untuk mendapatkan data yang valid dan reliable yang diuji validitas dan reliabilitasnya adalah intrumen penelitiannya. Sedangkan dalam penelitian kualitatif yang diuji adalah datanya. Oleh karena itu Susan Stainback (1988) menyatakan bahwa penelitian kuantitatif lebih menekankan pada aspek reliabilitas, sedangkan penelitian kualitatif lebih pada aspek validitas.
“Dalam penelitian kualitatif, temuan atau data dinyatakan valid apabila tida perbedaan antara yang dilaporkan peneliti dengan apa yang sesungguhnya terjadi pada obyek yang diteliti”. Tetapi perlu diketahui kebenaran realitas data menurut penelitian kualitatif tidak bersifat tunggal, tetapi jamak dan tergantung pada konstruksi manusia dibentuk dalam diri seseorang sebagai hasil proses mental tiap individu dengan berbagai latar belakangnya. Oleh karena itu bila terdapat 10 peneliti dengan latar belakang yang berbeda, meneliti pada obyek yang sama, akan mendapatkan 10 temuan, dan semuanya dinyatakan valid, kalau apa yang ditemukan itu tidak berbeda dengan kenyataan sesungguhnya yang terjadi pada obyek yang diteliti. Dalam obyek yang sama peneliti yang berlatar belakang Pendidikan akan menemukan data yang berbeda dengan peneliti yang berlatar belakang Manajemen, Antropologi, Sosiologi, Kedokteran, Teknik, dan sebagainya.
Pengertian reliabiltas dalam penelitian kuantitatif, sangat berbeda dengan reliabilitas dalam penelitian kualitatif. Hal ini terjadi karena terdapat perbedaan paradigma dalam melihat relitas. Menurut penelitian kualitatif, suatu realitas itu bersifat majmuk/ ganda, dinamis/ selalu berubah, sehingga tidak ada yang konsisten, dan berulang seperti semula. Heraclites dalam Nasution (1988) menyatakan bahwa “kita tidak bisa dua kali masuk sungai yang sama” air mengalir terus, waktu terus berubah, situasi senantiasa berubah dan demikian pula perilaku manusia yang terlibat dalam situasi social. Dengan demikian tidak ada suatu data yang tetap/ konsisten/ stabil.
Selain itu, cara melaporkan penelitian ideosyneratic dan indivudualistik, selalu berbeda dari orang perorang. Tiap peneliti member laporan menurut bahasa dan jalan pikiran sendiri. Demikian dalam pengumpulan data, pencatatan hasil observasi dan wawancara terkandung unsure-unsur individualistic. Proses penelitian sendiri selalu bersifat persolistik dan tidak ada dua peneliti akan menggunakan dua cara yang persis sama.
2.    Kreteria Keabsahan Data
Untuk menetapkan keabsahan data diperlukan teknik pemeriksaan (pengujian). Pelaksanaan tekhnik pemeriksaan didasarkan atas sejumlah kriteria tertentu. Ada empat kriteria yang digunakan yaitu derajat kepercayaan (credibility), keteralihan (transferability), kebergantungan (dependability) dan kepastian (confirmability).
1.    PengujianKredibilitas (derajad keterpercayaan)
a.    Perpanjangan Pengamatan
Melalui perpanjangan pengamatan berarti peneliti kembali ke lapangan, melakukan pengamatan, melakukan wawancara dengan sumber data, baik yang pernah ditemui maupun yang baru ditemui. Dengan perpanjangan pengamatan ini, hubungan peneliti dengan narasumber akan semakin terbentuk dan semakin akrab, semakin terbuka, saling mempercayai sehingga tidak ada informasi yang disembunyikan lagi. Pada tahap awal memasuki lapangan,  peneliti masih dianggap orang asing, masih dicurigai sehingga informasi yang diberikan belum lengkap, tidak mendalam, dan mungkin masih banyak yang dirahasiakan. Dengan perpanjangan pengamatan ini, peneliti mengecek kembali apakah data yang diberikan selama ini merupakan data yang sudah benar atau tidak. Bila data yang telah diperoleh selama ini setelah dicek kembali pada sumber data asli atau sumber data lain tidak benar, peneliti melakukan pengamatan lagi secara lebih luas dan mendalam sehingga diperoleh data yang pasti kebenarannya. Lamanya perpanjangan pengamatan ini dilakukan sangat bergantung kepada kedalaman, keluasan, dan kepastian data.


b.    Meningkatkan Ketekunan
Meningkat ketekunan berarti melakukan pengamatan secara lebih cermat dan berkesinambungan. Dengan cara tersebut, kepastian data dan urutan peristiwa akan dapat direkam secara pasti dan sistematis. Meningkatkan ketekunan ibarat mengecek soal-soal atau makalah yang dikerjakan, ada yang salah atau tidak. Dengan meningkatkan ketekunan itu, peneliti dapat melakukan pengecekan kembali apakah data yang telah ditemukan itu salah atau tidak. Selain itu, peneliti juga dapat mendeskripsi data secara akurat dan sistematis.
Kekurang tekunan pengamatan terletak pada pengamatan terhadap pokok persoalan yang dilakukan secara terlalu awal. Hal itu mungkin dapat disebabkan oleh tekanan subyek atau sponsor atau barangkali juga karena ketidaktoleransian subyek, atau sebaliknya peneliti terlalu cepat mengarahkan fokus penelitiannya walaupuntampaknya belum patut dilakukan demikian. Persoalan itu bisa terjadi pada situasi ketika subyek berdusta, menipu, atau berpura-pura, sedangkan peneliti sudah sejak awal mengarahkan fokusnya, padahal barangkali belum waktunya berbuat demikian.
c.    Triangulasi
Triangulasi dalam pengujian kredibilitas ini diartikan sebagai pengecekan data dari berbagai sumber dengan berbagai cara dan berbagai waktu.
Dengan demikian, triangulasi terdiri atas triangulasi sumber, triangulasi teknik,  dan triangulasi waktu.
1)    Triangulasi Sumber
Triangulasi sumber dilakukan dengan cara mengecek data yang diperoleh dari beberapa sumber. Sebagai contoh, untuk menguji kredibilitas data tentang gaya kepemimpinan seseorang, maka pengumpulan dan pengujian data yang telah diperoleh dilakukan kebawahan yang dipimpin, ke atasan yang menugasi, dan keteman kerja yang merupakan kelompok kerjasama. Data dari tiga sumber tersebut, tidak bisa di rata-ratakan seperti dalam penelitian kuantitatif, tetapi dideskripsikan, dikategorisasikan, mana pandangan yang sama, yang berbeda, dan mana yang spesifik dari tiga sumber data tersebut. Selanjutnya diminta kesepakatan (membercheck) dengan tiga sumber data tersebut untuk mendapatkan kesimpulan.
2)    Triangulasi Teknik
Triangulasi teknik dilakukan dengan cara mengecek data pada sumber yang sama dengan teknik yang berbeda.
3)    Triangulasi Waktu
Triangulasi waktu berkaitan dengan keefektifan waktu. Data yang dikumpulkan dengan teknik wawancara di pagi hari pada saat narasumber masih segar dan belum banyak masalah akan memberikan data yang valid sehingga lebih kredibel.
d.    Diskusi dengan Teman Sejawat
Teknik ini dilakukan dengan cara mengekspos hasil sementara atau hasil yang diperoleh dalam bentuk diskusi analitik denga rekan-rekan sejawat. Teknik ini mengandung beberapa maksud sebagai salah satu teknik pemeriksaan keabsahan data. Pertama, untuk membuat agar peneliti tetap mempertahankan sikap terbuka dan kejujuran. Kedua, diskusi denga sewajat ini memberikan suatu kesempatan awal yang baik untuk mulai menjajaki dan menguji hipotesis yang muncul dari pemikiran peneliti.
e.    Analisis Kasus Negatif
Kasus negatif adalah kasus yang tidak sesuai atau berbeda dengan hasil penelitian hingga pada saat tertentu. Peneliti berusaha mencari data yang berbeda atau bahkan bertentangan dengan data yang telah ditemukan. Bila tidak ada lagi data yang berbeda atau bertentangan dengan temuan, berarti data yang ditemukan sudah dapat dipercaya.
f.    Menggunakan Bahan Referensi
Bahan referensi adalah adanya pendukung untuk membuktikan data yang telah ditemukan oleh peneliti. Bahan referensi ini dapat berupa foto-foto, rekaman, dan dokumen autentik.


g.    Mengadakan Memberchek
Memberchek adalah proses pengecekan data yang diperoleh peneliti kepada pemberi data. Tujuan memberchek adalah agar informasi yang diperoleh yang akan digunakan dalam penulisan laporan sesuai dengan apa yang dimaksud sumber data dan informan.
2.    Pengujian Transferability (keteralihan)
Transferability merupakan validitas eksternal dalam penelitian kuantitatif. Validitas eksternal menunjukan derajad ketepatan atau dapat diterapkannya hasil penelitian ke populasi di mana sampel tersebut diambil.
3.    Pengujian Depenability (kebergantungan)
Depenability dalam penelitian kuantitatif, dependability disebut reliabilitas. Suatu penelitian yang reliable adalah apabila orang lain dapat mengulangi/ mereplikasi proses penelitian tersebut. Dalam penelitian kualitatif, ujidepenabilitydilakukan dengan melakukan audit terhadap keseluruhan proses penelitian. Sering terjadi peneliti tidak melakukan proses penelitian kelapangan, tetapi bias memberikan data. Peneliti seperti ini perlu diuji depenabilitynya. Jika proses penelitian tidak dilakukan tetapi datanya ada, maka penelitian tersebut tida reliable atau dependable. Bagaimana peneliti mulai menetukan masalah/ focus, memasuki lapangan, menentukan sumber data, melakukan analisis data, melakukan uji keabsahan data, sampai membuat kesimpulan harus dapat ditunjukan oleh peneliti. Jika peneliti tidak mempunyai dan tidak dapat menunjukan jejak aktivitas lapangannya maka depebilitas penelitiannnya patut diragukan.
4.    Pengujian Konfirmability (kepastian)
Pengujian konfirmability dalam penelitian kuantitatif disebut dengan uji obyektivitas penelitian. Penelitian dikatakan obyektif  bila hasil penelitian telah disepakati banyak orang. Dalam penelitian kualitatif, uji konfirmabilitymirip dengan dependability, sehingga pengujiannya dapat dilakukan secara bersamaan. Menguji konfirmabilityberarti menguji hasil penelitian dikaikan dengan proses yang dilakukan. Bila hasil penelitian merupakan fungsi dari proses penelitian yang dilakukan, maka penelitian tersebut telah memenuhi standar konfirmability. Dalam penelitian jangan sampai proses tidak ada, tetapi hasilnya ada.
3.    Tes Tertulis Untuk Prestasi Belajar
1.    Bentuk-bentuk Tes
Dalam hal ini kita bedakan atas dua bentuk tes, yaitu sebagai berikut :
a.    Tes Subjektif
Tes subjektif yang pada umumnya berbentuk esai (uraian). Tes bentuk esai adalah sejenis tes kemajuan belajar yang memerlukan jawaban yang bersifat pembahasan atau uraian kata-kata. Ciri-ciri pertanyaannya didahului dengan kata-kata seperti : uraikan, jelaskan, mengapa, bagaimana, bandingkan, simpulkan dan sebagainya.
Soal-soal bentuk esai biasanya jumlahnya tidak banyak, hanya sekitar 5-10 buah soal dalam waktu kira-kira 90 s.d 120 menit. Soal-soal bentuk esai ini menuntut kemampuan siswa untuk dapat mengorganisir, menginterprestasi, menghubungkan pengertian-pengertian yang telah dimiliki. Dengan singkat dapat dikatakan bahwa tes esai menuntut siswa untuk dapat mengingat-ingat dan mengenal kembali, dan terutama harus mempunyai daya kreativitas yang tinggi.
b.    Tes Objektif
Tes objektif adalah tes yang dalam pemeriksaannya dapat dilakukan secara objektif. Hal ini memang dimaksudkan untuk mengatasi kelemahan-kelemahan dari tes bentuk esai. Dalam penggunaan tes objektif ini jumlah soal yang diajukan jauh lebih banyak daripada tes esai. Kadang-kadang untuk tes yang berlangsung selama 60 menit dapat diberikan 30-40 buah soal.
2.    Macam-macam tes objektif
a.    Tes Benar-Salah (True-False)
Soal-soalnya berupa pernyataan-pernyataan (statement). Statement tersebut ada yang benar dan ada yang salah. Orang-yang ditanya bertugas untuk menandai masing-masing pernyataan itu dengan melingkari huruf B jika pernyataan itu betul menurut pendapatnya dan melingkari huruf S jika pernyataannya salah.
b.    Tes Pilihan Ganda (Multiple Choice Test)
Multiple Choice Test terdiri atas suatu keterangan atau pemberitahuan tentang suatu pengertian yang belum lengkap. Dan untuk melengkapinya harus memilih satu dari beberapa kemungkinan jawaban yang telah disediakan. Atau multiple choice test terdiri atas bagian keterangan (stem) dan bagian kemungkinan jawaban atau alternative (options). Kemungkinan jawaban (option) terdiri atas satu jawaban yang benar yaitu kunci jawaban dan beberapa pengecoh (distractor).
c.    Menjodohkan (Matching Test)
Matching Test dapat kita ganti dengan istilah mempertandingkan, mencocokkan, memasangkan, atau menjodohkan. Matching Test terdiri atas satu seri pertanyaan dan satu seri jawaban. Masing-masing pertanyaan mempunyai jawabannya yang tercantum dalam seri jawaban. Tugas pengisi ialah mencari dan menempatkan jawaban-jawaban sehingga sesuai atau cocok dengan pertanyaannya.
d.    Tes Isian (Completion Test)
Completion Test biasa kita sebut dengan istilah tes isian, tes menyempurnakan, atau tes melengkapi. Completion test terdiri atas kalimat-kalimat yang ada bagian-bagiannya yang dihilangkan. Bagian yang dihilangkan atau yang harus diisi oleh pengisi ini adalah merupakan pengertian yang kita minta dari pengisi.
3.    Pengukuran Ranah Afektif
Pengukuran ranah afektif tidaklah semudah mengukur ranah kognitif. Pengukuran ranah afektif tidak dapat dilakukan setiap saat (dalam arti pengukuran formal) karena perubahan tingkah laku siswa tidak dapat berubah sewaktu-waktu. Pengubah sikap seseorang memerlukan waktu yang relative lama. Demikian juga pengembangan minat dan penghargaan serta nilai-nali.
Di dalam petunjuk Pelaksanaan Penilaian Pendidikan Sejarah Perjuangan Bangsa (PSPB) disebutkan bahwa penilaian ranah kognitif bertujuan mengukur pengembangan penalaran, sedangkan tujuan penilaian afektif adalah sebagai berikut :
a.    Untuk mendapatkan umpan balik (feedback), baik bagi guru maupun siswa sebagai dasar untuk memperbaiki proses belajar-mengajar dan mengadakan program perbaikan (remedial program) bagi anak didiknya.
b.    Untuk mengetahui tingkat perubahan tingkah laku anak didik yang dicapai, yang antara lain diperlukan sebagai ahan untuk perbaikan tingkah laku anak didik, pemberian laporan kepada orang tua, dan penentuan lulus tidaknya anak didik.
c.    Untuk menenmpatkan anak didik dalam situasi belajar mengajar yang tepat, sesuai dengan tingkat pencapaian dan kemampuan serta karakteristik anak didik.
d.    Untuk mengenal latar belakang kegiatan belajar dan kelainan tingkah laku anak didik. (Depdikbud, 1983:2)
Sehubungan dengan tujuan penilaiannya ini maka yang menjadi sasaran penilaian kawasan afektif adalah perilaku anak didik, bukan pengetahuannya.  Sebagai contoh, siswa bukan dituntut untuk mengetahui sebab –sebab dibentuknya BPUPKI, tetapi bagaimana sikapnya terhadap pembentukan BPUPKI tersebut.
Pertanyaan afektif tidak menuntut jawaban benar atau salah, tetapi jawaban yang khusus tentang dirinya mengenai minat, sikap, dan internalisasi nilai (oleh Cronbach dibedakan antara maximum performance dengan typical performance attitude) (Cronbach, 1970).
4.    Pengukuran Ranah Psikomotor
Pengukuran ranah psikomotor dilakukan terhadap hasil-hasil belajar yang berupa penampilan. Namun demikian biasanya pengukuran ranah ini disatukan atau dimulai dengan pengukuran ranah kognitif sekaligus. Misalnya, penampilannya dalam menggunakan thermometer diukur mulai dari pengetahuan mereka mengenai alat tersebut, pemahaman tentang alat  dan penggunaannya (aplikasi), kemudian baru cara menggunakannya dalam bentuk keterampilan. Untuk pengukuran yang terakhir ini harus diperinci antara lain: cara memegang, cara meletakkan/menyelipkan kedalam ketiak atau muut, cara membaca angka, cara mengembalikan ketempatnya dan sebagainya. Ini semua tergantung dari kehendak kita, asal tujuan pengukuran dapat tercapai.
Instrument yang digunakan mengukur keterampilan biasanya berupa matriks. Ke bawah menyatakan perperincian aspek (bagian keterampilan) yang akan diukur, kekanan menunjukkan besarnya skor yang dapat dicapai.

4.    Menganalisis Hasil Test
1.    Menilai Test yang Dibuat Sendiri
Ada 4 cara untuk menilai test, yaitu:
a.    Cara pertama meneliti secara jujur soal – soal yang sudah disusun, kadang – kadang dapat diperoleh jawaban tentang ketidak jelasan perintah atau bahasa, taraf kesukaran, dan lain – lain keadaan soal tersebut.
b.    Cara kedua adalah mengadakan analisis soal. Analisi soal adalah suatu prosedur yang sistematis, yang akan memberikan informasi – informasi yang sangat khusus terhadap butir test yang kita susun. Analisis soal terutama dapat dilakukan untuk test objektif. Hal ini tidak berarti bahwa test uraian tidak dapat dianalisis, akan tetapi memang dalam menganalisis butir test uraian, belum ada pedoman secara standar.
c.    Cara ketiga adalah mengadakan checking validitas. Validitas yang paling penting dari test buatan guru adalah validitas kulikuler. Untuk mengadakan checking validitas kulikuler, kita harus merumuskan tujuan setiap bagian pelajaran secara khusus dan jelas sehingga setiap soal dapat kita jodohkan dengan setiap tujuan khusus tersebut.
d.    Cara keempat adalah dengan mengadakan checking reabiitas. Salah satu indicator untuk test yang mempunyai reabilitas yang tinggi adalah bahwa kebanyakan dari soal – soal test itu mempunyai daya beda yang tinggi.


2.    Analisis butir soal ( item analysis)
Analisis soal anatara lain bertujuan untuk mengadakan identifikasi soal – soal yang baik, kurang baik, dan soal yang jelek. Dengan analisis soal dapat diperoleh informasi tentang kejelekan tentang sebuah soal dan “ petunjuk” untuk mengadakan perbaikan.
a.    Taraf kesukaran
Soal yang baik adalah soal yang tidak terlalu mudah atau tidak terlalu sukar. Soal yang terlalu mudah tidak merangsang siswa untuk mempertinggi usaha memecahkannya. Sebaliknya soal yang terlalu sukar akan menyebabkan sisiwa menjadi putus asa dan tidak mempunyai semangat untuk mencoba lagi karena diluar jangkauan.
Bilangan yang menunjukan sukar dan mudahnya sesuatu soal disebut indeks kesukaran (difficulty index). Besarnya indeks kesukaran antara 0,00 sampai denga 1,0. Indeks kesukaran ini menunjukan taraf kesukaran soal. Soal dengan indeks kesukaran 0,0 menunjukan soal itu terlalu sukar, sebaliknya indeks 1,0 menunjukan soalnya terlalu mudah. Didalam istilah evalusi, indeks kesukaran ini diberi symbol p (P) singkatan dari kara “Proporsi”, dengan demikian maka soal dengan P sama dengan 0,70 lebih mudah jika dibandingkan dengan P=0,20 sebaliknya soal dengan P=0,30 lebih sukar dari pada soal dengan P=0,80.
Melihat besarnya bilangan indeks ini, maka lebih cocok jikabukan disebut sebagai indeks kesukaran tetapi indeks kemudahan atau indeks vasilitas, karena semakin mudah soal itu, semakin besar pula bilangan indeksnya. Akan tetapi telah disepakati bahwa walaupun semakin tinggi indeksnya menunjukan soal yang semakin mudah, tetapi tetap disebut indeks kesukaran.
Rumus Mencari P  adalah :
P = B
      JS
    Dimana :
P = indeks kesuakran
B = banyaknya siswa yang menjawab soal itu dengan benar
JS = jumlah seluruh siswa dalam Tes

b.    Daya Pembeda
Daya pembeda soal, adalah kemampuan sesuatu soal untuk membedakan antara siswa yang pandai (berkemampuan tinggi) dengan siswa yang bodoh (berkemampuan rendah). Angka yang menunjukan besarnya daya pembeda disebut indeks diskriminasi, disingkat D. seperti halnya indeks kesukaran, indeks diskriminasi (daya pembeda) ini berkisar antara 0,00 – 1,00. Hanya bedanya indeks kesukaran tidak mengenal tanda negative (-), tetapi pada indeks diskriminasi ada tanda negative. Tanda negative pada indeks diskriminasi digunakan jika sesuatu soal “terbalik” menunjukan kualitas testee. Yaitu anak pandai disebut bodoh dan anak bodoh disebut pandai.
Cara menentukan daya pembeda (nilai D) :
Untuk ini perlu dibedakan antara kelompok kecil (kurang dari 100) dan kelompok besar (100 orang keatas).
1.    Untuk kelompok kecil
Seluruh kelompok testee dibagi dua sama besar 50% kelompok atas dan 50% kelompok bawah.
2.    Untuk kelompok Besar
Mengingat biaya dan waktu untuk menganalisis, maka untuk kelompok besar biasanya hanya diambil kedua kutubnya saja, yaitu 27% skor teratas sebagai kelompok atas (Ja) dan 27% skor terbawah sebagai kelompok bawah (Jb).
Ja = jumlah kelompok atas
Jb = Jumlah kelompok Bawah

Rumus mencari D
Rumus untuk menentukan Indeks diskriminasi adalah :
D = Ba     Bb  = Pa – Pb
        Ja       Jb   


Keterangan :
J = Jumlah peserta Test
Ja = Banyaknya peserta kelompok atas
Jb = Banyaknya peserta kelompok bawah
Ba = Banyaknya peserta kelompok atas yang menjawab soal itu dengan benar
Bb = Banyaknya peserta kelompok bawah yang menjawab soal itu dengan benar
Pa = Proporsi peserta kelompok atas yang menjawab benar (ingat, P sebagai indeks kesukaran)
Pb = Proporsi peserta kelompok bawah yang menjawab benar

c.    Pola Jawaban Soal
Yang dimaksud pola jawaban disini adalah distribusi testee dalam hal menentukan pilihan jawaban pada soal bentuk pilihan ganda. Pola jawaban soal diperoleh dengan menghitung banyaknya testee yang memilih pilihan jawaban a,b,c atau d atau yang tidak memilih pilihan manapun (blangko). Dalam istilah evaluasi disebut Omit, disingkat O.
Dan pola jawaban soal dapat ditentukan apakah pengecoh (distractor) berfungsi sebagai pengecoh dengan baik atau tidak. Pengecoh yang tidak dipilih sama sekali oleh testee berarti bahwa pengecoh itu jelek, terlalu menyolok menyesatkan. Sebaliknya sebuah distractor (pengecoh) dapat dikatakan berfungsi dengan baik apabila distractor tersebut mempunyai daya tarik yang besara bagi pengikut-pengikut tes yang kurang memahami konsep atau kurang menguasi bahan.
Dengan melihat pola jawaban soal, dpaat diketahui :
1.    Taraf Kesukaran Soal
2.    Daya Pembeda Soal
3.    Baik dan Tidaknya Distractor


Sesuatu distractor dapat diperlakukan dengan tiga cara yaitu :
1.    Diterima, karena sudah baik
2.    Ditolak, karena tidak baik, dan
3.    Ditulis kembali, karena kurang baik.
 Kekurangannya mungkin hanya terletak pada rumusan kalimatnya sehingga hanya perlu ditulis kembali dengan perubahan seperlunya. Menulis soal adalah sesuatu pekerjaan yang sulit, sehingga apabila masih dapat diperbaiki, sebaiknya diperbaiki saja, tidak dibuang. Suatu distractor dapat dikatakan berfungsi baik jika paling sedikit dipilih oleh 5% pengikut test.
BAB III
PENUTUP
A.    Kesimpulan
Validitas adalah derajad ketepatan antara data yang terjadi pada obyek penelitian dengan data yang dapat dilaporkan oleh peneliti atau  derajad ketepatan suatu alat ukur tentang pokok isi atau arti sebenarnya yang diukur. Data yang valid adalah data yang tidak berbeda antar data yang dilaporkan oleh peneliti dengan data yang sesungguhnya terjadi pada obyek penelitian. Sebaliknya data yang tidak valid adalah data yang tidak sesuai dengan apa yang terjadi pada obyek. Validitas penelitian ada dua, yaitu: Pertama, validitas internal yakni validitas yang berkenaan dengan derajad akurasi desain penelitian dengan hasil yang dicapai. Kedua validitas eksternal yakni berkenaan dengan derajad akurasi apakah hasil penelitian dapat digeneralisasikan atau diterapkan pada populasi dimana sampel tersebut diambil.
Reliabilitas (stabilitas, dapat dipercaya dan dapat diramalkan )adalah derajad ketepatan dan ketelitian atau akurasi yang ditunjukan oleh instrument pengukuran. Obyektivitas adalah derajad kesepekatan atau interpersonal agreement antar banyak orang terhadap suatu data dan atu derajad dimana pengukuran yang dilakukan bebas dari pendapat dan penilaian subyektif, bebas dari bias dan perasaan orang-orang yang menggunakan tes. Dalam penelitian kuantitatif, untuk mendapatkan data yang valid dan reliable yang diuji validitas dan reliabilitasnya adalah intrumen penelitiannya. Sedangkan dalam penelitian kualitatif yang diuji adalah datanya.  Untuk menetapkan keabsahan data diperlukan teknik pemeriksaan (pengujian). Ada empat kriteria yang digunakan yaitu:
1.    Pengujian Kredibilitas (derajad keterpercayaan)
a.    Perpanjangan Pengamatan
b.    Meningkatkan Ketekunan
c.    Triangulasi (sumber, teknik, waktu)
d.    Diskusi dengan Teman Sejawat
e.    Analisis Kasus Negatif
f.    Menggunakan Bahan Referensi
g.    Mengadakan Memberchek
2.    Pengujian Transferability (keteralihan)
3.    Pengujian Depenability (kebergantungan)
4.    Pengujian Konfirmability (kepastian)

DAFTAR PUSTAKA

Lexi J. Moleong, Metodologi Penelitian Kualitatif, Bandung: PT Remaja Rosda Karya, 2002.
Sugiyono, Metode Penelitian Kuantitatif, Kualitatif dan R&D, Bandung: Alfabeta, 2010.

PENGEMBANGAN & PENYUSUNAN TES EVALUASI





BAB I
PENDAHULUAN

A.    Latar Belakang
Setiap kegiatan belajar harus diketahui sejauh mana proses belajar tersebut telah memberikan nilai tambah bagi kemampuan siswa. Salah satu cara untuk melihat peningkatan kemampuan tersebut adalah dengan melakukan tes. Tes sebagai alat penilaian adalah pertanyaan-pertanyaan yang akan diberikan kepada siswa untuk mendapat jawaban dari siswa dalam bentuk lisan (tes lisan), dalam bentuk tulisan (tes tulisan), atau dalam bentuk perbuatan (tes tindakan).
Ada beberapa prinsip dasar yang perlu dicermati di dalam menyusun tes hasil belajar agar tes tersebut dapat mengukur tujuan instruksional khusus untuk mata pelajaran yang telah diajarkan, atau mengukur kemampuan dan keterampilan peserta didik yang diharapkan, setelah mereka menyelesaikan suatu unit pengajaran tertentu. Pertama, tes hasil belajar harus dapat mengukur secara jelas hasil belajar yang telah ditetapkan sesuai dengan tujuan instruksional. Kedua, butir-butir tes hasil belajar harus merupakan sampel yang representative dari populasi bahan pelajaran yang telah diajarkan, sehingga dapat dianggap dapat mewakili seluruh performanceyang telah diperoleh selama pesrta didik mengikuti suatu unit pengajaran. Ketiga, bentuk soal yang dikeluarkan dalam tes hasil belajar harus dibuat bervariasi. Keempat, tes hasil belajar harus didasain sesuai dengan kegunaannya untuk memperoleh hasil yang diinginkan. Kelima, tes hasil belajar harus memiliki realibilitas yang dapat diandalkan. Keenam, tes hasil balajar disamping harus dapat dijadikan alat pengukur keberhasilan belajar siswa, juga harus dapat dijadikan alat untuk mencari informasi yang berguna untuk memperbaiki cara belajar siswa dan cara mengajar guru itu sendiri.



B.    Rumusan Masalah
1.    Bagaimana pengertian dari tes?
2.    Bagaimana pengembangan tes pada kawasan( kognitif, afektif, dan psikomotor) ?
3.    Apa saja tahap-tahap dalam penyusunan tes?
C.    Tujuan
1)    Untuk mengetahui pengertian dari tes.
2)    Untuk mengetahui pengembangan tes pada kawasan( kognitif, afektif, dan psikomotor)
3)    Untuk mengetahui Tahap-tahap dalam penyusunan tes

BAB II
PEMBAHASAN

A.    Pengertian Tes
Tes adalah alat untuk memperoleh data tentang perilaku individu ( Allen dan Yen, 1979:1). Karena itu, didlam tes terdapat sekumpulan pertanyaan yang harus dijawab atau tugas yang harus dikerjakan, yang akan memberikan informasi mengenai aspek psikologis tertentu ( sampel perilaku ) berdasarkan jawaban yang diberikan individu yang dikenai tes tersebut ( anastari, 1982:22 ).
Dengan demikian ada tiga hal yang penting dalam pengertian tes, pertama adalah sebutan pengukuaran. Pemberian tes (testing adalah bagian dari kegiatan pengukuran (measurement). Kedua tes adalah alat untuk mengukur sampel pengetahuan atau kemampuan yang dimiliki seseorang. oleh karena itu, pemberian tes sebenarnya terbatas dari segi waktu pelaksanannya; pengetahuan dan kemampuan yang di ukur bersifat luas hampir tanpa batas, sedangkan gambaran pengetahuan dan kemampuan yang diperoleh melalui tes merupakan sampel dari semua pengetahuan dan kemampuan yang mungkin dimiliki oleh pembelajar. Ketiga, tes adalah penafsiran angka yang diperoleh untuk menentukan cukup baik atau tidaknya seseorang pembalajar dalam mencapai suatu tujuan.

B.    Mengembangkan tes pada kawasan ( kognitif, afektif, dan psikomotor )
1.    Mengembangkan  Tes pada Domain Kognitif
Pada  dasarnya  akan  sangat mudah mengembangkan  tes  untuk  mengukur indikator pencapaian hasil belajar pencapaian kawasan  (domain) kognitif, hampir semua jenis tes dengan  berbagai bentuk soal  dapat digunakan untuk  mengukur kawasan ini seperti misalnya :
a.    Tes Lisan
Pertanyaan secara lisan masih sering digunakan untuk mengukur daya serap peserta  didik  pada  kawasan  kognitif.  Yang  perlu  Anda  ingat  tes  lisan  harus disampaikan dengan jelas, dan semua peserta didik harus diberi kesempatan yang sama.  Beberapa  prinsip  yang  harus  dipedomani  adalah  memberi  waktu  untuk berpikir, baru menunjuk peserta untuk menjawab pertanyaan. Tingkat berpikir untuk pertanyaan lisan di kelas cenderung rendah, seperti pengetahuan dan pemahaman. Jawaban salah satu siswa harus dikembalikan ke forum kelas untuk ditanggapi siswa yang lain.
b.    Tes  Pilihan Ganda
Ketika Anda mengembangkan   tes pilihan ganda hendaknya memperhatikan sepuluh pedoman penulisannya yaitu:
1)    soal harus jelas,
2)    isi pilihan jawaban homogen dalam arti isi,
3)    panjang kalimat pilihan jawaban relatif sama,
4)    tidak ada petunjuk jawaban benar,
5)    hindari mengggunakan pilihan jawaban “semua benar “ atau “semua salah”,
6)    pilihan jawaban angka diurutkan,
7)    pilihan jawaban logis dan tidak menggunakan negatif ganda,
8)    kalimat yang digunakan sesuai dengan tingkat perkembangan peserta tes,
9)    menggunakan bahasa Indonesia yang baik dan baku, dan
10)    letak pilihan jawaban benar ditentukan secara acak.
c.    Bentuk Tes  uraian Obyektif
Bentuk ini tepat digunakan untuk bidang Matematika dan IPA, karena kunci jawabannya hanya satu. Pengerjaan soal ini melalui suatu prosedur atau langkahlangkah tertentu. Setiap langkah ada skornya. Objektif disini dalam arti apabila diperiksa oleh beberapa guru dalam bidang studi tersebut hasil penskorannya akan sama. Pertanyaan pada bentuk soal ini di antaranya adalah: hitunglah, tafsirkan, buat kesimpulan dsbnya.
Tes ini menuntut siswa menyampaikan, memilih, menyusun, dan memadukan gagasan dan ide-idenya dengan menggunakan kata-katanya sendiri. Keunggulan bentuk tes ini dapat mengukur tingkat berpikir dari yang rendah sampai yang tinggi, yaitu mulai dari hapalan sampai dengan evaluasi.


d.    Bentuk Tes jawaban Singkat
Tes ini mengharuskan siswa menuliskan jawaban singkatnya sesuai dengan petunjuk. Ada tiga jenis soal bentuk ini, yaitu: jenis pertanyaan, jenis melengkapi atau isian, dan jenis identifikasi atau asosiasi. Ketika Anda menyusun tes bentuk ini perhatikan keharusannya yaitu; soal mengacu pada indikator, rumusan kalimat soal harus komunikatif, dan tidak menimbulkan interpretasi ganda.
2.    Mengembangkan  Tes pada Domain Afektif
Pengembangan tes pada domain afektif ini, untuk beberapa fokus sikap diantaranya adalah :
a.    Sikap terhadap mata pelajaran
Tes  sikap  terhadap  mata  pelajaran  dapat  diberikan  pada  awal  atau  akhir program  agar siswa  memiliki sikap yang lebih baik pada suatu mata pelajaran. Perlu dilakukan   tindakan bila sebagian besar siswa bersikap negatif pada mata pelajaran tertentu.
b.    Sikap positif terhadap belajar
Siswa  diharapkan  memiliki  sikap  yang  baik  terhadap  belajar.  Siswa  yang memiliki sikap positif terhadap belajar cenderung menjadi pembelajar pada masa depan.
c.    Sikap  terhadap diri sendiri
Meskipun harga diri siswa dipengaruhi oleh keluarga dan kejadian di luar sekolah, hal-hal yang terjadi di kelas diharapkan dapat meningkatkan harga diri siswa.
d.    Sikap positif terhadap perbedaan
Siswa perlu mengembangkan sikap yang lebih toleran dan menerima perbedaan seperti etnik,  jender, kebangsaan dan keagamaan.
e.    Sikap terhadap permasalahan faktual yang ada di sekitarnya
Penilaian afektif juga dapat melihat fokus nilai semacam kejujuran, integritas, keadilan, dan nilai kebebasan. Fokus penilaian afektif dapat dikenakan terhadap permasalahan-permasalahan aktual di sekitar siswa.
Penilaian sikap dapat dilakukan dengan beberapa cara atau teknik antara lain: observasi perilaku, pertanyaan langsung, dan laporan pribadi. Hasil observasi perilaku dapat dijadikan sebagai umpan balik dalam pembinaan. Perilaku adalah kecenderungan seseorang dalam sesuatu hal.
Pada tes ini biasanya digunakan dengan   memanfaatkan   skala likert. Langkah-langkah dalam menyusun skala likert antara lain adalah:
1)    Memilih variabel afektif yang akan diukur;
2)    Membuat beberapa pernyataan tentang variabel afektif yang dimaksudkan;    
3)    Mengklasifikasikan pernyataan positif atau negatif;
4)    Menentukan jumlah gradual dan frase atau angka yang dapat menjadi alternatif pilihan;
5)    Menyusun  pernyataan dan pilihan jawaban menjadi  sebuah  alat penilaian;
6)    Melakukan ujicoba;
7)    Membuang butir-butir pernyataan yang kurang baik; dan
8)    Melaksanakan penilaian.
3.    Mengembangkan  Tes pada Domain Psikomotor
Pada umumnya pelajaran yang termasuk kelompok psikomotor adalah mata pelajaran  yang  indikator  keberhasilan  yang  lebih  beorientasi  pada  gerakan  dan menekankan  pada  reaksi-reaksi  fisik  atau  keterampilan  tangan.  Hasil  belajar psikomotor dapat diklasifikasikan menjadi tiga, yaitu:
a.    specific responding, siswa baru mampu merespons hal-hal yang sifatnya fisik, yang dapat didengar, dilihat, atau diraba, misalnya memegang raket, memegang bed untuk tenis meja dsb. dan 
b.    motor chaining, siswa sudah mampu menggabungkan lebih dari dua keterampilan dasar  menjadi  satu  keterampilan  gabungan,  misal  memukul  bola,  menggergaji, menggunakan  jangka  sorong.  Pada  tingkat  rule  using  siswa  sudah  dapat menggunakan hukum-hukum dan atau pengalaman-pengalaman untuk melakukan keterampilan yang komplek, misal bagaimana  memukul  bola  yang  tepat  agar dengan tenaga yang sama namun hasilnya lebih keras.
Gagne (1977) berpendapat bahwa ada 2 kondisi yang dapat mengoptimalkan hasil belajar keterampilan yaitu kondisi internal dan eksternal.
1)    Untuk kondisi internal dapat dilakukan dengan cara, yakni :
a)    mengingatkan kembali sub-sub keterampilan yang sudah dipelajari dan
b)    mengingatkan prosedur-prosedur atau langkah-langkah gerakan yang telah dikuasainya.
2)    Untuk kondisi eksternal dapat dilakukan dengan:
a)    instruksi verbal,
b)    gambar,
c)    demonstrasi,
d)    praktik, dan
e)    umpan balik.
Soal untuk ranah psikomotor juga harus mengacu pada standar kompetensi yang sudah dijabarkan menjadi kompetensi dasar. Setiap butir standar kompetensi dijabarkan menjadi 3 sampai dengan 6 butir kompetensi dasar. Selanjutnya setiap butir kompetensi dasar dapat dijabarkan menjadi 3 sampai dengan 6 indikator dan setiap indikator harus dapat dibuat lebih dari satu butir soal. Namun, ada kalanya satu butir soal ranah psikomotor terdiri dari beberapa indikator.
Instrumen psikomotor ini terdiri dari dua macam, yaitu :
1)    Menyusun  Soal
Menyusun  soal  dapat  diawali  dengan  mencermati  kisi-kisi  instrumen psikomotor  yang  telah  dibuat.  Soal  harus  dijabarkan  dari  indikator  dengan memperhatikan materi pokok dan pengalaman belajar. Namun adakalanya soal ranah psikomotor untuk ujian    blok yang biasanya sudah mencapai tingkat psikomotor manipulasi, mencakup beberapa indikator.
2)    Menyusun Lembar Observasi dan Lembar Penilaian
Lembar observasi dan lembar penilaian harus mengacu pada soal. Soal atau lembar tugas atau perintah kerja inilah yang selanjutnya dijabarkan menjadi aspek-aspek keterampilan.

C.    Bentuk-bentuk Penyusunan Tes
1.    Penyusunan Tes Tertulis
Sebagai alat pengukur perkembangan dan kemajuan belajar peserta didik, apabila ditinjau dari segi bentuk soal-soal, dapat dibedakan menjadi dua macam, yaitu tes belajar bentuk uraian (tes subjektif), dan tes hasil belajar bentuk obyektif.
a.   Tes uraian
Pada umumnya  berbentuk esai (uraian). Tes bentuk esai adalah sejenis tes kemampuan belajar yang memerlukan jawaban yang bersifat pembahasan atau uraian kata-kata. Ciri-ciri pertanyaannya didahului dengan kata-kata seperti uraikan, jelaskan, mengapa, bagaimana, bandingkan, simpulkan, dan sebagainya. Soal-soal bentuk esai biasanya jumlahnya tidak banyak, hanya sekitar 5-10 buah dalam waktu kira-kira 90-120 menit. Soal-soal bentuk esai menuntut kemampuan siswa untuk dapat mengorganisir, menginterpretasi, menghubungkan pengertian-pengertian yang telah dimiliki. Dengan singkat dapat dikatakan bahwa tes esai menuntut siswa untuk dapat mengingat-ingat dan mengenal kembali, dan terutama harus mempunyai daya kreativitas yang tinggi.
Petunjuk penyusunan tes uraian adalah :
1)    Hendaknya soal-soal tes dapat meliputi ide-ide pokok dari bahan yang diteskan, dan kalau mungkin disusun soal yang sifatnya komprehensif.
2)    Hendaknya soal tidak mengambil kalimat-kalimat yang disalin langsung dari buku atau catatan.
3)    Pada waktu menyusun, soal-soal itu sudah dilengkapi dengan kunci jawaban serta pedoman penilaiannya.
4)    Hendaknya diusahakan agar pertanyaan bervariasi antara “jelaskan”, “mengapa”, “bagaimana”, “seberapa jauh”, agar dapat diketahui lebih jauh penguasaan siswa terhadap bahan.
5)    Hendaknya rumusan soal dibuat sedemikian rupa sehingga mudah dipahami oleh siswa.
6)    Hendaknya ditegaskan model jawaban apa yang dikehendaki oleh penyusun tes.


b. Tes objektif
1)    Tes benar-salah (true-false)
Tes obyektif bentuk true-false adalah salah satu bentuk tes obyektif dimana butir-butir soal yang diajukan dalam tes hasil belajar itu berupa pernyataan, pernyataan ada yang benar dan ada yang salah.
Petunjuk penyusunan tes benar-salah adalah:
a)    Tulislah huruf B-S pada permulaan masing-masing item dengan maksud untuk mempermudah mengerjakan dan menilai (scoring).
b)    Usahakan agar jumlah butir soal yang harus dijawab B sama dengan butir soal yang harus dijawab S. Dalam hal ini hendaknya pola jawaban tidak bersifat teratur misalnya B-S-B-S-B-S atau SS-BB-SS-BB-SS.
c)     Hindari item yang masih bisa diperdebatkan.
Contoh:
B-S Kekayaan lebih penting dari pada kepandaian.
d)    Hindarilah pertanyaan-pertanyaan yang persis dengan buku.
e)    Hindarilah kata-kata yang menunjukan kecenderungan memberi saran seperti yang dikehendaki oleh item yang bersangkutan, misalnya: semuanya, tidak selalu, tidak pernah dan sebagainya.
2)    Tes pilihan ganda (multiple choice test)
Multiple choice test terdiri atas suatu keterangan atau pemberitahuan tentang suatu pengertian yang belum lengkap. Dan untuk melengkapinya harus memllilih satu dari beberapa kemungkinan jawaban yang telah disediakan.
Pada dasarnya, soal bentuk pilihan ganda ini adalah soal bentuk benar salah juga, tetapi dalam bentuk jamak. Testee diminta membenarkan atau menyalahkan setiap item dengan tiap pilihan jawab. Kemungkinan jawaban itu biasanya sebanyak tiga atau empat buah, tetapi adakalanya dapat juga lebih banyak (untuk tes yang akan diolah dengan komputer banyaknya option diusahakan 4 buah).
3)    Menjodohkan  (Matching test)
Matching test dapat diganti dapat diganti dengan istilah mempertandingan, mencocokkan, memasangkan, atau menjodohkan. Matching test terdiri atas satu seri pertanyaan dan satu seri jawaban. Masing-masing pertanyaan mempunyai tercantum dalam seri jawaban.
Petunjuk-petunjuk yang perlu diperhatikan dalam menyusun tes bentuk matching ialah:
a.    Seri pertanyaan-pertanyaan dalam Matching testhendaknya tidak lebih dari sepuluh soal (item). Sebab pertanyaan-pertanyaan yang banyak itu akan membingungkan murid. Juga kemungkinan akan mengurangi homogenitas antara item-item itu.
b.    Jumlah jawaban yang harus dipilih, harus lebih banyak dari pada jumlah soalnya (kurang lebih 1 ½  kali). Dengan demikian murid dihadapkan kepada banyak pilihan, yang semuanya mempunyai kemungkinan benarnya, sehingga murid terpaksa lebih menggunakan pikirannya.
c.    Antara item-item yang tergabung dalam satu seri matching test harus merupakan pengertian-pengertian yang benar-benar homogen.
4)    Tes isian (complection test)
Complection test biasa kita sebut dengan istilah tes isian, tes menyempurnakan, atau tes melengkapi. complection test terdiri atas kalimat-kalimat yang ada bagian-bagiannya yang dihilangkan. Bagian yang dihilangkan atau yang diisi oleh murid ini adalah merupakan pengertian yang kita minta dari murid.
Saran-saran dalam menyusun tes bentuk isian ini adalah sebagai berikut:
a)    Perlu selalu diingat bahwa kita tidak dapat merencenakan lebih dari satu jawaban yang kelihatan logis.
b)    Jangan mengutip kalimat/pertanyaan yang tertera pada buku/catatan.
c)    Diusahakan semua tempat kosong hendaknya sama panjang.
d)    Diusahakan hendaknya setiap pertanyaan jangan mempunyai lebih dari satu tempat kosong.
e)    Jangan mulai dengan tempat kosong.

2.    Penyusunan Tes Lisan
Tes lisan digunakan untuk mengevaluasi hasil belajar berupa kemampuan untuk mengemukakan pendapat-pendapat atau gagasan-gagasan secara lisan.
Berberapa petunjuk berikut ini dapat dipergunakan dalam tes lisan
a.    Sebelum tes lisan dilaksanakan, seyogyanya tester sudah melakukan inventarisasi berbagai jenis soal yang akan diajukan kepada teste dalam tes lisan tersebut, sehingga tes lisan dapat diharapkan memiliki validitas yang tinggi, baik dari segi isi maupun kontruksinya.
b.    Setiap butir soal yang telah ditetapkan untuk diajukan kepada tes lisan itu, juga harus disiapkan sekaligus pedoman atau ancar-ancar jawaban betulnya.
c.    Jangan sekali-kali menentukan skor atau nilai hasil tes lisan setelah seluruh teste menjalani tes lisan. Skor atau nilai hasil tes lisan harus dapat ditentukan disaat masing-masing teste selesai dites. Hal ini dimaksudkan agar pemberian skor atau nilai hasil tes lisan yang diberikan kepasa teste itu tidak dipengaruhi oleh jawaban yang diberikan oleh testee yang lain.
d.    Tes belajar yang dilaksanakan secara lisan hendaknya jangan sampai menyimpang atau berubah arah dari evaluasi menjadi diskusi.
e.    Dalam rangka menegakkan prinsip objektivitas dan prinsip keadilan, dalam tes yang dilaksanakan secara lisan itu, tester hendaknya jangan sekali-kali “memberikan angin segar” atau “memancing-mancing” dengan kata-kata arau kalimat atau kode-kode tertentu yang sifatnya menolong testee karena menguji pada hakikatnya adalah mengukur bukan membimbing testee.

3.    Penyusunan tes tindakan
Tes tindakan dimaksudkan untuk mengukur keterampilan siswa dalam melakukan suatu kegiatan. Dalam tes tindakan persoalan disajikan dalam bentuk tugas yang harus dikerjakan oleh testi.
Tes tindakan pada unumnya digunakan untuk mengukur taraf kompetensi  yang bersifat keterampilan (psikomotorik), dimana penilaiannya dilakukan terhadap proses penyelesaian tugas dan hasil akhir yang dicapai oleh testee tersebut.


D.    Tahap-Tahap Penyusunan Tes
Ada enam tahap dalam merencanakan dan menyusun tes agar diperoleh tes yang baik,yaitu:
1.    Pengembangan spesifikasi tes
Spesifikasi tes adalah suatu ukuran yang menunjukkan keseluruhan kualitas tes dan ciri-ciri yang harus dimiliki oleh tes yang akan dikembangkan.
2.    Penulisan soal
3.    Penelaahan soal, yaitu menguji validitas soal yang bertujuan untuk mencermati apakah butir-butir soal yang disusun sudah tepat untuk mengukur tujuan pembelajaran yang sudah dirumuskan, ditinjau dari segi isi/materi, kriteria dan psikologis.
4.    Pengujian butir-butir soal secara empiris, kegiatan ini sangat penting jika soal yang dibuat akan dibakukan.
5.    Penganalisisan hasil uji coba.
6.    Pengadministrasian soal

E.    Langkah-langkah Dalam Penyusunan Tes
Penyusunan tes dilakukan dengan langkah-langkah sebagai berikut:
1.    Menentukan tujuan mengadakan tes
2.    Mengadakan pembatasan terhadap bahan yang akan diteskan.
3.    Merumuskan tujuan instruksional khusus dari tiap bagian bahan
4.    Manderetkan semua TIK dalam tabel persiapan yang memuat ula aspek tingkah laku terkandung dalam TIK itu. Tabel ini digunakan untuk mengadakan identifikasi terhadap tingkah laku yang dikehendaki, agar tidak terlewati.
5.    Menyusun tabel spesifikasi yang memuat pokok materi, aspek berpikir yang diukur beserta imbangan antara kedua hal tesebut.
Tabel spesifikasi yang juga dikenal dengan kisi-kisi adalah sebuah tabel yang didalamnya dimuat rincian materi tes dan tingkah laku beserta proporsi yang dikehendaki oleh penilai, dimana pada tiap petak dari tabel tersebut diisi dengan angka-angka yang menunjukan banyaknya butir soal yang akan dikeluarkan dalam tes hasil belajar.
Adapun dari arah taraf kompetensi, biasanya penilai menggunakan model yang dikembangkan oleh Bloom (1956). Menurut Benjamin S. Bloom, kompetensi kognitif peserta mulai dari yang paling rendah sampai dengan yang paling tinggi adalah
a.    Pengetahuan/ingatan
b.    Pemahaman
c.    Aplikasi atau penerapan
d.    Analisis
e.    Sintesis, dan
f.    Evaluasi.

6.    Menuliskan butir-butir soal, didasarkan atas TIK-TIK yang sudah dituliskan pada tabel TIK dan aspek tingkah laku yang dicakup.
F.    Komponen-komponen Penyusunan Tes
Komponen Atau Kelengkapan Sebuah Tes Terdiri Atas :
1.    Buku Tes
Buku Tes yaitu Lembaran atau buku yang memuat butir-butir soal yang harus dikerjakan oleh siswa.
2.    Lembar Jawaban Tes
Lembar Jawaban Tes yaitu Lembaran yang disediakan oleh penilaian bagi testee untuk mengerjakan tes.
3.    Kunci Jawaban Tes
Kunci Jawaban Tes berisi jawaban-jawaban yang dikehendaki. Kunci jawaban ini dapat berupa huruf-huruf yang dikehendaki atau kata/kalimat. Untuk tes bentuk uraian yang dituliskan adalah kata-kata kunci ataupun kalimat singkat untuk memberikan ancar-ancar jawaban.


Ide dari adanya kunci jawaban ini adalah agar
a.    Pemekrisaan tes dapat dilakukan oleh orang lain,
b.    Pemeriksaannya betul,
c.    Dilakukan dengan mudah,
d.    Sesedikit mungkin masuknya unsur subjektif.

4.    Pedoman penilaian
Pedoman penilaian atau pedoman scoring berisi keterangan perincian tentang skor atau angka yang diberikan kepada siswa bagi soal-soal yang telah dikerjakan.


BAB III
PENUTUP

A.    KESIMPULAN
Tes adalah alat untuk memperoleh data tentang perilaku individu ( Allen dan Yen, 1979:1). Karena itu, didlam tes terdapat sekumpulan pertanyaan yang harus dijawab atau tugas yang harus dikerjakan, yang akan memberikan informasi mengenai aspek psikologis tertentu ( sampel perilaku ) berdasarkan jawaban yang diberikan individu yang dikenai tes tersebut ( anastari, 1982:22 ).
Ada tiga hal yang penting dalam pengertian tes, pertama adalah sebutan pengukuaran. Pemberian tes (testing adalah bagian dari kegiatan pengukuran (measurement). Kedua tes adalah alat untuk mengukur sampel pengetahuan atau kemampuan yang dimiliki seseorang. Ketiga, tes adalah penafsiran angka yang diperoleh untuk menentukan cukup baik atau tidaknya sseorang pembalajar dalam mencapai suatu tujuan.
Sebuah tes harus sesuai dengan apa yang akan diukur sehigga dapat meberikan informasi yang benar. Dengan kata lain sebuah tes adalah alat yang dipakai untuk mengetahui ketercapaian keadaan yang diinginkan oleh pengetes, setelah terlebih dahulu meberikan perlakuan yang benar terhadap objek yang di tes. Tentuya sebuah tes harus dibuat berdasaran ketentuan-keetentuan atau prinsip tertentu yang sesuai dengen perlakuan yag diberikan kepada objek, sehingga informasi yang diahasilkan dapat dipercaya. Sebuah tes dapat dikatakan baik apabila memenuhi empat faktor yakni: Valid, Reriabel, praktis, dan objektif.


DAFTAR PUSTAKA

Amir Daien Indrakusuma. 1993. Evaluasi Pendidikan. Malang: Penerbit IKIP Malang.
Arikunto, Suharsimi. 2007. Dasar – Dasar Evaluasi Pendidikan Ed. Revisi, Cet. 7. Jakarta: Bumi Aksara.
http://www.artikelind.com/2011/06/penyusunan-dan-pengembangan-tes.html#ixzz4QYmGrHzj


PERUMUSAN TUJUAN INSTRUKSIONAL





TUJUAN INTUKSIONAL
1.    Bermacam – macam tujuan pendidikan
Setiap negara tentu mempunyai cita-cita tentang warga negaranya akan diarahkan. Cita-cita tersebut dimenifesikan dalam bentuk tujuan pendidikannya. Sebagai contoh, negara sparta ingin mengarahkan warga negaranya menjadi manusia yang sehat jasmani dan rohaninya makan tujuan pendidikan telah disejajarkan dengan cita-cita tersebut.
    Cita-cita bangsa indonesia adalah terbentuknya manusia pancasila bagi seluruh warga negaranya. Tujuan pendidikannya telah disejajarkan dengan cita-cita tersebut. Semua institusi atau lembaga pendidikan harus mengarahkan segala kegiatan disekolahnya bagi pencapaian tujuan itu. Inilah yang disebut dengan tujuan umum pensdidikan yang secara eksplisit tertera didalam garis-garis besar haluan negara.
    Semua aparatur pemerinah termamsuk petugas-petugas pendidikan, harus terlebih dahulu memaham makna dari rumusan tujuan yang sesuai dengan tingkat dan jenis pendidikan yang diselenggarakan pada lembaga tersebut. Inilah yang disebut sebagai tujuan intruksional. Tujuan sudah khusus diperuntukkan bagi tujuan penyelenggara sekolah/institusi ini. Semua tujuan pendirian sekolah harus berkiblat kepada tujuan umum atau tujuan pendidikan nasional yang telah disebut.
    Dengan demikian maka tujuan pendidkn nasional memiliki fungsi sebagai frame of reference untuk selanjutnya dijabarkan menjadi tujuan intruksional. Sebagai pendalaman berikut ini adlah kutipan rumusan tujuan umum tersebut:
“Pengembangan dibidang pendidikan didsarkan atas falsafah negera pencasila dan diarahkan untuk membentuk manusia-manusia pembangunan yang ber-pancasila dan untuk membentuk manusia Indonesia yang sehat jasmani dan rohaninya memiliki pengetahuan dan keterampilan, dapat mengembangkan kreativitas dan tanggung jawab, dapat menyuburkan sikap demokrasi dan penuh tanggung rasa, dapat mengembangkan kecerdasan yang tinggi dan disertai budi pekerti yang luhur, mencintai bangsanya mencintai sexama manusia sesuai dengan ketentuan termaktub dalam UUD 1945.”
Kegiatan-kegiatan yang muncul dalam pola kesamaan pendidikan, didsarkan pada rumusan tujuan pendidikan nasional ini. Sedangkan materinya perlu diisi dari hasil studi empiris tentang harapan-harapan masyarakat mengenai kemampuan pengetahuan dan sikap yang harus dimiliki oleh para lulusan.
Selanjutnya, sebagai tindak lanjut dari penjabaran tujuan umum menjadi tujua institusional, adalah perumusan lain telah disiapkan oleh para ahli bidang studi, sebagai penanggung jawab program kurikuler.
Untuk dapat memenuhi harapan dicapainya peguasaan terhadap program kurikuler ini, dirumuskanlah suaru tujuan yang disebut tujuan kurikuler. Tujuan  kurikuler adlah tujuan yang dirumuskan untuk masing-masing bidang studi.
Dari skema tersebut akan mudah dipahami bahwa:
a.    Tujuan institional adalah tujuan dari masing-mamsing institusi atau lembaga. Misalnya:
1)    Tujuan Sekolah Dasar,
2)    Tujuan Sekolah Menengah Pertama
3)    Tujuan Sekolah Pendidikan Guru, dan sebagainya yang masing-masing sudah direncanakan sesuai dengan lulusannya.
b.    Tujusn Kurikurer adalah tujuan dari masing-masing bidang studi. Misalnya:
1)    Tujuan Pelajaran Pendidikan Agama,
2)    Tujuan peajaran Matematika,
3)    Tujuan pelajaran Ilmu Pengetahui Sosial,
dan sebagainya, yang akan berbeda dari satu bidang dari satu bidang studi kebidang studi lain, dan juga dari tingkat institusi yang satu ke tingkat institusi yang lain. Akan tetapi, antara tujuan kurikurer sesuatu institusi ada hubungan dengan tujuan kurikuler institusi yang lain.
c.    Tiap-tiap tujuan, baik institusional maupun tujuan kurikurer selalu merupakan sumbangan bagi tercapainya tujuan umum, yakni tujuan pendidikan nasional.

2.    TUJUAN INSTRUKSIONAL (Instructional Objectives)
Materi sesuatu bidang studi tidak mungkin menjadi milik kita, tanpa dipelajari terlebih dahulu, baik dipelajari sendiri maupun diajarkan oleh guru. Proses atau kegiatan mempelajari materi ini terjadi dalam saat terjadinya situasi belajar-mengajar atau instruksional inilah maka timbul istilah tujuan instruksional, yaitu tujuan yang menggambarkan pengetahua, kemampuan, keterampilan dan sikap yang harus dimiliki oleh siswa sebagai akibat dari hasil pengajaran yang dinyatakan dalam bentuk tingkah laku (behavior) yang dapat diamati dan diukur.
    Ada 2 (dua) macam tujuan instruksional, yaitu:
a.    Tujuan Instruksional Umum (TIU),
b.    Tujuan Instruksional Khusus (TIK)
Perbedaan atas 2 (dua) macam tujuan ini didasarkan atas luasnya tujuan yang akan dicapai sehingga apabila dibagankan akan terlihat dibawah ini:
Didalam merumuskan tujuan intruksional hartis diusahakan agar tampak bahwa setelah tercapainya tujuan itu terjadi adanya perubahan pada diri anak yang meliputi kemampuan, intelektual, sikap/minat maupun keterampilan yang oleh Bloom dan kawan-kawannya dikenal sebagai aspek kognitif, aspek afektif, dan aspek psikomotor seperti telah diterangkan terdahulu.
Apakah tujuan  intruksional itu memang perlu?
Bekerja tanpa diketahui arahnya sama halnya dengan berlayar tanpa diketahui mau ke pulau mana kapal akan dilarikan. Kapal itu akan berputar-putar saja di tengah lautan luas, kadang-kadang menghadap ke barat, kadang-kadang menghadap  ke timur dan sebagainya dan akhirnya tidak diketahui apa hasil yang telah dilakukan. Demikian pula halnya dengan mengajar. Guru yang tidak mengetahui apa tujuan mengajarnya, tidak akan jelas setiap kegiatan yang dilakukan.
Demikian ada kecenderungan bagi guru untuk menentukan tujuan pelajarannya pada masalah penyelesaian bahan. Dalam satu jam mengajar guru telah menargetkan berapa bab atau berapa bagian bahan akan diselesaikan dalam  jam  pelajaran itu. Akibatnya guru tersebut akan terpaku pada bahan, dan apabila dilihat waktunya hampir habis, ia menerangkan dengan cepat agar target yang telah ditetapkan tercapai, tanpa memperhatikan apakah siswanya dapat memahami pelajarannya atau tidak.
Dalam pembaruan sistem pendidikan yang berlaku di Indonesia sekarang ini, setiap guru dituntut untuk menyadari tujuan dari kegiatannya mengajar dengan titik tolak kebutuhan siswa. Oleh karena pertama yang ia lakukan adalah membuat tujuan instruksinonal. Dengan tujuan instruksional:
a.    Guru mempunyai arah untuk:
1)    Memilih bahan  pelajaran,
2)    Memilih prosedur (metode) mengajar,
b.    Siswa mengetahui arah belajarnya
c.    Setiap guru mengetahui batas-batas tugas dan wewenangnya mengajarkan suatu materi sehingga diperkecil kemungkinan timbulnya celah (gap) atau saling menutup (overlap) anatara guru.
d.    Guru mempunyai patokan dalam mengadakan penilaian kemajuan belajar siswa.
e.    Guru sebagai pelaksanaan daan petugas-petugas pemegang kebijaksanaan (decision maker) mempunyai kriteria untuk mengevaluasi kualitas maupun efisiensi pengajaran.
3.   Merumuskan Tujuan Intruksional
Telah disebutkan bahwa tujuan instruksional adalah tujuan yang menyatakan adanya sesuatu yang dapat dikerjakan atau dilakukan oleh siswa setelah pengajaran. Jadi sebelum adanya pengajaran, siswa tidak mempunyai kemampuan untuk mengerjakan ataupun melakukannya.
Contoh:
Sebelum ada pengajaran, siswa belum dapat membuat tabel spesifikasi, sesudah pengajaran diberikan siswa dapat membuat tabel spesifikasi.
Jadi dalam diri siswa terjadi perubahan tingkah laku selama mengikuti program pengajaran, atau dengan lain perkataan, perubahan tingkah laku itu merupakan hasil dari adanya proses belajar mengajar. Oleh karena baik guru maupun siswa perlu menggetahui perubahan apakah yang telah terjadi pada waktu pengajaran, maka perku adanya perumusan yang jelas bagi tujuan instruksional itu.
Pada oelaksanaan sistem-sistem baru misalnya sistem pengajaran dengan  modul atau sistem yang mengguanakan strategi belajar tuntas, tujuan instruksional ini sudah diketahui oleh siswa sebelum pelajaran mulai.
Sebagaimana ketentuan dalam Peraturan Pemerintah Nomor 19 Tahun 2005 tentang Sttandar Pendidikan Nasional, kurikulum yang berlaku di Indonesia adalah Kurikulum Tingkat Satuan Pendidikan  (KTSP). Dalam ketentuan yang tertera dalam KTSP tersebut, tujuan pendidikan tidak lagi menggunakan istilah-istilah lama seperti Tujuan Kurikuler (TK), Tujuan Instruksional Umum (TIU) dan Tujuan Instruksional Khusus (TIK) lagi, tetapi menggunakan istilah Standar Kompetensi, disingkat SK, Kompetensi Dasar, disiingkat KD, dan untuk istilah tujuan yang ingin dicapai oleh  guru menjadi milik siswa dikenal dengan nama ‘indikator’. Istilah ‘indikator’berasal dari bahasa Inggris to indicate, berarti menunjukkan. Dalam hal ini indikator menunjukkan sesuatu sebagai bukti bahwa yang ingin dicapai sudah dapat betul-betul dicapai. Proses dan langkah sebetulnya sama saja dengan yang lama, tetapi hanya istilahnya saja yang berbeda. Berikut ini disampaikan langkah-langkah untuk menentukan tujuan khusus dan dalam KTSP disebut indikator. Yang juga digunakan dala istilah tujuan pembelajaran.

4. Langkah-langkah yang Dilakukkan dalam Mmerumuskan Tujuuan Instruksinonal Khusus
a.    Memuat sejumlah TIU (Tujuan Instruksinoal Umum) untuk setiap mata pelajaran/bidang studi yang akan diajarakan. Di dalam kurikulum tahun 1975 maupun 1984, TIU sudah ada tercantum dalam buku Garis-Garis Besar Program Pengajaran. Dalam merumuskan TIU digunakan kata kerja yang sifatnya masih umum dan tidak dapat diukur karena perubahan tingkah laku masih terjadi di dalam diri manusia (intern).
b.    Dan masing-masing TIU dijabarkan menjadi sejumlah TIK yang rumusannya jelas, khusus, dapat diamati, terukyr, dan menujukkan perubahan tingkah laku.
Contoh-contoh rumusan untuk TIU:
-    Memahami teori evalusi.
-    Mengetahui perbedaan anatara skor dan nilai.
-    Mengerti cara mencari validita.
-    Menghayati perlunya penilaian yang tepat.
-    Menyadari pentingnya mengikuti kuliiah dengan teratur.
-    Menghargai kejujuran mahasiswa dalam mengerjakan tes.
Dalam contoh-contoh ini digunakan kata-kata kerja: memahami, mengetahui, mengerti, menghayati, menyadari, menghargai, dan masih ada beberapa lagi yang sifatnya masih terlalu umum sehingga penafsirannya dapat berbeda antara orang yang satu dengan yang lain.
Contoh:
Memahami teori evaluasi, apakah seseorang yang hanya dapat menuliskan rumus mmencari relliabilitas sudah dapat dikatakan memahmi teori evalusi?
Menghargai kejujuran mahasiswa dalam mengerjakan tes.
Bagaimanakah bukti-bukti kejujuran itu?
Lagi pula rumusan-rumusan kata kerja itu sendiri merupakan kata-kata yang menunjukkan adanya perubahan tingkahlaku dalam diri manusia sehingga tidak dapat dilihat.
Contoh:
Mahasiswa mengerti cara mencari validitas suatu soal. Bagaimanakah kita tahu bahwa ia mengerti? Apakah karena pada waktu diterangkandia tampak mengangguk-anggukkan kepala? Boleh jadi dia mengangguk-anggukkan kepala hanya merupakan suatu usaha agar tidak dikatakan mengantuk atau sedang melamunkan sesuatu. Tampaknya mengangguk mereaksi kuliah, tetapi angannya melayang.
Atas dasar semua keterangan ini maka agar dalam mengadakan evaluasi terlihat hasilnya, TIU ini perlu  diperinci lagii sehingga menjadi jelas dan tidak dapat disalahtafsirkan oleh beberapa orang.
Rumusan TIK yang lengkap memuat 3 (tiga) komponen,yaitu :
1)    Tingkah laku akhir ( terminal behavior).
2)    Kondisi demonstrasi ( condition of demonstration or test).
3)    Standar keberhasilan ( standar of performance).

5.Tingkah laku akhir
Tingkah laku akhir adalah tingkah laku yang diharapkan setelah seseorang mengalami proses belajar.Di sini tingkah laku ini harus menampakkan din dalam suatu perbuatan yang diamati dan diukur ( observable and measurable ).
Contoh :
-    Menuliskan kalimat perintah
-    Mengalikan pecahan persepuluhan
-    Menggambarkan kurva normal
-    Menyebutkan batas-batas Daerah Istimewa Yogyakarta
-    Menerjemahkan bacaan Inggris ke dalam bahasa Indonesia
-    Menceritakan kembali uraian guru
-    Mendemonstrasikan cara mengukur suhu
-    Mengutarakan pendapatnya mengenai sesuatu yang dikemukakan  guru
-    Menjelaskan hasil bacaan dengan kalimat sendiri,dan lain-lain lagi yang berujud kata kerja perbuatan/operasional ( action verb ) yang dapat di amati dan di ukur.

6.Kata-kata Operasional
a. Cognitive  Domain; level and corresponding action verbs
1)    Pengetahuan ( knowledge )
Mendefinisikan,mendeskripsikan,mengidentifikasikan,mendaftarkan,menjodohkan,menyebutkan,menyatakan ( states ),mereprosuksi.
2)    Pemahaman ( comprehension )
Mempertahankan,membedakan,menduga(estimates),menerangkan,memperluas,menyimpulkan,menggeneralisasikan,memberikan contoh,menuliskan kembali,memperkirakan.

3)    Aplikasi
Mengubah,menghitung,mendemonstrasikan,menemukan,memanipulasikan, memodisikan,mengoperasikan,meramalkan,menyiapkan,menghasilkan, menghubungkan,menunjukkan,memecahkan,menggunakan.
4)    Analisis
Memerinci,menyusun diagram,membedakan,mengidentifikasikan,mengilustrasikan,menyimpulkan, menunjukkan,menghubungkan,memilih,memisahkan,membagi (subdivides).
5)    Sintesis
Mengategorikan,mengombinasikan,mengarang,menciptakan,membuat desain,menjelaskan,memodifikasikan,mengorganisasikan,menyusun,membuat rencana,mengatur kembali,merekonstruksikan,menghubungkan,mereorganisasikan,merevisi, menuliskan kembali,menuliskan,menceritakan.
6)    Evaluasi
Menilai,membandingkan,menyimpulkan,mempertentangkan,mengkritik, mendeskripsikan,membedakan,menerangkan,memutuskan,menafsirkan, menghubungkan,membantu( supports).   
b.    Affective Domain; Learning Levels and Corresponding Action Berbs
1)    Reesiving
Menanyakan,memilih,mendeskripsikan,mengikuti,memberikan,mengidentifikasikan,menyebutkan,menunjukkan,memilih,menjawab.
2)    Responding
Menjawab,membantu,mendiskusikan,menghormat,berbuat,melakukan, membaca,memberikan,menghafal,melaporkan,memilih,menceritakan,menulis.
3)    Valuing
Melengkapi,menggambarkan,membedakan,menerangkan,mengikuti,membentuk,mengudang,menggabung,mengusulkan,membaca,melaporkan,memilih,bekerja,mengambil bagian (share),mempelajari.
4)    Organization
Mengubah,mengatur,menggabungkan,membandingkan,melengkapi,mempertahankan,menerangkan,menggeneralisasikan,mengidentifikasikan,mengintegrasikan,mendofinisikan,mengorganisir,menyiapkan,menghubungkan,mensitesiskan.
5)    Characterization by value or value complex
Membedakan,menerapkan,mengusulkan,memperagakan,mempengaruhi,mendengarkan,memodifikasikan,mempertunjukkan,menanyakan,merevisi,melayani,memecahkan,menggunakan.


c.    Psyhomotor Domain
Kata-kata operasional untuk aspek psikomotor harus menunjuk pada aktualisasi kata-kata yang dapat diamati meliputi :
1)    Muscular or motor skills
Mempertontonkan gerak,menunjukkan hasil  (pekerjaan tangan),melompat,menggerakan,menampilkan.
2)    Manipulations of materials or object
Mereparasi,menyusun,membersihkan,menggeser,memindahkan,membentuk.
3)    Neuromuscular coordination
Meengamati,menerapkan,menghubungkan,menggandeng,memadukan, memasang,memotong,menarik,menggunakan.
Kata-kata yaang telah disajikan di atas merupakan kata-kata kerja yang dipakai dalam merumuskan tujuan instuksional khusus bagi siswa-siswa belajar yang belajar,sehingga rumusan seutuhnya menjadi pernyataan-pernyataan,sebagai berikut :
1)    Siswa dappat menjumlahkan bilangan-bilangan yang terdiri dari puluhan dan satuan.
2)    Siswa dapat menunjukkan letak gunung-gunug yang ada di Jawa Tengah.
3)    Siswa dapat menceritakan kembali isi bacaan tentang kisah keluarga.

7. Kondisi Demonstrasi
Kondisi demonstrasi adalah komponen TIK yang menyatakan suatu kondisi atau situasi yang dikenakan kepada siswa pada saat ia mendemonstrasikan tingkah laku akhir,misalnya :
•    Dengan penulisan yang betul.
•    Urut dari yang paling tinggi.
•    Dengan bahasanya sendiri
Dengan demikian maka rangkaian kata-kata dalam rumusan TIK menjadi :
•    Siswa dapat menjumlahkan bilangan yang terdiri dari puluhan dan satuan dengan penulisan yang betul.
•    Siswa dapat menunjukkan letak gunung-gunung yang ada di Jawa Tengah,urut dari yang paling tinggi.
•    Siswa dapat menceritakan kembali isi bacaan tentang kisah keluarga dengan bahasanya sendiri.
Kata-kata bercetak miring itulah yang menunjukkan standar keberhasilan.
Standar keberhasilan adalah komponen TIK yang menunjukkan seberapa jauh tingkat keberhasilan yang dituntut oleh penilai bagi tingkah laku pelajar pada situasi akhir.
Tingkatan keberhasilan dapat dinyatakan dalam jumlah maupun presentase misalnya:
•    Dengan 75% betul,
•    Sekurang-kurangnya 5 dari 10,
•    Tanpa kesalahan
Dengan tambahan tingkat keberhasilan ini maka bunyi rumusan TIK menjadi:
•    Siswa dapat menjumlahkan bilangan yang terdiri dari puluhan dan satuan tanpa kesalahan.
•    Siswa dapat menyebutkan kembali kota-kota yang ada di Jawa Barat, urut dari yang paling berat, dengan hanya 25% kesalahan.
Yang umum dikerjakan sampai saat ini hanya sampai tingkah laku akhir saja;
Setelah kurikulum tahun 1975 berjalan beberapa tahun timbullah berbagai ketidakpuasan di kalangan para pengembang kegiatan belajar mengajar. Dikatakan bahwa tujuan belajar yang dimaksud terlalu bersifat behavioristik, yakni mementingkan tingkah laku, di samping juga hanya bersifat output oriented, Ykni terlalu mementingkan hasil.
Dengan tekanan pada hal-hal tersebut, guru berusaha memberikan sebanyak-banyaknya informasi, pengertian dan konsep-konsep kepada siswa. Pengembangan kegiatan belajar-mengajar yang mengarah pada proses, belum mendapatkan perhatian sepenuhnya.
Dengan keluarnya kurikulum 1984, tekanan pada hasil ini agak dikurangi. Dalam kurikulum 1984 proses belajar mengajar lebih banyak ditekankan pada bagaimana seseorang memperoleh hasil.
Dalam pedoman pelaksanaan kurikulum dijelaskan bahwa dalam kegiatan belajar mengajar guru diharruskan memperhatikan pula keterampilan siswa dalam hal memperoleh hasil, yakni memperoleh keterampilan tentang prosesnya. Pendekatan ini disebut dengan istilah pendekatan keterampilan proses (PKP). Keterampilan-keterampilan yang dimaksud meliputi keterampilan dalam hal:
a.    Mengamati,
b.    Menginterpretasikan (menafsirkan) hasil pengamatan,
c.    Meramalkan,
d.    Menerapkan konsep,
e.     merencanakan penelitian,
f.    Melaksanakan penelitian, dan
g.    Mengkomunikasikan hasil penemuan.
Sesuai dengan tuntutan tersebut maka guru dalam merumuskan tujuan instruksional khusus harus mengandung apa yang dilakukan siswa dalam kegiatan belajar-mengajar (keterampilan yang mana), bagaimana menunjukan kemampuan atau hasilnya (tingkah laku) dan perolehannya. Untuk mempermudah tugas ini, dalam buku GBPP kurikulum 1984, tujuan instruksional umum yang termuat sudah dirumuskan dalam stu rumusan yang menjelaskan:
a.    Materi yang dipelajari,
b.    Perilaku mengutarakan hasil, dan
c.    Proses penapaiannya.

Diagram perumusan TIU atau TIK
1)    Siswa mampu untuk                                                                            
2)    Siswa dapat melalui                               
3)    Siswa mampu            


PKP = Pendekatan Keterampilan Proses
Contoh rumusan TIK
Model 1.    Siswa mampu melakukan eksperimen untuk selanjutnya dapat menerangkan kepad kawan-kawan sekelasnya tentang proses osmase.
Model 2.    Ssiswa dapat menjelaskan perbedaan di sebagai kata depan dan di sebagai awalan melalui pengamatan contoh-contoh yang diberikan oleh guru.
Model 3.    Siswa mampu menginterpretasikan hsil pengamatan dan menerangkan hubungan kata-kata dalam suatu kalimat.

KESIMPULAN

BENTUK - BENTUK TES DALAM EVALUASI




BAB I
PENDAHULUAN
A.    Latar Belakang

Evaluasi merupakan subsistem yang sangat penting dan sangat di butuhkan dalam setiap sistem pendidikan, karena evaluasi dapat mencerminkan seberapa jauh perkembangan atau kemajuan hasil pendidikan. Dengan evaluasi, maka maju dan mundurnya kualitas pendidikan dapat diketahui, dan dengan evaluasi pula, kita dapat mengetahui titik kelemahan serta mudah mencari jalan keluar untuk berubah menjadi lebih baik ke depan.Tanpa evaluasi, kita tidak bisa mengetahui seberapa jauh keberhasilan siswa, dan tanpa evaluasi pula kita tidak akan ada perubahan menjadi lebih baik, maka dari itu secara umum evaluasi adalah suatu proses sistemik umtuk mengetahui tingkat keberhasilan suatu program. Evaluasi pendidikan dan pengajaran adalah proses kegiatan untuk mendapatkan informasi data mengenai hasil belajar mengajar yang dialami siswa dan mengolah atau menafsirkannya menjadi nilai berupa data kualitati atau kuantitati sesuai dengan standar tertentu. Hasilnya diperlukan untuk membuat berbagai putusan dalam bidang pendidikan dan pengajaran.
Ditjen Dikdasmen Depdiknas (2003 : 1) secara eksplisit mengemukakan bahwa antara evaluasi dan penilaian mempunyai persamaan dan perbedaan. Persamaannya adalah keduanya mempunyai pengertian menilai atau menentukan nilai sesuatu. Adapun perbedaannya terletak pada konteks penggunaannya. Penilaian (assessment) digunakan dalam konteks yang lebih sempit dan biasanya dilaksanakan secara internal, yakni oleh orang-orang yang menjadi bagian atau terlibat dalam sistem yang bersangkutan, seperti guru menilai hasil belajar murid, atau supervisor menilai guru. Baik guru maupun supervisor adalah orang-orang yang menjadi bagian dari sistem pendidikan. Adapun evaluasi digunakan dalam konteks yang lebih luas dan biasanya dilaksanakan secara eksternal, seperti konsultan yang disewa untuk mengevaluasi suatu program, baik pada level terbatas maupun pada level yang luas.
Fungsi Evaluasi Pendidikan. Sangat diperlukan dalam pendidikan antara lain memberi informasi yang dipakai sebagai dasar untuk : 1. Membuat kebijaksanaan dan keputusan. 2. Menilai hasil yang dicapai para pelajar. 3.  Menilai kurikulum. 4. Memberi kepercayaan kepada sekolah. 5. Memonitor dana yang telah diberikan. 6. Memperbaiki materi dan program pendidikan. Hasil evaluasi yang didapat sampai sekarang tentang dunia pendidikan Nasional kita cukup memperihatinkan, tidak hanya dalam segi kualitas tapi juga kegagalan dalam membentuk karakter building generasi muda bangsa. Pendidikan menjadi tanggung jawab semua pihak, dimana tujuan pendidikan adalah memanusiakan manusia. membentuk SDM yang berkualitas. Namun sayang kebijakan pendidikan yang ada sampai sekarang masih jauh dari harapan.
Dalam setiap pembelajaran, pendidik harus berusaha mengetahui hasil dari proses pembelajaran yang ia lakukan. Hasil yang dimaksud adalah baik, tidak baik, bermanfaat, atau tidak bermanfaat, dll. Pentingnya diketahui hasil ini karena ia dapat menjadi salah satu patron bagi pendidik untuk mengetahui sejauh mana proses pembelajran yang dia lakukan dapat mengembangkan potensi peserta didik. Artinya, apabila pembelajaran yang dilakukannya mencapai hasil yang baik, pendidik tentu dapat dikatakan berhasil dalam proses pembelajaran dan demikian pula sebaliknya. Salah satu cara yang dapat dilakukan untuk mengetahui hasil yang telah dicapai oleh pendidik dalam proses pembelajaran adalah melalui evaluasi. Evaluasi yang dilakukan oleh pendidik ini dapat berupa evaluasi hasil belajar dan evaluasi pembelajaran.
Selanjutnya, ada juga para ahli evaluasi pendidikan, seperti Sudijono, menyebutkan bahwa evaluasi adalah (1) proses/kegiatan untuk menentukan kemajuan pendidikan, dibandingkan dengan tujuan yang telah ditentukan, (2) usaha untuk memperoleh informasi berupa umpan balik (feed back) bagi penyempurnaan pendidikan (Sudijono, 2006:2). Hampir sama dengan Sudijono, Dimyati dan Mujiono menyebutkan bahwa evaluasi adalah suatu proses untuk menentukan nilai belajar dan pembelajaran yang dilaksanakan (2006:192).  Selain istilah evaluasi, terdapat juga istilah penilaian, pengukuran, dan tes. Sebenarnya, apakah ketiga istilah ini mengandung pengertian yang sama? Jawabannya tentu saja tidak.
Penilaian pendidikan bukanlah semata-mata penilaian hasil belajar, tetapi mencangkup aspek yang lebih luas yaitu input/komponen, proses, produk dan program pendidikan. Untuk dapat menilai aspek-aspek tersebut dengan komponen-komponen yang menyertainya, maka instrumen-instrumen penilaian pendidikan yang digunakan harus terkait dengan aspek yang dinilai dan tujuan pada masing-masing aspek tersebut. Secara garis besar instrumen evaluasi dapat diklasifikasikan atas dua bagian yaitu  tes dan non tes. Perbedaan yang prinsip antara tes dan non tes, terletak pada jawaban yang diberikan. Dalam suatu tes hanya ada kemungkinan benar atau salah, sedangkan untuk non tes tidak ada jawaban benar atau salah, semuanya tergantung kepada keadaan seseorang. Selanjutnya akan diuraikan lebih rinci mengenai tes sebagai sebagai alat evaluasi hasil belajar.

B.    Rumusan Masalah
1.    Apa saja bentuk-bentuk tes untuk melaksanakan Evaluasi Pembelajaran
2.    Bagaimana ciri-ciri tes yang baik untuk Evaluasi Pembelajaran
3.    Apa saja langkah-langkah pengembangan suatu bentuk tes evaluasi
4.    Bagaimana cara menganalisis suatu bentuk tes

C.    Tujuan Penulisan
1.    Untuk mengetahui apa saja bentuk-bentuk te untuk melaksanakan evaluasi
2.    Untuk mengetahui apa saja ciri-ciri tes yang baik
3.    Untuk mengetahui langkah-langkah pengembangan suatu bentuk tes evaluasi
4.    Untuk mengetahui cara menganalisis suatu tes


BAB II
PEMBAHASAN
A.    Pengertian Tes
Tes merupakan alat atau prosedur yang digunakan untuk mengetahui atau mengukur sesuatu dalam suasana, dengan cara dan aturan-aturan yang sudah ditentukan. Tes hasil belajar adalah sekelompok pertanyaan atau tugas-tugas yang harus dijawab atau diselesaikan oleh siswa dengan tujuan untuk mengukur kemajuan belajar siswa.
Tes dapat didefinisikan sebagai suatu pernyataan atau tugas atau seperangkat tugas yang direncanakan untuk memperoleh informasi tentang strait(sifat) atau atribut pendidikan atau psikologik yang setiap butir pertanyaan atau tugas tersebut mempunyai jawaban atau ketentuan yang dianggap benar.

B.    Jenis-jenis Tes
1.    Dari segi bentuk pelaksanaannya
a.    Tes Tertulis ( paper and pencil test)
Tes tertulis dalam pelaksanaannya lebih menekankan pada penggunaan kertas dan pencil sebagai instrumen utamanya, sehingga tes mengerjakan soal atau jawaban ujian pada kertas ujian secara tertulis, baik dengan tulisan tangan maupun menggunakan komputer.
b.    Tes Lisan ( oral test)
Tes lisan dilakukan dengan pembicaraan atau wawancara tatap muka antara guru dan murid.
c.    Tes Perbuatan (performance test)
Tes perbuatan mengacu pada proses penampilan seseorang dalam melakukan sesuatu unit kerja. Tes perbuatan mengutamakan pelaksanaan perbuatan peserta didik.
2.    Dari segi bentuk soal dan kemungkinannya
a.    Tes Essai (Uraian)
Tes Essay adalah tes yang disusun dalam bentuk pertanyaan terstruktur dan siswa menyusun, mengorganisasikan sendiri jawaban tiap pertanyaan itu dengan bahasa sendiri. Tes essay ini sangat bermanfaat untuk mengembangkan kemampuan dalam menjelaskan atau mengungkapkan suatu pendapat dalam bahasa sendiri.
Jenis tes ini (disebut juga tes uraian) menuntut kemampuan siswa untuk mengemukakan, menyusun, dan memadukan gagasan yang telah dimilikinya dengan menggunakan kata-katanya sendiri. Tes jenis ini memungkinkan siswa menjawab pertanyaan secara bebas. Tes uraian (essay tes), yang sering juga dikenal dengan istilah tes subyektif, adalah salah satu jenis tes hasil belajar yang memiliki karakteristik sebagaimana dikemukakan berikut ini.
a.    Tes tersebut berbentuk pertanyaan atau perintah yang menghendaki jawaban berupa uraian atau paparan kalimat yang pada umumnya cukup panjang.
b.    Bentuk-bentuk pertanyaan atau perintah itu menuntut kepada testee untuk memberikan penjelasan, komentar, penafsiran, membandingkan, membedakan, dan sebagainya.
c.    Ketiga, jumlah butir soalnya umumnya terbatas, yaitu berkisar antara lima sampai dengan sepuluh butir.
d.    Keempat, pada umumnya butir-butir soal tersebut diawali dengan katakata: jelaskan, mengapa, bagaimana, atau kata-kata lain yang serupa dengan itu. (Anas Sudijono, 2008: 100)
Beberapa keunggulan dan kelemahan dari tes bentuk esai
•    Keunggulan

a.    Memungkinkan siswa menjawab pertanyaan tes secara bebas
b.    Memberi kesempatan kepada siswa untuk meningkatkan kemampuannyabdalam hal menulis, mengutarakan ide-ide atau jalan pikirannya secara terorganisir, berpikir kreatif dan kritis
c.    Merupakan tes terbaik untuk mengukur kemampuan siswa mengemukakan pandangan dalam bentuk tulisan
d.    Merupakan tes terbaik untuk mengukur kemampuan siswa menjelaskan, membandingkan, merangkumkan, membedakan, menggambarkan dan mengevaluasi suatu topik atau pokok bahasan.
e.    Relatif lebih mudah menyusun pertanyaannya dibandingkan dengan tes bentuk obyektif
f.    Sangat memperkecil kemungkinan siswa menebak jawaban yang benar
g.    Dapat menggalakkan siswa untuk mempelajari secara luas konsepkonsep dan generalisasi yang berkaitan dengan topic pembahasan/pengajaran

•    Kelemahan
a.    Sukar diskor secara benar-benar obyektif, walaupun itu tes yang dikualifikasi sebagai tes uraian obyektif sekalipun
b.    Membutuhkan waktu yang lama untuk menjawab pertanyaan
c.    Jumlah pokok bahasan/subpokok bahasan yang dapat diambil sebagai sumber pertanyaaan sangat terbatas
d.    Membutuhkan waktu yang jauh lebih lama bagi guru untuk membaca dan menilai semua jawaban siswa
e.    Sering terbuka untuk hallo effect yang berupa kecenderungan untuk memberi nilai tinggi bagi siswa yang dianggap/dinilai mempunyai kemampuan yang lebih tinggi dibandingkan dengan teman sekelasnya. (Suke Silverius, 1991:63-65)
Tes hasil belajar bentuk esai sebagai salah satu alat pengukur hasil belajar, tepat digunakan apabila pembuat soal disamping ingin mengungkap daya ingat dan pemahaman siswa terhadap materi pelajaran yang ditanyakan dalam tes, juga dikehendaki untuk mengungkap kemampuan siswa dalam memahami berbagai macam konsep berikut aplikasinya.selain itu tes esai juga lebih tepat dipergunakan apabila jumlah siswa terbatas.
b.    Tes objektif
Tes objektif adalah tes yang disusun sedemikian rupa dan telah disediakan alternatif jawabannya. Tes ini terdiri dariberbagai macam bentuk, antara lain ;
1.    Tes Betul-Salah (TrueFalse)
2.    Tes Pilihan Ganda (Multiple Choice)
Dalam Journal of Educational Enquiry disebutkan Multiple-choice questions are an efficient means of knowledge assessment (particularly in well defined subjects that do not change with time. They are a widely used assessment ). Artinya yakni beberapa pertanyaan pilihan merupakan sarana yang efisien dalam penilaian (Khususnya untuk mata pelajaran yang tidak berubah dengan waktu). Bentuk tes pilihan ganda banyak digunakan dalam metodologi penilaian. Dan dalam jurnal internasional yang lain disebutkanA conventional multiple-choice test is one of the most widely used assessment methods. When faced with a question in a conventional multiplechoice test, a candidate must evaluate each option and choose the most (Annie W.Y. Ng dan Alan H.S. Chan, 2009: 1). Artinya yakni tes pilihan ganda konvensional adalah salah satu bentuk tes yang paling banyak digunakan metode penilaian. Ketika seorang siswa diberi pertanyaan dalam bentuk tes pilihan ganda konvensional, seorang siswa harus mengevaluasi setiap pilihan dan memilih salah satu yang paling sesuai.

Kelebihan bentuk tes Pilihan Ganda
1.    Dapat digunakan untuk mengukur semua jenjang kemampuan berfikir dalam ranah kognitif
2.    Memperkecil kemungkinan menebak benar kunci jawaban
3.    Dapat dibuat menjadi banyak ragam/variasi bentuk, yakni:
a.    Variasi jawaban yang benar
b.    Variasi jawaban yang paling banyak
c.    Variasi banyak jawaban
d.    Variasi pernyataan tidak lengkap
e.    Variasi negatif
f.    Variasi pengganti
g.    Variasi alternatif yang tidak lengkap
h.    Variasi jawaban terpadu.
4.    Jawabannya tidak harus mutlak benar, tetapi dapat berupa jawaban yang paling benar, atau dapat pula mengandung jawaban yang semuanya benar
5.    Dapat digunakan pada semua jenjang sekolah dan kelas
6.    Dapat diskor dengan sangat obyektif
7.    Dapat diskor dengan mudah dan cepat
8.    Ruang lingkup bahan yang ditanyakan sangat luas. (Suke Silverius, 1991:67-68)

Betapapun unggulnya bentuk pilihan ganda dibandingkan bentuk-bentuk tes yang lain, bentuk tes pilihan ganda tidak luput dari kelemahan. Adapun kelemahanan dari bentuk tes ini yaitu:

1)    Pokok soal tidak cepat cukup jelas sehingga terdapat kemungkinan ada lebih dari satu jawaban yang benar
2)    Kadang-kadang jawaban soal dapat diketahui siswa meskipun belum diajarkan karena adanya petunjuk jawaban yang benar, atau karena butir soal itu mengukur sikap dan bukan mengukur pengetahuan
3)    Sampai suatu tingkat tertentu keberhasilan atas suatu jawaban dapat diperoleh melalui tebakan
4)    Sulit membuat pengecoh (distraktor) yang berfungsi, yakni yang mempunyai peluang besar untuk dipilih siswa
5)    Membutuhkan waktu yang lama untuk menulis soal-soalnya
6)    Siswa cenderung mengembangkan cara belajar terpisah-pisah menurut bunyi tiap soal. (Suke Silverius, 1991:68-69)
Dalam evaluasi hasil belajar, bentuk tes pilihan ganda lebih banyak dipakai dibandingkan bentuk tes yang lain karena bentuk tes pilihan ganda bebas dari kelemahan bentuk-bentuk tes yang lain.
3.    Tes Menjodohkan (Matching)
4.    Tes Analisa Hubungan (Relationship Analysis).

3.    Dari Segi fungsi tes di Sekolah
a.    Tes Formatif
Tes Formatif, yaitu tes yang diberikan untuk memonitor kemajuan belajar selama proses pembelajaran berlangsung. Tes ini diberikankan dalam tiap satuan unit pembelajaran. Manfaat tes formatif bagi peserta didik adalah :
1.    Untuk mengetahui apakah peserta didik sudah menguasai materi dalam tiap unit pembelajaran.
2.    Merupakan penguatan bagi peserta didik.
3.    Merupakan usaha perbaikan bagi siswa, karena dengan tes formatif peserta didik mengetahui kelemahan-kelemahan yang dimilikinya.
4.    Peserta didik dapat mengetahui bagian dari bahan yang mana yang belum dikuasainya.

b.    Tes Sumatif
Tes sumatif diberikan dengan maksud untuk mengetahui penguasaan atau pencapaian peserta didik dalam bidang tertentu. Tes sumatif dilaksanakan pada tengah atau akhir semester.
c.    Tes Penempatan
Tes penempatan adalah tes yang diberikan dalam rangka menentukan jurusan yang akan dimasuki peserta didik atau kelompok mana yang paling baik ditempati atau dimasuki peserta didik dalam belajar.

d.    Tes Diagnostik
Tes diagnostik adalah tes yang digunakan untuk mendiagosis penyebab kesulitan yang dihadapi seseorang baik dari segi intelektual, emosi, fisik dan lain-lain yang mengganggu kegiatan belajarnya.
C.    Ciri-ciri Tes Yang Baik
Sebuah tes dikatakan baik jika memenuhi persyaratan:
1.    Bersifat valid atau memiliki validitas yang cukup tinggi. Suatu tes dikatakan valid bila tes  itu isinya dapat mengukur apa yang seharusnya di ukur, artinya alat ukur yang digunakan tepat
2.    Bersifat reliable, atau memiliki reliabelitas yang baik. Reliabelitas sering diartikan dengan keterandalan. Suatu tes dikatakan relliabel jika tes itu diberikan berulang-ulang memberikan hasil yang sama.
3.    Bersifat praktis atau memiliki kepraktisan. Tes memiliki sifat kepraktisan artinya praktis dari segi perencanaan, pelaksanaan tes dan memiliki nilai ekonomi tetapi harus tetap mempertimbangkan kerahasiaan tes.

Namun syarat minimum yang harus dimiliki oleh sebuah tes yang baik adalah valid dan reliable.
D.    Langkah-langkah Pengembangan Tes
Dalam mengembangkan suatu Tes, Ada enam tahap dalam merencanakan dan menyusun tes agar diperoleh tes yang baik,yaitu:
1.    Pengembangan Spesifikasi tes
Spesifikasi tes adalah suatu ukuran yang menunjukkan keseluruhan kualitas tes dan ciri-ciri yang harus dimiliki oleh tes yang akan dikembangkan. Hal yang perlu diperhatikan adalah :
a)    Menentukan tujuan, tujuan pembelajaran yang baik hendaklah berorientasi kepada peserta didik, bersifat menguraikan hasil belajar, harus jelas dan dapat dimengerti, mengandung kata kerja yang jelas (kata kerja operasional), serta dapat diamati dan dapat di ukur.
b)    Menyusun kisi-kisi soal, penyusunan kisi-kisi soal bertujuan untuk merumuskan setepat mungkin ruang lingkup, tekanan dan bagian-bagian tes sehingga perumusan tersebut dapat menjadi petunjuk yang efektif bagi penyusun tes.
c)    Memilih tipe soal, dalam memilih tipe soal perlu diperhatikan kesesuaian antara tipe soal dengan materi, tujuan evaluasi, skoring, pengelolaan hasil evaluasi, penyelenggaraan tes, serta ketersediaan dana dan kepraktisan.
d)    Merencanakan tingkat kesukaran soal, untuk soal objektif dapat diketahui melalui uji coba atau dapat juga diperkirakan berdasarkan berat ringannya beban penyeleaian soal tersebut
e)    Merencanakan banyak soal
f)    Merencanakan jadwal penerbitan soal


2.    Penulisan Soal
3.    Penelaahan soal, yaitu menguji validitas soal yang bertujuan untuk mencermati apakah butir-butir soal yang disusun sudah tepat untuk mengukur tujuan pembelajaran yang sudah dirumuskan, ditinjau dari segi isi/materi, kriteria dan psikologis.
4.    Pengujian butir-butir soal secara empiris, kegiatan ini sangat penting jika soal yang dibuat akan dibakukan.
5.    Penganilasaan hasil uji coba
6.    Pengadministrian soal

E.    Menganalisis Tes
Menganalisis instrument (alat evaluasi) bertujuan untuk mengetahui apakah alat ukur yang digunakan atau yang akan digunakan sudah memenuhi syarat-syarat sebagai alat ukur yang baik, tepat mengukur sesuatu sesuai tujuan yang telah dirumuskan. Sebuah instrument dikatakan baik jika memenuhi syarat  validitas, reliabelitas dan bersifat praktis.

1.    Validitas tes
Suatu tes dikatakan valid jika tes itu dapat mengukur apa yang seharusnya diukur. Valid disebut juga sahih, terandalkan atau tepat. Tes hasil belajar yang valid, harus dapat menggambarkan hasil belajar yang di ukur
Macam-macam Validitas
1). Validitas isi (content validity)
   Penelaahan butir soal secara umum ditinjau dari tiga aspek yaitu:
1.    Aspek materi
2.    Aspek bahasa
3.    Aspek konstruksi

2). Validitas Ramalan (Predictive Validity)
        Suatu tes dikatakan memiliki validitas ramalan, apabila hasil pengukuran yang dilakukan dengan tes itu dapat digunakan untuk meramalkan, atau tes itu mempunyai daya prediksi yang cukup kuat. Untuk mengetahui apakah suatu tes hasil belajar dapat dinyatakan sebagai tes yang memiliki validitas ramalan dapat dilakukan dengan mengkorelasikan tes hasil belajar yang sedang diuji dengan kriterium yang ada.
                      3). Validitas bandingan (concurent validity)
Suatu tes dikatakan memiliki validitas concurrent, apabila tes tersebut mempunyai kesesuaian dengan hasil pengukuran lain yang dilaksanakan saat itu. Misalnya, membandingkan hasil tes dari soal yang sedang dicari validitasnya dengan hasil tes dari soal standar. Jika terdapat korelasi yang positif antara kedua tes tersbut, berarti soal tes yang dibuat mempunyai validitas concurrent.
                      4). Construct Validity (Validitas konstruk)
Validitas konstruk artinya butir-butir soal dalam tes tersebut membangun setiap aspek berpikir seperti yang tercantum dalam tujuan pembelajaran yang telah dirumuskan. Penganalisisan validitas ini dapat dilakukan dengan jalan melakukan pencocokan antara aspek berpikir yang dikehendaki diungkapkan oleh tujuan pembelajaran, yaitu melalui penelaahan butir-butir soal.
          Meski terdapat beberapa jenis validitas, dalam periode terakhir validitas dianggap sebagai suatu konsep utuh, tidak dipilah-pilah sebagai jenis validitas.

•    Cara menentukan Validitas Instrumen
Validitas instrument dapat diketahui dengan mencari korelasi hasil instrument dengan dengan kriterium atau melakukan analisis butir. Apabila data yang digunakan adalah data interval maka dapat digunakan rumus Product Moment Korelasi, sebagai berikut :
              v Rumus angka kasar
Keterangan :
= Koefisien korelasi antara instrument X dan instrument Y

v  Rumus untuk skor deviasi

Kriteria- kriteria hasil validitas :
Antara  sangat tinggi
Antara  tinggi
Antara  cukup
Antara  rendah
Antara  sangat rendah          
  (Yusuf, 2005:75).
•    Cara menentukan Validitas tiap butir soal
Tinggi rendahnya validitas soal secara keseluruhan berhubungan dengan validitas tiap butir soal. Validitas butir soal dapat dicari dalam hubungannya dengan skor total tiap individu yang ikut serta dalam evaluasi. Langkah-langkah yang ditempuh sebagai berikut :
1.    Skor suatu instrument dengan baik dan teliti. Untuk individu yang benar diberi angka 1, sedangkan yang salah diberi angka nol.
2.    Jumlahkan skor total untuk tiap individu.
3.    Gunakan rumus product moment correlation atau korelasi biserial.

2.    Reliabilitas
Suatu alat ukur dikatakan reliabel, apabila alat ukur itu dicobakan kepada objek  yang sama secara berulang-ulang maka hasilnya akan tetap sama, konsisten, stabil atau relatif sama.
•    Faktor-faktor yang mempengaruhi reliabilitas
1.    Konstruksi item yang tidak tepat, sehingga tidak dapat mempunyai daya pembeda yang kuat.
2.    Panjang/pendeknya suatu instrumen
3.    Evaluasi yang surjektif akan menurunkan reliabilitas
4.    Ketidaktepatan waktu yang diberikan
5.    Kemampuan yang ada dalam kelompok
6.    Luas/tidaknya sampel yang diambil.

•    Teknik pengujian reliabilitas tes hasil belajar
a.    Bentuk objektiv
1)    Metode Belah dua
Dalam pelaksanaanya,seorang penilai hanya melakukan ujian satu kali terhadap sejumlah peserta, sehingga tidak ada pengaruh dari instrumen yang terdahulu. Jumlah butir soal yang diberikan harus genap sehingga dapat dibagi dua dan tiap kelompok mempunyai jumlah butir yang sama. Koefisien reliabilitas akan menunjukkan internal konsistensi dari pada butir soal dalam keseluruhan instrumen. Cara membelah dua instrumen tersebut dapat dilakukan dengan cara nomor genap dan ganjil, awal dan akhir. Untuk menentukan reliabilitas kedua bagian instrumen tersebut dapat digunakan Product Moment Coorelation, sedangkan untuk mencari reliabilitas keseluruhan instrumen dapat digunakan rumus Spearman Brown, sebagai berikut :
Keterangan :
           n  : koefisien reliabilitas
           r : korelasi antara bagian instrumen



2)    Metode Ulangan
Pelaksanaannya dilakukan dua kali kepada sejumlah subjek yang sama, dalam waktu yang berbeda. Reliabilitas metode ulangan ini untuk melihat bagaimana stabilnya skor setiap individu apabila dilakukan pengujian dalam waktu  yang berbeda, dengan kondisi dan perlengkapan yang sama/ hampir bersamaan. Rumus yang digunakan untuk menentukan metode ulangan ini adalah Product Moment Correlation.
3)    Metode bentuk Paralel
Bentuk ini dapat digunakan untuk memperkirakan reliabilitas dari semua tipe, tetapi koefisien yang dihasilkan hanya menggambarkan ekivalensi antara kedua instrumen. Tidak akan menunjukkan ekivalensi dalam kesukaran butir dan isi. Kedua bentuk instrumen yang diberikan mengukura hal yang sama, dengan memiliki tingkat kesukaran yang sama, pengetahuan dan keterangpilan yang sama dengan sistematika yang tidak berbeda antara kedua bentuk instrumen tersebut, tetapi dalam bentuk pertanyaan yang berbeda. Rumus yang dapat digunakan untuk menentukan reliabilitas instrumen dalam bentuk paralel ini adalah product moment correlation dan Rank order correlation.
b.    Bentuk essay
Rumus yang digunakan untuk mengukur reliabilitas tes berbentuk uraian dinamakan rumus Alpha, yaitu :

Dimana:
rxy    : Koefisien reliabilitas tes
 X     : banyaknya butir item yang dikeluarkan dalam tes
n       : Jumlah variansi skor dari tiap-tiap butir item                                 Y      : Variansitotal

Interpretasi terhadap koefisien reliabilitas tes pada umumnya digunakan patokansebagai berikut:
0,80  < r11 £ 1,00                     reliabilitas sangat tinggi
0,60  < r11 £ 0,80                     reliabilitas tinggi
0,40  < r11 £ 0,60                     reliabilitas sedang
0,20  < r11 £ 0,40                     reliabilitas rendah
0,00  < r11 £ 0,20                     reliabilitas sangat rendah
Nilai r yang diperoleh dibandingkan dengan rtabel. Jika rhitung > rtabel maka dapat disimpulkan bahwa soal tes reliabel.

3.    Analisis Soal Tes
Untuk mendapatkan kualitas soal yang baik, maka dilakukan langkah-langkah sebagai berikut:
1)    Daya pembeda
Daya pembeda soal adalah kemampuan suatu soal untuk membedakan antara siswa yang pandai dengan siswa yang bodoh. Angka yang menunjukkan besarnya daya pembeda disebut indek diskriminan. Untuk menentukan daya pembeda soal dapat dilakukan seperti yang dikemukakan oleh Prawironegoro (1985:11):
Terlebih dahulu dicari degress of freedom (df) dengan rumus:
df = (nt – 1) + (nr – 1)
dimana:
nt = nr = 27% x N
kemudian digunakan rumus:
dimana:
Ip = daya pembeda soal
Mt = rata-rata skor dari kelompok tinggi
Mr = rata-rata skor dari kelompok rendah
= jumlah kuadrat deviasi skor kelompok tinggi
= jumlah kuadrat deviasi skor kelompok rendah
n          = 27% x N
N         = banyak pengikut tes
Soal mempunyai daya pembeda yang berarti (signifikan) jika Ip hitung ³ Ip tabel pada derajat kebebasan yang sudah ditentukan.

2)  Indek kesukaran.
Agar tes dapat digunakan secara luas, setiap soal harus diselidiki tingkat kesukarannya yaitu apakah soal tersebut termasuk soal yang mudah, sedang atau sukar. Untuk menentukan indek kesukaran digunakan rumus yang dikemukakan Prawironegoro (1985:14) yaitu:
dimana:
Ik = indeks kesukaranDt = jumlah skor dari kelompok tinggi
Dr = jumlah skor dari kelompok rendah
m   = skor setiap soal jika benar
n    = 27% x N
N   = banyak pengikut tes
Soal dinyatakan sukar, jika           0%  £ Ik < 27%
sedang, jika        27% £ Ik £ 73%
mudah, jika                                Ik > 73%

3)    Penerimaan soal
Setiap soal yang telah dianalisa perlu diklasifikasikan menjadi soal yang tetap dipakai, direvisi atau dibuang. Menurut Prawironegoro (1985:16) tentang klasifikasi soal:
Soal yang baik akan tetap dipakai jika Ip signifikan dan  0% < Ik £ 100%.
Soal diperbaiki jika:
Ip signifikan dan Ik = 100% atau Ik = 0%.
Ip tidak signifikan dan 0% < Ik < 100%.
Soal diganti jika Ip tidak signifikan dan Ik = 100% atau Ik = 0%.



BAB III
PENUTUP
A.    Kesimpulan
Jenis-jenis tes dibedakan berdasarkan bentuk :
1.    Pelaksanaannya
2.    Soal dan kemungkinan jawabannya
3.    Segi fungsi tes di sekolah
Ciri-ciri tes yang baik meliputi :
1.    Bersifat valid atau memiliki validitas yang cukup tinggi.
2.    Bersifat reliabel, atau memiliki reliabilitas yang baik.
3.    Bersifat praktis atau memiliki kepraktisan.
Langkah-langkah pengembangan tes
1.    Pengembangan Spesifikasi tes
2.    Penulisan soal
3.    Penelaahan soal
4.    Pengujian butir-butir soal secara empiris
5.    Penganalisaan hasil uji coba
6.    Pengadministrasian soal
Menganalisa hasil tes
Menganalisis instrument (alat evaluasi) bertujuan untuk mengetahui apakah alat ukur yang digunakan atau yang akan digunakan sudah memenuhi syarat-syarat sebagai alat ukur yang baik, tepat mengukur sesuatu sesuai tujuan yang telah dirumuskan. Sebuah instrument dikatakan baik jika memenuhi syarat  validitas, reliabelitas dan bersifat praktis.
Saran


DAFTAR PUSTAKA