PENENTUAN SKOR DENGAN ITEM RESPONSE THEORI MENGGUNAKAN METODE MAKSIMUM LIKELIHOOD PDF

Title PENENTUAN SKOR DENGAN ITEM RESPONSE THEORI MENGGUNAKAN METODE MAKSIMUM LIKELIHOOD
Author Muhammad Tahir
Pages 36
File Size 2.1 MB
File Type PDF
Total Downloads 6
Total Views 131

Summary

LAPORAN HASIL PENELITIAN PENENTUAN SKOR DENGAN ITEM RESPONSE THEORI MENGGUNAKAN METODE MAKSIMUM LIKELIHOOD Ketua/Anggota Tim Dr. Drs. Muhammad Tahir, M.Si / 0007026201 (Ketua) Ir. Ruslan B, S.Pd., M.Pd. / 0930055802 (Anggota) SEKOLAH TINGGI KEGURUAN DAN ILMU PENDIDIKAN YAYASAN PENDIDIKAN UJUNG PANDA...


Description

Accelerat ing t he world's research.

PENENTUAN SKOR DENGAN ITEM RESPONSE THEORI MENGGUNAKAN METODE MAKSIMUM LIKELIHOOD Muhammad Tahir LPPM STKIP-YPUP

Cite this paper

Downloaded from Academia.edu 

Get the citation in MLA, APA, or Chicago styles

Related papers

Download a PDF Pack of t he best relat ed papers 

Analisis Kemampuan Siswa Menggunakan Teori Respons But ir (It em Response T heory) rizkinor amelia

Implement asi It em Response T heory sebagai Basis Analisis Kualit as But ir Soal dan Kemampuan Kimi… rizkinor amelia Model Jaringan Syaraf Fuzzy Radial Basis Funct ion unt uk Peramalan Nilai BOD pada Kali Surabaya Eddy Hermawan, Nisa Ayunda

LAPORAN HASIL PENELITIAN

PENENTUAN SKOR DENGAN ITEM RESPONSE THEORI MENGGUNAKAN METODE MAKSIMUM LIKELIHOOD

Ketua/Anggota Tim

Dr. Drs. Muhammad Tahir, M.Si / 0007026201 (Ketua) Ir. Ruslan B, S.Pd., M.Pd. / 0930055802 (Anggota)

SEKOLAH TINGGI KEGURUAN DAN ILMU PENDIDIKAN YAYASAN PENDIDIKAN UJUNG PANDANG (STKIP-YPUP) Februari 2020

ii

RINGKASAN

Tujuan dari penelitian ini adalah untuk mengetahui bagaimana menentukan skor dengan Item Response Theori menggunakan metode Maksimum Likelihood. Karakteristik butir yang digunakan adalah Model Logistik 1-Parameter. Penjang tes yang digunakan adalah 24 butir dan menggunakan 1500 responden, data diambil dengan perangkat lunak WinGen. Hasil penelitian menemukan bahwa hanya dengan dua langkah sederhana setelah data responden disiapkan, maka skor setiap responden dapat diperoleh yaitu: langkah pertama adalah menggunakan perangkat lunak Xcalibre 4.2.2. (Guyer & Thompson, 2016), untuk menentukan butir-butir instrumen yang memenuhi karakteristik butir yang digunakan, dan dengan mengeluarkan data responden pada butir-butir yang tidak memenuhi syarat. Langkah kedua adalah menggunakan perangkat lunak Xcalibre 4.2.2. untuk menentukan skor setiap responden. Kata kunci: penentuan skor, Item Response Theori, model logistik 1-parameter, metode Maksimum Lokelihood.

iii

IDENTITAS DAN URAIAN UMUM 

Judul Penelitian: Penentuan Skor dengan Item Response Theori Menggunakan Metode Maksimum Likelihood



Tim Peneliti:

No

Nama

Jabatan

1

Dr. Drs. Muhammad Tahir, M.Si.

Dosen STKIP YPUP

2

Ir. Ruslan B, S.Pd., M.Pd.

Dosen STKIP YPUP

Bidang Keahlian Pendidikan Matematika dan Evaluasi Pendidikan Pendidikan Matematika

Instansi Asal Prodi Matematika STKIPYPUP Prodi Matematika STKIPYPUP

Alokasi Waktu 18 jam/minggu

12 jam/minggu



Masa Pelaksanaan Enam Bulan. Mulai: bulan Agustus tahun 2019 Berakhir: bulan Februari tahun 2020



Temuan yang ditargetkan: Ditemukan langkah-langkah penentuan skor dengan Item Response Theori menggunakan metode Maksimum Likelihood.



Kontribusi pada capaian renstra STKIP-YPUP adalah: • Hasil penelitian ini dapat mendukung tercapainya VISI dan MISI STKIP YPUP yaitu “menjadi Perguruan Tinggi Bermutu yang Berwawasan Keilmuan, Kependidikan”. • Hasil penelitian ini sejalan dengan visi Lembaga Penelitian STKIP yaitu ―Unggul dan terkemuka dalam penelitian dan pengembangan pendidikan, yang berwawasan kependidikan‖, dan misi Lembaga Penelitian STKIP YPUP ―Melaksanakan penelitian dan pengembangan ilmu pengetahuan, sains, teknologi, untuk memecahkan masalah akademik dan kemasyarakatan‖.



Jurnal ilmiah nasional terakreditasi yang menjadi sasaran tempat publikasi adalah: • Jurnal terakreditasi Universitas Negeri Jakarta atau • Jurnal terakreditasi Universitas Negeri Makassar.

iv

DAFTAR ISI

SAMPUL.......................................................................................................... PENGESAHAN ............................................................................................... RINGKASAN .................................................................................................. IDENTITAS DAN URAIAN UMUM ............................................................ DAFTAR ISI ................................................................................................... BAB I. PENDAHULUAN 1.1. Latar Belakang .......................................................................................... 1.2. Masalah Penelitian ................................................................................... 1.3. Tujuan Penelitian ..................................................................................... 1.4. Manfaat Hasil Penelitian........................................................................... BAB 2. TINJAUAN PUSTAKA 2.1 Skor ........................................................................................................... 2.2. Panjang Tes dan Jumlah Responden ........................................................ 2.3. Estimasi Skor Teori Responsi Butir ......................................................... 2.4. Karakteristik Butir .................................................................................... 2.5. Metode Estimasi ................................................................................... 2.6. Penentuan Skor ......................................................................................... BAB 3. METODE PENELITIAN 3.1. Jenis Penelitian ......................................................................................... 3.2. Waktu Penelitian....................................................................................... 3.3. Sumber Data dan Proses Penelitian .......................................................... BAB 4. HASIL PENELITIAN & PEMBAHASAN 4.1. Penentuan Butir Tes yang Memenuhi Syarat L1P .................................... 4.2. Penentuan Skor Setiap Responden ............................................................ 4.3. Pembahasan Hasil Penelitian .................................................................... BAB 5. KESIMPULAN DAN SARAN 5.1. Kesimpulan ............................................................................................... 5.2. Saran ......................................................................................................... DAFTAR PUSTAKA ..................................................................................... LAMPIRAN ...................................................................................................

v

i ii iii iv v 1 3 3 3 5 6 7 12 14 18 20 20 20 22 23 24 25 25 27 29

BAB I PENDAHULUAN

1.1. Latar Belakang Kualitas pendidikan matematika saat ini masih belum memadai bila dibandingkan dengan kualitas pendidikan matematika negara lain. Hal ini terlihat dari hasil studi TIMMS tahun 2015 yang melaporkan bahwa siswa-siswa Indonesia berada pada urutan 44 dari 49 negara yang disurvei dengan skor 397, adapun skor tertinggi adalah Singapura 618 dan skor terendah Kuwait 353. (TIMMS, 2015). Salah satu upaya untuk meningkatkan kualitas pendidikan adalah peningkatan kualitas penilaian termasuk kualitas pendidikan matematika, karena penilaian merupakan bagian tidak terpisahkan dalam proses pendidikan termasuk proses pendidikan matematika. Kualitas penilaian sangat erat hubungannya dengan instrumen berupa butirbutir tes yang digunakan untuk mengukur kemampuan siswa, baik berupa pengetahuan maupun keterampilan yang dimiliki. Butir-butir tes tersebut dibuat bersesuaian dengan materi yang diberikan pada siswa. Jumlah butir yang digunakan juga menjadi perhatian, pada penelitian ini digunakan 24 butir. Berdasarkan jawaban siswa atas instrumen yang diberikan dapat diperoleh skor setiap siswa, karena berdasarkan jawaban atas butir-butir instrumen hasil pengukuran tersebut menghasilkan angka-angka berupa nilai kuantitatif yang selanjutnya dapat diperoleh angka tunggal untuk setiap peserta didik yang disebut skor, dengan kata lain skor adalah hasil kuantifikasi dari jawaban peserta terhadap suatu instrumen. Pernyataan

1

ini sesuai dengan pendapat Naga yang menyatakan bahwa pada pelaksanaan suatu pengukuran, alat ukur yang terdiri dari banyak butir yang dijawab atau ditanggapi oleh banyak peserta tes, setelah dinilai oleh penilai terdapatlah hasil ukur yang kemudian disebut sebagai skor. (Naga, 2012). Penilaian yang berkualitas dalam rangka mengetahui tingkat penguasaan siswa terhadap suatu konten spesifik tertentu, sangat dibutuhkan oleh pemerhati pendidikan utamanya tentu para pengambil kebijakan dalam rangka upaya peningkatan kualitas pendidikan, misalnya kepala sekolah, karena dengan mengetahui skor siswa yang tepat dapat memberikan solusi yang tepat pula atas permasalahan yang dialami siswa tersebut. Penentuan skor dengan menggunakan Item Response Theori (IRT) tidak bisa dilepaskan dari model karakteristik butir yang digunakan. Terdapat tiga model karakteristik butir yang sering digunakan yaitu: model logistik satu parameter, dikenal sebagai model L1P, model logistik dua parameter, dikenal sebagai model L2P, dan model logistik tiga parameter, dikenal sebagai model L3P. Perbedaan dari ketiga model tersebut terletak pada banyaknya parameter yang digunakan. Adapun parameter-parameter yang dimaksud adalah taraf sukar butir, daya beda butir, dan faktor kebetulan menjawab betul pada butir. Model karakteristik butir yang digunakan pada penelitian ini adalah L1P. Adapun metode pemberian skor yang digunakan adalah metode Maksimum Likelihood. Kebaruan penelitian ini adalah berupaya menunjukkan langkah-langkah yang dilakukan untuk menentuan skor dengan IRT menggunakan metode Maksimum 2

Likelihood, karakteristik butir L1P, panjang tes 24 butir, dan menggunakan 1500 respoden. Berbeda dengan penelitian terdahulu oleh Pommerich dan Nicewaner yang membandingkan akurasi beberapa metode estimasi dengan jumlah butir 5, 10, dan 20 butir, dan jumlah respoden yang digunakan adalah 25, 50, dan 100 responden.( Pommerich dan Nicewander, 1998).

1.2. Masalah Penelitian Masalah penelitian adalah bagaimana menemukan langkah-langkah yang dilakukan untuk menentuan skor dengan IRT menggunakan metode Maksimum Likelihood, dengan karakteristik butir L1P, panjang tes 24 butir, dan menggunakan 1500 respoden.

1.3. Tujuan Penelitian Tujuan penelitian adalah menemukan langkah-langkah yang dilakukan untuk menentuan skor dengan IRT menggunakan metode Maksimum Likelihood, dengan karakteristik butir L1P, panjang tes 24 butir, dan menggunakan 1500 respoden.

1.4. Manfaat Hasil Penelitian Penelitian ini diharapkan bermanfaat baik secara teoritis maupun secara praktis dalam rangka meningkatkan kualitas pendidikan, Secara teoritis penelitian ini dapat memberikan gambaran tentang metode estimasi skor Maksimum Likelihood. Secara praktis bagi guru dan dosen dapat menggunakan hasil penelitian ini dalam rangka menentukan skor siswa, dan bagi pengambil kebijakan hasil penelitian ini

3

dapat digunakan dalam rangka mengambil kebijakan yang lebih tepat. Bagi peneliti, untuk pengembangan ilmu pengetahuan di bidang psikometrika bahwa hasil penelitian ini sebagai bahan informasi dalam meneliti kembali bagaimana jika menggunakan metode estimasi skor yang lain.

4

BAB 2 TINJAUAN PUSTAKA

2.1. Skor

Skor merupakan data kuantitatif yang diberikan kepada setiap responden setelah mengikuti pengukuran mental. Hasil pengukuran dengan menggunakan alat ukur tes pada penelitian ini telah diperoleh berupa skor setiap butir sebagai hasil respon dari peserta tes, yaitu jika respon yang diberikan benar diberi skor 1 dan jika salah diberi skor 0. Tes menggunakan bentuk soal objektif. Skor setiap responden pada setiap paket tes diperoleh berdasarkan seberapa banyak jumlah butir yang dijawab benar. Skor tersebut disebut skor mentah. Langkah selanjutnya

setelah

mendapatkan

skor

mentah

setiap

responden

adalah

menterjemahkan skor mentah tersebut ke skor akhir responden. Langkah ini dikenal sebagai memberi nilai, pada penelitian ini diberi nama skor. Skor selanjutnya ditafsirkan sehingga menjadi nilai yang dapat dikategorikan sebagai skor rendah, menengah, atau tinggi. Penentuan tinggi rendahnya skor yang diperoleh selalu dikaitkan dengan acuan penilaian. Dikenal ada dua macam acuan penilaian yang sering digunakan dalam dunia psikologi dan pendidikan, yaitu acuan norma dan acuan kriteria.(Mardapi ,2012). Pada penelitian ini digunakan acuan kriteria. Proses menterjemahkan skor mentah menjadi skor, pada penelitian ini dilakukan dengan menggunakan IRT untuk mendapatkan skor setiap responden.

5

2.2. Panjang Tes dan Jumlah Responden Panjang tes ditunjukkan oleh banyaknya butir yang terdapat dalam perangkat tes. Seberapa banyak jumlah butir yang dibutuhkan dalam suatu tes untuk mendapatkan hasil pengukuran yang sesuai dengan standar keakuratan yang diinginkan adalah suatu hal yang perlu diketahui, agar hasil pengukuran tersebut dapat dijadikan bahan pertimbangan dalam mengambil kebijakan. Saifuddin Azwar menyatakan bahwa tes yang pendek memiliki butir yang lebih sedikit namun berisi butir-butir berdaya diskriminasi tinggi adalah lebih baik reliabilitasnya dibanding tes yang panjang memiliki butir-butir yang lebih banyak namun berisi butir-butir yang berkualitas rendah. Implikasinya adalah efisiensi tes dengan mengurangi butir dapat dipertimbangkan tanpa mengorbankan realibilitas, bila didasarkan pada pemilihan butir yang berdaya dikriminasi tinggi.(Azwar, 2009). Penelitian yang telah dilakukan oleh Ilham Falani dan Siti Ayu Kumala dengan judul ―Kestabilan Estimasi Parameter Kemampuan pada Model Logistik Item Response Theory Ditinjau dari Panjang Tes” Variasi panjang tes yang digunakan ada 3 macam dengan jumlah butir 20, 40, dan 60 butir. Menemukan bahwa semakin panjang tes yang digunakan, estimasi parameter kemampuan semakin akurat.(Falani, 2017). Saiful Ridho dalam penelitiannya mengenai Tes Pengetahuan Praktikum Biologi dengan menggunakan panjang tes 4, 8, dan 16 butir menemukan bahwa tidak ada perbedaan yang signifikan mengestimasi parameter butir.(Saiful, 2011). Panjang tes yang digunakan pada penelitian ini adalah 24 butir.

6

Jumlah responden juga menjadi perhatian dalam penelitian adalah berapa jumlah responden ideal yang dibutuhkan pada penelitian tersebut, sebagai contoh Saiful Ridho dalam penelitiannya mengenai Tes Pengetahuan Praktikum Biologi, mengambil jumlah responden 250, 500, 1000, 1500, dan 2000 siswa untuk mengestimasi parameter butir. (Saiful, 2011). Sejumlah penelitian psikometri lainnya menggunakan jumlah responden yang hampir sama jumlahnya yaitu sekitar 1000 responden seperti yang dilakukan oleh Ilham Falani dan Siti Ayu Kumala yang telah dituliskan di atas, contoh lain R. Darrell Bock juga menggunakan 1000 responden. (Bock, Thissen, dan Zimowski, 1997). Pada penelitian ini jumlah responden yang digunakan adalah 1500 responden.

2.3.Estimasi Skor Teori Responsi Butir Teori pemberian skor dipilah menjadi dua kelompok yaitu teori pemberian skor klasik dan teori pemberian skor modern, masing-masing kelompok memiliki ciri yang berbeda. Ciri pemberian skor klasik yaitu kelompok butir pada tes atau kuesioner tidak dapat dipisahkan dari kelompok peserta yang menempuh tes atau yang mengisi kuesioner, skor tergantung pada butir dan peserta tes. Pengungkapan skor selalu disertai keterangan tentang butir dan peserta yang terlibat di dalam pemberian skor tersebut. Adapun ciri dari teori pemberian skor modern yaitu melepaskan ketergantungan antara butir tes dengan peserta tes. Dengan pengukuran modern ciri butir akan tetap sama, tidak menjadi soal peserta mana yang menempuhnya. Demikian pula ciri peserta akan tetap sama, tidak menjadi soal butir

7

mana yang ditanggapinya, teori pemberian skor modern dikenal dengan nama teori responsi butir (item response theori – IRT). (Naga , 1992). Sejarah IRT ditulis dalam buku yang berjudul “Item Response Theory for Psychologists” oleh Susan E. Embretson dan Steven P. Reise antara lain dinyatakan bahwa: Ide awal IRT ditulis dalam satu makalah yang sangat penting oleh Lord pada tahun 1953, dan ditulis buku teks klasik pertama oleh Lord dan Novick pada tahun 1968. Selanjutnya berkembang sampai saat ini. (Susan & Reise, 2000). Teori responsi butir baru dapat berlaku apabila memenuhi asumsi: unidimensi, independensi lokal, dan invariansi kelompok. Berikut ini penjelasan ketiga asumsi tersebut yang diambil dari buku “Fundamental of Item Response Theory” ditulis oleh Hambleton, dkk. (Hambleton dan Rogers, 1991). Buku “Teori Responsi Butir dan Penerapannya” ditulis oleh Heri Retnawati.(Heri Retnawati, 2015). dan dari buku ―Teori Sekor Pada Pengukuran Mental” ditulis oleh Naga. (Naga, 2012). Sebagai berikut: 1). Unidimensi Jika asumsi unidimensi dipenuhi suatu butir maka lengkungannya sesuai dengan karakteristik butir sebagaimana pada gambar 2.1, yaitu lengkungannya terus naik mengikuti kenaikan parameter kemampuan, dengan demikian pemeriksaan pemenuhan asumsi unidimensi dilakukan dengan pencocokkan model karakteristik butir yang dipilih dengan data dari lapangan. Jika lengkungan karakteristik butir yang dipilih sesuai dengan data dari lapangan maka asumsi unidimensi sudah terpenuhi.

8

Contoh butir yang tidak memenuhi asumsi unidimensi yaitu butir geometri yang dilengkapi gambar ruang dengan keterangan gambar dalam bahasa arab yang tidak dipahami seluruh responden, akibatnya responden yang kuat geometri dan tidak paham bahasa arab memiliki probabiltas jawaban betul yang rendah, kurang lebih sama posisinya dengan responden yang lemah geometri dan tidak paham bahasa arab yang juga memiliki probabilitas jawaban betul yang rendah. Dengan demikian lengkungan karakteristik butir tersebut tidak meningkat dengan meningkatnya kemampuan geometri responden. Inilah sebabnya mengapa teori responsi butir harus memenuhi asumsi unidimensi. 2). Independensi lokal Asumsi Independensi lokal pada teori responsi butir dimaksudkan untuk menjamin bahwa setiap butir adalah independen dengan butir lainnya, dan setiap responden adalah independen dengan responden lainnya dalam menanggapi suatu butir. Secara statistika asumsi independensi baik independensi butir maupun independensi

responden

dapat

diuji

dengan

teori

probabilitas,

misalkan

anggota himpunan kejadian yang independen maka berlaku: (

)

(

)

( )

( )

∏ ( )

9

( )

(

)

Sebagai contoh kita ingin menguji independesi lokal antar dua butir dengan jawaban benar atau salah, yaitu butir-s dan butir-t, jawaban benar diberi simbol 1 dan jawaban salah diberi simbol 0, dengan demikian probabilitas gabungan butir-s dan butir-t adalah: P(11), P(10), P(01), dan P(00). Sedangkan probabilitas pada setiap skor butir masing-masing adalah: disajikan sebagai berikut:

( ),

( ),

( ), dan

( ). Lebih mudahnya

Butir-t Butir-s

1 0

1 P(11) P(01) ( )

Butir-s dan butir-t indepensi lokal jika memenuhi: P(11) = P(10) = P(01) = P(00) =

( ). ( )

( ). ( )

( ). ( )

( ). ( )

10

0 P(10) P(00) ( )

( ) ( ) 1

Misalkan data responden untuk butir-s dan butir-t sebagai berikut: Responden Butir-s

0

1

0

0

1

0

0

1

1

1

Butir-t

0

1

1

1

0

0

1

1

0

1

Butir-t Butir-s

...


Similar Free PDFs