Data screening: Membersiapkan data untuk analisa kuantitatif

Data screening: Membersiapkan data untuk analisa kuantitatif

Oleh: Herri Mulyono

Dosen UHAMKA Jakarta

 

Data screening, atau juga dikenal dengan data cleaning (membersihkan data) merupakan salah satu teknik persiapan data untuk analisa data kuantitatif. Tujuan utama dari data screening ini adalah khususnya menghilangkan data-data yang hilang (missing value) ataupun data-data yang dianggap tidak normal. Contohnya, kita sering menemui data-data dari kuesioner tidak diisi oleh responden pada beberapa item, mungkin dikarenakan terlewat, terlupakan, atau mungkin saja responden tidak berkenan mengisinya. Juga, banyak ditemui data-data yang diisikan oleh responden tidak sesuai dengan apa yang diinstruksikan. Misal, dalam skala sikap 1 sampai 5, responden mengisi 0, atau 6. Sehingga, nilai 0 atau 6 ini menjadi data yang dianggap diluar kewajaran untuk dianalisa secara kuantitaitf. Contoh dalam aplikasi kuesioner dapat disimak sebagai berikut:

Ada seorang responden (responden 1) yang diminta menilai 5 jenis nasi goreng dengan skala 1-5, dengan skala 1: sangat tidak enak, dan skala 5 menunjukan rasa yang sempurna (sangat enak). Data yang diperoleh:

Responden 1:

Nasi goreng A -3, Nasi goreng B -4, Nasi goreng C-0, Nasi goreng D – 0, Nasi goreng E -5.

Dari data responden diatas, terlihat nasi goreng C mendapatkan score 0 diluar dari skala 1-5. Hal ini bisa jadi responden tidak ingin berkomentar, atau tidak (ingin) memakan nasi goreng tersebut. Juga pada kasus nasi goreng D yang tidak memiliki score (0).

Sayangnya, banyak peneliti pemula tidak sadar tentang data screening pada awal persiapan analisa data kuantitatif ini. Banyak juga yang kemudian memutuskan untuk menghapus atau mengeluarkan (exclude) data-data yang hilang atau diluar kenormalan tersebut. Padahal, mempersiapkan data melalui prosedur data screening ini dapat banyak membantu dalam menormalisasi distribusi data.

Berikut ini adalah beberapa hal yang perlu dilakukan dalam data screening:

Langkah 1. Merespon missing value

Missing value adalah nilai atau data yang terlewat (hilang) dari sebuah isian kuesioner, test atau instrumen lainnya. Missing value selalu berarti hilangnya data secara keseluruhan. Atau dengan kata lain, ada bagian yang hilang dari keseluruhan data responden.

Berikut adalah contoh dari data nilai bahasa Inggris siswa dari tiga sekolah (N=65)

Gambar 1.

Output 2

 

 

 

 

 

 

 

 

 

 

Bila kita memasukkan data-data tersebut diatas kedalam SPSS, maka akan diperoleh output Descriptive statistics seperti dibawah ini:

Gambar 2.

Output 2

 

 

 

 

 

 

 

 

 

 

Pada output diatas terlihat bahwa nilai valid N 64 dengan range nilai minimum 0 dan maksimum 4. Namun, data diatas tidak memperlihatkan bila terdapat data yang hilang. Untuk mengetahuinya, kita dapat menggunakan menu SPSS dengan analyze\data statistics\frequencies. Output yang diproduksi oleh SPSS adala sebagi berikut:

Gambar 3.

Output 2

 

 

 

 

 

 

 

 

Pada output terlihat jelas nilai yang hilang, contohnya terdapat 1 nilai hilang Pre_Syntax, Pre_Cohesion, dan seterusnya. Untuk mengkoreksina, pertama kita harus meneliti terlebih dahulu apakah data tersebut tidak ter-input ataukan memang hilang (karena partisipan tidak mengisinya).

Selanjutnya, kita dapat mengukuti Langkah 1, yaitu dengan menganggap data yang hilang tersebut tidak ada (ignore). Langkah 1 ini dapat dilakukan dengan merubah data variable 3 dan 6 dengan nilai diskrit 99.

Gambar 4.

Output 2

 

 

 

 

 

 

 

 

 

 

Jika dari pengisian kolom missing dengan 99 tidak merubah hasil output pada deskriptif statistik, maka kita menuju kepada langkah berikutnya, yaitu mengidentifkasi outlier.

Langkah 2. Mendeteksi outlier

Outlier adalah data-data yang berada pada batas kewajararan. Seperti pada contoh niali kita diatas, terlihat bahwa skala yang digunakan untuk menilai siswa adalah 1-5. Namun pada data ditemukan nilai 0 yang berada diluar skala 1-5 tersebut. Nilai 0 ini disebut dengan outlier. Perlu diketahui, bahwa pada beberapa kasus nilai outlier ini bisa saja berupa bilangan desimal diluar nilai 0 tadi. Bila dibiarkan begitu saja maka outlier ini sangat mempengaruhi distribusi data nantinya. Pada sample kecil, outlier dapat dengan mudah diidentifikasi. Namun, untuk kasus data dengan sampel besar, maka diperlukan cara untuk mendeteksi outlier tersebut. Untuk mendeteksi outlier, kita dapat menggunakan nilai Z. Dalam SPSS kita dapat menggunakan menu Analyize\Descriptive statistics\Descritpive, lalu tik Save standardized values as variables.

Gambar 5.

Output 2

 

 

 

 

 

 

 

 

 

 

Dengan menggunakan instruksi seperti diatas, maka kita akan mendaptkan variabel baru dengan huruf awal Z seperti ZPre_Vocab, ZPre_Syntax dan seterusnya.

Gambar 6.

Output 2

 

 

 

 

 

 

 

Untuk mendeteksi apakah data dikategorikan dengan outlier atau tidak, maka kita menggunakan standar nilai 3.29. Hal ini berarti, data yang berada lebih besar dari 3.29 atau lebih kecil dari -3.29 dianggap data outlier – data diluar kewajaran. Pada SPSS, urutkan data-data nilai Z dengan Ascending, untuk melihat apakah data lebih besar dari 3.29 atau lebih kecil dari – 3.29.

Gambar 7.

Output 2

 

 

 

 

 

 

 

 

Dengan mengurutkan variable Z satu persatu, maka kita dapatkan beberapa kasus nilai yang lebih besar dari 3.29 atau lebih kecil dari -3.29.

Gambar 8.

Output 2

 

 

 

 

 

 

Nilai tersebut kita dapati beberapa nilai pada variable PreVocab berada diluar kewajaran, atau nilai outlier. Pada data terdapat nilai 2.5 yang tidak ada dalam skala 1, 2, 3, 4 dan 5. Sehingga, kita perlu 1) mengeceknya bila terjadi kesalahan input data, atau 2) kita bisa menggabaiannya dengan menggunakan range diskrit nilai 2.1 -2.9 dan nilai diskrit 99. Masukkan nilai tersebut pada kolom missing ada variabel yang terdidentifikasi outlier tersebut seperti pada gambar berikut:

Gambar 9.

Output 2

 

 

 

 

 

 

 

 

 

Jika kita telah merespon nilai yang hilang serta nilai outlier, maka langkah terakhirnya adalah mengganti nilai yang hilang tersebut dengan nilai seri rerata seperti yang disediakan oleh SPSS.

Langkah 3. Transform data

Transform data adalah langkah terakhir dalam merespon nilai hilang. Field (2013) menyebutkan empat jenis transformasi data, yaitu: transformasi log transformasi akar kuadrat, transformasi berbanding terbalik, serta transformasi nilai berlawanan. Tiga transformasi data yang pertama: log, akar kuadrat dan berbanding terbalik dapat digunakan untuk memperbaiki kemiringan/skew positif serta varian yang tidak sama. Sedangkan, transformasi nilai berlawanan dapat dijadikan langkah untuk mempergaiki kemiringan negatif.

Leech, Barret dan Morgan (2005) memberikan alternatif lain, yaitu dengan mengganti nilai yang hilang tersebut dengan salah satu cara seperti interpolasi, imputasi, ataupun dengan mengganti nilai yang hilang dengan nilai rerata atau nilai tengah. Dalam posting ini, metode transform data dengan menggunakan nilai pengganti rerata bertujuan untuk mengisi nilai-nilai hilang pada data. Tujuannya adalah untuk menyeimbangkan nilai rerata. Dengan menggunakan menu Transform\ Replacing missing values kita dapat mendapatkan nilai pengganti dari nilai yang hilang tersebut. Perhatikan prosedur penggantian nilai hilang seperti pada gambar dibawah ini:

Gambar 10.

Output 2

 

 

 

 

 

 

 

 

 

 

Untuk mengganti nilai hilang pada tiap variabel, kita dapat menggunakan metode series of mean sebagai menu default. Untuk beberapa kasus, dapat pula digunakan metode lainnya yang tersedia.

Dari instruksi tersebut kita mendapatkan variable baru dengan nama Pre_Vocab_1 dan seterusnya. Label SMEAN(Pre_Vocab) mengidentifikasikan bahwa nilai hilang pada variable Pre_Vocab sudah diganti. Untuk analisa kuantitatif selanjutnya (uji normalitas, homogenitas, anova dll) kita menggunakan variable baru ini.

Perhatikan deskripsi statistik untuk frekuensi pada gambar berikut:

Gambar 11.

 

Output 4

 

 

 

 

 

 

 

 

 

 

Pada gambar 11 diatas, terlihat bahwa nilai yang hilang sudah tidak ada (N=65, Persentase data 100%). Untuk melihat bagaimana transformasi data dapat mempengarhui kemiringan seperti yang disarankan oleh Field (2013) diatas. Perhatikan deskripsi statistik pada gambar berikut:

 

 

 

 

 

 

 

 

Dengan membandingkan gambar 2 (deskripsi data sebelum transformasi) dengan gambar 10 (setelah transformasi data), maka terlihat bahwa pada nilai Pre_Vocab kemiringan (skewness) kurva bergeser dari -.138 menjadi -.122 artinya kurva bergerang kesumbu positif. Hal ini juga terjadi pada nilai-nilai pada variabel lainnya.  Selain itu, perubahan juga terlihat pada nilai rerata serta standar deviasi. Pergeseran nilai pada kemeiringan kurva, perbaikan nilai rerata dan nilai standar deviasi ini membuktikan pendapat Field (2013) dan WIlcox (2005) bahwa data screening (memperbaiki data) dapat mempengaruhi distribusi normal data, yang tentunya akan berpengaruh didalam menentukan pilihan parametrik ataupun non parametrik test.

 

Semoga bermanfaat

Referensi Bacaan lebih lanjut:

Field, A.P. (2013). Dicovering statistics using IBM SPSS Statistics: And sex and drugs and rock ‘n’ roll (4th ed.) London: Sage

Leech, N.L., Barret, K.C., & Morgan, G.A. (2005). SPSS for intermediate statistics: Use and interpretation (2nd ed). London: Lawrence Erlabaum Associates.

Morgan, G.A., Leech, N.L., Gloeckner, G.W., & Barret, K.C. (2004). SPSS for introductory statistics: Use and interpretation (2nd ed.). London: Lawrence Erlabaum Associates.

Wilcox, R.R. (2005). Introduction to robust estimation and hypothesis testing (2nd ed.). Elsevier.

 

Note:

Berkahi ilmu anda dengan mendoakan penulis serta mengutip dengan isi posting diatas dengan prosedur selayaknya akademisi. Untuk mengutip:

Mulyono, H. (2014, 31 July). Data screening: Membersiapkan data untuk analisa kuantitatif. Diakses pada tanggal (tuliskan tanggal anda membaca posting ini) dari (copy link posting ini)

 

Advertisements

Melihat Quasi Experiment dari 2 Sisi

Melihat Quasi Experiment dari 2 Sisi

Ditulis oleh Herri Mulyono

Secara literasi, quasi berasar dari bahasa latin yang memiliki makna “seolah-olah” atau “hampir” (Oxford), maka Eksperimen Kuasi (quasi experiment) dilihat sebagai “seolah-olah eksperimen” atau “hampir eksperimen”. Pada dasarnya quasi-experiment hampir sama dengan experiment dimana pada quasi experiment terdapat pemberian perlakuan atau treatment dan pengukuran hasil perlakuan tersebut (Teddie, C., & Tashakkori, A., 2009). Namun Robson (1993) melihat quasi-experiment sebagai  bentuk sederhana dari experiment research dimana penyederhanaan tersebut tampak pada penyederhanaan tempat ataupun sampel pada penelitian. Penyederhanan experimental research ini juga dikenal dengan limited quantification atau kuantitatif terbatas (Seale, 2004, Spicer dalam Seale 2004) yang diartikan sebagai pembatasan lingkungan penelitian yang digunakan. Pemanfaatan sampel group yang tidak sama atau non equivalent group, atau mungkn benar-benar berbeda (tidak) dalam quasi-experiment design merupakan salah satu bentuk penyederhanaan dari pure-experiment approach (Cohen dan Manion, 1994). Dengan menggunakan dua sudut pandang pendekatan penelitian experiment dan mixed method, quasi experiment akan memperlihatkan kekurangan dan kelebihannya masing-masing.

Jika dilihat dari sisi implementasi experimental research, desain quasi-experiment kurang mendapat bobot yang tingi, atau sering dianggap lemah dilihat dari sisi persyaratan experiment yang banyak terpenuhi, dan dipandang tidak mampu dalam memberikan generalisasi terhadap hasil penelitian nantinya. Tentulah, penyederhanaan-penyederhanaan yang dilakukan atau sengaja di desain dalam model  quasi experiment ini dianggap subjektif karena memiliki tujuan-tujuan tertentu dari aktivitas penyederhanaan tersebut. Sebagai contoh, penggunaan kelas experiment (tanpa menggunakan pembanding, kelas kontrol — pada desain one-group) memunculkan argumentasi tersendiri. Bahwa ketika hasil diketahui memilik efek atau pengaruh tertentu terhadap sebuah perlakuan maka sulit untuk diterima, karena sesuatu dikatakan baik tentu jika ada pembanding buruk (yang dicontohkan pada kelas kontrol). Selain sampel yang khusus digunakan untuk perlakuan tertentu ketimbang taknik random yang umum digunakan dalam experimental research dengan tujuan generalisasi hasil nantinya, pilihan non-equivalent control atau kelas kontrol yang tidak ekivalen memberikan tendensi tersendiri yang memberikan keraguan atas faktor atau indikator lain yang mempengaruhi variabel penelitian. Masalah lainnya jika dipandang dari experiment approach adalah pada konteks validitas dari penelitian tersebut yang awal diragukan ( Campbell dan Stanly (1963), Bracht and Glass (1968) dalam Cohen dan Manion, 1994).

Namun, quasi experiment memiliki nilai yang tinggi dalam social research ketika pure-experiment design dipandang tidak praktis atau tidak etis untuk digunakan (Seale, 2004). Penggunaan desain quasi-experiment sangat berperan khususnya dalam menganalisa data yang diperoleh dari survey (Seale, 2004) atau skala (rating) tertentu. Hal terpenting dari nilai quasi experiment adalah bagaimana hasil analisa kuantiatif tersebut dapat menjadi informasi penting yang mendukung data kualiatatif atau sebaliknya dalam desain mixed approach (Creswell, J. W. , 2003; Teddie, C., & Tashakkori, A., 2009). Peran penting quasi-experiment dalam area penelitian sosial, khususnya dalam area pendidikan adalah ketika melihat manusia sebagai objek penelitian yang memiliki karakter-karakter tertentu yang jelas berbeda satu sama lain dan sulit untuk diukur presentasikan hanya dengan angka-angka.

Memutuskan untuk menggunakan model quasi-experiment sebagai metode penelitian dalam memcahkan sebuah masalah atau investigasi terrhadap suatu hal bisa menjadi alternatif yang menguntungkan. Namun, tidak selalu diambil cara termudah yaitu manakala random sampling tidak dapat dipenuhi atau faktor-faktor lain yang tidak bisa dipenuhi dalam experiment. Artinya, pemilihan tersebut harus didasarkan pada tujuan penelitian, yaitu apakah akan berhubungan dengan ranah sosial (pendidikan) dimana manusia menjadi dijadikan objek penelitian yang tidak bisa diukur “hanya dengan angka”.

Referensi:

Cohen, L., & Manion, L. (1994). Research methods in education (4th ed.). London ; New York: Routhledge.

Creswell, J. W. (2003). Research design : qualitative, quantitative, and mixed method approaches (2nd. ed.). Thousand Oaks, Calif. ; London: Sage Publications.

Seale, Clive. 2004. History of Qualitative Methods. Dalam Researching Society and Culture (Seale, Clive (eds)). London: Sage.

Spicer, Neil. 2004. Combining Qualitative and Quantitative Methods. Dalam Researching Society and Culture (Seale, Clive (eds)). London: Sage.

Robson, Colin. 1993. Real World Research. Oxford: Blackwell.

Teddie, C., & Tashakkori, A. (2009). Foundations of Mixed Method Research: Integrating Quantitative and Qualitative Approaches in the Social and Behavioral Sciences. California: SAGE.

Untuk mengutip:

Mulyono, Herri. 2012. Melihat Quasi Experiment dari 2 sisi. Terdapat di https://myenglish01.wordpress.com/2012/10/08/model-quantitative-resesarch-quasi-experiment/. diakses (tanggal, bulan, tahun)

—–

Jika posting ini bermanfaat bagi anda, silahkan di share melalui aplikasi social network yang tersedia dibawah ini.

Quantitative Abuse?

Quantitative Abuse: Mixed Method?

Ditulis oleh:

Herri Mulyon (Dosen UHAMKA)

Beberapa hal yang harus dipertanyakan adalah tren penelitian pendidikan yang mengarah pada hubungan, pengaruh, efek dimana metode penelitian kuantitatif menjadi tolak ukur utama. Tren inilah yang kemudian ‘memaksa’ mahasiswa akhir yang sedang mengerjakan riset sebagai tugas akhir studinya untuk menggunakan metode hitung-hitungan angka ini menjadi metode pemecahan masalah risetnya. Padahal tren kuantitatif dalam penelitian sosial khususnya pendidikan kini mulai menjadi isu hangat dalam perdebatan para ahli. Salah satu isu utamanya adalah subjek penelitian, manusia yang memiliki sifat, tingkah laku, perasaan atau karakteristik khusus lainnya yang tidak bisa semata diteliti dengan menggunakan metode kuantitatif. Sehingga alternatif mixed method atau metode kombinasi antara kuanatitatif dan kualitatif menjadi jalan keluar yang menjanjikan seperti yang di usung oleh Lewis & Ritchie, 2004; Cohen & Manion, 1994; Creswell, 2003; Robson, 1993; dan Tashakkori & Teddlie, 2010.

Ada beberapa indikator mengapa mixed method ini belum digandrungi oleh banyak peneliti muda di Indonesia (berdasarkan hasil survey saya di jurnal online universitas yang memiliki program keguruan):

1) Masih kuatnya image superioritas Logika matematika

Walau Gardner telah memunculkan teori tentang multiple intelligence yang mulai membuka pemahaman baru tentang kecerdasan yang tidah hanya tergambar dari test IQ, image masyarakat luas, juga beberapa kaum akademisi tentang ‘kecerdasan’ yang diukur dengan test IQ (logika matematis) masih menjadi trend. Hal inilah yang menjadikan banyak pemahaman bahwa riset yang berkualitas sangat bersandar pada angka-angka yang disajikan. Hal ini juga meluas kepada salah persepsi yang kemudian ditampilkan dalam perkuliahan Metode Kuantitatif, yang menekankan pada aktivitas perhitungan yang terlihat rumit, dibandingkan pembahasan tentang metode, desain, serta prosedur penelitian yang memiliki peran utama dalam menjawab pertanyaan penelitian (research question). Padahal, perkembangan software statistik kini sudah mulai meluas dikalangan masyarakat akademis sehingga quantitative abuse seharusnya tidak dijadikan momok yang menakutkan

2) Belum tersentuhnya metode Mixed Method dalam perkuliahan

Sejauh ini, perkuliahan metode penelitian hanya mencakup dua hal, yaitu kuantitatif dan kualitatif dimana alternative mixed method belum mendapat ruang sebagai jalan alternatif mencapai tujuan penelitian. Pemisahan dua mata kuliah kuantitatif dan kualitatif hendaknya tidak lagi dijadikan isu utama dalam pengajaran melainkan integrasi kedua mata kuliah itu menjadi pilihan bagi mahasiswa dalam risetnya nanti. Sehingga, mixed method dapat menjadi salah satu dari dua yang telah tersedia sebagai alternatif dalam pemecahan masalah riset yang sedang digiatkan oleh mahasiswa

3) Faktor pembimbingan

Dalam banyak hal, aktivitas penelitian oleh mahasiswa cendrung sangat dipengaruhi oleh dosen pembimbing, baik dalam penentuan tema penelitian hingga metode apa yang digunakan dalam riset mahasiswa. Isu klasiknya adalah belum meluasnya budaya open-minded dan budaya belajar bagi sebagian dosen sehingga mahasiswa cendrung diarahkan dengan ‘cara-cara yang sama’ seperti dosen tersebut menjalani studinya beberapa tahun yang silam. Sehingga ada baiknya jika dosen juga dituntut melakukan up-date ilmu pengetahuan dan keluar dari budaya-budaya kuno yang justru mengikat dirinya jauh untuk tidak berkembang.

(bersambung …)

*Jika post ini bermanfaat, mohon di rating dan share sehingga yang lain juga dapat mengambil manfaatnya