Langsung ke konten utama

Besar Sampel dan Sumber Data

Dalam statistik inferensial, besar sampelsangat menentukan representasi sampel yang diambil dalam menggambarkan populasipenelitian. Oleh karena itu menjadi satu kebutuhan bagi setiap peneliti untuk memahami kaidah-kaidah yang benar dalam menentukan sampel minimal dalam sebuah penelitian.
Cara menghitung besar sampel suatu penelitian sangat ditentukan olehdesain penelitian yang digunakan dan data yang diambil. Jenis penelitian observasional dengan menggunakan disain cross-sectional akan berbeda dengan case-control study dan khohor, demikian pula jika data yang dikumpulkan adalah proporsi akan beda dengan jika data yang digunakan adalah data continue. Pada penelitian di bidang kesehatan masyarakat, kebanyakan menggunakan disain atau pendekatan cross-sectional atau belah lintang, meskipun ada beberapa yang menggunakan case control ataupun khohor.
Terdapat banyak rumus untuk menghitung besar sampel minimal sebuah penelitian, namun pada artikel ini akan disampaikan sejumlah rumus yang paling sering dipergunakan oleh para peneliti.

Rumus Sampel Penelitian Cross-sectional

Untuk penelitian survei, biasanya rumus yang bisa dipakai menggunakan proporsi binomunal (binomunal proportions). Jika besar populasi (N) diketahui, maka dicari dengan menggunakan rumus berikut:
Rumus Sampel Cross Sectional
Rumus Sampel Cross Sectional
Dengan jumlah populasi (N) yang diketahui, maka peneliti bisa melakukan pengambilan sampel secara acak).
Namun apabila besar populasi (N) tidak diketahui atau (N-n)/(N-1)=1 maka besar sampel dihitung dengan rumus sebagai berikut :
Rumus Lemeshow
Rumus Lemeshow
Keterangan :
n = jumlah sampel minimal yang diperlukan
= derajat kepercayaan
p = proporsi anak yang diberi ASI secara eksklusif
q = 1-p (proporsi anak yang tidak diberi ASI secara eksklusif
d = limit dari error atau presisi absolut
Jika ditetapkan =0,05 atau Z1- /2 = 1,96 atau Z2
1- /2 = 1,962 atau dibulatkan menjadi 4, maka rumus untuk besar N yang diketahui kadang-kadang diubah menjadi:
Penyederhanaan Rumus Lemeshow
Penyederhanaan Rumus Lemeshow


Misalnya, kita ingin mencari sampel minimal untuk suatu penelitian mencari faktor determinan pemberian ASI secara eksklusif. Untuk mendapatkan nilai p, kita harus melihat dari penelitian yang telah ada atau literatur. Dari hasil hasil penelitian Suyatno (2001) di daerah Demak-Jawa Tengah, proporsi bayi (p) yang diberi makanan ASI eksklusif sekitar 17,2 %. Ini berarti nilai p = 0,172 dan nilai q = 1 – p. Dengan limit dari error (d) ditetapkan 0,05 dan nilai Alfa = 0,05, maka jumlah sampel yang dibutuhkan sebesar:
Contoh Rumus Sampel Cross Sectional
Contoh Rumus Sampel Cross Sectional


= 219 orang (angka minimal)
Jika tidak diketemukan nilai p dari penelitian atau literatur lain, maka dapat dilakukan maximal estimation dengan p = 0,5. Jika ingin teliti teliti maka nilai d sekitar 2,5 % (0,025) atau lebih kecil lagi.


Rumus Sampel Penelitian Case Control dan Kohort

Rumus yang digunakan untuk mencari besar sampel baik case control maupun kohort adalah sama, terutama jika menggunakan ukuran proporsi. Hanya saja untuk penelitian khohor, ada juga yang menggunakan ukuran data kontinue (nilai mean).
Besar sampel untuk penelitian case control adalah bertujuan untuk mencari sampel minimal untuk masing-masing kelompok kasus dan kelompok kontrol. Kadang kadang peneliti membuat perbandingan antara jumlah sampel kelompok kasus dan kontrol tidak harus 1 : 1, tetapi juga bisa 1: 2 atau 1 : 3 dengan tujuan untuk memperoleh hasil yang lebih baik. Adapun rumus yang banyak dipakai untuk mencari sampel
minimal penelitian case-control adalah sebagai berikut:
Rumus Sampel Case Control dan Kohort
Rumus Sampel Case Control dan Kohort


Pada penelitian khohor yang dicari adalah jumlah minimal untuk kelompok exposure dan non-exposure atau kelompok terpapar dan tidak terpapar. Jika yang digunakan adalah data proporsi maka untuk penelitian khohor nilai p0 pada rumus di atas sebagai proporsi yang sakit pada populasi yang tidak terpapar dan p1 adalah proporsi yang sakit pada populasi yang terpapar atau nilai p1 = p0 x RR (Relative Risk).
Jika nilai p adalah data kontinue (misalnya rata-rata berat badan, tinggi badan, IMT dan sebagainya) atau tidak dalam bentuk proporsi, maka penentuan besar sampel untuk kelompok dilakukan berdasarkan rumus berikut:
Rumus Sampel Case Control dan Kohort 2
Rumus Sampel Case Control dan Kohort 2
Contoh kasus, misalnya kita ingin mencari sampel minimal pada penelitian tentang pengaruh pemberian ASI eksklusif dengan terhadap berat badan bayi. Dengan menggunakan tingkat kemaknaan 95 % atau Alfa = 0,05, dan tingkat kuasa/power 90 % atau ß=0,10, serta kesudahan (outcome) yang diamati adalah berat badan bayi yang ditetapkan memiliki nilai asumsi SD=0,94 kg, dan estimasi selisih antara nilai mean kesudahan (outcome) berat badan kelompok tidak terpapar dan kelompok terpapar selama 4 bulan pertama kehidupan bayi (U0 – U1) sebesar 0,6 kg (mengacu hasil penelitian Piwoz, et al. 1994), maka perkiraan jumlah minimal sampel yang dibutuhkan tiap kelompok pengamatan, baik terpapar atau tidak terpapar adalah:


Contoh Hitung Sampel Case Control dan Kohort
Contoh Hitung Sampel Case Control dan Kohort
= 51,5 orang atau dibulatkan: 52 orang/kelompok
Pada penelitian khohor harus ditambah dengan jumlah lost to follow atau akalepas selama pengamatan, biasanya diasumsikan 15 %. Pada contoh diatas, maka sampel minimal yang diperlukan menjadi n= 52 (1+0,15) = 59,8 bayi atau dibulatkan menjadi sebanyak 60 bayi untuk masing-masing kelompok baik kelompok terpapar ataupun tidak terpapar atau total 120 bayi untuk kedua kelompok tersebut.

Penelitian Eksperimental

Menurut Supranto J (2000) untuk penelitian eksperimen dengan rancangan acak lengkap, acak kelompok atau faktorial, secara sederhana dapat dirumuskan:
(t-1) (r-1) > 15
dimana : t = banyaknya kelompok perlakuan
j = jumlah replikasi
Contohnya: Jika jumlah perlakuan ada 4 buah, maka jumlah ulangan untuk tiap perlakuan dapat dihitung:
(4 -1) (r-1) > 15
(r-1) > 15/3
r > 6

Untuk mengantisipasi hilangnya unit ekskperimen maka dilakukan koreksi dengan 1/(1-f) di mana f adalah proporsi unit eksperimen yang hilang atau mengundur diri atau drop out.

Sumber Data

      Sumber data terbagi menjadi dua yaitu data primer dan data sekunder. Data primer adalah data yang diperoleh peneliti secara langsung (dari tangan pertama), sementara data sekunder adalah data yang diperoleh peneliti dari sumber yang sudah ada.
Contoh data primer adalah data yang diperoleh dari responden melalui kuesioner, kelompok fokus, dan panel, atau juga data hasil wawancara peneliti dengan nara sumber.
Contoh data sekunder misalnya catatan atau dokumentasi perusahaan berupa absensi, gaji, laporan keuangan publikasi perusahaan, laporan pemerintah, data yang diperoleh dari majalah, dan lain sebagainya.
JENIS DATA

Sumber data penelitian yaitu sumber subjek dari tempat mana data bisa didapatkan. Jika peneliti memakai kuisioner atau wawancara didalam pengumpulan datanya, maka sumber data itu dari responden, yakni orang yang menjawab pertanyaan peneliti, yaitu tertulis ataupun lisan. Sumber data berbentuk responden ini digunakan didalam penelitian.

BERDASARKAN TIPE PENELITIAN

  Ø  Data Kuantitatif

Data kuantitatif adalah data yang dapat diinput ke dalam skala pengukuran statistik. Fakta dan fenomena dalam data ini tidak dinyatakan dalam bahasa alami, melainkan dalam numerik.

  Ø  Data Kualitatif

Data kualitatif adalah data yang dapat mencakup hampir semua data non-numerik. Data ini dapat menggunakan kata-kata untuk menggambarkan fakta dan fenomena yang diamati.

BERDASARKAN SUMBER

  Ø  Data Primer

Data primer adalah data yang dikumpulkan oleh peneliti sendiri atau dirinya sendiri. Ini adalah data yang belum pernah dikumpulkan sebelumnya, baik dengan cara tertentu atau pada periode waktu tertentu.

  Ø  Data Sekunder

      Data seunder adalah data yang dikumpulkan oleh orang lain, bukan peneliti itu sendiri. Data ini biasanya berasal dari penelitian lain yang dilakukan oleh lembaga-lembaga atau organisasi seperti BPS dan lain-lain.

BERDASARKAN CARA MEMPEROLEH

  Ø  Data Observasional

Data observasi adalah data yang ditangkap in situ. Data ini sekali jadi atau tidak bisa diulang, diciptakan atau diganti.

  Ø  Data Wawancara

Data wawancara adalah data yang diperoleh melalui tanya-jawab antara peneliti dan informan. Data ini bisa divalidasi menggunakan triangulasi.

  Ø  Data Eksperimental

Data eksperimental adalah data yang dikumpulkan dalam kondisi terkendali, in situ atau berbasis laboratorium dan harus bisa direproduksi.

  Ø  Data Simulasi

Data simulasi adalah data hasil dari penggunaan model dan metadata di mana input lebih penting daripada output. Contoh: model iklim, model ekonomi, model kosmologi dan lain-lain.

  Ø  Data Referensi atau Kanonik

Data Referensi atau kanonik adalah data statis atau koleksi organik (peer-reviewed) Contoh: menggunakan data urutan gen yang sudah tersedia, struktur kimia, data sensus dan lain-lain.

  Ø  Data Derivasi atau Kompilasi

Data derivasi atau kompilasi adalah data reproduksi. Contoh: kompilasi database yang sudah ada untuk membangun struktur 3D.

BERDASARKAN FORMAT BERKAS

  Ø  Data Kuantitatif
Contoh: SPSS, SAS, Microsoft Ecel, XML dan lain-lain.

  Ø  Data Kualitatif
Contoh: Microsoft Word, Rich Text Format, HTML dan lain-lain.

  Ø  Data Geospatial
Contoh: ESRI Shapefile, Geo-referenced TIFF, CAD data, Tabular GIS attribute data, MapInfo Interchange Format, dan lain-lain.

  Ø  Data Digital Image
Contoh: TIFF, JPEG, Adobe Portable Document Format (PDF) dan lain-lain.

  Ø  Data Digital Audio
Contoh: Free Lossless Audio Codec, Waveform Audio Format, MPEG-1 Audio Layer, Audio Interchange File Format dan lain-lain.

  Ø  Data Digital Video
Contoh: MPEG-4 High Profile, Motion JPEG 2000, GIF dan lain-lain.

BERDASARKAN SUBJEK KEDOKTERAN

  Ø  Data Diagnosis
Contoh: subklasifikasi penyakit atau histologi, sitogenetika, penanda molekuler dan lain-lain.

  Ø  Data Demografi
Contoh: sosial ekonomi informasi, jenis kelamin, usia, ras/etnis dan lain-lain.   
   
 Salah satu pertimbangan dalam memilih masalah penelitian adalah ketersediaan sumber data. Penelitian kuantitatif lebih bersifat explanation (menerangkan, menjeleskan), karena itu bersifat to learn about the people (masyarakat objek), sedangkan penelitian kualitatif lebih bersifat understanding (memahami) terhadap fonemena atau gejala sosial, karena bersifat to learn about the people (masyarakat sebagai subyek).
Yang dimaksud sumber data dalam penelitian adalah subyek dari mana data dapat diperoleh.
Apabila penelitian menggunakan kuisioner atau wawancara dalam pengumpulan datanya, maka sumber data disebut responden, yaitu orang yang meresponatau menjawab pertanyaan peneliti, baik pertanyaan tertulis maupun lisan.
Apabila peneliti menggunakan teknik observasi, maka sumber datanya bisa berupa benda, gerak atau proses tertentu. Contohnya penelitian yang mengamati tumbuhnya jagung, simber ddatanya adalah jagung, sedangkan objek penelitiannya adalah pertumbuhan jagung.
Jadi yang dimaksud sumber data dari uraian diatas adalah subyek penelitian dimana data menempel. Sumber data dapat berupa benda, gerak, manusia, temp at dan sebagainya
Sedangkan sumber data dalam PSBK adalah merupakan data yang diperoleh yang berkaitan dengan penelitian sosial budaya keagamaan itu sendiri baik dengan metode kuisioner maupun observasi.
Ketepatan memilih dan menentukan jenis sumber data akan menentukan kekayaan data yang diperoleh. jenis sumber data terutama alam penelitian kualitatif dapat diklasifikassikan sebagai berikut:
1. Narasumber (informan)
Dalam penelitian kuantitatif sumber data ini disebut”Responden”, yaitu orang yang memberikan “Respon” atau tanggapan terhadap apa yang diminta atau ditentukan oleh peneliti. Sedangkan pada penelitian kualitatif posisis nara sumber sangat penting, bukan skedar memberi respon, melainkan juga sebagai pemilik informasi.
Karena itu, ia disebut informan (orang yang memberikan informasi, sumber informasi, sumber data) atau disebut juga subyek yang diteliti. Karena ia juga aktor atau pelaku yang ikut melakukan berhasil tidaknya penelitian berdasarkan informasi yang diberikan.
2. Peristiwa Atau Aktivitas
Data atau informasi juga dapat diperoleh melalui pengamatan terhadap peristiwa atau aktivitas yang berkaitan dengan permasalahan penelitian. Dari peristiwa atau kejadian ini, peneliti bisa mengetahui proses bagaimana sesuatu terjadi secara lebih pasti karena menyaksikan sendiri secara langsung.
Dengan mengamati sebuah peristiwa atau aktivitas, peneliti dapat melakukan cross check terhadap informasi verbal yang diberikan oleh subyek yang diteliti.
3. Tempat Atau Lokasi
Tempat atau lokasi yang berkaitan dengan sasaran atau permasalahan penelitian juga merupakan salah satu jenis sumber data. Informasi tentang kondisi dari lokasi peristiwa atau aktivitas dilakukan bisa digali lewat sumber lokasi peristiwa atau aktivitasyang dilakukan bisadigali lewat sumber lokasinya, baik yang merupakan tempat maupun tempat maupun lingkungnnya.
4. Dokumen atau Arsip
Dokumen merupakan bahan tertulis atau benda yang berkaitan dengan suatu peristiwa atau aktivitas tertentu. Ia bisa merupakan rekaman atau dokumen tertulis seperti arsip data base surat-surat rekaman gambar benda-benda peninggalan yang berkaitan dengan suatu peristiwa.

Referensi:

1. Bhisma-Murti, Prinsip dan Metoda Riset Epidemiologi, Gadjah Mata University Press,1997
2. Lemeshow, S. & David W.H.Jr, 1997. Besar Sampel dalam Penelitian Kesehatan (terjemahan), Gadjahmada University Press, Yogyakarta
3. Snedecor GW & Cochran WG, Statistical Methods 6th ed, Ames, IA: Iowa State University Press, 1967
4. Supranto, J. 2000. Teknik Sampling untuk Survei dan Eksperimen. Penerbit PT Rineka Cipta, Jakarta.

Komentar

  1. Menghitung Jumlah Sampel Menggunakan Rumus Lemeshow Dengan Excel
    Counting Number of Samples Using Lemeshow Formulas With Excel
    Klik (Click) Link
    https://bit.ly/Lemeshow

    BalasHapus

Posting Komentar

Postingan populer dari blog ini

Penyimpangan Data

PENGUKURAN PENYIMPANGAN DATA Pengukuran penyimpangan data adalah suatu ukuran yang menunjukkan tinggi  rendahnya perbedaan data yang diperoleh dari rata-ratanya. Ukuran penyimpangan digunakan untuk mengetahui luas penyimpangan data atau homogenitas data. Dua variabel data yang memiliki mean sama belum tentu memiliki kualitas yang sama, tergantung dari besar atau kecil ukuran penyebaran datanya. Ada bebarapa macam ukuran penyebaran data, namun yang umum digunakan adalah standar deviasi. Macam-macam ukuran penyimpangan data adalah : Jangkauan ( range ) Simpangan rata-rata ( mean deviation ) Simpangan baku ( standard deviation ) Varians ( variance ) Koefisien variasi ( Coefficient of variation ) 1. Jangkauan ( range ) Range adalah salah satu ukuran statistik yang menunjukan jarak penyebaran data antara nilai terendah (Xmin) dengan nilai tertinggi (Xmax). Ukuran ini sudah digunakan pada pembahasan daftar distribusi frekuensi. Adapun rumusnya adalah Cont

Uji Anova(Uji F)

Anova adalah sebuah analisis statistik yang menguji perbedaan rerata antar grup. Grup disini bisa berarti kelompok atau jenis perlakuan. Anova ditemukan dan diperkenalkan oleh seorang ahli statistik bernama Ronald Fisher. Anova merupakan singkatan dari Analysis of variance. Merupakan prosedur uji statistik yang mirip dengan t test. Namun kelebihan dari Anova adalah dapat menguji perbedaan lebih dari dua kelompok. Berbeda dengan  independent sample t test  yang hanya bisa menguji perbedaan rerata dari dua kelompok saja. Dalam kesempatan bahasan kali ini, statistikian  akan menjelaskannya secara singkat namun dengan penuh harapan agar para pembaca mudah memahami dan mempraktekkannya dalam penelitian di lapangan nantinya. Kegunaan Anova Anova digunakan sebagai alat analisis untuk menguji hipotesis penelitian yang mana menilai adakah perbedaan rerata antara kelompok. Hasil akhir dari analisis ANOVA adalah nilai F test atau F hitung. Nilai F Hitung ini yang nantinya akan diband

Contoh Soal Uji Chi Kuadrat

CONTOH SOAL UJI CHI KUADRAT      Contoh 1 untuk dua kategori: Telah dilakukan pengumpulan data untuk mengetahui bagaimana kemungkinan rakyat dikabupaten pringgodani dalam memilih dua calon kepala desa. Calon yang satu adalah wanita dan calon yang kedua adalah pria. Sampel sebagai sumber data diambil secara random sebanyak 300 orang. Dari sampel tersebut ternyata 200 orang memilih pria dan 100 orang memilih wanita. Hipotesis yang diajukan adalah: Ho: peluang calon pria dan wanita adalah sama untuk dapat dipilih menjadi kepala desa. Ha: peluang calon pria dan wanita adalah tidak sama untuk dapat di pilih menjadi kepala desa. Untuk dapat membuktikan hipotesis dengan rumus 5.4 tersebut, maka data yang terkumpul perlu disusun ke dalam tabel seperti tabel 5.3 berikut: TABEL 5.3 KECENDRUNGAN RAKYAT DI KABUPATEN PRINGGODANI DALAM MEMILIH KEPALA DESA Alternatif Calon Kepala Desa Frekuensi yang diperoleh Frekuensi yang diharapkan Calon Pria Calon Wanita