Langsung ke konten utama

Penyimpangan Data

PENGUKURAN PENYIMPANGAN DATA


  • Pengukuran penyimpangan data adalah suatu ukuran yang menunjukkan tinggi  rendahnya perbedaan data yang diperoleh dari rata-ratanya. Ukuran penyimpangan digunakan untuk mengetahui luas penyimpangan data atau homogenitas data. Dua variabel data yang memiliki mean sama belum tentu memiliki kualitas yang sama, tergantung dari besar atau kecil ukuran penyebaran datanya. Ada bebarapa macam ukuran penyebaran data, namun yang umum digunakan adalah standar deviasi.
Macam-macam ukuran penyimpangan data adalah :
  1. Jangkauan (range)
  2. Simpangan rata-rata (mean deviation)
  3. Simpangan baku (standard deviation)
  4. Varians (variance)
  5. Koefisien variasi (Coefficient of variation)
1. Jangkauan (range)
Range adalah salah satu ukuran statistik yang menunjukan jarak penyebaran data antara nilai terendah (Xmin) dengan nilai tertinggi (Xmax). Ukuran ini sudah digunakan pada pembahasan daftar distribusi frekuensi. Adapun rumusnya adalah
1
3
Contoh : 
Berikut ini nilai ujian semester dari 3 mahasiswa
A = 60 55 70 65 50 80 40
B = 50 55 60 65 70 65 55
C = 60 60 60 60 60 60 60
Dari data diatas dapat diketahui bahwa
A = memiliki Xmax=80, Xmin= 40 , R = 40 , meanya 60
B = memiliki Xmax=70, Xmin= 50 , R = 20 , meanya 60
C = memiliki Xmax=60, Xmin= 60 , R = 0 , meanya 60
Dari contoh di atas dapat disimpulkan bahwa :
a. Semakin kecil rangenya maka semakin homogen distribusinya
b. Semakin besar rangenya maka semakin heterogen distribusinya
c. Semakin kecil rangenya, maka meannya merupakan wakil yang representatif
d. Semakin besar rangenya maka meannya semakin kurang representatif
2. Simpangan Rata-rata (mean deviation)
Simpangan rata-rata merupakan penyimpangan nilai-nilai individu dari nilai rata-ratanya. Rata-rata bisa berupa mean atau median. Untuk data mentah simpangan rata-rata dari median cukup kecil sehingga simpangan ini dianggap paling sesuai untuk data mentah. Namun pada umumnya, simpangan rata-rata yang dihitung dari mean yang sering digunakan untuk nilai simpangan rata-rata.
  • Data tunggal dengan seluruh skornya berfrekuensi satu
1
dimana xi merupakan nilai data
  • Data tunggal sebagian atau seluluh skornya berfrekuensi lebih dari satu
2
dimana xi merupakan nilai data
  • Data kelompok ( dalam distribusi frekuensi)
2
dimana xi merupakan tanda kelas dari interval ke-i dan fi merupakan frekuensi interval ke-i
Contoh :
Dari tabel diperoleh 1
2
1
3. Simpangan Baku (standard deviation)
Standar deviasi merupakan ukuran penyebaran yang paling banyak digunakan. Semua gugus data dipertimbangkan sehingga lebih stabil dibandingkan dengan ukuran lainnya. Namun, apabila dalam gugus data tersebut terdapat nilai ekstrem, standar deviasi menjadi tidak sensitif lagi, sama halnya seperti mean.
Standar Deviasi memiliki beberapa karakteristik khusus lainnya. SD tidak berubah apabila setiap unsur pada gugus datanya di tambahkan atau dikurangkan dengan nilai konstan tertentu. SD berubah apabila setiap unsur pada gugus datanya dikali/dibagi dengan nilai konstan tertentu. Bila dikalikan dengan nilai konstan, standar deviasi yang dihasilkan akan setara dengan hasilkali dari nilai standar deviasi aktual dengan konstan.
Rumus Simpangan Baku untuk Data Tunggal
  • untuk data sample menggunakan rumus
11
  • untuk data populasi menggunkan rumus
1
Contoh :
Selama 10 kali ulangan semester ini sobat mendapat nilai 91, 79, 86, 80, 75, 100, 87, 93, 90,dan 88. Berapa simpangan baku dari nilai ulangan sobat?
Jawab
Soal di atas menanyakan simpangan baku dari data populasi jadi menggunakan rumus simpangan baku untuk populasi.
Kita cari dulu rata-ratanya
rata-rata = (91+79+86+80+75+100+87+93+90+88)/10 = 869/10 = 85,9
3
Kita masukkan ke rumus
1
Rumus Simpangan Baku Untuk Data Kelompok
  • untuk sample menggunakan rumus
2
  • untuk populasi menggunakan rumus
21
Contoh :
Diketahui data tinggi badan 50 siswa samapta kelas c adalah sebagai berikut
4
hitunglah berapa simpangan bakunya
1. Kita cari dulu rata-rata data kelompok tersebut
5
2. Setelah ketemu rata-rata dari data kelompok tersebut kita bikin tabel untuk memasukkannya ke rumus simpangan baku
6
4. Varians (variance)
Varians adalah salah satu ukuran dispersi atau ukuran variasi.  Varians dapat menggambarkan bagaimana berpencarnya suatu data kuantitatif.  Varians diberi simbol  σ2 (baca: sigma kuadrat) untuk populasi dan untuk ssampel.
Selanjutnya kita akan menggunakan simbol s2  untuk varians karena umumnya kita hampir selalu berkutat dengan sampel dan jarang sekali berkecimpung dengan populasi.
Rumus varian atau ragam data tunggal untuk populasi
01
Rumus varian atau ragam data tunggal untuk sampel
02
Rumus varian atau ragam data kelompok untuk populasi
03
Rumus varian atau ragam data kelompok untuk sampel
04
Keterangan:
σ2 = varians atau ragam untuk populasi
S2 = varians atau ragam untuk sampel
fi = Frekuensi
xi = Titik tengah
x¯ = Rata-rata (mean) sampel dan   μ = rata-rata populasi
=  Jumlah data
5. Koefisien variasi (Coefficient of variation)
Koefisien variasi merupakan suatu ukuran variansi yang dapat digunakan untuk membandingkan suatu distribusi data yang mempunyai satuan yang berbeda. Kalau kita membandingkan berbagai variansi atau dua variabel yang mempunyai satuan yang berbeda maka tidak dapat dilakukan dengan menghitung ukuran penyebaran yang sifatnya absolut.
Koefisien variasi adalah suatu perbandingan antara simpangan baku dengan nilai rata-rata dan dinyatakan dengan persentase.
Besarnya koefisien variasi akan berpengaruh terhadap kualitas sebaran data. Jadi jika koefisien variasi semakin kecil maka datanya semakin homogen dan jika koefisien korelasi semakin besar maka datanya semakin heterogen.

Komentar

Postingan populer dari blog ini

Uji Anova(Uji F)

Anova adalah sebuah analisis statistik yang menguji perbedaan rerata antar grup. Grup disini bisa berarti kelompok atau jenis perlakuan. Anova ditemukan dan diperkenalkan oleh seorang ahli statistik bernama Ronald Fisher. Anova merupakan singkatan dari Analysis of variance. Merupakan prosedur uji statistik yang mirip dengan t test. Namun kelebihan dari Anova adalah dapat menguji perbedaan lebih dari dua kelompok. Berbeda dengan  independent sample t test  yang hanya bisa menguji perbedaan rerata dari dua kelompok saja. Dalam kesempatan bahasan kali ini, statistikian  akan menjelaskannya secara singkat namun dengan penuh harapan agar para pembaca mudah memahami dan mempraktekkannya dalam penelitian di lapangan nantinya. Kegunaan Anova Anova digunakan sebagai alat analisis untuk menguji hipotesis penelitian yang mana menilai adakah perbedaan rerata antara kelompok. Hasil akhir dari analisis ANOVA adalah nilai F test atau F hitung. Nilai F Hitung ini yang nantin...

Besar Sampel dan Sumber Data

Dalam statistik inferensial, besar  sampel sangat menentukan representasi sampel yang diambil dalam menggambarkan  populasi penelitian. Oleh karena itu menjadi satu kebutuhan bagi setiap peneliti untuk memahami kaidah-kaidah yang benar dalam menentukan sampel minimal dalam sebuah penelitian. Cara menghitung besar sampel suatu penelitian sangat ditentukan oleh desain penelitian  yang digunakan dan data yang diambil. Jenis penelitian observasional dengan menggunakan disain cross-sectional akan berbeda dengan case-control study dan khohor, demikian pula jika data yang dikumpulkan adalah proporsi akan beda dengan jika data yang digunakan adalah data continue. Pada penelitian di bidang kesehatan masyarakat, kebanyakan menggunakan disain atau pendekatan  cross-sectional  atau belah lintang, meskipun ada beberapa yang menggunakan  case control ataupun khohor . Terdapat banyak rumus untuk menghitung besar sampel ...