1. PENGERTIAN Sampel adalah sebagian dari anggota populasi yang dipilih dengan cara tertentu
yang akan diteliti sifat-sifatnya sifat-sifatnya dalam penelitian.
Nilai-nilai yang berasal dari data
sampel dinamakan dengan Statistik . Sampling
distribution
adal adalah ah
dist distri ribu busi si
prob probab abil iliitas tas
dari dari
suat uatu
statisti statistik.Sampl k.Sampling ing distributi distribution on tergantung tergantung dari ukuran populasi, populasi, ukuran sampel, sampel, metode memililih sampel. Distribusi sampling dari X dari X dengan dengan dengan ukuran sampel n adalah suatu distribusi yang bila percobaan dilakukan secara berulang (selalu dengan jumlah sampel n) akan menghasilkan banyak nilai sampel dengan rata-rata X rata-rata X . Distribusi sampling ini menggambarkan variabilitas (perubahan) rata-rata sampel terhadap rata-rata populasi μ.
Random Sampling atau atau sam samplin pling g
seca secara ra acak acak adal adalah ah suat suatu u pros proses es
pengambilan sampel dimana setiap anggota populasi memiliki kesempatan yang sama untuk terpilih sebagai sampel.
Manfaat Sampling :
untuk membantu memahami distribusi dari suatu karakteristik populasi yang tidak diketahui, ilmuwan dan insinyur sering menggunakan data sampel
teknik sampling berguna dalam penarikan kesimpulan (inference (inference)) yg valid dan dapat dipercaya
teknik pengambilan sampling yang baik dan benar dapat menghemat biaya da n
waktu
tanpa
mengurangi
keakuratan
hasil
Page | 1
Populasi Terhingga dan Tak Hingga :
adalah populasi populasi yang jumlah seluruh seluruh Populasi terhingga ( finite population) adalah anggo anggota tany nyaa teta tetap p dan dan dapat dapat dida didaft ftar ar.. Cont Contoh oh:: pengu pengukur kuran an bera beratt bada badan n mahasiswa ITS jurusan Teknik Kelautan angkatan 2007.
Populasi tak terhingga ( infinite population ) adalah populasi yang memiliki
anggota anggota yang yang banyaknya tak terhingga. Contoh: Contoh: pengama pengamatan tan kejadi kejadian an kecelakaan kecelakaan yang terjadi di bundaran ITS selama kurun waktu yang tidak dibatasi.
Penelitian sensus adalah penelitian yang dilakukan dengan cara mengumpulkan data dari semua anggota populasi. Pene Peneli liti tian an
samp sampli ling ng
adal adalah ah
pene peneli liti tian an
yang yang
dila dilaku kuka kan n
deng dengan an
cara cara
mengumpulkan data dari anggota sample. Beda antara Statistik Sampel Vs Sampel Vs Parameter Parameter Populasi? Populasi? perhatikan tabel berikut: Ukur Ukuran an//Ciri Ciri
Par Paramet ameter er Popu Popullasi asi
Stat Statiistik stik Sam Sampel pel
Rata-Rata
µ : myu
x
Selisih 2 Rata-rata
µ1
− µ 2
:
mutlak Standar Devi Devias asii
= σ : sigma
nilai x1 − x2
:
nilai
mutlak S
Simpangan Baku Varians = Ragam
σ²
s²
Proporsi
π : phi atau p
p atau p
Page | 2
Selisih 2 proporsi
π1
− π 2
mutlak
:
nilai
p1 − p2
:
nilai
mutlak
Sampel yang baik diperoleh dengan memperhatikan hal-hal berikut : 1. keacakannya (randomness) randomness) 2. ukuran 3. teknik penarikan sampel sampel sampling (sampling ) yang sesuai dengan kondisi atau sifat populasi
Beberapa Teknik Penarikan Sampel :
a. Penarikan Sampel Acak Sederhana (Simple (Simple Randomized Sampling ) Pengacakan dapat dilakukan dengan : undian, tabel bilangan acak, program komputer. (Systematic Sampling ) b. Penarikan Sampel Sistematik (Systematic Tetapkan interval lalu pilih secara acak anggota pertama sampel Contoh : Ditetapkan interval = 20 Secara acak terpilih terpilih : Anggota Anggota populasi populasi ke-7 sebagai anggota ke-1 dalam sampel maka : Anggota populasi ke-27 menjadi anggota ke-2 dalam sampel Anggota populasi ke-47 menjadi anggota ke-3 dalam sampel, dst.
Page | 3
c. Penarikan Sampel Acak Berlapis (Stratified Random Sampling ) Populasi terdiri dari beberapa kelas/kelompok. Dari setiap kelas diambil sampel secara acak. Perhatikan !!!! Antar Kelas bersifat (cenderung) berbeda nyata (heterogen). Anggota dalam suatu kelas akan (cenderung) sama (homogen). Contoh : Dari 1500 penumpang KA (setiap kelas memiliki ukuran yang sama) akan diambil 150 orang sebagai sampel, dilakukan pendataan tentang tingkat kepuasan, maka sampel acak dapat diambil dari : Kelas Eksekutif
: 50 orang
Kelas Bisnis
: 50 orang
Kelas Ekonomi
: 50 orang
d. Penarikan Sampel Gerombol/Kelompok (Cluster Sampling ) Populasi juga terdiri dari beberapa kelas/kelompok Sampel yang diambil berupa kelompok bukan individu anggota Perhatikan !!!!
Page | 4
Antar Kelas bersifat (cenderung) sama (homogen). Anggota dalam suatu kelas akan (cenderung) berbeda (heterogen). Contoh : Terdapat 40 kelas untuk tingkat II Jurusan Ekonomi-GD, setiap kelas terdiri dari 100 orang. Populasi mahasiswa kelas 2, Ekonomi-UGD = 40 × 100 = 4000. Jika suatu penelitian dilakukan pada populasi tersebut dan sampel yang diperlukan = 600 orang, dilakukan pendataan mengenai lama waktu belajar per hari maka sampel dapat diambil dari 6 kelas.... Dari 40 kelas, ambil secara acak 6 kelas.
e. Penarikan Sampel Area ( Area Sampling ) Prinsipnya sama dengan Cluster Sampling . Pengelompokan ditentukan oleh letak geografis atau administratif. Contoh : Pengambilan sampel di daerah JAWA BARAT, dapat dilakukan
dengan
memilih secara acak KOTAMADYA tempat pengambilan sampel, misalnya terpilih, Kodya Bogor, Sukabumi dan Bandung. Sampel acak menjadi dasar penarikan sampel lain.
Penarikan Sampel Acak dapat dilakukan dengan 2 cara, yaitu :
a) Penarikan sampel tanpa pemulihan/tanpa pengembalian : setelah didata, anggota sampel tidak dikembalikan ke dalam ruang sampel.
Page | 5
b) Penarikan sampel dengan pemulihan : bila setelah didata, anggota sampel dikembalikan ke dalam ruang sampel.
Berdasarkan Ukurannya, maka sampel dibedakan menjadi :
a) Sampel Besar jika ukuran sampel (n) ≥ 30 b) Sampel Kecil jika ukuran sampel (n) < 30
Distribusi Penarikan Sampel atau Distribusi Sampling :
•
Jumlah Sampel Acak yang dapat ditarik dari suatu populasi adalah sangat banyak.
•
Nilai setiap Statistik Sampel akan bervariasi/beragam antar sampel.
•
Suatu statistik dapat dianggap sebagai peubah acak yang besarnya sangat tergantung dari sampel yang kita ambil.
•
Karena statistik sampel adalah peubah acak maka ia mempunyai distribusi yang kita sebut sebagai : Distribusi peluang statistik sampel atau Distribusi Sampling atau Distribusi Penarikan Sampel.
2. DISTRIBUSI SAMPLING RATA-RATA Beberapa notasi : n
: ukuran sampel
N
: ukuran populasi
x
: rata-rata sampel
µ
: rata-rata populasi
s
: standar deviasi sampel
σ
:standar deviasi populasi
µ x
: rata-rata antar semua sampel
σ x
: standar deviasi sampel
Page | 6
2.1 Distribusi Sampling Rata-Rata Sampel Besar Dalil 1
JIKA Sampel:
berukuran = n ≥ 30
rata-rata = x
diambil DENGAN PEMULIHAN dari
Populasi berukuran = N
Terdistribusi NORMAL
Rata-rata = µ ; simpangan baku = σ
MAKA Distribusi Rata-rata akan mendekati distribusi Normal dengan :
µ x = µ
dan σ x
=
σ n
dan nilai z =
x
σ
−
µ n
Page | 7
Dalil 2
JIKA
Sampel: berukuran = n rata-rata = x
≥
30
diambil TANPA PEMULIHAN dari
Populasi berukuran = N
Terdistribusi NORMAL
Rata-rata = µ ; simpangan baku = σ
MAKA
Distribusi Rata-rata akan mendekati distribusi Normal dengan : x
µ x = µ
dan σ x
=
σ n
N
−
n
N − 1
dan nilai
z =
(σ /
− µ
n)
N
−
n
N − 1
Page | 8
N
•
•
−
n
N − 1
disebut sebagai FAKTOR KOREKSI populasi terhingga.
Faktor Koreksi (FK) akan menjadi penting jika sampel berukuran n diambil dari populasi berukuran N yang terhingga/ terbatas besarnya
•
Jika sampel berukuran n diambil dari populasi berukuran N yang sangat besar
maka FK akan mendekati 1 →
−n ≈ 1 , hal ini mengantar kita pada dalil N − 1
N
ke-3 yaitu
DALIL LIMIT PUSAT = DALIL BATAS TENGAH = THE CENTRAL LIMIT THEOREM Dalil 3 DALIL LIMIT PUSAT
JIKA Sampel:
berukuran = n
rata-rata = x
diambil dari
Populasi
berukuran
=
N
yang
BESAR
distribusi : SEMBARANG
Rata-rata = µ ; simpangan baku = σ
Page | 9
MAKA Distribusi Rata-rata akan mendekati distribusi Normal dengan :
µ x = µ
•
dan σ x
=
σ n
Dalil Limit Pusat berlaku untuk :
dan nilai z =
x
− µ
σ
n
- penarikan sampel dari populasi yang
sangat besar, - distribusi populasi tidak dipersoalkan
•
Beberapa buku mencatat hal berikut : Populasi dianggap BESAR jika ukuran sampel n
KURANG DARI 5 % ukuran populasi atau
N
<
5%
Dalam pengerjaan soal DISTRIBUSI SAMPLING RATA-RATA perhatikan asumsiasumsi dalam soal sehingga anda dapat dengan mudah dan tepat menggunakan dalildalil tersebut!
Contoh : PT AKUA sebuah perusahaan air mineral rata-rata setiap hari memproduksi 100 juta gelas air mineral. Perusahaan ini menyatakan bahwa rata-rata isi segelas AKUA
Page | 10
adalah 250 ml dengan standar deviasi = 15 ml.
Rata-rata populasi dianggap
menyebar normal. 1.
Jika setiap hari diambil 100 gelas AKUA sebagai sampel acak DENGAN PEMULIHAN, hitunglah : a. standard error atau galat baku sampel tersebut? b. peluang rata-rata sampel akan berisi kurang dari 253 ml?
2.
Jika sampel diperkecil menjadi 25 gelas, hitunglah : a. standard error atau galat baku sampel tersebut? b. peluang rata-rata sampel akan berisi lebih dari 255 ml?
1. Diselesaikan dengan DALIL 1 → karena PEMULIHAN Diselesaikan dengan DALIL 3 → karena POPULASI SANGAT BESAR µ = µ = 250
N = 100 000 000
σ = 15
x
n = 100
P( x < 253) = P(z < ?)
GALAT BAKU = σ x
z =
=
σ n
253 − 250 15 .
15
=
100
=
3 15 .
=
15 10
=
15 .
= 2.0
Jadi P( x < 253) = P(z < 2.0) = 0.5 + 0.4772 = 0.9772
Page | 11
2. Diselesaikan dengan DALIL 3 → karena POPULASI SANGAT BESAR µ = µ = 250
N = 100 000 000
σ = 15
x
n = 25
P( x > 255) = P(z > ?)
GALAT BAKU = σ x
z =
=
σ n
=
255 − 250 3.0
15 25
=
=
5 3.0
15 5
=
=
3.0
1.67
Jadi P( x > 255 ) = P(z > 1.67) = 0.5 - 0.4525 = 0.0475
Contoh : Dari 500 mahasiswa FE-GD diketahui rata-rata tinggi badan = 165 cm dengan standar deviasi = 12 cm, diambil 36 orang sebagai sampel acak. Jika penarikan sampel dilakukan TANPA PEMULIHAN dan rata-rata tinggi mahasiswa diasumsikan menyebar normal, hitunglah : a. galat baku sampel? b. peluang sampel akan memiliki rata-rata tinggi badan kurang dari 160 cm?
Diselesaikan dengan DALIL 2 → TANPA PEMULIHAN
Page | 12
µ = µ = 165
N = 500 n
Catatan
σ = 12
x
N
=
36
n = 36
= 0.072 = 7.2% > 5%
500
→
Dalil Limit Pusat tidak dapat
digunakan
P( x < 160) = P(z < ?)
FK =
−n = N − 1
N
500 − 36 500 − 1
GALAT BAKU σ x
z =
=
σ n
=
464
=
499
x FK =
160 − 165 1928 . ...
0.929... = 0.964...
12 36
×
0964 . ... = 2 x 0.964... = 1.928...
2.59...
= −
P( x < 160) = P(z < -2.59) = 0.5 - 0.4952 = 0.0048
2.2 Distribusi Sampling Rata-rata Sampel Kecil 2.2.1 DISTRIBUSI t
•
Distribusi Sampling didekati dengan distribusi t Student = distribusi t
(W.S. Gosset).
•
Distribusi-t pada prinsipnya adalah pendekatan distribusi sampel kecil
dengan distribusi normal. Dua hal yang perlu diperhatikan dalam Tabel t adalah
derajat bebas (db)
Page | 13
nilai α
Derajat bebas (db) = degree of freedom = v = n - 1. n : ukuran sampel.
• Nilai α adalah luas daerah kurva di kanan nilai t kiri
atau luas daerah kurva di
nilai –t
• Nilai α → 0.1 (10%) ; 0.05 (5%) ; 0.025(2.5%) ; 0.01 (1%) ; 0.005(0.5%) • Nilai α terbatas karena banyak kombinasi db yang harus disusun! •
Kelak Distribusi t akan kita gunakan dalam PENGUJIAN HIPOTESIS
•
Pembacaan Tabel Distribusi-t
Misalkan
n = 9 → db = 8;
Nilai
α
ditentukan = 2.5% di kiri dan kanan
kurva t tabel (db, α) = t tabel(8; 0.025) = 2.306 Jadi t = 2.306 dan -t = -2.306
2.5%
-2.306
95 %
0
2.5%
2.306
Page | 14
Arti Gambar di atas nilai t sampel berukuran n = 9, berpeluang 95% jatuh dalam selang -2.306 < t < 2.306. Peluang t >2.306 = 2.5 % dan Peluang t < -2.306 = 2.5 %
Perbedaan Tabel z dan Tabel t Tabel z → nilai z menentukan nilai α Tabel t → nilai α dan db menentukan nilai t
Dalam banyak kasus nilai simpangan baku populasi (σ) tidak diketahui, karenanya nilai σ diduga dari nilai simpangan baku sampel (s)
Dalil 4
JIKA Sampel:
ukuran KECIL n < 30
diambil dari
rata-rata = x simp. baku = s
Populasi berukuran = N
terdistribusi : NORMAL
Rata-rata = µ
MAKA
Page | 15
Distribusi Rata-rata akan mendekati distribusi-t dengan : s
µ x = µ
dan σ x
=
n
x
dan nilai t =
s
− µ
n
pada derajat bebas = n-1 dan suatu nilai α Contoh : Manajemen PT JURAM menyatakan bahwa 95% rokok produksinya rata-rata mengandung nikotin 1.80 mg, data tersebar normal. Yayasan Konsumen melakukan pengujian nikotin terhadap 9 batang rokok dan diketahui rata-rata sampel = 1.95 mg nikotin dengan standar deviasi = 0.24 mg. Apakah hasil penelitian Yayasan Konsumen mendukung pernyataan Manajemen PT JURAM? 95 % berada dalam selang → berarti 5 % berada di luar selang;
Jawab :
2.5 % di kiri t dan 2.5% di kanan t
α = 2.5 % = 0.025 n = 9 → db = n - 1 = 8 t tabel (db, α) = t-tabel(8; 0.025) = 2.306 Jadi 95 % berada dalam selang -2.306 < t < 2.306
µ = 1.80
Nilai t-hitung = ? t =
x
− µ
s
n
= t =
1.95 − 180 . 0.24
9
=
0.15 0.08
n=9
x = 1.95
s = 0.24
. = 1875
Page | 16
Nilai t hitung = 1.875 berada dalam selang -2.306 < t < 2.306 jadi hasil penelitian Yayasan Konsumen masih sesuai dengan pernyataan manajemen PT JURAM.
2.3 Distribusi Sampling Beda 2 Rata-Rata Dalil 5 JIKA
Dua (2) Sampel berukuran n1 dan
n2
rata-rata = x1 dan x2
diambil dari
Dua (2) Populasi berukuran BESAR
Rata-rata µ 1 dan µ 2
Ragam
σ 1
2
dan
σ 2
2
MAKA Distribusi Rata-rata akan mendekati distribusi Normal dengan : 2
µ x
1 − x2
=
µ1 − µ 2
dan standard error = σ x
1
− x2
=
σ1
n1
+
σ 2
2
n2
dan
Page | 17
z =
nilai z
x1 − x2
−
µ1 − µ 2
2
σ1
n1
+
σ 2
2
n2
→ ambil nilai mutlaknya!
•
Beda atau selisih 2 rata-rata = µ1
•
Melibatkan 2 populasi yang BERBEDA dan SALING BEBAS
•
Sampel-sampel yang diambil dalam banyak kasus (atau jika dilihat secara
−
µ 2
akumulatif) adalah sampel BESAR
Contoh : Diketahui rata-rata IQ mahasiswa Eropa = 125 dengan ragam = 119 sedangkan ratarata IQ mahasiswa Asia = 128 dengan ragam 181. diasumsikan kedua populasi berukuran besar Jika diambil 100 mahasiswa Eropa dan 100 mahasiswa Asia sebagai sampel, berapa peluang terdapat perbedaan IQ kedua kelompok akan ku rang dari 2?
Jawab :
Populasi Parameter
populasi ke-1 (Mhs. Eropa)
populasi ke-2 (Mhs. Asia)
Rata-rata (µ)
125
128
Ragam (σ²)
119
181
Page | 18
Beda 2 Rata-rata = µ x
1
Sampel : n1 = 100
−x
2
n2 =
µ1 − µ 2 = 125− 128
=
= −3 =
3
100
P( x 1 − x2 <2 ) = P ( z < ?)
z =
x1
−
x2
−
µ1 − µ 2
2
σ1
n1
+
σ 2
2
n2
2−3 =
119 100
181 +
−1 =
3
= −0.577...≈ −0.58
100
P(z<-0.58) = 0.5 - 0.2190 = 0.2810
3. DISTRIBUSI SAMPLING RATA-RATA 3.1 Rata-rata distribusi sampling 1 rata-rata Bila suatu sampel acak dari suatu n pengamatan diambil dari suatu populasi normal dengan rata-rata μ dan varians σ2. Maka, setiap pengamatan Xi, i =1,2,3, ..., n dari sampel acak tersebut akan mempunyai distribusi normal yang sama seperti popolasi yang bersangkutan. Sehingga dapat disimpulkan bahwa:
memiliki distribusi normal
Page | 19
dengan rata-rata :
dan varians :
Bila sampel yang diambil dari suatu populasi yang tidak diketahui distribuisnya, distribusi sampling dari X akan tetap mendekati nomal dengan rata-rata μ dan varians σ2 asalkan sampel yang diambil dalam jumlah yang besar. Hasil ini merupakan konsekeuesi dari suatu teorema batas tengah (central limit theorem) berikut: Teorema: Central Limit Theorem . Bila X adalah rata-rata suatu sampel acak yang diambil dari suatu populasi dengan ukuran n, rata-rata μ dan varians σ2, maka bentuk batas distribusi :
bila n
∞, distribusinya adalah distribusi normal standar n(z;0,1)
3.1 Distribusi sampling dari dua rata-rata Teorema : Bila dua sampel yang saling bebas, n1 dan n2, diambil dari dua
populasi, diskrit atau menerus, dengan rata-rata μ1 dan μ2 dan varians σ12 dan σ22 , maka distribusi sampling dari perbedaan rata-rata,
mendekati distribusi
Page | 20
normal dengan rata-rata dan varians sebagai berikut:
Sehingga:
mendekati variabel normal standar.
4. DISTRIBUSI SAMPLING PROPORSI ( Nilai statistik (sampel) dari proporsi adalah
)
, sedangkan nilai parameter (populasi)
adalah P. Rumus untuk menghitung proporsi adalah : = x/n di mana : x : jumlah / anggota sampel n : jumlah sampel Proporsi sampel
merupakan variabel acak dan distribusi probabilitas sehingga
disebut distribusi sampling p. Untuk menentukan hubungan proporsi sampel p dengan proporsi populasi P, kita perlu memahami sifat-sifat distribusi sampling standar
, dan bentuk distribusi sampling
: nilai yang diharapkan
, deviasi
.
4.1 Nilai yang diharapkan
Page | 21
Nilai yang diharapkan p, seluruh nilai kemungkinan p, sama dengan proporsi populasi P. E(
)=P
di mana : E(
) : nilai yang diharapkan
P : proporsi populasi karena E (
) = P,
b. Standar deviasi
adalah bias pengukur P.
(kesalahan baku)
Seperti kita ketahui di standar deviasi
x , pada standar deviasi
juga
terdiri dari populasi terbatas dan tidak terbatas.
•
Kesalahan baku populasi terbatas σp=
•
N–n
P ( 1- P )
N – 1
n
Kesalahan baku populasi tidak terbatas σ p=
P ( 1-P ) n
Dapat kita lihat bahwa perbedaan kesalahan baku proporsi terbatas dan tidak terbatas hanya pada faktor koreksi
(N –n ) / (N- 1)
Page | 22
Seperti
rata-rata sampel
x
, perbedaan antara kesalahan baku populasi
terbatas dan populasi tak terbatas menjadi diabaikan jika ukuran populasi terbatas lebih besar dibandingkan dengan ukuran sampel. Jika populasi terbatas dengan n/N <= 0.05 , kita tidak perlu menggunakan faktor koreksi . Sedangkan jika populasi terbatas dengan n/N > 0.05 maka kita menggunakan faktor koreksi. Kita menggunakan kesalahan baku proporsi mengacu pada standar deviasi
.
Setelah itu, kita dapat menentukan nilai Z : Z=
-P σp
c. Bentuk distribusi sampling Seperti kita ketahui, setelah mengetahui standar deviasi distribusi sampling , langkah selanjutnya adalah menentukan bentuk distribusi sampling. Proporsi sampel
= x/n. Sampel acak sederhana dari populasi besar, nilai x adalah variabel
acak binomial . Karena n merupakan konstan, probabilitas dari x/n sama dengan probabilitas binomial x, di mana distribusi sampling
berbeda dengan distribusi
probabilitas dan probabilitas untuk tiap nilai x/n sama dengan probabilitas x. Distribusi sampling
diperkirakan oleh distribusi normal di mana ukuran
sampelnya besar dan terdapat dua kondisi : np >= 5 dan n(1-P) >=5
5.Properties Of Point Estimators (Sifat Penduga Titik) Di bab ini, kita menunjukkan bagaimana statistik sampel seperti mean ,standar deviasi sampel s, dan proposi sampel penduga
yang
berhubungan
dengan
populasi
dapat digunakan sebagai titik parameter
.
Sebelum
Page | 23
menggunakan titik penduga , statistik harus memeriksa apakah statistik sampel menunjukan sifat yang berkaitan dengan titik penduga yang baik. Karena beberapa sampel statistik yang berbeda dapat digunakan sebagai poin estimasi untuk beberapa parameter populasi, kita menggunakan notasi umum berikut dalam bagian ini: parameter ketertarikan populasi sampel statistik atau poin estimasi akan Notasi
adalah surat yunani theta, dan notasi
disebut “theta-hat”. Umumnya,
mewakili setiap populasi parameter seperti populasi mean, populasi standar deviasi , populasi proporsi, dan lainnya.
5.1 Unbiased Unbiased Estimators : jika nilai yang diharapkan dari statistik sampel adalah sama dengan parameter populasi yang diperkirakan. Statistik sampel adalah objektif parameter dari populasi parameter
jika
E ( ) = Dimana E ( ) = nilai yang diharapkan dari statistik sampel
Gambar 7.1 menunjukkan unbiased dan biased titik penduga. Di dalam ilustrasi tersebut menunjukkan objektif penduga,
mean dari distribusi sampling
adalah sama dengan nilai parameter populasi. kesalahan estimasi mengimbangi dalam
Page | 24
hal ini, karena kadang-kadang nilai estimator titik
mungkin kurang dari
dan
lainnya kali itu mungkin lebih besar daripada . dalam hal ini dari penduga bias, mean dari distribusi sampling kurang dari atau lebih daripada nilai parameter populasi. Ilustrasi di Panel B 7.10 , E ( ) lebih besar daripada
.statistik sampel
memiliki probabilitas hugh dari melebih-lebihkan nilai dari parameter populasi. jumlah bias ditunjukkan dalam gambar
Dalam membahas distribusi sampling dari mean sampel dan proporsi sampel, kami menyatakan bahwa E ( ) =
dan E ( )=p. Dengan demikian, keduanya
estimators objektif tentang parameter populasi yang berhubungan. Dalam hal ini standar deviasi sampel s dan varians sampel ditunjukkan bahwa E ( )= sampel
, dapat
. Dengan demikian, kita concluede bahwa varians
, adalah penduga yang tidak bias dari varians populasi
. Pada
kenyataannya, ketika kita pertama kali presenteed rumus untuk varians sampel dan standar deviasi sampel,n-1 daripada n digunakan sebagai penyebut. alasan untuk
Page | 25
menggunakan n-1 daripada n adalah untuk membuat sampel varians estimator bias dari varians populasi.
5.2 Efficiency (Efesiensi) Berasumsi bahwa sampel randome sederhana n elemen dapat digunakan untuk menyediakan dua estimator titik objektif tentang parameter populasi yang sama. Dalam situasi ini, kita akan lebih suka menggunakan estimator titik dengan standard error yang lebih kecil, karena cenderung memberikan perkiraan lebih dekat dengan parameter populasi. Estimator titik dengan kesalahan kecil standrad dikatakan memiliki efisiensi relatif lebih besar daripada yang lain. Gambar 7.11 menunjukkan distribusi sampling dari dua penduga titik bias, dan
2
. Perhatikan bahwa kesalahan baku,
demikian, nilai dari paramater titik
1
kurang dari kesalahan baku
1
daripada
daripada melakukan nilai-nilai
2
. dengan
memiliki kesempatan lebih besar untuk menjadi dekat dengan . Karena kesalahan baku dari estimator
2
kurang dari kesalahan baku estimator titik
1
2
1
,
2
1
relatif lebih efisien
dan merupakan estimator titik pilihan.
5.3 Consistensy (Konsistensi) Sebuah properti ketiga yang terkait dengan estimator titik yang baik adalah konsistensi.Estimator titik konsisten jika estimator titik cenderung menjadi lebih dekat dengan parameter populasi sebagai ukuran sampel menjadi lebih besar. Dengan kata lain, ukuran sampel yang besar cenderung memberikan estimasi titik yang lebih baik daripada ukuran sampel yang kecil. Perhatikan bahwa untuk rata-rata sampel , kami menunjukkan bahwa kesalahan standar
yang diberikan oleh
=
Page | 26
.
Karena
berkaitan dengan ukuran sampel sehingga ukuran sampel besar
menyediakan lebih kecil.
Nilai
, kami menyimpulkan bahwa ukuran sampel yang lebih besar
cenderung untuk memberikan estimasi titik lebih dekat dengan populasi berarti Dalam hal ini, kita dapat mengatakan bahwa rata-rata sampel konsisten dari mean populasi
.
adalah estimator
. Menggunakan alasan serupa, kita juga dapat
menyimpulkan bahwa propotion sampel
adalah estimator konsisten dari proporsi
populasi p.
6. Metode Sampling 6.1 Stratified Random Sampling
Page | 27
Di dalam Stratified Random Sampling, elemen dalam populasi yang pertama dipisahkan menjadi kelompok yang disebut strata sehingga setiap elemen di populasi milik satu dan hanya satu stratum. Dasar membentuk strata seperti departemen, lokasi, umur, tipe industry, dll adalah kebijaksanaan pembuat sample. Hasil yang terbaik diperoleh ketika elemen-elemen dalam setiap stratum hampir sama. Berikut adalah diagram populasi yang memisahkan ke dalam H strata.
Populasi Populasi
Strata 11 Strata
Strata 22 Strata
Strata H H Strata
Setelah strata terbentuk, simple random sampel diambil dari setiap stratum. Rumusnya adalah dengan mengkombinasi hasil individu stratum sampel ke satu elemen yang diestimasi dari kepentingan populasi parameter. Nilai dari stratified random sampling bergantung pada bagaimana homogennya elemen dalam starata. Jika elemen dalam starata menyerupai, starata akan memiliki selisih yang rendah/ sedikit. Jika staratanya homogen, stratified random sampling akan memberikan hasil yang tepat seperti simple random sampling dengan menggunakan total ukuran sample yang kecil. Jika kondisi populasi mengandung sejumlah katagori yang berbeda, maka kerangka sampel dapat diorganisasikan dengan menggunakan katagori ini ke dalam strata yang terpisah. Sampel kemudian dipilih masing-masing stratum secara terpisah untuk membuat stratum berstrata.
Ukuran sampel biasanya proporsional dengan
ukuran relatif strata. Sekalipun demikian semua varian berbeda secara signifikan diantara strata. Semua ukuran sampel harus dibuat seara proporsional terhadap
Page | 28
standar deviasi stratum. Stratifikasi yang tidak proporsional dapat saja menghasilkan presisi yang lebih baik daripada stratifikasi yang bersifat proporsional. 6.2 Cluster Sampling Di dalam cluster sampling, elemen dalam populasi adalah yang pertama dipisahkan kedalam grup yang disebut cluster. Setiap elemen dalam sample cluster membentuk sebuah sampel. Cluster sampling cenderung memberikan hasil yang baik ketika elemen dalam cluster tidak menyerupai. Nilai dari cluster sampling bergantung pada bagaimana perwakilan setiap cluster dalam seluruh populasi. Jika semua cluster sesuai, sampling cluster yang kecil akan memberikan estimasi yang baik bagi populasi parameter. Umumnya cluster sampling membutuhkan ukuran sampel yang besar daripada simple random sampling/stratified random sampling tetapi hal tersebut dapat menghasilkan penghematan biaya karena pada faktanya ketika interviewer dikirimkan ke sample cluster, banyak observasi sample yang dapat diperoleh dalam waktu singkat. Tujuan pokok menggunakan metode ini ialah untuk mengurangi biaya dengan cara meningkatkan efisiensi penarikan sampel
Populasi
Cluster 1
Cluster 2
Cluster K
6.3 Systematic Sampling Dalam beberapa situasi sampling terutama dengan populasi besar akan memakan waktu untuk memilih sebuah simple random sampel dengan mencari
Page | 29
nomor secara acak dan menghitungnya atau mencari sepanjang daftar populasi sampai elemen yang sesuai ditemukan. Alternatif untuk simple random sampling adalah systematic sampling. Contoh jika sampel ukuran 50 yang diinginkan dari populasi yang terdiri dari 5000 elemen, kita akan membuat sampel 1 elemen untuk setiap 5000/50=100 elemen dalam populasi. Systematic sample untuk masalah ini melibatkan pemilihan acak salah satu dari 100 elemen pertama dari daftar populasi. Elemen sampel yang lain akan di identifikasikan dengan memulai elemen sampel pertama dan memilih setiap 100 elemen yang ada di daftar populasi. Sebenarnya, sampel dari 50 di identifikasi dengan memindahkan secara sistematik ke populasi dan mengindentifikasi setiap 100 elemen setelah pertama kali pemilihan acak elemen. Sampel dari 50 akan lebih mudah untuk di identifikasi dengan cara ini daripada jika simple random sampling digunakan. Karena elemen pertama dipilih secara acak, sample systematic seringkali diasumsikan memiliki sifat dari simple random sampling. Asumsi ini terutama berlaku ketika daftar elemen di populasi adalah urutan acak elemen. 6.4 Convenience Sampling Metode Sampling dibahas sejauh ini disebut dengan teknik probability sampling . Elemen yang dipilih dari populasi yang diketahui sebagai probabilitas dalam sample. Keuntungan dari sample probabilitas adalah distribusi sampelnya sesuai dengan stastik sampel yang dapat di identifikasi. Formulanya dengan salah satu sampel random sampling yang disajikan dapat digunakan untuk menentukan sifat dari distribusi sample sehingga dapat digunakan untuk membuat probabilitas tentang kesalahan yang terkait dengan penggunaan hasil sampel untuk membuat kesimpulan populasi. Convenience sampling adalah teknik nonprobability sampling . Penarikan sample menggunakan teknik inidilakukan dengan cara memilih unit-unit analisis yang dianggap sesuai oleh penenliti. Pemilihan sampel didasarkan pada kemudahan akses,
Page | 30
misalnya teman, teman sekerja, para pengunjung mall pada saat belanja, dan sebagainya. Oleh karena itu, convenience sample memiliki kelebihan yaitu pemilihan sample yang mudah. Kelemahannya ialah mengandung sejumlah kesalahan sistematik dan variabel-variabel yang tidak diketahui.
6.5 Judgement Sampling Teknik nonprobability sampling yang lain adalah judgement sampling. Secara keseluruhan, metode ini merupakan cara mudah dalam pemilihan sampel. Contoh seorang reporter ingin mengambil sampel dari 2/3
anggota dewan untuk
mendapatkan opini umum yang mewakili semua anggota dewan. Tetapi kualitas hasil sampel tersebut tergantung pada penilaian orang-orang yang dipilih menjadi sampel sehingga diperlukan kehati-hatian dalam menarik kesimpulan yang didasarkan pada penilaian sampel untuk digunakan dalam membuat kesimpulan populasi. Teknik judgement/ penelitian atau dikenal juga sebagai teknik penarikan sampel purposif ini dilakukan dengan cara memilih sampel dari suatu populasi didasarkan pada informasi yang tersedia serta sesuai dengan penelitian yang sedang berjalan, sehingga perwakilannya terhadap populasi dapat dipertanggungjawabkan. Teknik ini digunakan terutama apabila hanya ada sedikit orang yang mempunyai keahlian (expertise) di bidang yang sedang diteliti. Keuntungannya ialah unit-unit yang terakhir dipilih dapat dipilih sehingga mereka
mempunyai
banyak
kemiripan.
Kerugiannya
ialah
memunculkan
keanekaragaman dan estimasi terhadap populasi dan sampel yang dipilihnya.
Page | 31
Istilah-Istilah
Parameter karakteristik numerik dari populasi, seperti rata-rata populasi µ, standar
deviasi populasi σ, proporsi populasi p. Sampel acak sederhana Populasi terbatas: sampel yang dipilih dimana tiap ukuran
sampel n memiliki kemungkinan yang sama untuk terpilih. Populasi tidak terbatas: sampel yang dipilih dimana tiap bagian berasal dari populasi yang sama dan element tersebut dipilih secara bebas. Sampling dengan penggantian element yang sudah terpilih dari suatu sampel, tidak
bisa dipilih kembali saat pengambilan berikutnya. Sampling dengan penggantian element yang sudah terpilih dari suatu sampel, bisa
dipilih kembali pada pengambilan berikutnya. Sampel statistik sebuah karakteristik sampel, seperti sampel rata-rata, sampel standar
deviasi, sampel proporsi. Nilai dari sampel statistic digunakan untuk mengestimasi nilai parameter populasi. Titik estimator sampel statistic seperti x bar, standar deviasi, atau p topi,
menyediakan titik estimasi dari parameter populasi. Titik estimasi nilai dari titik estimator yang digunakan sebagai contoh tertentu dalam
perkiraan parameter populasi. Distribusi sampling distribusi kemungkinan yang terdiri dari seluruh nilai sampel
statistic.
Page | 32