KONSEP DASAR STATISTIK
(Coretan menurut pemahaman pribadi dari beberapa sumber)
Oleh
Joni Saputra, SKM
Definisi Statistika
![]() |
| Sumber gambar : Seratus Institute |
Statistika Deskriptif
Statistika
deskriptif adalah tehnik yang digunakan untuk mensarikan data dan menampilkannya
dalam bentuk yang dapat dimengerti oleh setiap orang. Hal ini melibatkan proses
kuantifikasi dari penemuan suatu fenomena. Berbagai statistik sederhana,
seperti rata-rata, dihitung dan ditampilkan dalam bentuk tabel dan grafik.
Statistika deskriptif dapat memberikan pengetahuan yang signifikan pada
kejadian fenomena yang belum dikenal dan mendeteksi keterkaitan yang ada di
dalamnya. Tetapi dapatkah statistika deskriptif memberikan hasil yang bisa
diterima secara ilmiah? Statistik merupakan suatu alat pengukuran yang
berhubungan dengan keragaman pada karakteristik objek-objek yang berbeda .
Objek
yang belum dikenal tidaklah mewakili populasi objek yang memiliki “quantifiabel
feature” melalui penyelidikan. Namun demikian, keragaman bisa menjadi hasil dari
keberagaman yang lainnya (karena acak atau terkontrol). Pada ilmu fisika, yang
sangat berkaitan dengan ekstraksi dan formulasi persamaan matematik tidak
menyisakan banyak tempat untuk fluktuasi acak. Pada ilmu statistika, fluktuasi
seperti itu dapat dijadikan model. Hubungan relasi statistik selanjutnya
merupakan hubungan relasi yang menerangkan suatu proporsi perubahan stokastik
yang pasti.
Statistika Induktif atau
statistik inferensial
Berbeda
dengan fisika, hubungan atau relasi empiris yang diobservasi pada ilmu alam,
sosiologi dan psikologi (dan bidang pilhan lain misalnya ekonomi) bersifat
statis. Pada bidang-bidang ini, pekerjaan empiris dilaksananakan berdasarkan
percobaan-percobaan atau survey sampel. Pada kasus lainnya, seluruh populasi
tidak dapat diobservasi-karena berbagai alasan ekonomis ataupun praktis.
Mengambil kesimpulan tentang suatu populasi berdasarkan data dari sampel yang
terbatas merupakan tujuan dari suatu proses pengambilan keputusan inferensial
atau statistik induktif.Perubahan di sini merupakan suatu refleksi variasi pada
sampel dan proses pengambilan sampel
1.
Jenis Data
Menurut Cara Memperolehnya
a.
Data Primer Data primer adalah secara langsung diambil dari objek /
obyek penelitian oleh peneliti perorangan maupun organisasi. Contoh :
Mewawancarai langsung penonton bioskop 21 untuk meneliti preferensi konsumen
bioskop.
b. Data Sekunder Data sekunder
adalah data yang didapat tidak secara langsung dari objek penelitian. Peneliti
mendapatkan data yang sudah jadi yang dikumpulkan oleh pihak lain dengan
berbagai cara atau metode baik secara komersial maupun non komersial. Contohnya
adalah pada peneliti yang menggunakan data statistik hasil riset dari surat
kabar atau majalah.
2. Macam-Macam Data Berdasarkan Sumber Data
a. Data Internal Data internal
adalah data yang menggambarkan situasi dan kondisi pada suatu organisasi secara
internal. Misal : data keuangan, data pegawai, data produksi, dsb.
b. Data Eksternal Data
eksternal adalah data yang menggambarkan situasi serta kondisi yang ada di luar
organisasi. Contohnya adalah data jumlah penggunaan suatu produk pada konsumen,
tingkat preferensi pelanggan, persebaran penduduk, dan lain sebagainya.
3.
Klasifikasi
Dara Berdasarkan Jenis Datanya
a. Data Kuantitatif Data
kuantitatif adalah data yang dipaparkan dalam bentuk angka-angka. Misalnya
adalah jumlah pembeli saat hari raya idul adha, tinggi badan siswa kelas 3 ips
2, dan lain-lain.
b. Data Kualitatif Data
kualitatif adalah data yang disajikan dalam bentuk kata-kata yang mengandung makna.
Contohnya seperti persepsi konsumen terhadap botol air minum dalam kemasan,
anggapan para ahli terhadap psikopat dan lain-lain.
4.
Pembagian Jenis
Data Berdasarkan Sifat Data
a. Data Diskrit Data diskrit
adalah data yang nilainya adalah bilangan asli. Contohnya adalah berat badan
ibu-ibu pkk sumber ayu, nilai rupiah dari waktu ke waktu, dan
lain-sebagainya.
b. Data Kontinyu Data kontinyu
adalah data yang nilainya ada pada suatu interval tertentu atau berada pada
nilai yang satu ke nilai yang lainnya. Contohnya penggunaan kata sekitar,
kurang lebih, kira-kira, dan sebagainya. Dinas pertanian daerah mengimpor bahan
baku pabrik pupuk kurang lebih 850 ton.
5. Jenis-jenis Data Menurut Waktu Pengumpulannya
a. Data Cross Section Data
cross-section adalah data yang menunjukkan titik waktu tertentu. Contohnya
laporan keuangan per 31 desember 2006, data pelanggan PT. angin ribut bulan mei
2004, dan lain sebagainya.
b. Data Time Series / Berkala
Data berkala adalah data yang datanya menggambarkan sesuatu dari waktu ke waktu
atau periode secara historis. Contoh data time series adalah data perkembangan
nilai tukar dollar amerika terhadap euro eropa dari tahun 2004 sampai 2006,
jumlah pengikut jamaah nurdin m. Top dan doktor azahari dari bulan ke bulan,
dll.
6.
Macam Tipe Data
Statistik
Pengetahuan
mengenai tipe2 data adalah penting di dalam statistika. Terdapat 4 tipe data,
diurutkan mulai dari tingkatan terendah hingga tertinggi:
a.
Nominal
Digunakan
untuk mengklasifikasikan informasi/data. Contoh:Data jenis kelamin = Laki-laki
dan Perempuan. Biasanya, saat analisis data, tipe data spt ini dilambangkan dg
bilangan numerik (angka).Laki-laki dilambangkan dengan angka 1, sedangkan
perempuan dilambangkan dengan angka 0. Tidak berarti angka 0 lebih rendah dari
angka 1, ingat!! cuma melambangkan saja.
b. Ordinal
Digunakan untuk
mengklasifikasikan serta memiliki tingkatan. Tipe data ordinal lebih tinggi
dari Nominal karena kemampuannya untuk membentuk tingkatan. Contoh:Jabatan di
dalam perusahaan = karyawan, manager, direktur utama. Misal, karyawan
dilambangkan dengan 1, manager dg 2, dan direktur utama dengan 3. Pada tipe
data ini, angka 1 dianggap lebih rendah dari angka 2, dst. Bisa saja karyawan
dilambangkan dengan angka 1, tetapi manager angka 3 dan direktur utama dengan
angka 10. Tipe data ini tidak mensaratkan jarak yang sama antar angka yang
digunakan sebagai lambang. Yang perlu diperhatikan hanyalah bahwa angka 3 lebih
tinggi dari angka 1, angka 10 lebih tinggi dari angka 3.
c. Interval
Ciri khas dari
tipe data ini, selain memiliki kemampuan mengklasifikasikan dan membentuk
tingkatan, adalah tidak adanya nilai nol mutlak. Artinya, angka nol yg
digunakan bukan berarti tidak ada. Contoh: Derajat suhu. Di dalam skala Celcius
misalnya, Nol derajat Celcius bukan berarti tidak ada suhu. Nol derajat itu
memiliki suhu, hanya saja dilambangkan dengan nol. Selain itu, jarak antar
setiap angka yg digunakan adalah sama. Misal: di dalam kuesioner, ada tingkatan
dari TIDAK SETUJU (lambang: 1) s.d. SANGAT SETUJU (lambang: 5). Jarak antara SANGAT
SETUJU (5) dg SETUJU (4) adalah 1, yaitu 5-4=1. Jarak antara SETUJU (4) dg
RAGU-RAGU (3) juga = 1, yaitu 4-3=1. dst.
d. Rasio
Memiliki
kemampuan dari ketiga tipe data sebelumnya, dan angka nol dianggap mutlak.
Contoh: data berat badan (kg). Angka Nol kg berarti memang tidak ada berat.
Tipe data nominal dan ordinal sering digunakan pada metode statistika
nonparametrik. Sedangkan tipe data interval dan rasio cocok untuk digunakan
pada metode statistika parametrik, asal asumsi yang dibutuhkan oleh metode statistika
parametrik yang bersangkutan dapat dipenuhi.
Tendensi Sentral
Salah
satu tugas statistik adalah menentukan suatu angka di sekitar mana nilai-nilai
dalam distribusi memusat. Dengan kata lain salah satu tugas statistik adalah
menentukan angka yang menjadi pusat suatu distribusi. Angka/ nilai yang menjadi
pusat suatu distribusi selanjutnya disebut tendensi sentral atau kecenderungan
tengah. Ada 3 jenis pengukuran tendensi sentral yang sangat penting yaitu;
Mean, Median dan Mode/ modus. Ketiga jenis pengukuran tendensi sentral tersebut
memiliki pengertian, asumsi dan tujuan serta metode penghitungan yang berbeda.
1. Mean
Pengukuran mean atau
rata-rata sangat sering digunakan dalam analisis statistik. Mean diterapkan
dengan tujuan untuk menentukan angka/ nilai rata-rata dan secara aritmatik
ditentukan dengan cara menjumlah seluruh nilai dibagi banyaknya individu.
Pengukuran rata-rata dapat diterapkan dengan asumsi bahwa data yang diperoleh
dari hasil pengukuran berskala interval dan rasio.
2.
Median
Median
adalah nilai yang menjadi batas 50 persen distribusi frekuensi bagian bawah dan
50 persen distribusi frekuensi bagian atas. Ringkasnya median adalah nilai yang
membagi distribusi menjadi 2 bagian yang sama yakni 50 persen, 50 persen.Harga
median bisa ditentukan dengan beberapa formulasi tergantung pada kasus yang
dihadapi.
3.
Modus
Secara sederhana modus didefinisikan nilai yang
paling sering muncul atau nilai yang memiliki frekuensi paling banyak. Satu hal
yang perlu diingat bahwa modus adalah persoalan nilai bukannya frekuensi.
Frekuensi hanya menunjuk intensitas kemunculan sesuatu nilai. Pada data
tunggal menentukan mode/modus mungkin tidaklah terlampau sulit. Hanya dengan
memperhatikan nilai yang memiliki frekuensi terbanyak maka dapat diidentifikasi
nilai modus/mode dari distribusi data. Hal ini agak berbeda jika berhadapan
dengan data bergolong.
PENGUKURAN PENYIMPANGAN
a. Range
Nilai rentang
ini menunjukkan selisih antara data yang paling tinggi dengan data yang paling
rendah. Dengan melihat ukuran ini maka dapat diketahui gambaran secara kasar
tentang variasi suatu distribusi data. Nilai range ini sangat kasar, karena
tidak mempertimbangkan nilai-nilai yang
lain selain nilai ekstrimnya.
b. Varians
ukuran bagi persebaran (dispersi) data. Yang diukur adalah
seberapa jauh data tersebar di sekitar rerata. Varians merupakan salah satu parameter bagi distribusi normal. Akar dari varians dikenal sebagai simpangan baku (standard deviation).
c. Standar deviasi
Adalah suatu nilai seberapa besar
sebaran data suatu sampel penelitian. Semakin kecil nilai standar deviasi maka
semakin kecil penyebaran datanya dan sebaliknya semakin besar nilai standar
deviasi maka semakin besar pula sebaran datanya.







0 comments:
Post a Comment