Peluang Usaha Mandiri

Tuesday, June 30, 2009

Grafik Batang Clustered dan Stacked pd SPSS (Seri 2 Grafik)

Tulisan ini merupakan lanjutan dari tulisan sebelumnya yang membahas mengenai grafik batang sederhana pada SPSS. Untuk memahami tulisan ini, silakan baca tulisan tersebut terlebih dahulu.
Kali ini kita akan membahas mengenai grafik batang clustered dan stacked. Data yang digunakan untuk latihan adalah data tingkat pendidikan dan pendapatan yang telah diberikan pada tulisan sebelumnya tersebut.
Setelah menginput data tersebut, klik Graphs > Legacy Dialogs > Bar. Akan muncul tampilan berikut:

Sebagai latihan, kita akan membuat grafik pendidikan yang dikelompokkan berdasarkan tingkat pendapatan. Klik Clustered, klik Summaries for groups of cases, kemudian klik Define, akan muncul tampilan berikut:

Pada Bar Represent klik % of cases (tentunya anda bisa mencoba pilihan lainnya). Masukkan variabel Pendidikan pada kotak Category Axis dan variabel Pendapatan pada kotak Define Cluster by. Kemudian klik OK. Akan muncul output grafik sebagai berikut:

Ini adalah grafik batang clustered. Apa perbedaannya dengan grafik batang stacked ? Jika anda ambil pilihan stacked pada proses sebelumnya, output grafik akan menjadi sebagai berikut:

Terlihat bahwa perbedaan antara grafik batang clustered dengan stacked adalah jika pada clustered pengelompokkan pendapatan dilakukan secara horizontal (kesamping), pada stacked dilakukan secara bertumpuk vertikal.

Grafik Batang Sederhana pada SPSS (Seri 1 Grafik)

Satu gambar sering lebih bermakna dari seribu kata. Ungkapan ini sering dikemukakan untuk menunjukkan peran grafik dalam mendeskripsikan data, selain dengan menggunakan tabel distribusi frekuensi yang telah kita bahas pada tulisan-tulisan sebelumnya.
Untuk kepentingan itu, dalam beberapa seri tulisan dalam blog ini, akan kita bahas cara membentuk grafik dengan SPSS.
Sebagai latihan misalnya kita punya data tingkat pendidikan dan pendapatan dari 30 orang responden penelitian. Tingkat pendidikan misalnya dikategorikan sebagai:
1 = responden yang berpendidikan SLTP kebawah
2 = responden yang berpendidikan SLTA
3 = responden yang berpendidikan D3
4 = responden yang berpendidikkan S1.
Pendapatan juga kita kelompokkan atas tiga yaitu:
1 = pendapatan rendah (kurang dari Rp. 1.000.000)
2 = pendapatan menengah ( Rp. 1.000.000 – 3.000.000)
3 = pendapatan tinggi ( diatas Rp 3.000.000)
( Catatan: jika data yang dimiliki masih berupa data mentah (belum dikelompokkan), kita dapat mengelompokkannya dengan SPSS. Baca tulisan ini).
Data tingkat pendidikan dan pendapatan responden tersebut diberikan di bawah ini.

Setelah menginput data tersebut (atau bisa juga sebelum menginput data ), berilah value label untuk masing-masing kategori variabel yaitu untuk pendidikan: 1 (=< SLTP), 2(SLTA), 3(D3), 4 (S1) sedangkan untuk pendapatan: 1 (rendah), 2(menengah), 3(tinggi). Cara memberikan value label, silakan baca tulisan ini.
Terdapat tiga jalur (cara) dalam pembuatan grafik pada SPSS. Pada tulisan ini kita akan membahas cara yang paling sederhana saja, sebagai berikut:
Kklik Graphs > Legacy Dialogs. Akan terdapat beberapa pilihan grafik yang tersedia yaitu:
Bar (grafik batang)
3-D (grafik batang tiga dimensi)
Line (grafik garis)
Pie (grafik lingkaran)
High-Low
Boxplot
Error Bar
Population Pyramid
Scatter/Dot (sebaran/titik)
Histogram
Masing-masing grafik memiliki karakteristik-karakteristik tertentu yang sesuai dalam penggambaran data. Grafik yang berbasis batang, umumnya digunakan untuk menggambarkan perbandingan antar variabel/kategori. Grafik yang berbasis garis, umumnya (lebih sesuai) untuk menggambarkan perkembangan data. Grafik yang berbasis lingkaran, umumnya untuk menggambarkan data yang bersifat proporsi. Grafik yang berbasis titik umumnya untuk menggambarkan pencaran/sebaran data.
Dalam konteks data latihan kita, pada tulisan ini kita akan membahas terlebih dahulu mengenai grafik batang. Untuk itu klik Bar, akan muncul tampilan berikut:

Terdapat tiga pilihan grafik batang, yaitu Simple, Clustered dan Stacked. Pilihan Simple digunakan untuk menggambarkan grafik dari variabel tunggal. Pilihan Clustered dan Stacked digunakan untuk menggambarkan grafik dari variabel tunggal tetapi dikelompokkan berdasarkan kategori dari variabel lainnya. Pengelompokan pada tipe grafik Clustered dilakukan secara horizontal, sedangkan pada tipe Stacked secara vertikal.
Kemudian terdapat pilihan tampilan data untuk grafik (Data in Chart Are), yaitu diringkas berdasarkan kategori (Summaries for groups of cases), diringkas berdasarkan pemisahan variabel (Summaries of separate variables) atau menampilkan data individual. (Catatan: anda bisa mencoba-coba pilihan tersebut untuk memahami maknanya).
Sebagai latihan awal, kita akan membuat grafik untuk variabel jenis kelamin. Kita pilih jenis grafik Simple (klik) dan tampilan data adalah Summaries for groups of cases. Kemudian klik Define, akan muncul tampilan berikut:

Tentukan terlebih dahulu ukuran yang akan ditampilkan oleh batang dari grafik kita (Bar Represent). Ada beberapa pilihan yaitu ukuran frekuensi absolut (N of cases), kumulatif frekuensi (Cum.N), persentase frekuensi (% of cases), kumulatif persentase frekuensi (Cum.%), atau ukuran statistik lainnya (Other Statistics). Anda juga bisa mencoba-coba berbagai pilihan ini untuk melihat perbedaan output grafiknya.
Untuk latihan ini, kita pilih % of cases. Selanjutnya masukkan variabel Pendidikan ke dalam kotak Category Axis, dan kemudian klik OK. Akan muncul output grafik sebagai berikut:

Ok, sekian dulu, kita lanjutkan pada tulisan berikutnya mengenai jenis grafik batang clustered dan stacked.

Monday, June 29, 2009

Tabel Silang Empat Variabel dengan SPSS

Tulisan ini merupakan lanjutan dari dua tulisan sebelumnya yang membahas mengenai tabel silang. Untuk memahami bagian ini, silakan baca terlebih dahulu bagian pertama dan bagian kedua ini.
Jika pada tulisan sebelumnya kita sudah membahas mengenai tabel silang untuk tiga variabel, sekarang kita akan membahas untuk empat variabel (dan dengan cara yang sama untuk lebih dari empat variabel).
Sebagai latihan, misalnya kita punya data mengenai jenis kelamin (sex), daerah, tingkat pendidikan dan pendapatan dari 60 orang responden penelitian.
Jenis kelamin dikode sebagai berikut:
1 = laki-laki
2 = perempuan
Daerah dikode sebagai berikut:
1 = Kota
2 = Desa
Tingkat pendidikan misalnya dikategorikan sebagai:
1 = responden yang berpendidikan SLTP kebawah
2 = responden yang berpendidikan SLTA
3 = responden yang berpendidikan D3 ke atas.
Pendapatan juga kita kelompokkan atas tiga yaitu:
1 = pendapatan rendah (kurang dari Rp. 1.000.000)
2 = pendapatan menengah ( Rp. 1.000.000 – 3.000.000)
3 = pendapatan tinggi ( diatas Rp 3.000.000)
( Catatan: jika data yang dimiliki masih berupa data mentah (belum dikelompokkan), kita dapat mengelompokkannya dengan SPSS. Baca tulisan ini).
Data jenis kelamin, daerah tingkat pendidikan dan pendapatan responden tersebut diberikan di bawah ini (Catatan: input data di bawah ini sebenarnya hanya terdiri dari empat kolom. Kolom pertama adalah jenis kelamin, kolom kedua adalah daerah, kolom ketiga adalah pendidikan dan kolom keempat adalah pendapatan. Mengingat keterbatasan halaman, tampilan dibawah dipotong jadi dua, seakan-akan jadi delapan kolom. Karenanya, jika anda menginput ke SPSS, tetap jadikan hanya empat kolom).

Setelah menginput data tersebut (atau bisa juga sebelum menginput data ), berilah value label untuk masing-masing kategori variabel yaitu untuk jenis kelamin: 1 (laki-laki), 2 (perempuan), untuk daerah: 1 (kota), 2 (desa), untuk pendidikan: 1 (=< SLTP), 2(SLTA), 3(>= D3), sedangkan untuk pendapatan: 1 (rendah), 2(menengah), 3(tinggi). Cara memberikan value label, silakan baca tulisan ini.
Selanjutnya, klik Analyze > Descriptive Statistics > Crosstabs. Akan muncul tampilan berikut:

Masukkan variabel Pendapatan ke kotak Row(s), Variabel Pendidikan ke kotak Column(s) serta Variabel Sex ke kotak Layer 1of 1. (Catatan: ini hanya salah satu contoh cara mengkombinasikan penempatan Row,column dan layer nya. Sebagai latihan silakan diganti-ganti dan lihat bentuk outputnya)
Selanjutnya klik Next, akan muncul tampilan berikut:

Masukkan variabel Daerah ke kotak Layer 2 of 2. (Catatan: Begitu seterusnya untuk tabel silang lebih dari empat variabel)
Selanjutnya klik Cells, akan muncul tampilan berikut:

Ada beberapa pilihan pada tampilan Cell Display diatas. Untuk kepentingan latihan saat ini, silakan klik saja Observed dan Column.
Pilihan Observed bertujuan untuk menampilkan frekuensi data sebenarnya, pilihan Row bertujuan untuk menampilkan persentase baris, column untuk persentase kolom dan total untuk persentase total dalam tabel silang.
Selanjutnya, klik Continue dan klik OK. Akan muncul output tabel silang sebagai berikut:

Contoh cara membacanya:
Dari output SPSS, Count adalah frekuensi dari data yang diamati (observed). Cara membacanya, misalnya angka 5 pada baris pertama kolom pertama dari tabel diatas berarti bahwa terdapat 5 responden laki-laki di kota dengan pendidikan =< SLTP yang berpendapatan rendah.
% within Pendidikan adalah persentase kolom dari tabel silang ini. Misalnya angka 71.4% (baris kedua kolom pertama) dari tabel diatas adalah berasal dari (5/7) x 100%. Cara membacanya adalah dari total responden laki-laki di kota yang berpendidikan SLTP ke bawah (sebanyak 7 orang), 71,4 persen diantaranya berpendapatan rendah.
Perhatikan bahwa dari tabel kita diatas terdapat banyak sel yang kosong. Hal ini terutama disebabkan jumlah observasi yang relatif sedikit dibandingkan jumlah sel yang terbentuk dari tabel silang ini. Oleh karenanya, jumlah observasi harus menjadi pertimbangan ketika kita ingin membentuk tabel silang dengan jumlah variabel atau kategori yang banyak.
Ok, cukup sekian dulu tulisan ini.

Tabel Silang Tiga Variabel dengan SPSS

Tabel silang pada dasarnya tidak hanya dapat dibentuk antar dua variabel, tetapi juga dapat dibentuk untuk melihat keterkaitan lebih dari dua variabel. Oleh karenanya, jika pada tulisan sebelumnya kita telah membahas membuat tabel silang untuk dua variabel (silakan baca dulu tulisan tersebut untuk memahami bagian ini), maka sekarang kita akan bahas cara membentuk tabel silang lebih dari dua variabel (untuk kali ini kita lihat terlebih dahulu untuk tiga variabel).
Sebagai latihan, misalnya kita punya data mengenai jenis kelamin (sex), tingkat pendidikan dan pendapatan dari 60 orang responden penelitian.
Jenis kelamin dikode sebagai berikut:
1 = laki-laki
2 = perempuan
Tingkat pendidikan misalnya dikategorikan sebagai:
1 = responden yang berpendidikan SLTP kebawah
2 = responden yang berpendidikan SLTA
3 = responden yang berpendidikan D3 ke atas.
Pendapatan juga kita kelompokkan atas tiga yaitu:
1 = pendapatan rendah (kurang dari Rp. 1.000.000)
2 = pendapatan menengah ( Rp. 1.000.000 – 3.000.000)
3 = pendapatan tinggi ( diatas Rp 3.000.000)
( Catatan: jika data yang dimiliki masih berupa data mentah (belum dikelompokkan), kita dapat mengelompokkannya dengan SPSS. Baca tulisan ini).
Data jenis kelamin, tingkat pendidikan dan pendapatan responden tersebut diberikan di bawah ini (Catatan: input data di bawah ini sebenarnya hanya terdiri dari tiga kolom. Kolom pertama adalah jenis kelamin, kolom kedua adalah pendidikan dan kolom ketiga adalah pendapatan. Mengingat keterbatasan halaman, tampilan dibawah dipotong jadi dua, seakan-akan jadi enam kolom. Karenanya, jika anda menginput ke SPSS, tetap jadikan hanya tiga kolom).

Setelah menginput data tersebut (atau bisa juga sebelum menginput data ), berilah value label untuk masing-masing kategori variabel yaitu untuk jenis kelamin: 1 (laki-laki), 2 (perempuan), untuk pendidikan: 1 (=< SLTP), 2(SLTA), 3(>= D3), sedangkan untuk pendapatan: 1 (rendah), 2(menengah), 3(tinggi). Cara memberikan value label, silakan baca tulisan ini.
Selanjutnya, klik Analyze > Descriptive Statistics > Crosstabs. Akan muncul tampilan berikut:

Masukkan variabel Pendapatan ke kotak Row(s), Variabel Pendidikan ke kotak Column(s) serta Variabel Sex ke kota Layer 1of 1. (Catatan: ini hanya salah satu contoh cara mengkombinasikan penempatan Row,column dan layer nya. Sebagai latihan silakan diganti-ganti dan lihat bentuk outputnya)
Selanjutnya klik Cells, akan muncul tampilan berikut:

Ada beberapa pilihan pada tampilan Cell Display diatas. Untuk kepentingan latihan saat ini, silakan klik saja Observed dan Column.
Pilihan Observed bertujuan untuk menampilkan frekuensi data sebenarnya, pilihan Row bertujuan untuk menampilkan persentase baris, column untuk persentase kolom dan total untuk persentase total dalam tabel silang.
Selanjutnya, klik Continue dan klik OK. Akan muncul output tabel silang sebagai berikut:

Contoh cara membacanya:
Dari output SPSS, Count adalah frekuensi dari data yang diamati (observed). Cara membacanya, misalnya angka 7 pada baris pertama kolom pertama dari tabel diatas berarti bahwa terdapat 7 responden laki-laki dengan pendidikan =< SLTP yang berpendapatan rendah.
% within Pendidikan adalah persentase kolom dari tabel silang ini. Misalnya angka 77.8% (baris kedua kolom pertama) dari tabel diatas adalah berasl dari (7/9) x 100%. Cara membacanya adalah dari total responden laki-laki yang berpendidikan SLTP ke bawah (sebanyak 9 orang), 77,8 persen diantaranya berpendapatan rendah.
Ok, sekian dulu. Pada tulisan berikutnya akan kita bahas tabel silang dalam kasus empat variabel (karena sedikit berbeda cara menginput perintahnya serta bentuk tampilannya).

Sunday, June 28, 2009

Tabel Silang dengan SPSS

Salah satu cara untuk menggambarkan keterkaitan antar variabel secara sederhana adalah dengan membentuk tabel silang (crosstabs) antar variabel tersebut. Tabel silang adalah tabel distribusi frekuensi yang menghubungkan dua atau lebih variabel.
Bagaimana cara kita membentuk tabel silang ini dengan SPSS ?
Sebagai latihan, misalnya kita punya data tingkat pendidikan dan pendapatan dari 60 orang responden penelitian. Tingkat pendidikan misalnya dikategorikan sebagai:
1 = responden yang berpendidikan SLTP kebawah
2 = responden yang berpendidikan SLTA
3 = responden yang berpendidikan D3 ke atas.
Pendapatan juga kita kelompokkan atas tiga yaitu:
1 = pendapatan rendah (kurang dari Rp. 1.000.000)
2 = pendapatan menengah ( Rp. 1.000.000 – 3.000.000)
3 = pendapatan tinggi ( diatas Rp 3.000.000)
(Catatan: jika data yang dimiliki masih berupa data mentah (belum dikelompokkan), kita dapat mengelompokkannya dengan SPSS. Baca tulisan ini).
Data tingkat pendidikan dan pendapatan responden tersebut diberikan di bawah ini (Catatan: input data di bawah ini sebenarnya hanya terdiri dari dua kolom. Kolom pertama adalah pendidikan dan kolom kedua adalah pendapatan. Mengingat keterbatasan halaman, tampilan dibawah dipotong jadi dua, seakan-akan jadi empat kolom. Karenanya, jika anda menginput ke SPSS, tetap jadikan hanya dua kolom).

Setelah menginput data tersebut (atau bisa juga sebelum menginput data ), berilah value label untuk masing-masing kategori variabel yaitu untuk pendidikan: 1 (=< SLTP), 2(SLTA), 3(>= D3), sedangkan untuk pendapatan: 1 (rendah), 2(menengah), 3(tinggi). Cara memberikan value label, silakan baca tulisan ini.
Selanjutnya, klik Analyze > Descriptive Statistics > Crosstabs. Akan muncul tampilan berikut:

Masukkan variabel Pendapatan ke kotak Row(s) dan Variabel Pendidikan ke kotak Column(s). Selanjutnya klik Cells, akan muncul tampilan berikut:

Ada beberapa pilihan pada tampilan Cell Display diatas. Untuk kepentingan latihan saat ini, silakan klik saja Observed, Row, Column, Total.
Pilihan Observed bertujuan untuk menampilkan frekuensi data sebenarnya, pilihan Row bertujuan untuk menampilkan persentase baris, column untuk persentase kolom dan total untuk persentase total dalam tabel silang.
Tentunya, pilihan-pilihan persentase ini dalam prakteknya tidak akan kita gunakan semuanya (karena akan memperumit pembacaan tabel). Tapi untuk sekedar latihan, silakan klik saja semua pilihan persentase tersebut.
Selanjutnya, klik Continue dan klik OK.Akan muncul output tabel silang sebagai berikut:

Dari output SPSS, Count adalah frekuensi dari data yang diamati (observed). Cara membacanya, misalnya angka 16 pada baris pertama kolom pertama dari tabel diatas berarti bahwa terdapat 16 responden dengan pendidikan =< SLTP yang berpendapatan rendah. Angka 7 pada kolom kedua baris pertama berarti bahwa terdapat 7 responden dengan pendidikan SLTA yang berpendapatan rendah.
% within Pendapatan adalah persentase baris dari tabel silang ini. Misalnya, angka 64.0% (baris kedua kolom pertama) dari tabel diatas adalah berasal dari (16/25) x 100%. Cara membacanya adalah dari total responden berpendapatan rendah (sebanyak 25 orang), 64,0 persen diantaranya adalah mereka yang berpendidikan SLTP ke bawah.
% within Pendidikan adalah persentase kolom dari tabel silang ini. Misalnya angka 69.6% (baris ketiga kolom pertama) dari tabel diatas adalah berasl dari (16/23) x 100%. Cara membacanya adalah dari total responden yang berpendidikan SLTP ke bawah (sebanyak 23 orang), 69,6 persen diantaranya berpendapatan rendah.
% within total adalah persentase total dari tabel silang ini. Misalnya angka 26.7% (baris keempat kolom pertama) adalah berasal dari (16/60) x 100%. Cara membacanya adalah dari total responden (sebanyak 60 orang), 26,7 persen diantaranya memiliki pendidikan SLTP kebawah dengan pendapatan rendah.
Sekali lagi, sebagai catatan, dalam prakteknya kita tidak perlu menggunakan semua jenis persentase ini. Silakan pilih sesuai dengan kebutuhan analisis, agar tampilan tabel silang tidak ruwet seperti diatas.
Ok, sekian dulu. Berkaitan dengan tabel silang ini akan kita bahas hal-hal lainnya pada tulisan berikutnya.

Saturday, June 27, 2009

Semudah Spreadsheet: Transformasi Variabel dg SPSS

Salah satu keunggulan SPSS sebagai salah satu software statistik adalah fasilitas transformasi variabelnya yang dapat dilakukan secara mudah seperti program-program spreadsheet lainnya (misalnya Excel).
Sebagai latihan sederhana, misalnya kita punya data pendapatan dan konsumsi dari 18 responden yang sudah diinput pada SPSS sebagai berikut:

Berdasarkan data tersebut, kita ingin menghitung tabungan masing-masing responden (yang berasal dari pendapatan dikurangi konsumsi), yang akan digunakan untuk pengolahan data lebih lanjut.
Untuk melakukan itu, klik Transform > Compute Variable. Akan muncul tampilan berikut:

Pada kotak Target Variable, masukkan nama variabel untuk menampung data hasil transformasi variabel tersebut. Misalnya dalam contoh kita diatas, diberi nama Tabungan.
Pada kotak Numeric Expression, isikan perintah transformasinya. Dalam kasus kita adalah Pendapatan-Konsumsi. Kemudian klik OK, maka pada worksheet SPSS akan muncul variabel baru dengan nama Tabungan sebagai berikut:

Ini adalah contoh sederhana. Tentunya kita menggunakan operasi perhitungan yang lebih rumit dengan memanfaatkan simbol-simbol yang ada pada kalkulator yang ada di bawah kotak Numeric Expression seperti perkalian (*), pangkat (**), pembagian (/) dan lainnya.
Pada prinsipnya, dalam perintah transformasi ini ada dua cara yang dapat dilakukan:
a. Membuat rumus sendiri, seperti contoh diatas.
b. Menggunakan fungsi yang sudah disediakan SPSS dalam kotak Function Group. SPSS menyediakan berbagai fungsi baik fungsi aritmatik, statistik, fungsi waktu dan lainnya.
Salah satu contoh memanfaatkan fungsi ini, misalnya kita ingin menentukan logaritma natural (Ln) variabel pendapatan. Fungsi tersebut disediakan oleh SPSS dalam Kelompok Fungsi Arithmethic.
Oleh karenanya, klik Arithmethic, maka akan muncul di kotak Function and Special Variables, fungsi-fungsi yang tersedia pada kelompok arithmetic ini (lihat gambar dibawah ini).

Isikan pada kotak Target Variable, nama variabel sebagai penampung transformasi tersebut. Dalam contoh diatas misalnya LnY
Kemudian klik Ln, dan klik tanda panah yang mengarah ke atas pada gambar diatas. Maka pada kotak Numeric Expression akan muncul tulisan seperti ini: LN(?).
Selanjutnya klik variabel Pendapatan (variabel asal yang akan ditransformasikan), dan klik panah yang mengarah kekanan dari gambar diatas. Prosedur ini akan mengganti tanda tanya diatas menjadi Pendapatan, sehingga tulisan pada kotak Numeric Expression akan menjadi: LN(Pendapatan).
Proses mengisi kotak Numeric Expression ini cukup berbelit, tetapi jika Anda sudah hafal cara penulisan fungsinya, anda tidak harus melalui tahapan-tahapan tersebut. Cukup langsung diketikkan saja: LN(Pendapatan).
Setelah itu klik OK, maka akan akan keluar output dari logaritma natural dari pendapatan yang berada pada variabel baru yang bernama LnY, seperti tampilan berikut:

Ok, cukup sekian tulisan ini. Silakan berlatih dengan jenis-jenis transformasi lainnya.

Friday, June 26, 2009

Pengelompokkan Data dengan SPSS

Seringkali dan biasanya, selain menampilkan ukuran statistik deskriptif dari kumpulan data, kita juga ingin menampilkan distribusi frekuensi dari data tersebut. Jika data sudah dalam bentuk kategori (misalnya pendidikan SD, SLTP,SLTA dst) atau data sudah dikategorikan dalam kelompok-kelompok interval tertentu misalnya pendapatan rendah ( < 1.000.000), menengah (1.000.000 – 2.0000), tinggi (>2.000.000), maka kita dapat secara langsung membuat distribusi frekuensinya dengan SPSS (caranya, lihat tulisan ini).
Tetapi bagaimana jika data belum terkelompok dalam kategori-kategori tertentu ? Tentunya tabel distribusi frekuensinya akan sangat panjang mengikuti keragaman dari nilai-nilai data tersebut. Misalnya kita punya data umur responden penelitian sebagai berikut:

Jika dibentuk tabel distribusi frekuensi dari data diatas, maka akan terbentuk tabel distribusi yang tidak ringkas, sehingga kita akan sulit menarik kesimpulan dari data tersebut, seperti terlihat dibawah ini:

Karenanya, agar tabel distribusi frekuensi menjadi lebih ringkas sehingga mudah diinterpretasikan., data umur dalam contoh kita diatas sebaiknya dikelompokkan terlebih dahulu.
Bagaimana cara mengelompokkan data ini dalam SPSS ?
Sebagai latihan, silakan input terlebih dahulu data umur responden diatas, definisikan nama variabel dengan umur (lihat cara mendefinisikan variabel pada tulisan ini), kemudian klik Transform. Ada dua pilihan dalam mengelompokkan data ini yaitu Recode into Same Variables (kode pengelompokkan akan menindih data asli) dan Recode into Different Variables (kode pengelompokan akan dibuat pada variabel yang baru). Kita pilih saja Recode into Different Variables, maka akan muncul tampilan berikut:

Pindahkan variabel umur yang tadinya ada dikotak sebelah kiri ke kotak sebelah kanan dengan cara mengklik panah arah ke kanan. Kemudian pada kotak Output Variable, untuk Name tuliskan Kel.Umur dan untuk Label tuliskan Kelompok Umur (lihat tampilan diatas), kemudian klik Change.
Selanjutnya, klik Old and New Values, akan muncul tampilan berikut:

Misalnya kita ingin mengelompokkan umur menjadi : < 29, 30 – 39, 40 – 49, dan >49.
Caranya perhatikan tampilan diatas.
Untuk mengelompokkan umur ≤ 29, pada bagian Old Value, klik Range,LOWEST through value, kemudian isikan pada kotak dibawahnya angka 29. Selanjutnya pada bagian New Value, pada kotak Value isikan angka 1, kemudian klik Add (lihat tampilan diatas)
Untuk mengelompokkan umur 30 – 39, pada bagian Old Value, klik Range, kemudian isikan pada kotak dibawahnya angka 30 dan kotak dibawah through angka 39. Selanjutnya pada bagian New Value, pada kotak Value isikan angka 2, kemudian klik Add (lihat tampilan berikut ini)

Dengan cara yang sama, lakukan untuk kelompok umur 40 – 49 (pada New Value beri kode 3).
Selanjutnya untuk kelompok umur ≥ 50, pada bagian Old Value, klik Range value through HIGHEST, kemudian isikan pada kotak dibawahnya angka 50. Selanjutnya pada bagian New Value, pada kotak Value isikan angka 4, kemudian klik Add.
Setelah selesai memberikan kode untuk pengelompokan umur ini, kemudian klik Continue dan OK.
Hasilnya, pada worksheet SPSS kita akan ada tambahan variabel baru yaitu kelompok umur sebagai berikut:

Sekarang kita tinggal memberikan Value Label untuk masing-masing kode pengelompokan umur tersebut dengan kode 1 (≤ 29), kode 2 (30-39), kode 3 (40 – 49), kode 4 (≥ 49). Cara memberikan value label dapat dilihat pada tulisan ini.
Setelah memberikan value label, bentuklah distribusi frekuensi untuk kelompok umur tersebut (lihat cara membuat distribusi frekuensi pada tulisan ini). Output SPSS dari latihan kita adalah sebagai berikut:

Statistik Deskriptif pd SPSS (Bagian 3)

Postingan ini merupakan bagian ketiga (terakhir) dari dua postingan sebelumnya mengenai statistik deskriptif pada SPSS. Untuk memahami bagian ini, silakan baca terlebih dahulu bagian 1 dan bagian 2.
Pada bagian ketiga ini, kita akan membahas mengenai skewness dan standar errornya serta kurtosis dan standar errornya sebagai bagian dari output statistik deskriptif SPSS yang ada pada kolom kesebelas sampai kolom keempatbelas.

Kolom kesebelas adalah skewness data. Skewness merupakan alat ukur dalam menelusuri distribusi data yang diperbandingkan dengan distribusi normal. Skewness merupakan pengukuran tingkat ketidaksimetrisan (kecondongan) sebaran data di sekitar rata-ratanya. Distribusi normal merupakan distribusi yang simetris dan nilai skewness adalah 0. Skewness yang bernilai positif menunjukkan ujung dari kecondongan menjulur ke arah nilai positif (ekor kurva sebelah kanan lebih panjang). Skewness yang bernilai negatif menunjukkan ujung dari kecondongan menjulur ke arah nilai negatif (ekor kurva sebelah kiri lebih panjang).
Rumus skewness adalah sebagai berikut:

Sebagai contoh, perhitungan skewness untuk data umur adalah sebagai berikut:



Kolom keduabelas adalah standar error dari skewness. Untuk menghitung standar error dari skewness ini (sebagai contoh umur) adalah sebagai berikut:

Kolom ketiga belas adalah Kurtosis. Sebagaimana skewness, kurtosisi juga merupakan alat ukur dalam menelusuri distribusi data yang diperbandingkan dengan distribusi normal. Kurtosis menggambarkan keruncingan (peakedness) atau kerataan (flatness) suatu distibusi data dibandingkan dengan distribusi normal. Pada distribusi normal, nilai kurtosis sama dengan 0. Nilai kurtosis yang positif menunjukkan distribusi yang relatif runcing, sedangkan nilai kurtosis yang negatif menunjukkan distribusi yang relatif rata.
Rumus kurtosis adalah:

Contoh perhitungan untuk data umur sebagai berikut:

Sehingga kurtosisnya adalah:

Kolom keempat belas adalah standar error dari kurtosis, yang dihitung dengan rumus berikut:

Dimana Ses adalah Standar error dari skewness yang telah kita hitung sebelumnya.
Dengan demikian, standar error kurtosis untuk kasus umur dalam latihan kita adalah:

(catatan: jika anda mendapatkan hasil yang sedikit berbeda, itu karena proses pembulatan)

Statistik Deskriptif pd SPSS (Bagian 2)

Bagian ini merupakan bagian kedua dari seri tulisan mengenai statistik deskriptif pada SPSS. Untuk memahami bagian ini, silakan baca dulu bagian 1.
Seperti yang terlihat pada bagian 1 tulisan ini, output SPSS untuk statistik deskriptif terdiri dari 14 kolom. Masing-masing kolom akan dijelaskan sebagai berikut:
Kolom pertama dari output menunjukkan variabel yang diolah.
Kolom kedua adalah jumlah observasi. Perhatikan bahwa untuk umur responden, jumlah observasi adalah 18, sedangkan untuk pendapatan responden adalah 16. Mengapa ? Karena dua observasi sesuai dengan contoh latihan kita adalah data missing. SPSS dalam hal ini hanya akan mengolah data yang valid dengan mengeluarkan data missing.
Kolom ketiga adalah range (jarak). Range merupakan pengukuran yang paling sederhana untuk dispersi (penyebaran) data. Rumus untuk range adalah:
Range = nilai maksimum – nilai minimum
Dalam kasus kita, misalnya range untuk umur adalah 37, karena nilai maksimum 57 dan nilai minimum 20.
Kolom keempat adalah nilai minimum (terendah) dari data
Kolom kelima adalah nilai maksimum (tertinggi) dari data
Kolom keenam adalah jumlah (sum) dari keseluruhan data.
Kolom ketujuh adalah nilai rata-rata, yaitu jumlah dibagi dengan banyaknya observasi. Dalam kasus umur = 658/18 = 36.56
Kolom kedelapan adalah standar error dari rata-rata (Standard error of Mean).
Ini adalah pengukuran untuk mengukur seberapa jauh nilai rata-rata bervariasi dari satu sampel ke sampel lainnya yang diambil dari distribusi yang sama.
Apa perbedaan standard error (of mean) dengan standar deviasi (kolom kesembilan)?.
Kalau standard deviasi adalah suatu indeks yang menggambarkan sebaran data terhadap rata-ratanya, maka standard error (of mean) adalah indeks yang menggambarkan sebaran rata-rata sampel terhadap rata-rata dari rata-rata keseluruhan kemungkinan sampel (rata-rata populasi).
Pengukuran ini berguna, terutama untuk menjawab pertanyaan “seberapa baik rata-rata yang kita dapatkan dari data sampel dapat mengestimasi rata-rata populasi ?”
Cara menghitung standard error dari rata-rata (misalnya untuk umur) adalah:

Dimana SE = standar error dari rata-rata
S = standar deviasi (lihat kolom 9)
n = jumlah observasi
Kolom kesembilan adalah standar deviasi, yang dihitung dengan rumus:

Sebagai contoh perhitungan untuk standard deviasi umur sebagai berikut:


Kolom kesepuluh adalah varians dari data. Secara matematis, varians dan standar deviasi saling terkait, dimana standar deviasi adalah akar varians, atau varians adalah kuadrat dari standar deviasi. Dengan demikian untuk varians umur adalah 10.999^2 = 120.967
Ok, masih terdapat empat kolom berikutnya yang belum kita bahas yaitu skewness dan standar errornya serta kurtosis dan standar errornya. Namun, agar postingan ini tidak terlalu panjang, akan kita bahas pada tulisan berikutnya. Silakan baca bagian 3 ini

Thursday, June 25, 2009

Statistik Deskriptif pd SPSS (Bagian 1)

Ukuran-ukuran statistik deskriptif dalam pengolahan data bertujuan untuk mendapatkan gambaran ringkas dari sekumpulan data, sehingga kita dapat menyimpulkan keadaan data secara mudah dan cepat. Selain itu, melalui ukuran-ukuran statistik deskriptif ini, kita dapat menentukan jenis pengolahan statistik lebih lanjut yang sesuai dengan karakteristik data kita tersebut.
Berkaitan dengan hal tersebut, seri tulisan ini akan membahas cara mendapatkan ukuran-ukuran statistik deskriptif pada SPSS. Sebagai latihan, misalnya terdapat data umur dan pendapatan dari 18 responden penelitian kita yang telah diinput pada SPSS sebagai berikut:

Perhatikan pada responden ketiga dan responden keempat belas. Pendapatannya disana tertulis 9999. Angka tersebut bukanlah pendapatan dari responden, tetapi adalah kode untuk “missing” data (data yang tidak tersedia). (lihat penjelasan pada tulisan ini untuk memahami cara memperlakukan data yang “missing”).
Selanjutnya untuk mendapatkan ukuran-ukuran statistik deskriptif, klik Analyze > Descriptive Statistics > Descriptives. Akan muncul tampilan berikut:

Pindahkan variabel umur dan pendapatan (yang tadinya ada dikotak sebelah kiri) ke kotak sebelah kanan, dengan cara klik variabel yang bersangkutan, kemudian klik panah yang menuju ke arah kanan. Kedua variabel akan pindah ke kotak kanan seperti yang terlihat pada tampilan diatas.
Selanjutnya, klik Options, akan muncul tampilan berikut:

Terdapat berbagai pilihan ukuran numerik statistik deskriptif dalam SPSS seperti yang terlihat pada tampilan diatas. Sebagai latihan, klik saja semua pilihan tersebut.
Selain itu, juga terdapat pilihan Display Order (urutan tampilan output). Jika diklik pilihan Variable list, maka output akan ditampilkan dengan urutan sesuai dengan urutan variabel yang kita input (dalam contoh ini, tampilan outputnya umur kemudian pendapatan). Jika dipilih alphabetic, maka output akan ditampilkan berdasarkan urutan abjad awal dari nama variabel (dalam hal ini pendapatan kemudian umur). Jika dipilih Ascending means, maka urutan tampilan output dimulai dari variabel dengan rata-rata terkecil. Jika dipilih Descending means, maka urutan tampilan output dimulai dari variabel dengan rata-rata terbesar. Dalam contoh kita diatas, kita ambil pilihan Variable list
Setelah mengambil pilihan-pilihan yang diinginkan, klik Continue dan klik OK. Akan muncul output statistik deskriptif sebagai berikut:

(Catatan: dalam output SPSS, tabel ini ditampilkan memanjang dalam satu tabel. Mengingat keterbatasan lebar halaman, disini dipecah jadi dua tabel)
Apa makna dari masing-masing pengukuran ? Silakan lihat bahasannya pada bagian kedua dari tulisan ini.