TRANSFORMASI DATA
TRANSFORMASI DATA
Re expression - Transformation
Transformation Objective
Tangga Transformasi Tukey
Transformasi Logaritma
Transformasi Akar Kuadrat
Transformasi Box-Cox
MENGAPA DILAKUKAN TRANSFORMASI DATA?
Pada beberapa kasus, mentransformasi data akan membuat kecocokannya
terhadap asumsi menjadi lebih baik. Untuk mentransformasi data, anda dapat menggunakan
operasi matematik pada setiap observasi, kemudian menggunakan angka-angka yang
telah bertransformasi tersebut pada pengujian.
BERIKUT INI ADALAH TIPE DATA DENGAN TRANSFORMASI YANG LAZIM
DIGUNAKAN
1. 1.
Data Jumlah/Total (amount)
Jumlah merupakan jenis data yang paling lazim ditemui.
Datanya terdiri dari data positif (tidak negative), bilangan bulat, pecahan,
dan angka irasional. Data jenis ini tidak mungkin negative, misalnya jumlah
uang, ketinggian gedung, jangka waktu, dan lain-lain. Menganalisa data jumlah
biasanya dengan mengambial angka logaritmanya. Beberapa ukuran yang biasanya digunakan
dalam ilmu pengetahuan adalah ukuran logaritmik data actual. Misalnya skala Richter
untuk mengukur gempa, mengukur intensitas suara, dan kecepatan peluru senapan.
2. 2.
Data Perhitungan (counts)
Perhitungan adalah jumlah dari suatu benda. Biasanya
direpresentasikan dengan bilangan bulat non-negatif, seperti jumlah orang di
kelas dan jumlah pegawai di perusahaan. Akar unit (square roots) atau Logaritma
(logarithms) biasanya diterapkan pada data perhitungan. Ada juga jenis
transformasi yang disebut transformasi “Box-Cox” yang merupakan alat untuk
mentransformasi data perhitungan
3. 3.
Pecahan
(fractions) & Persen (percentages)
Merupakan data rasio dan biasanya merupakan data persentase
dengan dasar perhitungan 100. Namun, semua angka rasional juga disebut pecahan.
Persen biasanya akan lebih mudah dibaca dengan log[ p/(1 – p) ], dimana p
adalah persentase yang digambarkan sebagai pecahan antara 0 dan 1. Jika kita
ingin mentransformasi persentase 100, transformasinya adalah log[ p/100-p) ].
4. 4.
Peringkat (rank)
Peringkat merupakan bilangan bulat yang menggambarkan
tingkatan objek atau entitas. Seringkali variabel tambahan ditambahkan kepada
data tersebut untuk mengindikasikan tingkatan objek yang dideskripsikan.
Peringkat biasanya ditransformasikan dengan log.
5. 5.
Neraca (balance)
Neraca merupakan variabel yang diukur pada sebuah skala yang
dapat berupa angka negative atau positif, biasanya memungkinkan bagi semua
angka baik itu bilangan bulat, pecahan, rasional, dan irasional. Misalnya data keuntungan
perusahaan, keuntungan/kerugian transaksi saham, temperatur suhu, dan lain-lain.
Data neraca jarang ditransformasikan.
Sumber: Mosteller,F. and .Tukey, J., Data Analysis and Regression,
Reading, MA: Addison-Wesley, 1977
KENAPA MEMAKAI LOGARITMA?
Number that are always positive (except for number between
0 and 1)
mendapatkan angka yang tidak berbeda jauh saat dilakukan
transformasi (not too closely alike)
Komentar
Posting Komentar