Recently Published
ANALISIS KLUSTERISASI DATA KEMISKINAN KOTA/KABUPATEN DI INDONESIA MENGGUNAKAN ALGORITMA K-MEANS PADA TAHUN 2019 - 2022
Penelitian ini bertujuan untuk mengklusterisasi 514 kota/kabupaten di Indonesia berdasarkan tingkat kemiskinan dari masa sebelum COVID-19 (tahun 2019) sampai masa akhir COVID-19 (tahun 2022) dan membandingkan hasil klusterisasi yang didapat. Data yang digunakan berasal dari data publikasi Badan Pusat Statistik (BPS) di tahun 2019 – 2022 yang memiliki 11 variabel yang berkaitan dengan kemiskinan. Metode yang diaplikasikan dalam penelitian ini adalah unsupervised learning melingkupi: normalisasi data serta penyederhanaan variabel menggunakan Principal Component Analysis; penentuan jumlah kluster optimal berdasarkan metode elbow, indeks silhouette, dan algoritma gap statistic yang menemukan 3 kluster optimal; dan algoritma K-Means untuk mengklusterisasi 514 kota/kabupaten. Dari analisis didapatkan: kota/kabupaten dengan tingkat kemiskinan rendah berada di kluster 1, tingkat kemiskinan sedang di kluster 2, dan tingkat kemiskinan tinggi di kluster 3; Jumlah kota/kabupaten di kluster 3 meningkat dari 36 kota/kabupaten di tahun 2019 menjadi 40 kota/kabupaten di tahun 2022; terdapat 32 kota/kabupaten yang selalu berada di kluster 3.
Kata kunci: unsupervised learning, PCA, Optimasi kluster, Algoritma K-Means, Data Kemiskinan
Multikolinieritas dengan R (UAS No 4)
Disini saya akan mempraktikkan langkah-langkah dalam memperbaiki masalah "multikolenieritas" dalam data regresi linier.
R Basic Exercise Function
A. Univariate Variable Function
B. Multivariate Variable Function
C. Simple Case Example
R Basic
1 Generate Data frame
2 Extraction
3 Renames Data Frame
4 Case Study
Basic RStudio
Assignment 3
1. Creating Vectors
2. Creating Matrices
3. Lists
4. Factors
5. Data Frames