Recently Published
Analisis Klasifikasi Tipe Kamar Airbnb NYC 2019 Menggunakan Multinomial Logistic Regression dan Linear Discriminant Analysis
Analisis ini membahas klasifikasi tipe kamar Airbnb di New York City menggunakan metode Multinomial Logistic Regression dan Linear Discriminant Analysis (LDA). Dataset Airbnb NYC 2019 dianalisis melalui tahapan data preprocessing, feature engineering, exploratory data analysis (EDA), pembangunan model klasifikasi multiclass, evaluasi performa model, hingga perbandingan kedua metode klasifikasi.
Penelitian ini bertujuan untuk mengidentifikasi faktor-faktor yang mempengaruhi tipe kamar Airbnb, seperti harga, lokasi, availability, aktivitas review, dan karakteristik host. Selain itu, analisis juga mengevaluasi kemampuan kedua model dalam mengenali kategori room type yang berbeda, termasuk tantangan klasifikasi pada kelas minoritas seperti Shared room.
Hasil analisis menunjukkan bahwa kedua model memiliki performa klasifikasi yang cukup baik dengan accuracy sekitar 82,9%, namun masih dipengaruhi oleh kondisi class imbalance pada dataset. Secara umum, Multinomial Logistic Regression unggul dalam interpretasi probabilitas dan pengaruh variabel, sedangkan Linear Discriminant Analysis menunjukkan performa yang lebih seimbang dalam klasifikasi multiclass serta visualisasi separasi antar kelas.
Analisis Multinomial Logistic Regression untuk Klasifikasi Tipe Kamar Airbnb di New York City
Proyek ini menganalisis data listing Airbnb di New York City untuk memahami faktor-faktor yang mempengaruhi tipe kamar. Dengan menggunakan multinomial logistic regression, penelitian ini mengkaji pengaruh harga, lokasi, availability, dan aktivitas review terhadap tipe kamar. Hasil analisis menunjukkan adanya segmentasi pasar yang jelas serta tantangan dalam memodelkan data yang tidak seimbang.
Perbandingan Lima Metode Clustering pada Data Sosial Ekonomi Negara
Clustering merupakan salah satu teknik dalam analisis multivariat yang digunakan untuk mengelompokkan objek berdasarkan kemiripan karakteristik. Studi ini bertujuan untuk mengelompokkan negara berdasarkan indikator sosial, ekonomi, dan kesehatan menggunakan lima metode clustering, yaitu K-Means, K-Medoids, DBSCAN, Mean Shift, dan Fuzzy C-Means.
Dataset yang digunakan berasal dari data negara dengan berbagai indikator pembangunan. Analisis dilakukan melalui tahapan preprocessing, penentuan jumlah cluster, implementasi metode, visualisasi menggunakan PCA, serta evaluasi menggunakan silhouette score.
Hasil analisis menunjukkan bahwa K-Means dan K-Medoids memberikan hasil clustering yang paling stabil dan mudah diinterpretasikan, sementara DBSCAN efektif dalam mendeteksi outlier. Mean Shift menunjukkan sensitivitas terhadap parameter bandwidth, dan Fuzzy C-Means memberikan fleksibilitas dalam keanggotaan cluster.
Implementasi MANOVA dan MANCOVA pada Analisis Faktor yang Mempengaruhi Nilai Akademik Siswa
Dokumen ini berisi analisis multivariat menggunakan dataset Student Alcohol Consumption dari Kaggle. Analisis meliputi MANOVA dan MANCOVA untuk memahami hubungan antar variabel terhadap nilai akhir siswa.
Analisis Multivariat Concrete Compressive Strength
Dokumen ini berisi analisis multivariat menggunakan dataset Concrete Compressive Strength dari UCI Machine Learning Repository. Analisis meliputi correlation matrix, variance–covariance matrix, serta perhitungan eigenvalue dan eigenvector untuk memahami hubungan antar variabel komposisi campuran beton dan kuat tekan beton.