Easy web publishing from R
Write
R Markdown
documents in RStudio.
Share them here on RPubs.
(It’s free, and couldn’t be simpler!)
Get Started
Recently Published
Heart Disease Analysis Project
This report contains exploratory data analysis, statistical tests, and machine learning models for heart disease prediction using R.
RegistrationUpdate
RegistrationUpdate
Heart Disease Analysis Project
This report contains exploratory data analysis, statistical tests, and machine learning models for heart disease prediction using R.
Project
Purchasing Behaviour
Clasification Analysis pada Dataset Dry Bean Dry Menggunakan Metode Analisis Diskriminan dan Multinomial Logistic Regression
Analisis klasifikasi ini bertujuan untuk mengklasifikasikan jenis biji kering berdasarkan Dry Bean Dataset dari UCI Machine Learning Repository menggunakan metode regresi logistik multinomial. Dataset yang digunakan terdiri dari 13.611 observasi yang merepresentasikan tujuh kategori jenis biji kering, yaitu BARBUNYA, BOMBAY, CALI, DERMASON, HOROZ, SEKER, dan SIRA, dengan karakteristik yang diukur berdasarkan fitur geometris biji. Variabel dependen dalam analisis ini adalah jenis biji (Class), sedangkan variabel independen yang digunakan merupakan hasil seleksi variabel, yaitu AspectRatio, ShapeFactor1, ShapeFactor4, Extent, dan Solidity, yang dipilih untuk merepresentasikan bentuk biji sekaligus mengurangi masalah multikolinearitas. Data diproses melalui tahap preprocessing yang meliputi pemeriksaan missing value, penghapusan data duplikat, standarisasi variabel numerik, serta identifikasi outlier untuk memastikan kualitas data sebelum pemodelan. Model awal dibangun menggunakan seluruh variabel prediktor, kemudian dilakukan evaluasi asumsi seperti independensi observasi, multikolinearitas, dan linearitas logit untuk memperoleh model yang lebih stabil dan parsimonious. Hasil pengujian menunjukkan bahwa model akhir dengan penambahan komponen non-linear mampu memberikan performa klasifikasi yang sangat baik, dengan akurasi sebesar 92,24%, nilai Kappa sebesar 0,9061, dan nilai Pseudo R² McFadden* sebesar 0,885. Hasil analisis menunjukkan bahwa regresi logistik multinomial mampu mengklasifikasikan jenis dry bean secara akurat berdasarkan karakteristik geometris biji, sehingga metode ini efektif digunakan sebagai pendekatan klasifikasi multikelas.
Peer Assignment 2 - Reproducible Research Coursera
Peer Assignment 2 - Reproducible Research Coursera
Project 4 Document Classification
A text classification model for spam detection using Naive Bayes, built on the SpamAssassin dataset with preprocessing and document-term matrix features.