gravatar

MrCristianrl

Cristian

Recently Published

K-means clustering with iris dataset in R
Brief introduction to K-means clustering algorithm in R working with iris dataset.
Applying Support Vector Machines to our dataset
Short project working with the support vector machines method trying to predict classes from lendingclub dataset. This dataset contains 13 different features to build the model.
Árboles de decisión y bosques aleatorios
Pequeño proyecto usando los métodos de árboles de decisión y bosques aleatorios para predecir si las universidades son públicas o privadas.
Trees and Random Forests
Pequeña introducción al uso de Trees y Random Forest en R.
Clasificación de las flor Iris mediante el método de KNN
Pequeño proyecto donde trabajamos con el dataset iris para usar el método de los K Nearest Neighbors para clasificar las distintas variaciones morfológicas.
K-vecinos más cercanos
Introducción al método de los K-vecinos más cercanos y puesta en práctica con el dataset de Caravans del paquete ISLR: desde su sintaxis hasta su posterior búsqueda del valor k más óptimo para minimizar el error del modelo.
Ejemplo de regresión logística para predecir ingresos en población americana.
Ejemplo del uso del modelo de regresión logística para predecir los ingresos de los diferentes habitantes de América del Norte y América del Sur. En este proyecto vemos desde el tratamiento del dataset para la limpieza de datos como la visualización de diferentes gráficas para intentar detectar diferentes comportamientos. Al final, usaremos el modelo de regresión logística para predecir los ingresos y valoraremos tanto su exactitud como precisión.
Predicción de supervivencia en el viaje del Titanic
Aplicación del modelo de regresión logístico sobre el dataset de Kaggle: Titanic para predecir si un pasajero sobreviviría o no en función de las distintas variables presentes en el dataset.
Regresión lineal para el alquiler de bicicletas
Proyecto para el uso del paquete ggplot2 para visualización de datos a lo largo del tiempo en el alquiler de bicicletas en Washington D.C. y el modelo lineal para el intento de predecir el alquiler de bicicletas.
Regresión lineal
Práctica donde se utiliza el modelo de regresión lineal para predecir las notas del tercer trimestre en matemáticas. Aquí vemos la sintaxis básica de la regresión lineal en R y cómo tratar los datos antes de llevar a cabo el modelo así como su posterior interpretación.
Análisis de jugadores de baseball para los Oakland A's.
Proyecto en búsqueda de 3 jugadores de la MLB para sustituír las bajas de Giambi, Damon y Olmedo en la temporada 2001. Inspirado en la idea que llevó a cabo Peter Brand para conseguir tal objetivo. Da lugar a la película Moneyball.
Gráfica similar a la de The Economist
Pequeño proyecto de manejo del paquete ggplot2 para la modificación de una gráfica.
Ejercicios con ggplot2
Ejercicios de ggplot2 resueltos del curso Data Science and Machine Learning Bootcamp with R colgado en Udemy:
Modificar temas en ggplot2
Práctica para modificar temas de las gráficas con ggplot2
Coordenadas y multi gráficos con ggplot2
Práctica para modificar los ejes de coordenadas y obtener varias gráficas en función de una variable.
Representación de 2 variables en ggplot2
Práctica con las funciones geom_bin2d(), geom_density2d() y geom_hex() para la representación de dos variables con ggplot2.
Boxplots con ggplot2
Quinta práctica con el paquete ggplot2 para la creación de diagramas de cajas.
Bar plot con ggplot2
Cuarta práctica con el paquete ggplot2. En esta ocasión se trata cómo generar un bar plot para graficar variables discretas.
Scatterplot con ggplot2
Tercera práctica con el paquete ggplot2. En este caso creación de una gráfica de puntos.
Histograma con ggplot2
Práctica para la creación de un histograma con ggplot2. Veremos desde el manejo básico de la sintaxis para un histograma hasta una edición básica para modificar el histograma final.
Práctica con ggplot2
Primera práctica con ggplot2