gravatar

SERGIO_ROMERO_NINA

SERGIO RICHARD ROMERO NINA

Recently Published

PRACTICA 6 CDAJ-SRRN
I. En base a un dataset de nuestra preferencia, mostremos la relación entre dos variables continuas o numéricas usando un gráfico de dispersión (vía geom_point()) y expliquemos lo que muestra el gráfico. Vale usar el dataset que hemos presentado en este capítulo, pero tendrá mucha más gracia jugar con algún otro. Realicemos un modelo de regresión lineal para esas dos variables. Describamos los resultados, ofreciendo una interpretación. Mostremos la relación entre una variables categórica y otra continua/numérica, con un gráfico boxplot (mediante geom_boxplot()) o un gráfico de puntos “sacudidos” (mediante geom_jitter()). Expliquemos lo que muestra el gráfico. Realicemos un modelo de regresión lineal para esas dos variables, describiendo los resultados sin olvidar interpretarlos. V. Realicemos una regresión lineal con la variable a predecir de I o III, junto con otras adicionales. Es decir, realizar una regresión con múltiples variables predictoras. Describamos los resultados, interpretándolos. ¿En qué cambian respecto al modelo que usa sólo un predictor?
PRACTICA 5 CDAJ-SRRN
I. Utilizando la información disponible en el dataset de delitos, creemos un gráfico un gráfico de líneas con geom_line() que muestre el ritmo horario para cada tipo. ¿Qué patrones se vislumbran? ¿Qué franja horaria representan la “hora pico” (u “hora punta”) para cada categoría? Volvamos al mapa de puntos que realizamos en la seción 5.1.2, donde ajustamos los atributos “color”, “size” y “alpha” para mejorar los resultados, además de probar con facetados y mapas de densidad. ¿Qué otras técnicas podemos usar para lidiar con el exceso de información volcada en pantalla? Sugerencia: intentar con geom_count(), que se emplea de forma similar ageom_point() (véase https://ggplot2.tidyverse.org/reference/geom_count.html)
PRACTICA 4 CDAJ-SRRN
1. En la última tabla pudimos ver en concreto quién habló y cuántas veces lo hizo. Pero notemos que aparecen algunos “del” y “de” sueltos… ¡falta el resto de esos apellidos!. ¿Cómo podríamos identificarlos y contarlos de modo separado a "DE LA SOTA, NATALIA", "DE LOREDO, RODRIGO", "DEL PLA, ROMINA", etc? 2. Descarguemos un tomo de jurisprudencia de la Corte Suprema de Justicia de la Nación (https://sjservicios.csjn.gov.ar/sj/tomosFallos.do?method=iniciar), o la similar en otros países, y extraigamos las citas a precedentes: "Fallos xxx:xxx
PRACTICA 3 CDAJ
Tomemos un dataset, y efectuemos las transformaciones necesarias para luego crear las siguientes visualizaciones: Scatter plot, o gráfico de dispersión: Mostrar correlación entre 2 variables numéricas. Gráfico de Barras: Comparar variables categóricas. Gráfico de Barras: Comparar variables categóricas mostrando la composición interna de las mismas. Histograma: Mostrar la distribución de una variable continua. Realicemos una versión facetada (con facet_wrap()) de cada tipo de gráfico. Pongamos a cada visualización su título, subtítulo, etiquetas en los ejes, nombre descriptivo en la leyenda y nota al pie.
PRACTICA 2 CDAJ
Tomamos otro dataset (potenciar-trabajo-listado-titulares-2022-10-01), como el que descargamos durante los ejercicios del capítulo anterior, e intentemos: usar select() para seleccionar ciertas columnas y/o cambiar su orden usar filter() para filtrar las filas, descartando las que no cumplan cierta condición o condiciones a elección usar arrange() para ordenar el dataframe según alguna de sus variables usar mutate() para crear una o más columnas nuevas usar en combinación group_by() y summarise() para generar un resumen del dataset, que contenga al menos 3 variables (se pueden usar medias, máximos, conteos, etc) Si antes hicimos todos los pasos por separado, ahora intentemos hacer todo el procedimiento en una sola cadena de instrucciones usando el operador pipe: %>%
PRACTICA 1 CDAJ
La primera practica de la clase de Ciencia de datos Escribamos y ejecutemos el código R necesario para: leer el archivo y asignar su contenido a una variable mostrar los nombres de sus columnas mostrar sus dimensiones (cantidad de filas y columnas) mostrar un resumen del contenido de cada una de las columnas