gravatar

erik4399

Erik

Recently Published

Biostatistician Technical Interview
Technical interview for working as a biostatistician.
API Idealista - Malaga
Prelievo dati tramite API da idealista in R. Analisi preliminare dei dati. Rappresentazione su mappa leaflet.
MIPC - Asset Allocator
Allocazione di portafoglio tramite ottimizzazione della frontiera efficiente. Grafici interattivi. Correlogramma. VaR. Diversificazione assi dei grafici. Decomposizione storica.
Bank fraud
Modelli per la prevenzioni di frodi bancarie. Tidymodels, random forest, glm, tuning, resamplinng. Grafici per coefficienti, matrice di confusione
Portafoglio di assicurazioni vita - Versione 1
Creazione di una funzione per la gestione di un portafoglio di assicurati con rendite vita di qualsiasi tipo (immediate, differite, vitalizie, ...). Visualizzazione del andamento del fondo e del suo rendimento. Applicazione del metodo Monte Carlo e creazione di una funzione per ottenere il valore del capitale minimo per soddisfare i requisiti di solvibilità (solvency) dell'assicurazione.
House sales - statistica (corso progredito)
Grafici geospaziali. Distribuzioni gamma, normale e quasipoisson (no distrib). Test statistici. Spline. Correlogramma. GAM, GLM e glmnet con LASSO. grafico dei coefficienti interattivo. Analisi del mmodello.
Analisi di portafoglio
Laboratorio 8
Tecniche di ricampionamento: ROSE, SMOTE, sottocampionamento e sovracampionamento. Modelli utilizzati: albero di classificazione, random forest, boosting e glm. Migliorata la funzione che fa il plot di più curve ROC su un unico grafico. Matrice di confusione di più modelli in un'unica visualizzazione
Laboratorio 7
Regressione logistica parametrica e semiparametrica. Riempimento di NA mancanti tramite funzioni autocostruite. Costruzione di procedure stepwise per selezione di modelli tramite AIC rimuovendo a ogni passo le variabili con più NA. Costruzione di una funzione per costruire la curva ROC, plottarla e calcolare AUC. Matrice di confusione e curva ROC applicata a regressione logistica e alberi di classificazione. Alberi di classificazione multivariati, plot della matrice di confusione.
Laboratorio 6
Bagging, Random Forest, Boosting, libreria Caret
Laboratorio 5
regression tree, MARS, CV tree, MSE alberi, Confronto con i modelli ridge, lasso e regressione lineare
Laboratorio 4
Splines naturali, cubiche. Generazione di dati da una spline. Modelli GAM e valutazione di essi tramite ANOVA
Apprendimento statistico dei dati - Laboratorio 3
coefplot, forestplot, funzione a gradini (cut), modelli polinomiali multipli tramite automatismi (map_df, sapply), scelta di modelli tramite anova e do.call, regressione locale (loess)
Apprendimento statistico dei dati - Laboratorio 2
Lasso, Ridge, Cross Validation, Validation Set, Glm
Apprendimento statistico dei dati - Laboratorio 1
Regressione polinomiale a confronto. Diversi gradi di polinomio sullo stesso grafico
Influenza dell'alcol nel sonno
Analisi dei dati - Compito PCA e clustering
Università degli studi di Trieste. Corso "Analisi dei dati", compito su analisi dei gruppi, PCA e clustering