Recently Published
Document - RMD (HTML)
Résumé :
Cet article explore les méthodes de régression Ridge et Lasso pour prédire les salaires des joueurs de baseball en fonction de certaines statistiques liées à leurs performances. L'auteur guide les lecteurs à travers les étapes de préparation des données, l'estimation des paramètres avec les fonctions glmnet et cv.glmnet, et l'évaluation des modèles avec une division de l'échantillon en ensembles d'apprentissage et de test.
Conclusion :
L'article conclut en soulignant l'importance de choisir judicieusement entre la régression Ridge et Lasso en fonction des données spécifiques et de leurs caractéristiques. Les résultats de l'évaluation comparative aident les lecteurs à comprendre les forces et les limitations de chaque méthode dans ce contexte particulier.
Lecteurs Cibles :
Les praticiens de la statistique, les chercheurs en apprentissage automatique, et toute personne intéressée par l'application des techniques de régularisation pour améliorer la précision des modèles de régression.
Document - RMD (HTML)
Résumé :
Cet article se penche sur l'application de méthodes de classification supervisée, notamment les k-nearest neighbors (k-NN), la régression logistique, et les machines à vecteurs de support (SVM). À travers des données de tumeurs représentant différents types de cancer, l'objectif est d'identifier le type de tumeurs en se basant sur les données d'expression génique.
Conclusions :
L'article souligne l'importance de choisir la méthode de classification appropriée en fonction de la nature des données. Il met en évidence les avantages et les limites de chaque méthode, fournissant ainsi des informations utiles pour les praticiens de l'apprentissage supervisé.
Lecteurs Cibles :
Les chercheurs, les professionnels de l'apprentissage automatique, et toute personne intéressée par l'application pratique des méthodes de classification supervisée sur des données biologiques complexes.
Document - RMD (HTML)
Résumé :
Cet article explore les intrications entre le poids corporel, la taille, l'activité physique régulière, et les régimes amaigrissants. En trois phases distinctes, nous abordons la corrélation entre le poids et la taille, l'influence de l'activité physique, et enfin, l'évaluation des régimes en considérant des aspects tels que l'endogénéité et la causalité inverse.
* Conclusions : L'article souligne l'importance de comprendre les relations complexes entre les variables, en mettant en lumière les nuances derrière les associations statistiques. Il insiste sur la nécessité de considérer la causalité inverse et l'endogénéité pour tirer des conclusions robustes à partir des modèles de régression.
* Lecteurs Cibles : Les professionnels de la statistique, les chercheurs en sciences sociales, et toute personne intéressée par l'application pratique des méthodes de régression pour comprendre les relations complexes entre les variables.
Document HTML - RMD
This article provides a comprehensive and intricate examination of panel data analysis utilizing the R programming language, encompassing a diverse array of statistical methodologies. The elucidation encompasses the intricacies of fixed effects and random effects models, ordinary least squares (OLS) regression, the least squares dummy variable (LSDV) model, and an array of sophisticated diagnostic tests. The exhaustive content delves into advanced statistical evaluations, such as the Hausman test, assessments for time-fixed effects, random effects models, and tests pertaining to serial correlation, unit roots, cross-sectional dependence, and heteroskedasticity, thereby offering an extensive and sophisticated exploration of panel data analytics within the realm of statistical research.
Document HTML - RMD
Ce fichier HTML est un exemple de la puissance de R pour créer des visualisations graphiques animées et interactives. Explorez, découvrez et plongez dans les données d'une manière que les chiffres statiques ne peuvent pas offrir. Profitez de cette expérience visuelle unique et éducative.
Document - RMarkdown (RMD)
Ce document HTML présente une analyse rigoureuse de la régression linéaire multiple et des techniques de visualisation dynamique. Il offre un aperçu détaillé des relations complexes entre plusieurs variables. De plus, il explore la distribution des données à travers des outils visuels tels que les Ridgeline Plots, les Boxplots, les Violin Plots et les Swarm Plots. Ce document est une ressource précieuse pour ceux qui souhaitent approfondir leur compréhension des données et tirer des insights significatifs.
Document - RMarkdown (RMD)
Régression Linéaire Multiple - data = iris. Je n'y régressé la variable "Sepal.Length" sur les variables "Sepal.Width + Petal.Length + Petal.Width" - visualisations graphiques et diagnostiques avec leurs interprétations respectives
Document
Régressant le prix da la maison sur la surface au sol de celle-ci, provenant des données "houseprices" du package "DAAG" sous R (Visualisations, Représentations Graphiques, Vérifications des Hypothèses d'une Régression Linéaire Simple à travers des diagnostics/tests et Interprétations)
Régression Linéaire Simple
Appliquant "LMS" sur une base de données existante sous R "mtcars" en y vérifiant la validité du modèle pris là-dans
Document
Économétrie de Données de Panel (Base de données "Grunfeld du package "AER") sous R-Markdown en utilisant le modèle "pooling" (Exemple d'une régression linéaire multiple) - HTML
Document
Quelques exemples de probabilités faits sous R-Markdown