gravatar

CorentinRoquebert

Corentin Roquebert

Recently Published

Tutoriel : Constituer un corpus Europresse utilisable dans R, Iramuteq et TXM
Ce tutoriel a pour objectif de permettre facilement la constitution d’un corpus d’articles de presse à partir de la base de données Europresse, pour pouvoir ensuite en faire des analyse avec des logiciels généralistes d’analyse des données (comme R) ou des logiciels spécialisés d’analyse textuelle, comme Iramuteq ou TXM. Il présente des scripts R qui permettent de constituer un corpus sous un format "dataframe" dans R, puis propose quelques outils de nettoyage des éléments récupérés (les titres des journaux notamment) ainsi que le passage aux formats admis dans Iramuteq et TXM.