gravatar

fjp

Fundação João Pinheiro

Recently Published

Tutorial Transformação Digital nº14 - Consolidação de arquivos
Este documento R Markdown demonstra como ler, combinar e salvar arquivos de diferentes formatos (CSV, TXT, XLS e XLSX) contidos na pasta Planilhas. Combina todos os data frames obtidos em um único data frame utilizando do.call com rbin. Salva o data frame consolidado em um arquivo .csv.
Tutorial Transformação Digital nº13 - Pré-Processamento de Texto
A análise de texto é uma técnica amplamente utilizada para extrair informações valiosas de grandes volumes de dados textuais. Neste documento demonstramos como realizar a limpeza dos dados, criar um corpus textual, gerar uma matriz termo-documento e construir uma nuvem de palavras para visualizar os termos mais frequentes. O objetivo é mostrar como estruturar e analisar dados textuais de forma eficiente, utilizando um conjunto de técnicas de text mining.
Tutorial Transformação Digital nº12 - Regressão Logística
Este tutorial sobre Regressão Logística em R abrangeu desde a introdução e preparação do ambiente até a construção e avaliação do modelo usando dados fictícios. Exploramos a interpretação dos coeficientes, a odds ratio, a significância estatística e a previsão em novos dados. Concluímos com um resumo dos aprendizados e limitações da técnica.
Tutorial Transformação Digital nº11 - Regressão Linear
Neste tutorial são abordados alguns conceitos sobre regressão linear, incluindo regressão linear simples e múltipla e análise, utilizando a linguagem e ambiente de computação estatística R. São apresentados alguns exemplos práticos com os respectivos códigos na linguagem R.
Tutorial Transformação Digital nº 10 - Modelo de Equações Simultâneas
Modelos de equações simultâneas são ferramentas estatísticas usadas para entender e analisar sistemas onde várias variáveis dependentes são inter-relacionadas, ou seja, onde uma variável pode ser simultaneamente causa e efeito de outras variáveis dentro do mesmo sistema. Esse documento aborda esses modelos.
Tutorial Transformação Digital nº 9 - Decomposição de Séries Temporais
Neste documento, exploraremos os conceitos teóricos da decomposição de séries temporais, apresentando uma aplicação prática utilizando um dado econômico brasileiro.
Tutorial Transformação Digital nº 8 - Análise Espacial da Cobertura Vacinal
Neste tutorial, exploramos a cobertura vacinal nos municípios de Minas Gerais.
Tutorial transformação digital nº 7 - CensoBr
Neste tutorial exploramos o pacote censobr que permite o acesso a dados do Censo diretamente no R.
Tutorial transformação digital nº 6 - Imputação em séries temporais
Neste tutorial são abordados alguns conceitos sobre séries temporais e procedimentos para imputação de dados em séries temporais utilizando a linguagem e ambiente de computação estatística R. São apresentados alguns exemplos práticos com os respectivos códigos na linguagem R.
Tutorial transformação digital nº 5 - Introdução às Técnicas de Imputação
Este tutorial aborda técnicas de imputação e o pacote VIM que, além de utilizar métodos de visualização, possui métodos de imputação implementados para imputar valores ausentes e suspeitos.
Tutorial transformação digital nº 4 - ACP
Este tutorial aborda a análise de componentes principais (ACP) em R. Exploraremos os conceitos fundamentais da ACP e demonstraremos como implementá-la em R. O tutorial inclui exemplos práticos e código fonte para ajudar os leitores a compreender e aplicar a ACP em seus próprios projetos de análise de dados.
Tutorial Transformação Digital nº 3 - Validate
Neste tutorial, exploramos o poderoso pacote validate do R, que é uma ferramenta essencial para validar dados e garantir a qualidade dos resultados em projetos. O pacote validate oferece uma variedade de funções que nos permitem verificar a validade dos dados criando regras de crítica.
Tutorial Transformação Digital nº 2 - DataMaid
Neste tutorial, você aprenderá como utilizar o pacote DataMaid no ambiente R para a preparação de dados, uma etapa crucial na análise de dados. O DataMaid é uma ferramenta poderosa que auxilia na verificação e limpeza de dados, fornecendo um documento para análise da estrutura dos dados. Ele é capaz de identificar diversos tipos de erros e inconsistências nos dados, como classes incorretas, duplicatas, inconsistências de capitalização, valores improváveis, espaços em branco, indicadores de falta não reconhecidos e muito mais.
Tutorial de Transformação Digital nº1 - Gini
Este tutorial aborda o cálculo e visualização do Índice de Gini, uma medida estatística amplamente utilizada para avaliar a desigualdade na distribuição de renda em populações ou regiões. O Índice de Gini varia de 0 (igualdade perfeita) a 1 (desigualdade máxima) e é essencial para economistas, pesquisadores e formuladores de políticas públicas compreenderem a desigualdade socioeconômica.