gravatar

victoria_vargas

Victória Vargas

Recently Published

Análise Multivariada - Atividade 03
A análise de agrupamentos ou clustering engloba um grupo de técnicas multivariadas cuja finalidade principal é agregar objetos com base nas características que eles possuem. Essa atividade consistiu no emprego de algoritmos de agrupamento para detecção de perfis de consumidores de crédito. Foi utilizado o dataset default of credit card clients.xls, retirado do Machine Learning Repository da University of California, Irvine (UCI), que contém dados pessoais e bancários de consumidores em Taiwan abrangendo o período de abril a setembro de 2005. PALAVRAS-CHAVE: agrupamento, clustering, PAM, CLARA, distância, Gower, Euclidiana
Análise Multivariada - Atividade 02
À medida que empregamos técnicas multivariadas, por sua própria natureza, o número de variáveis aumenta. E à medida que o número de variáveis aumenta, cada vez mais a sobreposição (ou seja, correlação) acontece entre as mesmas. Quando variáveis se tornam correlacionadas, o pesquisador precisa de caminhos para gerenciá-las – agrupando variáveis altamente correlacionadas, rotulando ou nomeando os grupos, e talvez até mesmo criando uma nova medida composta que possa representar cada grupo de variáveis. A análise fatorial fornece ferramentas para analisar a estrutura das inter-relações (correlações) em um grande número de variáveis, definindo conjuntos de variáveis que são fortemente inter-relacionadas, conhecidos como fatores. Esses grupos de variáveis (fatores) são considerados como representantes de dimensões dentro dos dados. O dataset food é composto por medidas relacionadas a características de uma classe de alimentos conhecida como pastry. O objetivo dessa atividade foi realizar uma análise fatorial com as variáveis do dataset food. PALAVRAS-CHAVE: analise fatorial
Análise Multivariada - Atividade 01
A concentração média anual de dióxido de enxofre, em microgramas por metro cúbico, é uma medida da poluição do ar em cidades. Utilizando uma base de dados relativa à poluição do ar de 41 cidades dos EUA, a questão de interesse aqui é quais ou como os aspectos do clima e da ecologia humana medidos pelas outras seis variáveis influenciam a poluição? PALAVRAS-CHAVE: PCA, MDS, t-SNE