gravatar

PMONIZ80

PAULO ROBERTO MONIZ

Recently Published

Uma Abordagem Prática para Avaliar o Desempenho de algoritmos para um problema de Classificação Binária em um Projeto de Machine Learning
Neste Projeto iremos abordar um quesito muito importante em Projeto de Machine Learning que é a escolha de um determinado algoritmo para um determinado problema. Neste trabalho o problema se traduz em tomar a decisão sobre qual algoritmo escolher para a construção de um modelo preditivo para um problema de Classificação Binária. Iremos abordar essa questão do início ao fim do projeto, desde a escolha de alguns algoritmos para a construção de modelos preditivos para o problema de Classificação Binária, usando técnicas de transformação dos Dados, Ajustes (Tuning) e a evolução desses modelos para melhorar a precisão (Acurácia) até atingir o limite de precisão de cada modelo,e por fim escolher aquele que possui a melhor acurácia. Para este projeto usaremos o conjunto de dados (Wisconsin Breast Cancer dataset), esse conjunto de dados representa uma amostra de tecido de câncer de mama que foram coletados de hospitais da Universidade de Wisconsin e pode ser baixado também da Internet no Repositório UCI Machine Learning. O objetivo principal do Projeto é criar um modelo que melhor preveja a Class ( benign(positivo) malignant (negativo). Embora as metodologias de teste difiram, os melhores resultados publicados parecem estar na precisão acima de 90%, entorno de 96% e 97%. A obtenção de resultados nesta faixa é o que desejamos neste projeto.
Data Analysis of Meteorological Phenomena Between 1950 and 2011
This report intends to demonstrate the effects of meteorological phenomena on the American population as storms and other severe climatic events. These phenomena can cause public and economic health problems for communities and municipalities. To perform this work, we will explore the US National Oceanic and Atmospheric Administration (NOAA) storm database. This database tracks the characteristics of major storms and climatic events in the United States and has information from the year 1950 to 2011. However, it is worth remembering that data after 1950 are more complete. This information includes when and where these events occur, as well as estimates of any fatalities, injuries and property damage. This report aims to answer some questions such as: What types of events are most harmful to the health of the population and which types of events produce the greatest economic consequences.