Recently Published
SQL : 데이터 분석을 위한 SQL
빅데이터 분석을 위한 SQL (업데이트 중...)
CSI : San Francisco Crime Classification
샌프란시스코에서 발생한 범죄 데이터를 바탕으로 지역의 범죄 특성을 분석(시간, 장소, 범죄 종류 등을 파악)하고, 범죄가 벌어질 지 예측 (업데이트 중...)
Korea Welfare
한국복지환경 데이터를 통해 알아본 한국인의 삶 (업데이트 중...)
Department Store : Maketing and Predictig
H백화점의 매출/고객 데이터를 활용해 고객의 특성을 분석하고, 고객의 구매 여부와 성별을 예측하는 프로젝트 (업데이트 중...)
Bank : Marketing Analytics
1. 은행의 고객 데이터를 바탕으로 고객 특성을 분석 2. 나이, 직업, 결혼 여부 등의 고객 정보 및 마케팅 이력을 통해 고객의 정기예금 가입 여부를 예측 (Yes / No)
Bank : Forecasting of Customer's Purchasing Intention
1. 은행의 고객 데이터를 바탕으로 고객 특성을 분석 2. 나이, 직업, 결혼 여부 등의 고객 정보 및 마케팅 이력을 통해 (목표)고객의 신규(목표)상품 가입 여부를 예측 (Yes / No)
Kickstarter : Project Data Analysis
1. 세계 최대 Crowdfunding 업체인 Kickstarter에서 진행된 프로젝트들의 다양한 요소들을 분석 2. 고객과 성공적인 프로젝트의 특성을 분석하고 프로젝트와 비즈니스의 성공을 위한 제안 제시
Lending Club : Credit Risk Modeling [CSS: EDA, Classification]
1. Lending Club(미국 최대의 핀테크 업체)의 고객의 대출 데이터를 바탕으로 고객 특성을 분석 2. 과거 대출 이력, 채무 불이행 여부, 신청자의 개인 정보(나이, 결혼 여부, 소득, 자가/전세 여부, 은행 잔고, 연체 금액) 등의 고객 정보를 통해 신청자의 채무 불이행 여부를 예측 (Yes / No)
Bank : Santander Product Recommendation
1. 자사의 금융 서비스를 이용하는 고객들의 특성 분석 2. 고객의 과거 이력과 유사한 고객군들의 데이터를 기반으로 다음달에 해당 고객이 무슨 상품을 사용할지 예측하고, 맞춤형 상품 추천을 제공 3. 고객의 만족도를 높임과 동시에 은행 매출에 기여
Social Science : Sudent alcohol consumption
중학생들의 사회적 정보, 성별, 학습 정보 등의 다양한 데이터를 기반으로 학생의 시험 성적을 예측
Airbnb : Weekdays make people wanted travel.
1. airbnb에 가입한 고객 데이터를 바탕으로 고객 특성을 분석 (전환율, 예약요일) 2. 나이, 성별, 사용기기, 기존 사용자들의 예약 내역 등의 고객 정보를 통해 고객의 예약을 하지 않은 고객이 예약할 장소를 예측
House : Predict house price using ML
1. 2014년 5월~ 2015년 5월의 시애틀 킹 카운티의 주택 실거래가 정보를 바탕으로 주택 가격에 영향을 미치는-상관관계를 가지는-변수를 파악 2. 집의 크기, 상태, 방의 개수, 전망, 지어진 시기 등 다양한 정보를 바탕으로 집의 가격을 예측
분석을 토대로 머신 러닝 모델을 적용하여 주택 가격 예측
Bike : Forecast use of a city bikeshare system
1. 미국 워싱턴의 Capital Bikeshare 데이터를 활용하여 고객의 특성을 분석 2. 시간, 날씨, 휴일, 회원 여부 등의 정보를 바탕으로 워싱턴 DC의 자전거 교통량(시간당 자전거 대여량)을 예측
Kickstarter : Business data anaysis report
킥스타터에서 제공하는 API를 통해 데이터를 크롤링한 다음에 그동안 진행되어왔던 수많은 프로젝트를 분석하며 추가로 (비즈니스적으로) 성공하기 위한 제안까지 제시
Netflix Culture : Freedom & Responsibility
넷플릭스라는 기업의 조직문화를 살펴보면서, 지속가능하면서도 발전적인 조직 문화를 만드는데 기여하는 구성원(Growth Hacker)이 되고자 함.
Titanic : Machine Learning from Disaster
1. 타이타닉에 탑승한 사람들의 데이터를 바탕으로 특성을 분석 2. 이름, 나이, 객실 등급, 운임요금, 가족의 형태 등의 정보를 통해 승객의 생존 여부를 예측 (Yes / No)
Social Science : Why do some people cheat on their spouses?
주부들을 대상으로 설문 조사를 통해 파악해 배우자 몰래 다른 데에서 파트너를 찾게 되는 사람들의 특징과 외도를 경험할 때 중요하다고 생각되는 많은 요소 중 가장 중요한 요소를 파악
Hospital : Breast Cancer Wisconsin
비정상 유방 종양이 포함된 여성의 조직검사 세포 측정치에 각 머신러닝 알고리즘을 적용(자동화된 검사를 통)해 주관적인 요소를 없애고 보다 (정확도) 높은 유방암 진단 시스템 구축
German bank loan : Identifying risky bank loans using Machine Learning
Identifying risky bank loans using Machine Learning
Statistics : Statistics for Data Science
기초 통계부터 시작해서 머신러닝 알고리즘까지 공부하며 정리한 내용들
Retail&Commerce : Finding Patterns - Market Basket Analysis Using Association Rules
1. 온라인, 오프라인 마트의 거래(transaction) 데이터를 기반으로, 구매 패턴을 파악하는 '장바구니 분석(Market Basket Analysis)'을 진행 2. 패턴을 파악해서 고객의 구매 행동 유도(추천 및 판촉 활동), 재고 최적화, 매장의 배치 구성 등에 활용(이 외에도 영화 추천이나 연애 사이트, 약품 사이에 위험한 상호 작용을 찾는 것까지 다양한 유형의 문제에도 적용 가능)
Titanic: Machine Learning from Disaster (타이타닉 생존 예측)
1. 타이타닉에 탑승한 사람들의 데이터를 바탕으로 특성을 분석 2. 이름, 나이, 객실 등급, 운임요금, 가족의 형태 등의 정보를 통해 승객의 생존 여부를 예측 (Yes / No)
Rossman Store : Sales Report
1. 유럽의 7개국에서 3,000개의 (한국의 올리브 영 같은 ) 매장에서 수집된 데이터를 바탕으로 비즈니스 특성을 분석 후, 각 부서(마케팅, 영업, 투자 전략, 현장)에 의사 결정에 도움이 되는 보고서를 제공
Lending Club : Identifying Risky Credit Loans
1. Lending Club(미국 최대의 핀테크 업체)의 고객의 대출 데이터를 바탕으로 고객 특성을 분석 2. 과거 대출 이력, 채무 불이행 여부, 신청자의 개인 정보(나이, 결혼 여부, 소득, 자가/전세 여부, 은행 잔고, 연체 금액) 등의 고객 정보를 통해 신청자의 채무 불이행 여부를 예측 (Yes / No)