Recently Published
Recruit Restaurant Visitor Forecasting by Kaggle
Be my guest - Recruit Restaurant EDA from Kaggle
R을 사용한 K-means 군집분석
K-means 군집 분석은 비계층적 군집 분석 방법을 이용하여 대상간의 유사도, 거리를 측정하는 방법입니다.
R 코딩 스타일 가이드라인
R 코딩 스타일은 코드를 작성할 때의 편집 규약이다. 소스코드의 가독성을 높이고, 유지보수를 쉽게 해주는 스타일에 대한 가이드라인을 제시한다.
빅데이터 분류분석 II
라쏘, 랜덤 포레스트, 부스팅 등
빅데이터 분류분석 1
기본 개념과 로지스틱 모형
testDocument
testsdfd
R에서 통계분석기법을 이용한 가설 검정
R을 통해 기술 통계와 추론 통계을 실행하기 위해 t 검정, 상관분석을 실행해 봅시다
R을 사용한 의사결정나무 분석
분류 및 예측은 데이터 분석의 중요한 카테고리 중 하나이면서, 실제 비즈니스에서도 많이 필요로 하는 분야입니다. 분류 및 예측을 위한 다양한 데이터 지도학습 기법 중 가장 직관적으로 이해할 수 있는 의사결정나무에 대해 소개해 보려고 합니다.
R에서 데이터 정제하기 (결측치, 이상치)
현장에서 만들어진 셀제 데이터는 오류를 포함하고 있기때문에 분석전 오류를 수정해야 합니다. dplyr 패키지를 활용하여 데이터 오류를 찾아 정제해 보시기 바랍니다.
R에서 자유자재로 데이터 가공하기!
보통 데이터 과학자의 데이터 분석 작업 시간의 70~80% 이상은 데이터 가공에 소요 됩니다. 거꾸로 생각하면 이 말은 데이터 가공을 잘하면 데이터를 분석하는 시간을 70~80% 줄일수 있다는 것입니다!
이런 데이터 전처리(Data Preprocessing)을 통해 데이터 일부를 추출하거나, 종류별로 나누거나, 여러 데이터를 합치는 등 데이터이를 자유롭게 가공할 수 있어야 목적에 맞게 분석할 수 있습니다.
ggplot2와 trelliscopejs의 환상적인 조합
ggplot2의 시각화 화면을 trelliscopejs 패키지를 이용하여 좀더 다이나믹하게 바꿔보자!
manhattanly R package Example
The required columns to create a manhattan plot are the chromosome, base-pair position and p-value. By default, the manhattanly function assumes these columns are named CHR, BP and P (but these can be specified by the user if they are different)
Create an interactive manhattan plot using one command:
Multiple Regression Model with package moonBook2
originated from moonBook2
moonBook2 Test
Originated from https://github.com/jmhome/moonBook2.git