책소개
※ 이 책은 PDF 북이므로 화면이 작은 단말기(스마트폰)에서는 보기 불편합니다. ※
통계, 프로그래밍을 1도 몰라도 데이터를 혼자서 다룰 수 있다!
데이터 분석 프로젝트 전 과정 수록!
데이터 분석을 처음 시작한 초보자도 어깨춤을 추며 데이터를 혼자 다룰 수 있게 한다는 강의가 책으로 출간되었다. 통계, 프로그래밍, 데이터 분석을 전혀 몰라도 「Do it! 쉽게 배우는 R 데이터 분석」을 통해 R로 최근 주목받고 있는 데이터 분석 기법들을 재미있게 배울 수 있다. 이 책은 데이터 정제, 가공, 분석부터 그래프 그리기까지 실제 현업에서 데이터 분석 프로젝트를 할 때와 같은 모든 과정을 직접 해볼 수 있다. 쉬운 예제부터 차근차근 실습을 하다 보면 어렵게 느껴졌던 R 코드에 익숙해지고, 끝에 가서는 자신만의 훌륭한 데이터 분석 프로젝트를 완수하게 된다!
목차
첫째마당 R이랑 친해지기
01 안녕, R?
01-1 R이 뭔가요? - R 이해하기
01-2 R이 강력한 이유
02 R 데이터 분석 환경 만들기
02-1 R과 R 스튜디오 설치하기
02-2 R 스튜디오와 친숙해지기
02-3 프로젝트 만들기
02-4 유용한 환경 설정
03 데이터 분석을 위한 연장 챙기기
03-1 변하는 수, ‘변수’ 이해하기
03-2 마술 상자 같은 ‘함수’ 이해하기
03-3 함수 꾸러미, ‘패키지’ 이해하기
둘째마당 본격 실습! 데이터 갖고 놀기
04 데이터 프레임의 세계로!
04-1 데이터는 어떻게 생겼나? - 데이터 프레임 이해하기
04-2 데이터 프레임 만들기 - 시험 성적 데이터를 만들어 보자!
04-3 외부 데이터 이용하기 - 축적된 시험 성적 데이터를 불러오자!
[정리하기]
05 데이터 분석 기초! - 데이터 파악하기, 다루기 쉽게 수정하기
05-1 데이터 파악하기
05-2 변수명 바꾸기
05-3 파생변수 만들기
[정리하기]
[분석 도전!]
06 자유자재로 데이터 가공하기
06-1 데이터 전처리 - 원하는 형태로 데이터 가공하기
06-2 조건에 맞는 데이터만 추출하기
06-3 필요한 변수만 추출하기
06-4 순서대로 정렬하기
06-5 파생변수 추가하기
06-6 집단별로 요약하기
06-7 데이터 합치기
[정리하기]
[분석 도전!]
07 데이터 정제 - 빠진 데이터, 이상한 데이터 제거하기
07-1 빠진 데이터를 찾아라! - 결측치 정제하기
07-2 이상한 데이터를 찾아라! - 이상치 정제하기
[정리하기]
08 그래프 만들기
08-1 R로 만들 수 있는 그래프 살펴보기
08-2 산점도 - 변수 간 관계 표현하기
08-3 막대 그래프 - 집단 간 차이 표현하기
08-4 선 그래프 - 시간에 따라 달라지는 데이터 표현하기
08-5 상자 그림 - 집단 간 분포 차이 표현하기
[정리하기]
[꿀팁 01] 초보자가 자주 하는 실수
[꿀팁 02] 에러 메시지 이해하기
셋째마당 실전! 데이터 분석 프로젝트
09 데이터 분석 프로젝트 - ‘한국인의 삶을 파악하라!’
09-1 ‘한국복지패널데이터’ 분석 준비하기
09-2 성별에 따른 월급 차이 - “성별에 따라 월급이 다를까?”
09-3 나이와 월급의 관계 - “몇 살 때 월급을 가장 많이 받을까?”
09-4 연령대에 따른 월급 차이 - “어떤 연령대의 월급이 가장 많을까?”
09-5 연령대 및 성별 월급 차이 - “성별 월급 차이는 연령대별로 다를까?”
09-6 직업별 월급 차이 - “어떤 직업이 월급을 가장 많이 받을까?”
09-7 성별 직업 빈도 - “성별로 어떤 직업이 가장 많을까?”
09-8 종교 유무에 따른 이혼율 - “종교가 있는 사람들이 이혼을 덜 할까?”
09-9 지역별 연령대 비율 - “노년층이 많은 지역은 어디일까?”
넷째마당 R로 하는 다양한 데이터 분석의 세계
10 텍스트 마이닝
10-1 힙합 가사 텍스트 마이닝
10-2 국정원 트윗 텍스트 마이닝
11 지도 시각화
11-1 미국 주별 강력 범죄율 단계 구분도 만들기
11-2 대한민국 시도별 인구, 결핵 환자 수 단계 구분도 만들기
12 인터랙티브 그래프
12-1 plotly 패키지로 인터랙티브 그래프 만들기
12-2 dygraphs 패키지로 인터랙티브 시계열 그래프 만들기
13 통계 분석 기법을 이용한 가설 검정
13-1 통계적 가설 검정이란?
13-2 t 검정 - 두 집단의 평균 비교
13-3 상관분석 - 두 변수의 관계성 분석
14 R Markdown으로 데이터 분석 보고서 만들기
14-1 신뢰할 수 있는 데이터 분석 보고서 만들기
14-2 R 마크다운 문서 만들기
15 R 내장 함수, 변수 타입과 데이터 구조
15-1 R 내장 함수로 데이터 추출하기
15-2 변수 타입
15-3 데이터 구조
[정리하기]
16 데이터 분석 기술을 효율적으로 익히는 방법
15-1 집중할 방향 정하기
15-2 데이터 분석 기술을 효율적으로 익히는 방법
15-3 오픈 소스 생태계와 어울리기
정답
찾아보기