책소개
“서울이 가장 더웠던 날은 언제였을까?”
“우리 동네에는 남성과 여성 중 어떤 성별이 더 많이 살고 있을까?”
”출근 시간대 사람들이 가장 많이 타고 내리는 역은 어디일까?“
데이터 분석의 시작은 관심 있는 데이터에 호기심을 가지는 것부터입니다. 이 책은 기온, 인구, 대중교통 같은 공공데이터를 활용한 데이터 분석 프로젝트를 진행합니다. 데이터 다운로드부터 정제, 문제 해결 방법 구상, 파이썬 코드로 구현까지 차근차근 진행하면서, 초보자가 데이터 분석의 성공적인 첫걸음을 내딛도록 도와줍니다. 이어서 막대그래프 그리기, 파이 차트 그리기, 버블 차트 그리기 같은 다양한 시각화 방법부터 numpy, pansdas 같은 라이브러리 활용법까지 다룹니다. 최소한의 파이썬 문법만을 사용하여 설명하므로 프로그래밍 경험이 적은 사람도 충분히 따라 할 수 있습니다. 이제 데이터 분석 전문가가 아니어도, 자신의 업무에서, 일생생활 속에서, 다양한 데이터를 스스로 분석하여 가치를 얻는 즐거움을 경험해 보세요!
1. 데이터 분석 실행 환경 만들기
데이터 분석에 필요한 아나콘다를 설치하고 환경 설정을 합니다.
2. 공공/오픈데이터를 활용한 실생활 프로젝트 실습하기
기온 공공데이터, 인구 공공데이터, 대중교통 데이터를 활용해서 질문을 던지고 질문의 답을 찾습니다. 또 꺾은선 그래프, 막대그래프, 항아리 그래프, 파이 차트 등 다양한 형태로 데이터를 시각화하고 분석하면서 나만의 인사이트를 발견합니다.
3. 파이썬 라이브러리 활용하기
데이터 분석 분야에서 가장 많이 사용되는 파이썬 라이브러리인 numpy, pandas를 활용해 프로젝트를 진행합니다.
저자소개
성균관대학교를 졸업하고 현재 도담중학교에서 정보 교사로 재직 중이다. 재미있는 수업 속에서 의미 있는 배움이 이루어지는 교실을 교육 비전으로 삼고 있으며, 정보 교육으로 세상을 변화시킬 수 있다는 믿음으로 교사들과 소통하며 더 나은 교육을 고민하는 중이다. 2015 SEF(SoftwareEduFest) 특별상, 2016 SW교육수기 우수상, 2017 정보과학인재양성 우수교사 선정, 2018 SW교육활성화 유공 표창을 받았으며, 저서로는 《소프트웨어와 함께 하는 창의력여행-중학교》(교육부, 2016), 《엔트리》(한빛미디어, 2016), 《진짜! 코딩 교과서》(동아출판, 2018) 등이 있다.
목차
Part 1. 기온 공공데이터
Unit 1 기온 데이터 분석 시작하기
Unit 2 서울의 기온 데이터 분석하기
Unit 3 서울이 가장 더웠던 날은 언제였을까
Part 2. 데이터 시각화 기초
Unit 4 기본 그래프 그리기
Unit 5 내 생일의 기온 변화를 그래프로 그리기
Unit 6 기온 데이터를 다양하게 시각화하기
Part 3. 인구 공공데이터
Unit 7 우리 동네 인구 구조 시각화하기
Unit 8 인구 구조를 다양한 형태로 시각화하기
Unit 9 우리 동네 인구 구조를 파이 차트로 나타내기
Unit 10 우리 동네 인구 구조를 산점도로 나타내기
Part 4. 대중교통 데이터 프로젝트
Unit 11 대중교통 데이터 시각화하기
Unit 12 지하철 시간대별 데이터 시각화하기
Part 5. 파이썬 데이터 분석 라이브러리를 활용한 프로젝트
Unit 13 숫자 데이터를 쉽게 다루게 돕는 numpy 라이브러리
Unit 14 numpy를 활용한 나만의 프로젝트 만들기
Unit 15 테이블 형태의 데이터를 쉽게 다루도록 도와주는 pandas 라이브러리
부록: 파이썬 병아리반