기초부터 응용까지 무료 통계학 eBook 19선 + α
2013-08-15
통계학 무료 eBook
인터넷은 정보의 바다입니다. 인터넷에는 통계학에 관한 자료도 일일이 셀 수 없을 정도로 많이 있습니다. 하지만 단편적인 정보가 많아 체계적인 지식의 습득에는 역시 책을 이용하는 편이 효율적이겠죠.
이번 포스팅에서는 인터넷에 무료로 공개되어있는 통계학 및 R 언어에 관한 eBook을 소개하려 합니다. 영어로 쓰인 책이 대부분입니다만, 몇몇 한글 자료도 소개합니다. 그리고 각 자료에 대한 간략한 설명은 저의 주관에 근거한 것이니 참고 정도로만 생각해 주세요.
통계학 입문
Illowsky, B., and Dean, S. Collaborative Statistics.
- 통계학 입문에서 다루어야 할 내용은 모두 들어가 있다고 해도 과언이 아님. PDF로 700페이지가 넘는 방대한 분량이지만 그만큼 내용도 충실
- 예제 및 연습문제가 풍부
- 샘플링, 기술통계, 확률 기초, 확률변수, 정규분포, 중심극한정리, 신뢰구간, 가설검정, 카이제곱 검정, 회귀분석 및 상관계수, 분산분석 등.
Diez, D., Barr, C., and Çetinkaya-Rundel, M. OpenIntro Statistics (2nd Edition).
- 입문서라 하긴 약간 어려울 수도 있음.
- 확률론, 확률변수의 분포, 연속형 이산형 데이터의 추검정, 선형회귀분석, 로지스틱 회귀분석 등.
Downey, A. B. Think Stats: Probability and Statistics for Programmers
- Python을 이용한 통계분석을 다룸
- 제목에서 알 수 있듯이 프로그래밍 경험이 있는 사람이 읽으면 이해하기 쉬움
- 통계적 사고, 분포, 확률, 가설검정, 추정, 상관분석 등. 특히 분포에 대해 많은 페이지를 할당하고 있음.
Butler, C. Statistics in Linguistics. Oxford: Basil Blackwell
- 언어학자를 위한 통계 입문서
- 절판된 책을 eBook으로 공개. 종이책을 스캔한 PDF라 가독성이 좋지 못함.
- 기술 통계에 대한 내용보다는 가설 검정에 대한 내용이 많음.
- 비모수 가설 검정법에 대해서도 약간 다루고 있음.
Yakir, B. Introduction to Statistical Thinking.
- 통계 입문서로 R 언어를 이용해 설명.
- 기술 통계, 가설검정의 기초, 선형회귀 분석 등.
- 통계 서적임에도 수식이 별로 없음. R을 이용한 처리가 중심.
Shafer, D., and Zhang, Z. Introductory Statistics.
- 기술통계, 확률분포, 추정, 검정, 선형회귀, 상관분석, 분할표 검정, 분산분석 등.
Navarro, D. Learning Statistics with R.
- 심리학도를 위한 통계
- R을 이용한 분석법 등을 설명
응용 통계학
입문서보다는 약간 더 세부 분야에 특화된 서적들입니다.
Lavine, M. (2013). Introduction to Statistical Thought.
- R을 이용해 수리 통계학적 방법을 설명
- 확률 및 통계모형 등에 대해 입문서보다는 자세히 설명되어 있음.
- 수식이 많아서 읽기 어려울 수도 있지만, R을 이용한 시뮬레이션도 있으므로 수식에 자신 없는 사람은 R 코드를 따라가는 것도 좋음.
Faraway, J. J. Practical Regression and Anova using R.
- R을 이용한 선형모형 입문서
- 분산분석 및 회귀분석에 대한 내용
- 가설검정의 기초는 알고 읽어야 함
Hyndman, R. J. and Athanasopoulos, G. Forecasting: Principles and Practice.
- 통계를 이용한 예측에 관한 내용
- 회귀분석, 시계열 분석, Exponential smoothing 등
- 통계계산은 R을 이용
Grinstead, C., and Snell, J. L. Introduction to Probability. American Mathematical Society.
- 확률론에 대한 내용
- 확률분포, 조합, 조건부확률, 대수의 법칙, 중심극한정리, Markov Chain, Random work 등
- 수식이 많음
Downey, A. B. Think Bayes: Bayesian Statistics Made Simple. Needham, MA: Green Tea Press.
- 베이즈 통계학에 관한 내용
- 통계계산은 python을 이용
Coghlan, A. A Little Book of R For Time Series
- R을 이용한 시계열 자료 분석
- 시계열 분석에 대한 이론적 설명보다는 R을 이용한 분석방법이 중심
기계학습, 데이터 마이닝
Hastie, T., Tibshirani, R., and Friedman, J. Elements of Statistical Learning: Data Mining, Inference, and Prediction (2nd Edition). New York: Springer.
- 통계적 학습, 데이터 마이닝에 대한 내용
- Supervised Learning, 회귀분석, 선형 판별분석, Kernel Smoothing Methods, 모형 평가 및 선택, 신경망 모형, 결정 나무 모형, SVM, Unsupervised Learning 등등.
Barber, D. Bayesian Reasoning and Machine Learning. Cambridge: Cambridge University Press.
- 확률모형, 베이즈 추론, 기계학습 등
MacKay, D. (2003). Information Theory, Pattern Recognition and Neural Networks. Cambridge: Cambridge University Press.
- 정보이론, 패턴 인식, 신경망 모형 등
Big Data.
- 이름 그대로 빅데이터에 대한 저널
R에 관한 eBook
R의 본거지라 할 수 있는 CRAN의 Documentation 이하 링크에는 수십 권의 eBook이 있습니다. R에 관한 자료는 먼저 이곳을 확인하는 것을 추천합니다.
Burns, P. The R Inferno.
- 프로그래밍 언어로서의 R에 대한 특성을 기술
- R에 대해 자세히 알고 있는 사람에게 추천
우리말 자료
R에 대한 우리말 자료는 R의 우리말 번역 프로젝트인 R-iHELP의 We Share 및 기여된 한국어 문서 저장소를 참고하세요.
전희원 R 기반의 데이터 시각화
맺음말
다른 분야도 마찬가지지만 통계학 및 R 언어에 대해서도 양질의 우리말 자료가 매우 부족합니다. 영어로 보면 된다 하지만 외국어와 자국어로 된 자료를 읽고 지식을 습득하는 속도는 당연히 자국어로 된 자료가 빠르겠죠. 우리말을 잘해야 외국어도 잘할 수 있다는 포스팅도 했습니다만, 영어에 올인하는 우리나라 교육은 아무리 생각해 봐도 문제가 많습니다.
어느 정도 알려진 책은 거의 다 번역판으로 나와 있는 일본이 때로는 부럽기도 하네요.
마지막으로 이번 포스팅에서 소개한 책을 제가 모두 읽고 내용을 숙지하고 있는 건 아니니, 책 내용에 대한 질문은 정중히 사양합니다.