기초부터 응용까지 무료 통계학 eBook 19선 + α

2013-08-15
통계학 무료 eBook

인터넷은 정보의 바다입니다. 인터넷에는 통계학에 관한 자료도 일일이 셀 수 없을 정도로 많이 있습니다. 하지만 단편적인 정보가 많아 체계적인 지식의 습득에는 역시 책을 이용하는 편이 효율적이겠죠.
이번 포스팅에서는 인터넷에 무료로 공개되어있는 통계학 및 R 언어에 관한 eBook을 소개하려 합니다. 영어로 쓰인 책이 대부분입니다만, 몇몇 한글 자료도 소개합니다. 그리고 각 자료에 대한 간략한 설명은 저의 주관에 근거한 것이니 참고 정도로만 생각해 주세요.

eBook

통계학 입문

Illowsky, B., and Dean, S. Collaborative Statistics.

  • 통계학 입문에서 다루어야 할 내용은 모두 들어가 있다고 해도 과언이 아님. PDF로 700페이지가 넘는 방대한 분량이지만 그만큼 내용도 충실
  • 예제 및 연습문제가 풍부
  • 샘플링, 기술통계, 확률 기초, 확률변수, 정규분포, 중심극한정리, 신뢰구간, 가설검정, 카이제곱 검정, 회귀분석 및 상관계수, 분산분석 등.

Diez, D., Barr, C., and Çetinkaya-Rundel, M. OpenIntro Statistics (2nd Edition).

  • 입문서라 하긴 약간 어려울 수도 있음.
  • 확률론, 확률변수의 분포, 연속형 이산형 데이터의 추검정, 선형회귀분석, 로지스틱 회귀분석 등.

Downey, A. B. Think Stats: Probability and Statistics for Programmers

  • Python을 이용한 통계분석을 다룸
  • 제목에서 알 수 있듯이 프로그래밍 경험이 있는 사람이 읽으면 이해하기 쉬움
  • 통계적 사고, 분포, 확률, 가설검정, 추정, 상관분석 등. 특히 분포에 대해 많은 페이지를 할당하고 있음.

Butler, C. Statistics in Linguistics. Oxford: Basil Blackwell

  • 언어학자를 위한 통계 입문서
  • 절판된 책을 eBook으로 공개. 종이책을 스캔한 PDF라 가독성이 좋지 못함.
  • 기술 통계에 대한 내용보다는 가설 검정에 대한 내용이 많음.
  • 비모수 가설 검정법에 대해서도 약간 다루고 있음.

Yakir, B. Introduction to Statistical Thinking.

  • 통계 입문서로 R 언어를 이용해 설명.
  • 기술 통계, 가설검정의 기초, 선형회귀 분석 등.
  • 통계 서적임에도 수식이 별로 없음. R을 이용한 처리가 중심.

Shafer, D., and Zhang, Z. Introductory Statistics.

  • 기술통계, 확률분포, 추정, 검정, 선형회귀, 상관분석, 분할표 검정, 분산분석 등.
  • 심리학도를 위한 통계
  • R을 이용한 분석법 등을 설명

응용 통계학

입문서보다는 약간 더 세부 분야에 특화된 서적들입니다.

Lavine, M. (2013). Introduction to Statistical Thought.

  • R을 이용해 수리 통계학적 방법을 설명
  • 확률 및 통계모형 등에 대해 입문서보다는 자세히 설명되어 있음.
  • 수식이 많아서 읽기 어려울 수도 있지만, R을 이용한 시뮬레이션도 있으므로 수식에 자신 없는 사람은 R 코드를 따라가는 것도 좋음.

Faraway, J. J. Practical Regression and Anova using R.

  • R을 이용한 선형모형 입문서
  • 분산분석 및 회귀분석에 대한 내용
  • 가설검정의 기초는 알고 읽어야 함

Hyndman, R. J. and Athanasopoulos, G. Forecasting: Principles and Practice.

  • 통계를 이용한 예측에 관한 내용
  • 회귀분석, 시계열 분석, Exponential smoothing 등
  • 통계계산은 R을 이용

Grinstead, C., and Snell, J. L. Introduction to Probability. American Mathematical Society.

  • 확률론에 대한 내용
  • 확률분포, 조합, 조건부확률, 대수의 법칙, 중심극한정리, Markov Chain, Random work 등
  • 수식이 많음

Downey, A. B. Think Bayes: Bayesian Statistics Made Simple. Needham, MA: Green Tea Press.

  • 베이즈 통계학에 관한 내용
  • 통계계산은 python을 이용

Coghlan, A. A Little Book of R For Time Series

  • R을 이용한 시계열 자료 분석
  • 시계열 분석에 대한 이론적 설명보다는 R을 이용한 분석방법이 중심

기계학습, 데이터 마이닝

Hastie, T., Tibshirani, R., and Friedman, J. Elements of Statistical Learning: Data Mining, Inference, and Prediction (2nd Edition). New York: Springer.

  • 통계적 학습, 데이터 마이닝에 대한 내용
  • Supervised Learning, 회귀분석, 선형 판별분석, Kernel Smoothing Methods, 모형 평가 및 선택, 신경망 모형, 결정 나무 모형, SVM, Unsupervised Learning 등등.

Barber, D. Bayesian Reasoning and Machine Learning. Cambridge: Cambridge University Press.

  • 확률모형, 베이즈 추론, 기계학습 등

MacKay, D. (2003). Information Theory, Pattern Recognition and Neural Networks. Cambridge: Cambridge University Press.

  • 정보이론, 패턴 인식, 신경망 모형 등

Big Data.

  • 이름 그대로 빅데이터에 대한 저널

R에 관한 eBook

R의 본거지라 할 수 있는 CRAN의 Documentation 이하 링크에는 수십 권의 eBook이 있습니다. R에 관한 자료는 먼저 이곳을 확인하는 것을 추천합니다.

Burns, P. The R Inferno.

  • 프로그래밍 언어로서의 R에 대한 특성을 기술
  • R에 대해 자세히 알고 있는 사람에게 추천

우리말 자료

R에 대한 우리말 자료는 R의 우리말 번역 프로젝트인 R-iHELP의 We Share기여된 한국어 문서 저장소를 참고하세요.

전희원 R 기반의 데이터 시각화

맺음말

다른 분야도 마찬가지지만 통계학 및 R 언어에 대해서도 양질의 우리말 자료가 매우 부족합니다. 영어로 보면 된다 하지만 외국어와 자국어로 된 자료를 읽고 지식을 습득하는 속도는 당연히 자국어로 된 자료가 빠르겠죠. 우리말을 잘해야 외국어도 잘할 수 있다는 포스팅도 했습니다만, 영어에 올인하는 우리나라 교육은 아무리 생각해 봐도 문제가 많습니다.
어느 정도 알려진 책은 거의 다 번역판으로 나와 있는 일본이 때로는 부럽기도 하네요.

마지막으로 이번 포스팅에서 소개한 책을 제가 모두 읽고 내용을 숙지하고 있는 건 아니니, 책 내용에 대한 질문은 정중히 사양합니다.

comments powered by Disqus