[R] boxplot의 새로운 형태 violin plot
2011/04/25데이터 분석을 할 때 가장 먼저 해야 하는 일은 데이터의 형태(분포)를 확인하는 것입니다. 많은 통계 교과서들이 각종 데이터 분석 기법을 설명하는 과정에서 데이터가 어떤 분포를 따르고 있다는 가정하에서 설명합니다. 따라서 데이터가 어떠한 분포를 따르고 있는지 파악해야만 사용할 수 있는 분석 기법을 결정할 수 있습니다.
개인적으로 데이터의 분포를 확인할 때 가장 많이 쓰는 방법이 boxplot입니다. 무엇보다도 간단하게 그릴 수 있고, 대략적인 이상치(outlier)의 존재를 확인할 수 있기 때문입니다.
계속 읽기 »




