GWAS로 배우는 유전통계학 – 2.2 집단의 구조화 문제

2012/04/1

많은 데이터분석에서 문제가 되는 것은 분석 대상 집단의 균질성입니다. 이질적인 집단의 혼재는 데이터분석 결과를 해석하는 데 있어 곤란을 불러일으킬 뿐만 아니라 잘못된 결론을 유도하게 할 수도 있습니다. 그러나 그룹 정보가 없는 데이터의 균질화는 어려우므로 관측항목에 이질성의 원인이 포함되어 있다 가정하고 군집분석 등의 분류모형을 이용해 추정하는 것이 일반적인 방법입니다.

게놈데이터 분석에서 분석 대상 집단의 이질성 대부분은 인종 차이가 그 원인입니다. 게놈연구에서는 이것을 집단의 구조화(population structure)라 합니다. 이번 포스팅에서는 GWAS에서 집단구조화가 분석결과에 미치는 영향, 구조화의 탐색방법, 그리고 그 해결방법에 대해서 알아보도록 하겠습니다.
계속 읽기 »

댓글 없음

GWAS로 배우는 유전통계학 – 2.1 가계모순과 하디-베인베르크 평형 법칙

2012/03/31

게놈정보는 유전계승법칙에 따라 부모로부터 자손에게 한 세대로부터 다음 세대로 안정된 형태로 계승되기 때문에 매우 균질한 특성을 가지고 있습니다. 게다가 게놈연구의 인과관계도 매우 명확하여 반드시 게놈이 원인이 되기 때문에 분석의 방향성도 매우 명확합니다. 이번 포스팅에서는 게놈연구의 통계적 이점에 대해 설명하고 게놈정보를 이용한 분석을 하기 위한 준비 작업에 대해 소개하도록 하겠습니다.

2.1 가계모순과 하디-베인베르크 평형의 법칙

인간은 부모로부터 각각 하나의 allele를 유전계승법칙에 따라 물려받습니다. 따라서 만약 관측한 유전자형 데이터가 유전계승법칙과 맞지 않다면 관측 데이터가 잘못된 경우가 많습니다. 예를 들어 다음 그림과 같은 가계정보와 하나의 SNP좌위의 유전자형이 관측되었다면
계속 읽기 »

댓글 없음

GWAS로 배우는 유전통계학 – 1. 시작하며

2012/03/30

이제 전 게놈 관련분석은 어느 정도 정형화된 분석방법이 아닌가 싶습니다. 예전부터 이 분석방법에 대해 한번 정리해보고 싶었는데, 마침 일본 계산기통계학회에서 종합보고서 형식의 글을 써달라는 제의가 왔기에 회사 동료와 함께 작성한 글을 바탕으로 앞으로 5~6회에 걸쳐 GWAS에 대해 정리해 보고자 합니다.

1. 시작하며

인간의 다양성(variation)에 대한 해명은 근대 통계학연구의 좋은 재료였습니다. 앞선 포스팅(유전통계학과 수리통계학의 역사)에서 자세히 살펴본 바와 같이 Galton, K. Pearson, Fisher로 대표되는 통계학자들은 인간의 다양성을 설명하기 위해 회귀분석, 검정, 우도 등 근대통계학의 기초를 세우게 됩니다. 특히 Fisher는 멘델의 법칙에 따라 안정된 상태로 다음 세대로 다양한 정보가 전달되며 그 결과로써 각종 다양성이 발생한다고 생각하였습니다. 이처럼 멘델의 법칙에 따라 다양성이 만들어진다고 생각한 연구그룹을 멘델학파(medelian)라 합니다. 그러나 당시에는 게놈정보의 관측이 어려웠으므로 관측 데이터로부터 다양성의 메커니즘을 평가하는 생물계측학파(biometrician)가 실세를 차지하고 있었습니다.
계속 읽기 »

댓글 없음