2012/04/7
3.2 질적 형질에 대한 관련분석
질적 형질에 대한 관련분석을 분할표를 이용한 Pearson의 카이제곱 검정이나 Fisher의 정확 검정법을 주로 이용합니다. 어떤 SNP 좌위에 대해 가장 기본적인 관측 데이터는 질적 형질의 표현형에 따른 유전자형의 도수겠죠. 많은 경우 질적 형질은 두 개의 카테고리를 가지므로 개체의 표현형을 D(disease)와 N(non-disease)라 하고 SNP의 allele를 A, a라고 한다면 표 1과 같은 분할표를 작성할 수 있습니다.

<표 1> 유전자형에 따른 돗수의 분할표
계속 읽기 »
2012/04/5
3. Genome-wide association study
관련분석은 유전적 변이와 형질과의 관련성을 검출하는 것이 목적입니다. 이때 관측된 SNP좌위가 형질의 표현형(phenotype)에 직접적인 영향을 미친다는 것을 검출할 수 있다면 가장 바람직스러운 결과일 것 입니다(direct association). 그러나 실제로는 관련성을 시사하고 있다고 한다 해도 관측된 SNP좌위가 표현형과 직접 관련이 있다고는 보장할 수 없습니다. 진짜 원인이 되는 유전자 좌와 연쇄불평형(linkage disequilibrium; LD) 상태에 있는 유전자 좌도 표현형과 간접적인 관련이 있을 때가 많기 때문입니다(indirect association).
계속 읽기 »
2012/04/3
2.3 게놈 데이터의 품질평가
게놈 정보는 유전계승형식을 이용한 품질평가가 중요합니다. 이번 포스팅에서는 앞서 소개한 하디-바인베르크 평형, 집단의 구조화 평가 이외의 품질평가 방법을 알아보도록 하겠습니다.
Call Rate
하나의 SNP를 다수의 개체에 대해 유전자형을 조사했을 때 어떠한 형태로든 유전자형이 결정된 개체의 비율을 SNP 당 Call Rate(CR)이라 합니다. SNP 당 CR이 낮은 유전자좌는 유전자형의 결정이 곤란하다는 것을 의미합니다. 바꿔 말하면 그 SNP좌위의 관측결과에 대한 신뢰성이 낮다는 것을 의미하는 거죠. 일반적으로 SNP 당 CR이 0.95 이상의 SNP좌위를 분석대상으로 삼습니다.
계속 읽기 »