기원에 따른 일치
둘 이상의 개체에서 어떤 DNA 구역이 똑같은 뉴클레오타이드 서열을 가질 때, 그 DNA 구역은 상태에 따라 일치(identical by state, IBS)한다고 한다. 둘 이상의 개체가 공통 조상으로부터 재조합 없이 IBS 구역을 물려받은 경우, 즉 이들 개체에서 IBS인 DNA 구역의 조상 기원이 똑같을 경우 그 DNA 구역을 기원에 따라 일치(identical by descent, IBD)한다고 한다. IBD인 DNA 구역은 정의에 따라 IBS가 된다. 하지만 다른 개체에서 나타난 똑같은 돌연변이나 그 구역을 바꾸지 않는 재조합에 의해 IBD가 아닌 DNA 구역도 IBS가 될 수 있다.
이론
편집유한한 개체군에 속하는 모든 개체를 과거로 충분히 거슬러 올라가면 모두 관련되므로 IBD 유전체 구역을 공유한다. 감수분열 시 IBD 구역은 재조합으로 쪼개진다. 따라서 IBD 구역의 예상 길이는 구역의 유전자자리가 공유하는 가장 최근의 공통 조상 이후의 세대 수에 따라 다르다. 과거의 공통 조상 n 세대(감수분열을 포함하면 2n) 이후 나타난 IBD 구역의 길이는 평균 1/(2n) 모건(M)으로 기하급수적으로 퍼진다.[1] IBD 구역의 예상 수는 이 유전자자리가 공유하는 공통 조상 이후의 세대 수에 따라 감소한다. 각 감수분열 과정에서 특정 DNA 구역이 잘릴 확률이 1/2이기 때문에 그 DNA 구역이 서로 IBD일 확률은 2-2n으로 감소한다.[2]
적용
편집IBD 구역을 확인하면 다양한 목적으로 사용할 수 있다. 위에서 언급한 것과 같이 공유하는 IBD 양(길이와 수)은 검사한 개인의 가족 관계에 따라 다르다. 따라서 IBD 구역을 탐지하면 유연관계를 정량화할 수 있다.[3][4][5][6] 유연관계를 측정하면 법의학 유전학에서나[7] 유전자 연관 지도 작성에서 많은 정보를 얻을 수 있고,[3][8] 표준 연관성 연구에서 새로운 관계에서의 편향을 줄이는 데도 도움을 준다.[6][9] 또한, IBD는 유전자형 귀속이나 하플로타입 위상 추론에도 쓰인다.[10][11][12] 짧은 영역으로 쪼개진 길게 공유된 IBD 구역은 위상 오류를 나타낼 수 있다.[5][13] :SI
IBD 지도 작성
편집IBD 지도 작성[3]은 연관 분석과 비슷하지만 관련 없는 개체 집단에서 알려진 가계도 없이도 수행할 수 있다. IBD 지도 작성은 여러 희귀 질환 감수성 변이를 포함하는 유전자나 유전체 영역의 지도를 작성하는 힘을 증가시켜주는 새로운 형태의 연관성 분석으로 볼 수 있다.[6][14]
시뮬레이션된 데이터를 사용하여 Browning과 Thompson 은 유전자 내의 여러 희귀 변이가 질병 감수성에 기여할 때 IBD 매핑이 연관 테스트보다 더 높은 힘을 갖는다는 것을 보여주었다.[14] IBD 매핑을 통해 표준 연관 테스트는 실패했지만 고립된 개체군과 이종교배 개체군에서 게놈 전체의 중요한 영역이 발견되었다.[11][15] Howen et al. IBD 공유를 사용하여 격리된 어업 집단에서 양성 재발성 간내 담즙 정체를 담당하는 유전자의 염색체 위치를 식별했다.[16] Kenny et al. 또한 분리된 개체군을 사용하여 GWAS( genome-wide association study)에서 발견된 혈장 식물 스테롤 (PPS) 수준의 신호를 미세 매핑하는데, 이는 장에서 콜레스테롤 흡수를 측정하는 대리 측정이다.[17] Francks et al. 사례 대조군 샘플의 유전자형 데이터를 사용하여 정신 분열증 및 양극성 장애에 대한 잠재적인 감수성 유전자좌를 식별할 수 있었다.[18] Linet al. 다발성 경화증 환자의 데이터 세트에서 게놈 전체에 중요한 연관 신호를 발견했다.[19] Letouzéet al. 암 샘플에서 창시자 돌연변이를 찾기 위해 IBD 매핑을 사용했다.[20]
IBD의 집단유전학
편집인간 게놈에서 자연 선택의 검출은 검출된 IBD 세그먼트를 통해서도 가능하다. 선택은 일반적으로 모집단의 개인들 사이에서 IBD 세그먼트의 수를 증가시키는 경향이 있다. 과도한 IBD 공유가 있는 영역을 스캔하여 인간 게놈에서 강력하고 가장 최근에 선택되었던 영역을 식별할 수 있다.[21][22]
그 외에도 IBD 세그먼트는 인구 구조에 대한 다른 영향을 측정하고 식별하는 데 유용할 수 있다.[6][23][24][25][26] Gusev et al. IBD 세그먼트가 병목 현상 및 혼합 을 포함한 인구 통계학적 기록을 추정하기 위해 추가 모델링과 함께 사용될 수 있음을 보여주었다.[24] 유사한 모델 사용 Palamara et al. 및 Carmi et al. Ashkenazi 유대인 과 케냐 마사이족 개인의 인구 통계학적 역사를 재구성했다.[25][26][27] Botiguet al. 유럽 인구 간의 아프리카 가계 차이를 조사했다.[28] Ralph와 Coop은 IBD 검출을 사용하여 다양한 유럽 인구[29]와 Gravel et al.의 공통 조상을 정량화했다. 유사하게 아메리카 대륙 인구의 유전적 역사에 대한 결론을 도출하려고 노력했다.[30] Ringbauer et al. 지난 세기 동안 동유럽 내 분산을 추정하기 위해 IBD 세그먼트의 지리적 구조를 활용했다.[31] 1000개의 게놈 데이터를 사용하여 Hochreiter는 아프리카, 아시아 및 유럽 인구 간의 IBD 공유와 네안데르탈인 또는 데니소바 와 같은 고대 게놈과 공유되는 IBD 세그먼트의 차이를 발견했다.[13]
방법 및 소프트웨어
편집관련 없는 개인의 IBD 구역 감지 프로그램에는 다음과 같은 것들이 있다.
- RAPID : Positional Burrows-Wheeler Transform을 사용하는 바이오뱅크 규모 코호트에서 하강 감지에 의한 초고속 식별[32]
- Parente : unphased genotype 데이터에서 개인 쌍 간의 IBD 세그먼트 식별[33]
- BEAGLE/fastIBD : 게놈 전체의 SNP 데이터에서 개인 쌍 사이의 IBD 세그먼트를 찾는다.[34]
- BEAGLE/RefinedIBD : 해싱 방법을 사용하여 개인 쌍에서 IBD 세그먼트를 찾고 가능성 비율을 통해 중요도 평가[35]
- IBDseq : 시퀀싱 데이터에서 pairwise IBD 세그먼트 감지[36]
- GERMLINE : 개인 쌍으로 선형 시간 IBD 세그먼트에서 발견[5]
- DASH : 단일 일배체형을 공유할 가능성이 있는 개인 클러스터를 추론하기 위해 쌍으로 IBD 세그먼트를 구축한다.[15]
- PLINK : pairwise IBD 부분 검출 방법을 포함하는 전체 게놈 연관 및 인구 기반 연관 분석을 위한 도구 세트[6]
- Relate : SNP를 사용하여 특정 유전자좌에 있는 개인 쌍 간의 IBD 확률 추정[3]
- MCMC_IBDfinder : 여러 개인에서 IBD 세그먼트를 찾기 위한 Markov chain Monte Carlo (MCMC) 기반[37]
- IBD-Groupon : pairwise IBD 관계를 기반으로 group-wise IBD 세그먼트 감지[38]
- HapFABIA : 여러 개인에서 동시에 대규모 시퀀싱 데이터의 희귀 변이를 특징으로 하는 매우 짧은 IBD 세그먼트 식별[13]
같이 보기
편집각주
편집- ↑ Browning, S. R. (2008). “Estimation of Pairwise Identity by Descent from Dense Genetic Marker Data in a Population Sample of Haplotypes”. 《Genetics》 178 (4): 2123–2132. doi:10.1534/genetics.107.084624. PMC 2323802. PMID 18430938.
- ↑ Thompson, E. A. (2008). “The IBD process along four chromosomes”. 《Theoretical Population Biology》 73 (3): 369–373. doi:10.1016/j.tpb.2007.11.011. PMC 2518088. PMID 18282591.
- ↑ 가 나 다 라 Albrechtsen, A.; Sand Korneliussen, T.; Moltke, I.; Van Overseem Hansen, T.; Nielsen, F. C.; Nielsen, R. (2009). “Relatedness mapping and tracts of relatedness for genome-wide data in the presence of linkage disequilibrium”. 《Genetic Epidemiology》 33 (3): 266–274. doi:10.1002/gepi.20378. PMID 19025785.
- ↑ Browning, S. R.; Browning, B. L. (2010). “High-Resolution Detection of Identity by Descent in Unrelated Individuals”. 《The American Journal of Human Genetics》 86 (4): 526–539. doi:10.1016/j.ajhg.2010.02.021. PMC 2850444. PMID 20303063.
- ↑ 가 나 다 Gusev, A.; Lowe, J. K.; Stoffel, M.; Daly, M. J.; Altshuler, D.; Breslow, J. L.; Friedman, J. M.; Pe'Er, I. (2008). “Whole population, genome-wide mapping of hidden relatedness”. 《Genome Research》 19 (2): 318–326. doi:10.1101/gr.081398.108. PMC 2652213. PMID 18971310.
- ↑ 가 나 다 라 마 Purcell, S.; Neale, B.; Todd-Brown, K.; Thomas, L.; Ferreira, M. A. R.; Bender, D.; Maller, J.; Sklar, P.; De Bakker, P. I. W. (2007). “PLINK: A Tool Set for Whole-Genome Association and Population-Based Linkage Analyses”. 《The American Journal of Human Genetics》 81 (3): 559–575. doi:10.1086/519795. PMC 1950838. PMID 17701901.
- ↑ Ian W. Evett; Bruce S. Weir (January 1998). 《Interpreting DNA Evidence: Statistical Genetics for Forensic Scientists》. Sinauer Associates, Incorporated. ISBN 978-0-87893-155-2.
- ↑ Leutenegger, A.; Prum, B.; Genin, E.; Verny, C.; Lemainque, A.; Clergetdarpoux, F.; Thompson, E. (2003). “Estimation of the Inbreeding Coefficient through Use of Genomic Data”. 《The American Journal of Human Genetics》 73 (3): 516–523. doi:10.1086/378207. PMC 1180677. PMID 12900793.
- ↑ Voight, B. F.; Pritchard, J. K. (2005). “Confounding from Cryptic Relatedness in Case-Control Association Studies”. 《PLOS Genetics》 1 (3): e32. doi:10.1371/journal.pgen.0010032. PMC 1200427. PMID 16151517.
- ↑ Kong, A.; Masson, G.; Frigge, M. L.; Gylfason, A.; Zusmanovich, P.; Thorleifsson, G.; Olason, P. I.; Ingason, A.; Steinberg, S. (2008). “Detection of sharing by descent, long-range phasing and haplotype imputation”. 《Nature Genetics》 40 (9): 1068–1075. doi:10.1038/ng.216. PMC 4540081. PMID 19165921.
- ↑ 가 나 Gusev, A.; Shah, M. J.; Kenny, E. E.; Ramachandran, A.; Lowe, J. K.; Salit, J.; Lee, C. C.; Levandowsky, E. C.; Weaver, T. N. (2011). “Low-Pass Genome-Wide Sequencing and Variant Inference Using Identity-by-Descent in an Isolated Human Population”. 《Genetics》 190 (2): 679–689. doi:10.1534/genetics.111.134874. PMC 3276614. PMID 22135348.
- ↑ Browning, B. L.; Browning, S. R. (2009). “A Unified Approach to Genotype Imputation and Haplotype-Phase Inference for Large Data Sets of Trios and Unrelated Individuals”. 《The American Journal of Human Genetics》 84 (2): 210–223. doi:10.1016/j.ajhg.2009.01.005. PMC 2668004. PMID 19200528.
- ↑ 가 나 다 Hochreiter, S. (2013). “HapFABIA: Identification of very short segments of identity by descent characterized by rare variants in large sequencing data”. 《Nucleic Acids Research》 41 (22): e202. doi:10.1093/nar/gkt1013. PMC 3905877. PMID 24174545.
- ↑ 가 나 Browning, S. R.; Thompson, E. A. (2012). “Detecting Rare Variant Associations by Identity-by-Descent Mapping in Case-Control Studies”. 《Genetics》 190 (4): 1521–1531. doi:10.1534/genetics.111.136937. PMC 3316661. PMID 22267498.
- ↑ 가 나 Gusev, A.; Kenny, E. E.; Lowe, J. K.; Salit, J.; Saxena, R.; Kathiresan, S.; Altshuler, D. M.; Friedman, J. M.; Breslow, J. L. (2011). “DASH: A Method for Identical-by-Descent Haplotype Mapping Uncovers Association with Recent Variation”. 《The American Journal of Human Genetics》 88 (6): 706–717. doi:10.1016/j.ajhg.2011.04.023. PMC 3113343. PMID 21620352.
- ↑ Houwen, R. H. J.; Baharloo, S.; Blankenship, K.; Raeymaekers, P.; Juyn, J.; Sandkuijl, L. A.; Freimer, N. B. (1994). “Genome screening by searching for shared segments: Mapping a gene for benign recurrent intrahepatic cholestasis”. 《Nature Genetics》 8 (4): 380–386. doi:10.1038/ng1294-380. PMID 7894490.
- ↑ Kenny, E. E.; Gusev, A.; Riegel, K.; Lutjohann, D.; Lowe, J. K.; Salit, J.; Maller, J. B.; Stoffel, M.; Daly, M. J. (2009). “Systematic haplotype analysis resolves a complex plasma plant sterol locus on the Micronesian Island of Kosrae”. 《Proceedings of the National Academy of Sciences》 106 (33): 13886–13891. Bibcode:2009PNAS..10613886K. doi:10.1073/pnas.0907336106. PMC 2728990. PMID 19667188.
- ↑ Francks, C.; Tozzi, F.; Farmer, A.; Vincent, J. B.; Rujescu, D.; St Clair, D.; Muglia, P. (2008). “Population-based linkage analysis of schizophrenia and bipolar case–control cohorts identifies a potential susceptibility locus on 19q13”. 《Molecular Psychiatry》 15 (3): 319–325. doi:10.1038/mp.2008.100. PMID 18794890.
- ↑ Lin, R.; Charlesworth, J.; Stankovich, J.; Perreau, V. M.; Brown, M. A.; Anzgene, B. V.; Taylor, B. V. (2013). Toland, Amanda Ewart, 편집. “Identity-by-Descent Mapping to Detect Rare Variants Conferring Susceptibility to Multiple Sclerosis”. 《PLOS ONE》 8 (3): e56379. Bibcode:2013PLoSO...856379L. doi:10.1371/journal.pone.0056379. PMC 3589405. PMID 23472070.
- ↑ Letouzé, E.; Sow, A.; Petel, F.; Rosati, R.; Figueiredo, B. C.; Burnichon, N.; Gimenez-Roqueplo, A. P.; Lalli, E.; De Reyniès, A. L. (2012). Mailund, Thomas, 편집. “Identity by Descent Mapping of Founder Mutations in Cancer Using High-Resolution Tumor SNP Data”. 《PLOS ONE》 7 (5): e35897. Bibcode:2012PLoSO...735897L. doi:10.1371/journal.pone.0035897. PMC 3342326. PMID 22567117.
- ↑ Albrechtsen, A.; Moltke, I.; Nielsen, R. (2010). “Natural Selection and the Distribution of Identity-by-Descent in the Human Genome”. 《Genetics》 186 (1): 295–308. doi:10.1534/genetics.110.113977. PMC 2940294. PMID 20592267.
- ↑ Han, L.; Abney, M. (2011). “Identity by descent estimation with dense genome-wide genotype data”. 《Genetic Epidemiology》 35 (6): 557–567. doi:10.1002/gepi.20606. PMC 3587128. PMID 21769932.
- ↑ Cockerham, C. C.; Weir, B. S. (1983). “Variance of actual inbreeding”. 《Theoretical Population Biology》 23 (1): 85–109. doi:10.1016/0040-5809(83)90006-0. PMID 6857551.
- ↑ 가 나 Gusev, A.; Palamara, P. F.; Aponte, G.; Zhuang, Z.; Darvasi, A.; Gregersen, P.; Pe'Er, I. (2011). “The Architecture of Long-Range Haplotypes Shared within and across Populations”. 《Molecular Biology and Evolution》 29 (2): 473–486. doi:10.1093/molbev/msr133. PMC 3350316. PMID 21984068.
- ↑ 가 나 Palamara, P. F.; Lencz, T.; Darvasi, A.; Pe’Er, I. (2012). “Length Distributions of Identity by Descent Reveal Fine-Scale Demographic History”. 《The American Journal of Human Genetics》 91 (5): 809–822. doi:10.1016/j.ajhg.2012.08.030. PMC 3487132. PMID 23103233.
- ↑ 가 나 Palamara, P. F.; Pe'Er, I. (2013). “Inference of historical migration rates via haplotype sharing”. 《Bioinformatics》 29 (13): i180–i188. doi:10.1093/bioinformatics/btt239. PMC 3694674. PMID 23812983.
- ↑ Carmi, S.; Palamara, P. F.; Vacic, V.; Lencz, T.; Darvasi, A.; Pe'Er, I. (2013). “The Variance of Identity-by-Descent Sharing in the Wright-Fisher Model”. 《Genetics》 193 (3): 911–928. arXiv:1206.4745. doi:10.1534/genetics.112.147215. PMC 3584006. PMID 23267057.
- ↑ Botigue, L. R.; Henn, B. M.; Gravel, S.; Maples, B. K.; Gignoux, C. R.; Corona, E.; Atzmon, G.; Burns, E.; Ostrer, H. (2013). “Gene flow from North Africa contributes to differential human genetic diversity in southern Europe”. 《Proceedings of the National Academy of Sciences》 110 (29): 11791–11796. Bibcode:2013PNAS..11011791B. doi:10.1073/pnas.1306223110. PMC 3718088. PMID 23733930.
- ↑ Ralph, P.; Coop, G. (2013). Tyler-Smith, Chris, 편집. “The Geography of Recent Genetic Ancestry across Europe”. 《PLOS Biology》 11 (5): e1001555. doi:10.1371/journal.pbio.1001555. PMC 3646727. PMID 23667324.
- ↑ Gravel, S.; Zakharia, F.; Moreno-Estrada, A.; Byrnes, J. K.; Muzzio, M.; Rodriguez-Flores, J. L.; Kenny, E. E.; Gignoux, C. R.; Maples, B. K. (2013). Williams, Scott M, 편집. “Reconstructing Native American Migrations from Whole-Genome and Whole-Exome Data”. 《PLOS Genetics》 9 (12): e1004023. arXiv:1306.4021. doi:10.1371/journal.pgen.1004023. PMC 3873240. PMID 24385924.
- ↑ Ringbauer, Harald; Coop, Graham; Barton, Nicholas H. (2017년 3월 1일). “Inferring Recent Demography from Isolation by Distance of Long Shared Sequence Blocks”. 《Genetics》 (영어) 205 (3): 1335–1351. doi:10.1534/genetics.116.196220. ISSN 0016-6731. PMC 5340342. PMID 28108588.
- ↑ Naseri A, Liu X, Zhang S, Zhi D. Ultra-fast Identity by Descent Detection in Biobank-Scale Cohorts using Positional Burrows–Wheeler Transform BioRxiv 2017.
- ↑ Rodriguez JM, Batzoglou S, Bercovici S. An accurate method for inferring relatedness in large datasets of unphased genotypes via an embedded likelihood-ratio test. RECOMB 2013, LNBI 7821:212-229.
- ↑ Browning, B. L.; Browning, S. R. (2011). “A Fast, Powerful Method for Detecting Identity by Descent”. 《The American Journal of Human Genetics》 88 (2): 173–182. doi:10.1016/j.ajhg.2011.01.010. PMC 3035716. PMID 21310274.
- ↑ Browning, B. L.; Browning, S. R. (2013). “Improving the Accuracy and Efficiency of Identity-by-Descent Detection in Population Data”. 《Genetics》 194 (2): 459–471. doi:10.1534/genetics.113.150029. PMC 3664855. PMID 23535385.
- ↑ Browning, B. L.; Browning, S. R. (2013). “Detecting Identity by Descent and Estimating Genotype Error Rates in Sequence Data”. 《The American Journal of Human Genetics》 93 (5): 840–851. doi:10.1016/j.ajhg.2013.09.014. PMC 3824133. PMID 24207118.
- ↑ Moltke, I.; Albrechtsen, A.; Hansen, T. V. O.; Nielsen, F. C.; Nielsen, R. (2011). “A method for detecting IBD regions simultaneously in multiple individuals--with applications to disease genetics”. 《Genome Research》 21 (7): 1168–1180. doi:10.1101/gr.115360.110. PMC 3129259. PMID 21493780.
- ↑ He, D. (2013). “IBD-Groupon: An efficient method for detecting group-wise identity-by-descent regions simultaneously in multiple individuals based on pairwise IBD relationships”. 《Bioinformatics》 29 (13): i162–i170. doi:10.1093/bioinformatics/btt237. PMC 3694672. PMID 23812980.