참깨(Sesamum indicum L.) (2n = 26)는 주요 유 료 작물로 옛날부터 아시아, 아프리카 및 남미의 열대 지방에 서 재배되어왔다(Bedigian, 2003). 참깨는 게놈 크기가 최대 369Mb로 추정되며(Zhang et al., 2013), Sesamum 속은 36종 이 보고되었고(Kobayashi, 1981) 그 중에서 Sasemum indicum L.은 가장 많이 재배되고 있는 종이다(Nayar and Mehra 1970). 일반적으로 자식성 작물로 여겨지며 자연교잡률의 범위 가 5%미만이다(Pathirana, 1994; Rheenen, 1980). 참깨는 사람 이 사용한 가장 오래된 유료종자 작물로 알려져 있으며(Joshi 1961; Weiss 1983; Mabberley 1997), 인디아 또는 아프리카가 기원으로 추정되고 있다(Bedigian and Harlan 1986; Bedigian et al., 1985; Bedigian 2003; Bedigian 2010; Nanthakumar et al., 2000; Fuller 2003; Kumar and Hiremath, 2008).
참깨 종자는 땅콩, 대두, 유채종자를 포함한 주요 유료종자 작물가운데 가장 많은 기름함량을 가지며(Anilakumar et al., 2010), 단백질, 비타민이 풍부할 뿐만 아니라, 세사민, 세사몰린 과 같은 항산화 물질을 다수 포함하고 있어(Namiki 1995; Moazzami and Kamal-Eldin 2006) ‘유류종자의 여왕’으로 불 린다. 그러나 세계의 많은 유전자 은행은 작물 유전자원 수집 품종 수의 급격한 증가로 인해 개발, 평가 및 활용에 어려움 을 가지고 있으며, 유지비용 문제에 직면하고 있다(Holden, 1984). Frankel and Brown (1984)는 이 문제를 해결하기 위 해 최소한의 개체 수를 통한 선발로 최대한 유전적 다양성을 포함하는 핵심집단(core collection) 개념을 제안하였다. 재배종 과 야생종의 관계에 대한 유전적 다양성 및 유연관계의 정보 는 식물 유전자원을 효과적으로 활용하는데 필요한 필수적인 것이라 할 수 있다.
Microsatellites과 SSRs는 작물 유전연구에 유용한 방법으로 서 집단 유전학과 유전자 매핑 분야에서 가깝게 연관되어 있 는 종이나 품종 사이의 유전적 관계를 밝히는데 활용되고 있 다(Zhao et al., 2009; Cho et al., 2010; Ma et al., 2010; Li et al., 2011; Hong et al., 2013). 교배 방법에서 참깨 Polymorpic SSR 마커의 사용은 Dixit et al., (2005), Jin et al., (2009), Jyothi (2009), Spandana et al., (2012)에 의해 보고 된 바가 있다. 참깨의 표현형과 유전자형을 이용하는 다양한 핵심집단 선발 방법론이 개발되어 왔다 그러나 농업형질과 형 태적 형질과 같은 표현형은 환경 요인에 의해서 강하게 편의 가 발생하고 또한 재배 조건에 의해서도 영향을 받게 된다. 이러한 문제를 해결하기 위해 유전자형을 이용한 핵심집단 선 발 방법이 발달하였는데 그 중 PowerCore 소프트웨어(Kim et al., 2007)는 기존의 방법보다 효과적으로 유전적 다양성을 포 함한 다양한 정보를 압출할 수 있다. 벼, 대두, 아마란스의 연 구에서 이를 사용하여 핵심집단을 선발한 바 있다.(Lu et al., 2009; Zhao et al., 2010a,b; Moe et al., 2012; Aye et al., 2013).
본 연구는 참깨의 유전적 다양성과 집단 구조분석을 통해 품종 육성 및 기초자료로 제공하기 위해, Park et al., (2014) 이 발표한 참깨 유전자원 핵심집단 277점을 농촌진흥청 국립 농업과학원 국립유전자원센터에서 분양을 받아 총 14개의 SSR 마커로 PowerCore의 휴리스틱 선발 분석을 실시하여 소규모 핵심집단을 구축하고 효율적인 자원 관리 및 육종에서 사용할 수 있는 기초 자료로서 제공하고자 한다.
재료 및 방법
식물 재료
농촌진흥청 유전자원센터에서 제공받은 모 핵심집단 277점 을 Park et al., (2014)이 분석에 이용한 14개의 SSR 마커로 genotype하여 112점의 핵심집단을 구축하였으며(Table 1), 각 참깨의 원산지는 한국 19점, 일본 5점, 이란 7점, 인도 12점, 중국 7점, 미국 5점 등 총 15개국이 포함되었다.
SSR genotyping
전체 DNA 추출은 Qiagen DNA extraction kit (Qiagen, Seoul, Republic of Korea)를 사용하여 추출하였다. DNA 추 출 후 14개의 SSR marker 정보(Dixit et al., 2005., Jin et al., 2009.)를 활용해 Schuelke (2000) 방법으로 Polymerase Chain Reaction (PCR)을 수행하였다(Lee et al., 2008). SSR allele 분석은 ABI-PRISM 3100 DNA sequencer (Applied Biosystems, Foster City, CA, USA)의 GeneScan 3.7 software (Applied Biosystems)를 이용하였으며, allele의 정확한 측정을 위해 GeneScan 500 ROX (6-carbon-X-rhodamine) molecular size standards (35-500bp)를 Genotyper 3.7 software (Applied Biosystems)와 함께 사용하였다.
Development of a core set for sesame
모 핵심집단의 allele로부터 효율적으로 allele를 포함시키기 위해 Zhao et al. (2010 a), Moe et al. (2012), and Aye et al. (2013)의 연구에 의하여 이미 사용성이 입증된 바가 있 는 PowerCore 1.0 (Kim et al., 2007)의 휴리스틱 알고리즘 을 이용하여 핵심집단을 선발하였다. 모집단과 선발된 대립유 전자간의 분석을 위해 Excel (Microsoft Office; Microsoft, Redmond, WA, USA)을 이용하였다.
Genetic diversity analysis and evaluation
Powermarker 3.25 (Liu and Muse 2005) 프로그램을 이용 하여 number of alleles (NA), number of specific alleles (SA), number of rare alleles (RA), major allele frequency (MF), polymorphism information content (PIC)에 대한 분석을 하였 고, 내장되어 있는 Mega 4.0 (Tamura et al. 2007) 프로그램 을 사용해 unrooted neighbor-joining tree를 작성하였다.
각 마커에 대한 PIC는 다음 공식에 의하여 계산하였다.
단, p는 i번째 SSR 마커의 j번째 패턴의 상대적 빈도 (Botstein et al., 1980).
Population structure analysis of the core set
핵심집단의 구조 분석을 위하여 The model-based program Structure 2.2 (Pritchard et al., 2000; Falush et al., 2003)를 사용하였으며, 설정된 값은 burn-in 100,000, run length은 150,000으로 하였다. Structure 프로그램에서 집단 (K)는 1에서 10까지 분석하였으며, 이 모델은 최대 확률을 가진 K를 구하 기 위해서 ΔK 값을 이용하였다. ΔK는 Structure (Evanno et al., 2005) 프로그램에서 추론된 클러스터 개수에 대한 로그 확률의 2차 변화와 관계된 량으로, 각각의 자원은 70%이상의 멤버십 추정 확률을 가지는 하나의 집단(sub 집단)으로 할당 되었다.
결 과
Sub core set development and allele capture efficiency
PowerCore를 이용하여 참깨 모 집단 277점으로부터 소규모 핵심집단을 구축한 결과, 112점의 소규모 핵심집단을 구축하 였으며 이는 모 집단 품종의 40.4%에 해당하며. 총 allele의 수는 158개 중 155개로 모 집단의 98%에 해당한다. 또한 SSR 마커의 대립유전자 분포는 모 집단과 비슷한 양상을 보였다 (Table 2, Fig 1).
Genetic diversity of the sub core set
Power Marker를 이용한 소규모 핵심집단과 모 핵심집단의 분석결과를 NA, GD, PIC, NG와 같은 척도로 평가하였을 때 비슷한 양상을 보였으며(Table 2), 평균 값은 각각 11.07, 0.65, 0.61 및 20.79였다.
MF는 소규모 핵심집단에서 감소한 것으로 관찰되었다. 모 집단에서는 38개의 specific allele와 112개의 rare allele로, 각 각의 평균은 2.71과 8.0인 반면에, 소규모 핵심집단에서는 45 개의 specific allele와 109개의 rare allele가 관찰되었으며 평 균은 3.21, 7.79로 나타났다. 특히, specific allele는 모 핵심 집단보다 소규모 핵심집단에서 45개로 증가한 것으로 관찰되 었다(Table 2).
Population structure of the sub core set
참깨 112점을 model-based program 및 14개의 SSR 마커 를 이용해 집단 구조 분석한 바 L(K)은 K과 같이 정확한 형 태를 보이지 않았으며, 정확한 K 값을 얻기 위해 Evanno et al., (2005) 제안한 ΔK을 사용하였다. Fig 2, 3
선발된 112점을 분석하기 위해 Alpha parameter를 최대로 하는 ΔK를 선택하였다. 최대 ΔK 값은 K = 4이고, alpha parameter는 0.1058이었으며, 모든 accessions은 4개의 subpopulation (membership > 70%)로 추정되었다. Pop-1는 19점, Pop-2 20점, Pop-3에는 21점이 포함되었고 16점은 Pop-4에 포함되었다. 다른 36점은 admixture에 포함되었다(Table 1, Fig. 4). 흥미롭게도 Pop-1에는 대부분 한국 품종이 포함되었 고 Pop-3은 중동 아시아, Pop-4는 남아시아 지역 품종이 포함 되었다. 마지막으로 Pop-2에는 다양한 지역의 품종이 포함되 었다.
유전적 차이 기반 분석은 112점에 속한 shared allele 빈도 로 계산하였고, unrooted phylogram는 Powermarker 3.23 와 Mega 4 (Tamura et al. 2007)를 이용하였다. 집단 구조분석의 유사 클러스터링 패턴을 분석하였고(Fig. 5), model-based 집 단 분석 결과에 따라 다른 색으로 구분하였다.
각 model-based 집단의 유전적 다양성을 측정한 결과(Table 3), Pop-1의 gene diversity는 0.483, allelic richness 평균은 4.643이 고 PIC는 0.445로 4개의 subpopulation 중에 가장 낮은 것으 로 관찰되었으나, Pop-2와 Pop-3, Pop-4는 gene diversity, PIC값이 Pop-1에 비해 모두 높았다. 소규모 핵심집단의 최대 점유 품종은 한국품종으로서 모 핵심집단에서의 수와 비율에 큰 차이가 없었다(Table 4).
고 찰
핵심집단 구축은 유전자원관리의 유용한 관리를 위해 Frankel (1984)가 제안하였다. 본 연구는 소규모 핵심집단은 다양한 유전자원에 대하여 대표성을 띄는 whole genome resequencing의 모 집단으로부터 구축되었으며. 277점의 모 집 단에서 대표적인 소규모 핵심집단 112점을 구축하였다.
소규모 핵심집단의 품종은 모 핵심집단의 대부분의 척도를 대변하고 있을 뿐만 아니라(Table 2), 전체 품종의 60%를 감 소시켰다(Table 4). 이는 Zhao et al. (2010a), Moe et al. (2012), and Aye et al. (2013)의 연구에 의하여 이미 사용성 이 입증된 바가 있는 PowerCore (Kim et al., 2007)는 본 연구에서도 그 사용성이 입증되었다 할 수 있겠다.
좋은 핵심집단은 최대한 적은 수의 자원으로 최대한 많은 유전적 다양성을 대표하는데 있다. 핵심집단 또는 allelemining set의 구축은 방대한 양의 유전자원에서 표현형 검사 나 육종에 이용할 수 있으며(Zhao et al., 2010a), allelic richness는 풍부한 다양성 관련 척도이다(Schoen and Brown 1993; Bataillon et al., 1996).
또한 소규모 집단에서 specific allele는 증가는PowerCore가 품종 수를 감소시키고 최대한의 다양성을 보여준다고 할 수 있으며, 중복성의 품종을 줄이거나 어떤 allele 선발할 때 specific allele를 구별해 준다(Aye et al., 2013). 이는 핵심집 단 내에서 specific allele의 증가를 도출할 것이고, 이러한 결 과는 중요한 allele를 보유하는 핵심집단 방식을 구현하여 나 타낼 것이다.
본 연구에서 소규모 핵심집단은 모 핵심집단의 대부분의 allele 다양성을 포함하였다(Table 2, Fig. 1). 따라서 핵심집단 은 277점에서 112점으로 수를 감소시키면서 최대의 유전적 다 양성을 보여주며, 전체 참깨 선발로부터 대표성을 나타낸다. Brown et al., (1987) 은 핵심집단의 수는 기본 선발집단에서 5 ~ 10%를 포함하여야 되며 적어도 70%이상 유전적 다양성을 대변할 수 있어야 한다고 하였으며, Diwan et al. (1995) 은 핵심집단은 항상 10% 이상 설정되어야 한다고 제안하였다. 또 한 van Hintum (1995)은 선정된 품종은 핵심집단의 특정 목 적에 따라 5 ~ 20% 의존한다 하였다. 따라서 선발된 핵심집단 은 본 연구의 모든 품종의 대표성을 충분히 나타낼 것으로 볼 수 있다.
참깨 원산지는 아프리카에서 중동지역을 거쳐 인도, 중국, 한국 일본 순으로 되어 있다(Bedigian et al., 1986; Bedigian and Harlan, 1986; Bedigian, 2003). 본 소규모 핵심집단의 sub-population group cluster를 각 자원의 원산지와 대응시켜 본 결과는 Fig. 6와 같다. 원산지 아프리카는 Pop-3가 우점 하였다. 원산지 아프리카와 가까운 유럽 쪽은 아프리카와 비슷 하게 Pop-3이 다수를 차지하였으며(Afghanistan, Iran, Turkey), 이 보다 더 먼 지역에서는 Pop-4가 증가하다가 (Nepal, China, India, Philippines), 이에서 더 멀어질수록 Pop-2과 Pop-1이 증가하는 양상을 보였다.
구조분석을 통해 4개의 subpopulation과 admixture가 동시에 있는 것으로 관찰되었으며(Table 1, Fig. 4), unrooted phylogram에서도 비슷한 경향을 보였다(Fig. 5). 본 연구결과에서 admixed/hybrid genotype이 존재한다는 사실은 참깨에서 hybridization/introgression가 빈번히 발생한다는 것을 시사한다. Hybridization과 introgression은 그것을 탐색하고 범위를 명확 하게 추정하는 것은 어려우나, 재배종과 야생종 및 잡초성 종 사이의 유전적 재조합은 재배작물의 기원을 밝히는 데 매우 중요하다. 본 연구 결과에서의 subpopulation 들은 다양한 지 역이 속해있는 Pop-2를 제외하고 지역에 따라 population이 구분되는 것으로 관찰되었다. Pop-1는 한국 품종이 대부분이 었으며 그럼에도 불구하고 소규모 핵심집단과 모 집단의 최대 포함 비율은 유지 되었다. 비록 Pop-1은 4개의 subpopulation 중 가장 낮은 gene diversity를 가졌지만 이는 한국품종의 고 유 특수성을 보여주는 결과라고 해석할 수 있다(Table 4).
결론적으로, 본 연구를 통해 277점의 모 집단으로부터 총 155 alleles, SSR locus 별로 평균 11.07 alleles를 가진 소규 모 핵심집단을 112점을 동정하였다. 이는 모 집단의 대부분 allele를 포함한 결과이다. 집단 구조 분석을 통해서 유전적 거 리에 따라 군집화를 수행한 결과 소규모 핵심집단은 4개의 subpopulation으로 나누어짐을 발견하였다. 따라서, 본 연구에 서 구축한 소규모 핵심집단을 기반으로 참깨 육종 및 연구자 들이 품종을 육성하는데 아직 이용하지 않은 유용한 allele들 을 도입하기 위한 참깨 유전자원의 효율적인 관리 및 유용유 전자 선발을 위한 기초 자료로서 유용하게 활용 될 수 있을 것으로 보이며, 향후 참깨 World Collection을 이용한 대규모 유전자원으로부터 선발된 참깨 핵심집단의 유전자형 변이와 주요 농업형질에 대한 association 분석을 통해 종실특성, 종실 의 지방산, 잎의 향, 색소 및 기능성 성분에 대한 유용 대립 유전자 대량 발굴로 참깨 molecular designed breeding 분야 에 활용될 수 있을 것으로 판단된다. 또한, 참깨 분리집단을 육성하여, 차후 유전체 분석을 통해 고밀도 유전자 연관지도 작성에 활용할 수 있으며, 분리집단의 주요 농업형질, 종실 품 질 특성, 생리활성 물질함량에 대한 특성 평가를 수행하여 목 적형질에 연관된 분자표지를 개발하여 목적형질에 대한 초기 세대 선발효율을 높일 수 있을 것으로 보인다. 고밀도 연관지 도를 활용하여 유전자 지도에 기초한 유전자 클로닝 등에 응 용될 수 있을 것이며, 참깨 또는 다른 작물과의 비교유전체 정보를 이용한 기능연구에 활용 가능할 것으로 사료된다.
적 요
-
국립유전자원센터에서 분양받은 참깨 모 핵심집단 277점 에 대해 PowerCore 의 휴리스틱 알고리즘을 이용하여 112점 의 소규모 핵심집단을 작성하였다.
-
본 연구에서 작성한 112점의 소규모 핵심집단은, 115개의 대립유전자를 가지고 있으며, 이들 대립유전자는 모 핵심집단 에서 총 158개의 유전자로부터 유래되었고, 소규모 핵심집단의 rare alleles은 모 핵심집단과 거의 100% 가깝게 표현되었다.
-
Structure 프로그램을 이용하여 집단 구조 분석을 수행한 결과, 소규모 핵심집단은 4개의 sub 집단과 admixture 집단 구조를 가지고 있음이 관찰되었다. Sub 집단 중 대부분의 한 국품종을 포함한 Pop-1은 유전적 다양성이 다른 3가지 sub 집단보다 낮지만, 모 핵심집단과 유사한 특징을 같은 비율을 지니고 있기 때문에 소규모 핵심집단은 최소한의 품종으로 표 현할 수 있다.