서 론
세계적으로 커피는 가장 소비가 많이 되는 음료 중 하나 이다. 커피는 크게 Coffee arabica 와 Coffee canephora로 분 류되는데 이중 C. arabica는 전세계 70%를 차지한다(Vega, 2008). 우리나라의 커피 소비량은 경제 수준에 향상으로 인해 생활 속 여가와 문화생활이 높아짐에 따라 다양하고, 고급 커 피 소비가 빠르게 성장하고 있다. 또한, 커피의 형태도 다양하 게 소비되고 있다. 하지만, 국내에서 재배되는 커피의 양이 제 한적이며, 대부분 수입에 의존하고 있다.
커피를 재배하기 위해서는 자연적 조건으로 위도, 해발고도, 토 양, 기후가 중요하다. 위도는 적도를 중심으로 남북위 25도 사이 에서 재배가 되고, 해발고도는 적도 지방에서는 1,000~ 2,100m 이며, 적도외 지역에서는 400~1,200m 지대에서 재배가 된다. 토 양은 배수가 잘되는 응회암, 화산재, 현무암과 화강암의 토양이 최소 2m가 있어야 가능하다. 기후 조건은 기온이 15~25°C, 강 수량은 연간 1,200~1,500mm와 월간 70mm가 적당하고, 습도는 60%가 적당하다. 이상의 조건들은 현재 아열대 기후로 변화 중 인 제주지역에 적합한 작물로 지형, 토양, 습도의 조건이 일치하 며, 한국형 커피 생산이 가능하다(Kim et al., 2011).
Fourier transform infrared(FT-IR) spectroscopy을 이용한 대 사체학 연구가 진행되면서 시료간의 양적, 질적 차이를 대사체 수준에서 확인되고 있다. Fourier transform infrared(FT-IR) spectroscopy, proton nuclear magnetic resonance(HNMR) spectroscopy 및 mass spectrometry(MS) 등의 기기들은 대사 체 연구에 이용되고 있으며 각각의 장비에서 분석된 데이터를 이용하여 시료의 식별 및 대사체 마커 개발에 활용이 되고 있 다(Krishnan et al., 2005). FT-IR 스펙트럼은 스펙트럼상에 amino acids(glutamic acids 1700-1750cm-1, Aspartic 1400- 1430 cm-1, Trytophan 1360 cm-1) 그룹이나 proteins(α-Helix 1275 cm-1, Anti-parallel β-sheet 1235 cm-1), Lipids/fatty acids (υ(C-C) 1100-800 cm-1), monosaccharides(α, β-Glucose, β- Fructose 898-847 cm-1) 등 다양한 정보를 포함하고 있고 다변 량 통계분석(PCA, PLS-DA, HCA)을 이용하면 신속하고 정확 하게 품종 구분할 수 있다(Schulz and Baranska, 2007; Gallardo-Velázquez et al., 2009). FT-IR 분석 기술을 이용하 여 미생물종의 유연관계를 식별하고(Goodacre et al., 1998; Timmins et al., 1998; Wenning et al., 2002), 돌연변이 선 발(Chen et al., 1998; Stewart et al. 1997), 고등식물의 종 구분 (Kim et al., 2004), 두과작물 품종 식별(Song et al., 2012) 등에 활용이 가능하다고 보고된 바 있다.
따라서 본 연구는 FT-IR 스펙트럼의 데이터를 이용하여 다 변량통계분석 기법을 통해 제주특별자치도에서 재배될 수 있 는 커피 품종을 대사체 수준에서 신속한 품종 식별 체계를 확 립하고, 우수한 계통 선발을 위한 품종 식별 기술을 구축하고 자 한다.
재료 및 방법
식물재료
본 연구는 제주특별자치도 국립원예특작과학원 온난화대 응농업연구소 포장 내 무가온하우스에서 재배되고 있는 커 피(C. arabica) 8종의 품종을 사용하였다. 연구에 사용된 커 피는 Arabica 종인 ‘Catuai’, ‘Caturra’, ‘CR-95’, ‘Geisra’, ‘Mahsellesa’, ‘Obata’, ‘Vemecia’ 7종과 교배종 1종을 사용하 였다. 8종 각각의 라인 잎을 3반복으로 시료를 준비하여 대사 체 분석에 이용하였다. 각각의 잎 시료는 동결건조하여 막자 와 막자사발을 이용하여 분말 형태로 분쇄하였다. 분쇄된 잎 시료는 -70°C 초저온냉동고에 보관하여 사용하였다.
커피 whole-cell 추출물 제조
8종의 커피 잎 시료 분말 20 mg을 1.5 mL Eppendorf tube 에 넣고 20%(v/v) methanol 200 μL을 첨가하여 시료와 용액 이 잘 섞이도록 vortexing하여, 50°C water bath에서 20분간 추출하였다. 추출된 시료는 15분간 13,000 rpm에서 원심분리 하고, 원심분리 후 상층액을 새로운 tube에 옮겼다. 추출물 찌 꺼기를 완전히 제거하기 위해 다시 한번 5분간 13,000 rpm에 서 원심분리하여 상층액을 새로운 tube로 옮겼다. FT-IR 스펙 트럼 분석에 사용하기 위해 추출된 추출물은 -20°C에서 냉동 보관하여 사용하였다(Song et al., 2014).
FT-IR 스펙트럼과 데이터 전처리 및 다변량 통계분석
FT-IR (Fourier transform infrared) 스펙트럼 조사는 Tensor 27 (Bruker Optics GmbH, Ettlingen, Germany)과 DTGS (Deuterated triglycine sulfate) 검출기를 사용하였다(Song et al., 2014). 추출된 각각의 시료는 5 μL씩 3반복으로 384-well ZnSe plate에 분주하여, 37°C hot plate에서 약 30분간 건조 한 후 HTS-XT (Bruker Optics GmbH) 고효율 자동화 장치 를 이용하여 스펙트럼을 측정하였다. 스펙트럼은 4000-400 cm-1 범위에서 4 cm-1 간격으로 128회 반복 측정되었고, 측정된 스 펙트럼의 평균 스펙트럼을 분석에 사용하였다. Bruker 에서 제 공하는 OPUS Lab (ver. 6.5, Bruker Optics Inc.)를 사용하 여 FT-IR 스펙트럼 분석 영역의 양 끝점(800-1800 cm-1)의 흡 광도를 0으로 조정하고, 오차를 최소화하기 위하여 각 스펙트 럼을 동일 면적으로 normalization을 실시하였으며, baseline 교정을 실시하였다. 가공된 스펙트럼은 mean centering 과정을 거쳐 2차 미분하고 FT-IR 스펙트럼 조사 및 데이터 변환에 사용하였다.
가공된 FT-IR 스펙트럼 데이터는 NIPALS 알고리즘(Wold, 1966)을 이용하여 R 프로그램(version 3.1.2)을 사용하여 PCA(Principal component analysis)와 PLS-DA(Partial least squares discriminant)분석을 수행하였다(Fiehn et al. 2000; Trygg et al. 2007). PCA 및 PLS-DA 분석을 통해 얻어진 score를 이용하여 HCA(hierarchical clustering analysis) 분석 하였으며 유사도 지수로 UPGMA(unweighted pair group method with arithmetic mean analysis)를 사용한 Euclidean distance를 측정하여 각 시료의 유연관계를 dendrogram으로 나 타냈다.
결과 및 고찰
커피의 FT-IR 스펙트럼 비교 분석
커피 잎으로부터 전세포추출물의 FT-IR 스펙트럼 데이터는 다변량통계분석을 통해 커피 작물의 대사체 수준에서 유연관 계를 규명하고 품종 식별을 분석하였다. ‘Catuai’, ‘Caturra’, ‘CR-95’, ‘Geisra’, ‘Mahsellesa’, ‘Obata’, ‘Vemecia’ 7종과 ‘non’ 교배종 1종 등 커피 작물들은 FT-IR 스펙트럼상에서 대 사체의 양적, 질적 패턴 변화가 나타났다(1700-1500, 1500- 1300, 1100-950cm-1)(Fig. 1). FT-IR 스펙트럼의 1700-1500, 1500-1300, 1100-950cm-1 주요 부위는 각각 특정 화합물들을 나타내는데, 주로 Amide I 과 II을 포함하는 아미노산 및 단 백질계열의 화합물들의 질적, 양적 정보를 나타내고(P = O, C = O, N-H, C-C 그리고 C = C), phosphodiester group을 포함한 핵산 및 인지질의 정보가 반영이 되고(CH2와 P = O), 단당류나 복합 다당류를 포함하는 carbohydrates 계열의 화합물들이 질적, 양적 정보가 반영(C-O, C-C 그리고 C-O-C) 되어 나타낸다(Parker, 1983; Dumas and Miller, 2003; Wolkers et al., 2004; Yee et al., 2004; D’Souza et al., 2008; Lopez-Sanchez et al., 2010). 이처럼 FT-IR 스펙트럼 상의 질적, 양적 차이가 커피 품종이 함유하고 있는 아미노산 이나 단백질, 지방산, 그리고 탄수화물계통의 화합물들의 질 적, 양적 차이가 현저하게 나타남을 의미한다. 따라서, FT-IR 스펙트럼 분석은 커피의 주요 대사체의 질적, 양적 변화를 분 석하여 계통 선발 수단으로 신속한 활용이 가능할 것이다.
FT-IR 스펙트럼 다변량 통계분석 및 유연관계 분석
8종 커피의 FT-IR 스펙트럼 데이터를 PCA 분석한 결과 PC 1과 2의 설명력이 64.2%와 11.8%로 각각 나타났다(Fig. 2A). 전체 커피 품종 중 ‘Caturra’와 ‘Mahsellesa’ 품종을 제 외한 ‘Catuai’, ‘CR-95’, ‘Geisra’, ‘Obata’, ‘Vemecia’ 그리고 ‘non’ 품종이 대사체 수준에서 유사성이 높게 나타났고, 각각 의 그룹을 형성하였다. ‘Caturra’와 ‘Mahsellesa’ 품종은 외각 의 그룹을 형성하면서 ‘Catuai’, ‘CR-95’, ‘Geisra’, ‘Obata’, ‘Vemecia’ 그리고 ‘non’ 품종들과는 차이를 나타냈다. ‘Caturra’와 ‘Mahsellesa’ 품종은 좌측과 상측의 그룹을 나타내 면서 C. arabica 종에서도 다른 대사체 정보를 나타내는 것으 로 판단되고, ‘Catuai’, ‘CR-95’, ‘Geisra’, ‘Obata’, ‘Vemecia’ 그리고 ‘non’ 품종은 유사한 대사체 정보를 나타내는 것으로 판단된다(Fig. 2A). 이처럼 동일한 C. arabica 계통에서도 대 사체 정보에 의해 품종간 분류가 가능한 것으로 나타났다. 대 사체 정보를 이용한 품종 분류에 대한 보고에 따르면, 아티초 크에서도 대사체를 이용한 품종 분류가 가능하였고(Kim et al., 2016), 다양한 종류의 아프리칸 얌 또한 품종간 분류가 가능하였다(Song et al., 2014). 또한, PCA 분석을 통해 대사 체 수준에서 두과작물 계통 분류가 가능하다고 보고되었다 (Song et al., 2012). 이 결과들은 커피 품종간에 대사체 수준 의 차이가 뚜렷하게 나타나는 것으로 보아 대사체 수준에서 마커 탐색에 가장 중요한 작용할 것으로 판단된다.
8종 커피의 대사체 수준 식별에 중요하게 작용한 FT-IR 스 펙트럼 부위를 확인하였다(Fig. 2B). FT-IR loading value를 확인한 결과, PC 1과 2를 분류하는 중요한 기준은 1650- 1550, 1450-1350 그리고 1100-1000cm-1 부위임을 알 수 있었 다(Fig. 2B). 1650-1550, 1450-1350 그리고 1100-1000cm-1 부위는 FT-IR 스펙트럼상에서 차이를 나타냈던 부위(Fig. 1)와 일치하였고, 이 부위가 나타내는 amide I, II와 carbohydrates 계열의 화합물들이 양적, 질적 차이를 보이면서 커피 대사체 수준 식별에 가장 중요한 역할을 하는 것으로 알 수 있었다 (Schulz and Baranska, 2007)(Fig. 2B).
PLS-DA 분석의 경우 PCA 분석 보다 커피의 종간 식별이 뚜렷하게 나타났다(Fig. 3A). PLS-DA score plot을 보면 ‘Caturra’와 ‘Mahsellesa’ 품종이 ‘Catuai’, ‘CR-95’, ‘Geisra’, ‘Obata’, ‘Vemecia’ 그리고 ‘non’ 품종과는 다르게 그룹을 형 성하였고, ‘Catuai’, ‘CR-95’, ‘Geisra’, ‘Obata’, ‘Vemecia’ 그 리고 ‘non’ 품종이 비슷한 위치에 그룹을 형성하면서 6개의 품종이 비슷한 대사체 정보를 나타내는 것으로 판단된다. 또 한, ‘non’ 품종은 교배종으로 ‘CR-95’와 ‘Geisra’ 품종과 근접 하면서 대사체 정보로 볼 때 두 품종의 교배종으로 판단된다 (Fig. 3A). 이 결과, FT-IR 스펙트럼 데이터를 이용한 PLSDA 분석으로 커피의 품종 구분이 가능함을 알 수 있었다.
HCA dendrogram 분석 결과를 이용하여 ‘non’ 품종의 교배 를 확인하였다(Fig. 3B). ‘non’ 품종은 ‘CR-95’와 ‘Geisra’ 품 종에 높은 유연관계를 나타냈고, ‘Catuai’ 품종과도 유연관계 를 나타냈다. 또한, ‘CR-95’, ‘Geisra’ 과 ‘Catuai’ 품종이 대 사체 분석을 이용한 유연관계 분석에서 유연관계가 다른 품종 에 비해 높게 나타나는 것으로 보아 대사체 정보가 유사한 것 으로 판단된다. 이상의 연구 결과로 판단할 때 커피의 FT-IR 스펙트럼 다변량통계분석을 이용한 대사체 수준에서 커피 품 종 구분이 가능함을 알 수 있었다. 대사체 분석을 이용한 커 피 품종 구분은 현재까지 다양하게 적용되고 있지 않지만 최 근 다양한 작물에서는 대사체 분석을 이용한 품종 식별 사례 가 보고되어 있다. 특히, 두과작물과 아티초크에서 품종간 대 사체 수준에서 FT-IR 스펙트럼의 특정 부위가 질적, 양적 차 이를 통해 품종을 구분이 가능하다고 보고되었다(Song et al., 2012, Kim et al., 2016). 이 FT-IR 스펙트럼의 부위들은 커 피에서 중요하게 작용한 FT-IR 스펙트럼과 일치하는 것을 볼 수 있었다. 또한, FT-IR 스펙트럼 데이터를 이용한 PLS 분석 이 바위 솔 종간 유연관계가 개체간에 대사물질이 차이를 보 였고, 분류학적 유연관계가 92.9%로 높은 예측의 정확도를 나 타났다고 보고된 바 있다(Kim et al., 2011). 그리고 아프리칸 얌에서도 대사물질과 기능성성분을 PLS 분석을 통해 예측이 가능하다고 보고된 바 있다(Song et al., 2014).
따라서 본 연구에서 확립된 대사체 수준에서 커피 품종 식 별 기술은 교배와 계통의 신속한 선발 수단으로 활용이 가능 할 것으로 예상된다.
적 요
본 연구에서는 커피(C. arabica)의 FT-IR 스펙트럼 데이터 를 기반한 다변량통계분석을 이용한 대사체 분석을 통해 품종 식별을 하여 육종 연구에 기초자료로 활용하고자 한다.
-
FT-IR 스펙트럼 데이터를 이용한 PCA(principal component analysis), PLS-DA(partial least square discriminant analysis) 그리고 HCA(hierarchical clustering analysis) 분석을 통해 품종 분류가 가능하였다.
-
커피 품종들은 FT-IR 스펙트럼 부위인 1700-1500-1 (Amide I 과 II을 포함하는 아미노산 및 단백질계열의 화합물 들), 1500-1300-1 (phosphodiester group을 포함한 핵산 및 인 지질의 정보), 1100-950cm-1 (단당류나 복합 다당류를 포함하 는 carbohydrates 계열의 화합물)에서 질적, 양적 정보의 차이 가 나타났다.
-
PCA 상에 나타난 8품종의 커피 품종이 각각 그룹을 형 성하였다. 그 중 ‘Caturra’와 ‘Mahsellesa’ 품종은 각각의 그룹 을 나타내면서 C. arabica 종에서도 다른 대사체 정보를 나타 내는 것으로 확인하였고, ‘Catuai’, ‘CR-95’, ‘Geisra’, ‘Obata’, ‘Vemecia’ 그리고 ‘non’ 품종은 유사한 대사체 정보 를 나타내는 것으로 확인하였다.
-
PLS-DA 분석의 경우 PCA 분석 보다 커피 품종간 식별 이 뚜렷하게 나타났다.
-
본 연구에서 확립된 대사체 수준에서 커피의 품종 식별 기술은 품종, 계통의 신속한 선발 수단으로 활용이 가능할 것 으로 기대되며 육종을 통한 품종개발 가속화에 기여 할 수 있 을 것으로 예상된다.