Journal Search Engine
Search Advanced Search Adode Reader(link)
Download PDF Export Citaion korean bibliography PMC previewer
ISSN : 1225-8504(Print)
ISSN : 2287-8165(Online)
Journal of the Korean Society of International Agriculture Vol.28 No.2 pp.259-267
DOI : https://doi.org/10.12719/KSIA.2016.28.2.259

Comparative Genomic Analysis for Identification and Characterization of Common Genes among Parasitic Nematodes

Vimalraj Mani, Kang-Hyun Choi, Parthiban Subramanian, Chang-Muk Lee, Joon-Soo Sim, Ha Young Chung, Inchan Choi, Ja Choon Koo*, Bum-Soo Hahn†
National Institute of Agricultural Sciences, Rural Development Administration, Korea
*Division of Science Education and Institute of FusionScience, Chonbuk National University, Jeonju 54874, Korea
Corresponding author +82-63-238-4612 (bshahn@korea.kr)
February 20, 2016 April 1, 2016 May 10, 2016

Abstract

Plant-parasitic nematodes are the most devastating group of plant pathogens worldwide and are extremely challenging to control. In the present study, we have performed a genome wide analysis to identify common genes among four nematode species consisting of root-knot nematodes (Meloidogyne incognita and Meloidogyne hapla), cyst nematode (Heterodera glycines), and free living nematode (Caenorhabditis elegans) respectively. Using their whole genome sequences, we predicted 15,274 genes from M. incognita, 38,149 genes from M. hapla, 8,061 genes from H. glycines and 23,894 genes from C. elegans, where, among the predicted genes, 1,358, 1,350, 1,401, 1,365 respectively from each nematode, code for common groups of proteins. Further, 2,067, 2,086, 1,566, 2,903 genes were recollected using Clusters of Orthologous Groups (COG) database. Under our search criteria, a total of 800 common genes were identified in all the four studied nematode genomes. The most annotated conserved genes were obtained from four different species using Basic Local Alignment Searching Tool (BLAST). Uni-Prot Taxon identifier database was used to elucidate their taxonomic classification such as 698 genes under kingdom Metazoa, 660 genes confined to Nematoda, 290 genes in Chordata and 660 genes falling under class Chromadorea. The biochemical characterization of proteins expressed by these genes was examined using Pedant-Pro sequence analysis. The protein length, molecular weight, isoelectric point (pI), and transmembrane domain of the coded proteins were at a range of 300 to 999 amino acids (40.9%), molecular weight of over 100 kDa (96%), pI from 4.5 to 5.5 (27.6%) and 0 (56.6%), respectively. To classify protein function, the obtained BLAST hits were assigned to Gene Ontology classification scheme. The fractions of protein function were distributed as cellular component, biological processes and molecular function of the cell (22.2%), multicellular organism process (15.8%) and binding (48.3%), respectively. The current study provides an excellent resource for nematode functional genomics studies, which can be utilized further for studies on role of genes involved in nematode biological processes.


선충 유전체 비교 분석을 통한 식물기생선충의 공통 유전자 발굴 및 특성 분석

머니 비말라즈, 최 강현, 스부라마니안 파르티반, 이 창묵, 심 준수, 정 하영, 최 인찬, 구 자춘*, 한 범수†
농촌진흥청 국립농업과학원
*전북대학교 과학교육학부 생물교육전공

초록


    Rural Development Administration
    PJ01086903

    식물기생선충에 의한 농업손실액은 전 세계적으로 대략 157억 달러에 이른다. 현재 식물기생선충을 제어하는 가장 효 과적인 방법은 살선충제(methyl bromide와 aldicarb)를 사용하 는 것이다. 그러나 이들 대부분은 인간과 환경에 독성을 가지 고 있어 점차 사용이 감소하는 추세에 있다. 바람직하게는 식 물 자체가 식물기생선충에 대한 저항성을 갖는 것이 가장 좋 지만(Trudgill & Blok, 2001), 선행연구에 따르면 다양한 선충 들이 작물 생산력에 피해를 주고 있다고 알려져 있다 (Williamson & Kumar, 2006). 농작물에게 가장 많은 피해를 주는 선충 종류는 뿌리혹선충류(Meloidogyne spp.)와 시스트 선충(GloboderaHeterodera spp.)을 포함하는 Heteroderidae 과로 알려져 있다(Bird & Koltai, 2000). 농업생산성에 크게 영향을 주어 경제적으로 의미가 있는 뿌리혹선충(Meloidogyne incognitaMeloidogyne hapla)과 시스트 선충(Heterodera glycines)은 넓은 기주 범위를 가지고 있는 절대 활물기생체로 알려져 있다.

    Caenorhabditis elegans의 유전체가 해독(Fulton et al., 1998)된 이후, 유전체 연구 분야의 발달로 2008년도에 식물기 생선충인 M. incognita, M. haplaH. glycines의 유전체 서 열이 발표되었다(Abad et al., 2008; Opperman et al., 2008; http://www.ncbi.nlm.nih.gov). 또한 워싱턴대학교 의과 대학에 서는 2003년 뿌리혹선충을 비롯한 여러 선충들의 expressed sequence tag (EST)을 수집하여 유전정보 서열을 발표 하였다 (Martin et al., 2012). 이러한 선충들의 ESTs들과 유전체분석 은 기생선충의 전사체 연구 분야의 폭넓은 분석을 가능하게 하였다(Rosso et al., 2009). 또한 현재 959개의 선충의 유전 체 정보 분석 계획이 진행되고 있어 향후 몇 년 내에 다양한 선충들의 유전정보를 이용하여 선충들의 진화론적 관계분석, 기생선충의 생활사 및 선충방제분야에 이용 등 다양한 분야에 활용할 수 있을 것이다(http://www.nematodes.org).

    이중나선 구조의 RNA (dsRNA)를 예쁜 꼬마 선충(Caenorhabditis elegans)에게 섭취하게 하여 세포내 전사억제 기작 인 RNA interference (RNAi)로 의해 유전자 발현을 억제할 수 있다는 사실이 확인된 이후로(Hannon, 2002; Timmons & Fire, 1998; Timmons et al., 2001), 최근에 식물기생선충이 숙주 내에서 기생하기 위해 필요한 유전자(parasitism genes)들 의 RNAi 억제 기작을 통한 식물기생선충의 방제 연구가 진 행되고 있다(Bakhetia et al., 2005; Bakhetia et al., 2008; Huang et al., 2006; Rosso et al., 2005; Shingles et al., 2007; Sindhu et al., 2009). 이러한 연구 방법은 다양한 선충 유전체 연구가 진행됨에 따라 풍부한 유전자정보를 활용하여 식물기생선충의 방제를 위한 기술로 활용 될 것으로 생각한다.

    본 연구 결과에서는 유전체 정보가 밝혀진 식물기생선충 3종 에 공통으로 들어 있는 유전자를 발굴하기 위하여, Caenorhabditis elegans의 유전자 예측에 최적화된 방법을 활용하 여 3종의 식물기생선충의 유전자 갯수를 재분석하였으며, 이들 유전자가 코딩하는 단백질의 특성 및 기능적인 분류를 진행하 였다. 본 연구 결과는 선충의 유전자 기능 유추를 통한 식물 기생선충의 생활사 이해에 도움이 될 것이고 선충 방제를 위 한 목표 유전자를 정하는데 활용가능하며, 나아가 농업생산성 향상을 위한 선충방제에 활용 할 수 있는 기술로 의의가 있다.

    재료 및 방법

    선충 유전체 자료 수집

    유전체 프로젝트가 진행 중인 식물기생선충 유전체 (Meloidogyne incognita, Meloidogyne hapla 그리고 Heterodera glycines)와 Caenorhabditis elegans의 단백질서열의 비교 분석을 통해 각 선충이 가지고 있는 공통 유전자를 선별하였 다. 수집 자료는 NCBI (National Center for Biotechnology Information)에서 제공하고 있는 3종의 선충 유전체 서열 (Meloidogyne incognita: 4.7Mbp, Meloidogyne hapla: 3.03Mbp, Heterodera glycines: 4.79Mbp)과 Caenorhabditis elegans의 유전자서열로부터 번역된 단백질 서열(23,894)을 가지고 4종 의 선충에 공통으로 존재하는 유전자를 구명 하고자 하였다.

    유전자 예측

    식물기생선층 유전체 서열로부터 유전자를 예측하기 위해서 스페인에서 개발된 ab initio 유전자 예측 프로그램인 Geneid (Guigó et al., 1992)를 사용하였으며, 사용된 프로그램은 splice signal, start codon, stop codon을 인식한 후, 후보 엑손을 계 산하는 방법으로 유전자를 예측 한다. 또한 이 프로그램은 동 물, 식물, 곰팡이 그리고 선충을 비롯한 많은 종에 최적화된 HMM(Hidden Markov Model) 행렬을 포함하고 있다. 본 연구에서는 C. elegans에 최적화된 행렬을 이용하여 M. incognita, M. hapla 그리고 H. glycines의 유전체 서열로부터 유전자를 예측하여 단백질 서열을 추출 하였다.

    종간 서열 분석 및 공통 유전자 탐색

    근연종에 있는 유전자를 진화론적인 분석법으로 타종과의 분석을 통해 일차적으로 서로 다른 종에서 동일한 기능을 수 행하는 ortholog 유전자를 분석하였다. 본 분석에서는 COG 알고리즘에 의한 서열 유사성 분석법을 이용하였다. 이는 서 로 다른 종간의 단백질의 서열을 비교하는 방법으로 최소 세 종 이상의 유전자가 서로 최고값으로 연결될 때 비로소 하나 의 ortholog 그룹을 형성하게 하는 분석 방법이다(Lee et al., 2002; Tatusov et al., 1997). 따라서 분석과정을 수행하기 위 해서 서로 다른 종에서 가장 유사한 단백질을 찾는 BLAST 과정과 가장 유사한 단백질들 간의 연결 고리를 분석하는 과 정으로 나눠 진행 하였다.

    COG 알고리즘(Tatusov et al., 1997)을 이용한 다른 종간에 존재하는 ortholog 분석을 위해 BLAST로 다른 종간의 일정 한 수준의 서열 유사성을 갖는 단백질을 다대다 방법으로 찾 았다. 먼저 유전자 예측을 통해 얻은 4종의 선충 단백질 서열 을 대상으로 BLAST(blastp)를 수행하였다. M. incognita의 모 든 단백질을 쿼리로 하고 H. glycines의 모든 단백질을 데이 타베이스로 하여 M. incognita의 단백질과 가장 서열상 유사 한 H. glycines 단백질을 확인하였다. 이러한 작업은 M. incognita을 기준으로 나머지 3종의 유전체로부터 예측된 단백 질에 대해 각각 수행하였으며 반복적으로 나머지 3종의 유전 체를 기준으로 동일하게 수행하여 총 BLAST를 12번(4 × 3) 수행하였다. BLAST 수행을 위해 e값을 1xe-2으로 설정하여 최소 서열 유사성을 분석 하였으며 가장 높은 서열 유사성을 갖는 단백질 하나만을 선택 하였다.

    BLAST를 이용하여 서로 다른 종간의 가장 유사한 단백질 을 찾은 후, 4종의 선충에 공통으로 존재하는 유전자를 찾고 자 coupling과 ortholog group matching을 통해 이들의 관계 를 분석하였다(Lee et al., 2002). 분석방법을 간략하면, M. incognita의 1번 단백질과 가장 유사한 H. glycines의 단백질 이 1번 단백질일 경우 반대로 H. glycines의 단백질 1번의 가 장 유사한 M. incognita의 단백질이 1번 단백질일 경우에만 서로 쌍이 되는 것으로 기준을 정하였으며, 서로 다른 단백질 이 유사한 단백질로 확인 됐을 경우에는 쌍이 인정되지 않는 것으로 하였다. 이러한 방법으로 최소 3종 이상에서 서로 가 장 유사한 단백질로 쌍이 됐을 경우 ortholog 그룹으로 확정 하였다. 그러나 유전체간의 유전자 구성과 복제수가 모두 동 일하지 않기 때문에 동일 기능의 유전자를 좀 더 확장하고자 예외적으로 ortholog 그룹으로 단백질이 쌍이 되지는 못했으 나 가장 유사한 단백질로 ortholog 그룹에 포함된 단백질로 선택될 경우 이를 paralog 단백질로 인정하여 ortholog 그룹에 포함시켰다.

    단백질 특성 및 기능 분석

    식물기생선충에 공통으로 존재하는 800개의 유전자로부터 예측된 단백질 서열을 가지고 PEDANT software suite (Frishman et al., 2003)를 이용하여 단백질 서열의 유사성, 단 백질의 생화학적인 특성 및 단백질 기능 등을 분석하였다. 분 석 방법을 간략 하면 다음과 같다. BLASTP 프로그램을 사용 하여 UniProt 데이타베이스에서 공통 유전자와 상동성과 유사 성이 높은 단백질을 찾았고 예측된 단백질은 BLASTP 상동성 값으로 그룹화 하였다(Altschul et al., 1997). 단백질의 분자량, 등전점 및 아미노산 갯수 등은 PEDANT 소프트웨어의 사용 를 사용하여 결정하였다(Frishman et al., 2003).

    통계분석에 기초한 방법으로 만들어진 막단백질들의 데이터 베이스, TMbase에서 TMpred 알고리즘울 사용하여 4종 선충 에 공통으로 존재하는 단백질의 세포막을 통과하는 지역과 방 향을 예측하여 막단백질의 특성을 분석 하였다(Hofmann & Stoffel, 1993). Enzyme Commission (E.C) 번호는 blastpgp 알고리즘을 이용하여 단백질 데이터베이스로 부터 추출하였으 며 분류학적 정보는 UniProt 단백질 데이터베이스로 부터 taxon 알고리즘을 이용하여 추출하였다(unpublished). Gene ontology (GO)는 서로 다른 데이터베이스에 있는 유전자들을 기능에 기초하여 일정하게 묘사할 때 사용되는 방법 중 하나로, 크게 biological process, cellular component와 molecular function인 3가지로 분류하여 단백질의 기능을 표현하고 있다. 3가 지의 알고리즘(gobysimilarity, gofromeckw, gofrominterpro)을 사용하여 하나의 단백질에 대한 GO 범주를 추출하였으며, gomerger 방법을 이용하여 세 가지의 알고리즘의 결과를 합쳤 다(Martin et al., 2004). 이러한 gomerger 방법은 세 가지 방법으로 얻어진 유전적 요소의 데이터를 GO 용어에 맞추기 위해 사용하는 방법으로 널리 알려져 있다. 각각의 GO 배치 는 GO 용어 갯수와 질적 값(BLAST e 값 또는 Interpro score)으로 구성되어 있으며 질적 값은 십진수의 마이너스 값 에 로그를 취한 값으로 전환 하였다. 각각의 GO 용어 갯수는 GO 트리에 있는 하나의 점에 대응되며 GO 트리 위쪽을 찾아 최상위 까지 정의된 GO 용어에 대응되게 하였다. 그런 후, 모 든 nodes로 부터의 값은 서로 더했고, GO 범주에 단백질 서 열을 배치하였다(Ashburner & Lewis, 2002; Martin et al., 2004).

    결과 및 고찰

    식물기생선충 유전체로부터 유전자 갯수 결정

    Geneid를 이용한 식물기생선충의 유전자 예측은 C. elegans 의 유전자 예측 모델 행렬을 이용하여 진행하였으며, 유전체 분석을 통해 단백질 서열을 제공하는 C. elegans을 제외한 나 머지 3종의 유전체 서열로부터 예측된 단백질 서열의 갯수는 각각 M. incognita (15,274), M. hapla (8,061)와 H. glycines (38,149)로 예측되었다(Table 1). 이러한 결과는 다른 그룹에서 발표된 선충 유전체분석 결과보다 적은 수의 유전자 갯수를 나타내었다. Abad 등은 M. incognita (47 ~ 51M)의 유전체에 서 19,212개 유전자를 유추하였으며(Abad et al., 2008), Opperman 등은 M. hapla(54M)에서 14,420개의 유전자를 유 추하였다(Opperman et al., 2008). 그러나 H. glycines (81.9M) 유전체 연구는 단백질 갯수를 제공하지 않았다(http://www. ncbi.nlm.nih.gov). 본 연구 결과와 다른 그룹에서 발표된 유전 자 갯수가 다른 이유로는 서로 다른 유전자 예측 프로그램을 사용한 결과로 생각되며 본 연구에서는 다른 그룹들 보다 엄 격한 기준이 사용되어 유추된 유전자 수가 적은 것으로 판단 된다. 이들 유추된 단백질 서열들은 4종의 선충에 공통으로 존 재하는 유전자를 선별하기 위해서 ortholog 분석에 사용하였다.

    식물기생선충의 공통 유전자 선별

    M. incognita를 포함한 4종의 선충유전체를 대상으로 COG 알고리즘을 사용하여 ortholog 분석을 수행한 결과 4종의 선 충에 공통으로 존재하는 유전자를 선별 하였다. 동일한 기능 을 수행할 것으로 예측되는 유전자를 COG 그룹으로 선별한 결과, 1,561 그룹으로 분류할 수 있었다. 또한 선충의 각각의 유전자를 M. hapla (1,410), C. elegans (1,365), M. incognita (1,358)와 H. glycines (1,350)순으로 COG 그룹에 분류 할 수 있었다(Table 2). 이들 중 C. elegans에 가장 많은 2,903 유전자들이 포함되었고, H. glycines (2,086), M. incognita (2,067), M. hapla (1,566) 순으로 유전자들을 분류할 수 있었다 (Table 2). 이러한 결과는 유전체의 크기가 큰 C. elegans에서 그 만큼 유전자의 copy수도 늘어 날 가능성이 크므로 하나의 ortholog 그룹에 하나 이상의 유전자가 포함될 가능성도 함께 증가하여 다른 선충 유전체에 비해 ortholog 그룹이 많이 포 함된 것으로 해석 된다. 그러나 현재 C. elegans를 제외한 식 물기생선충의 경우 완벽한 유전체 서열이 아닌 점을 감안하면, 완벽한 유전체 서열이 밝혀지면 더 많은 유전자들이 ortholog 그룹에 포함될 것으로 기대된다. 또한 4종의 선충에 공통으로 존재하는 유전자를 찾기 위해 BLAST를 이용하여 coupling과 ortholog group matching 방법으로 통해 서로 다른 종간의 가 장 유사한 공통의 단백질 800개를 찾았다. 공통으로 존재 하 는 유전자 중 단백질을 한정할 수 있는 것들은 474개였으며, 단백질 이름을 특정할 수 없는 서열은 326개로 분류되었다. 공통의 단백질 800개의 아미노산 구성 갯수는 32 ~ 1,832개로 존재함을 확인 할 수 있었고 단백질 서열의 평균 유사성은 43.9% ~ 99.9%의 범위를 보였다. 이들 결과에서 확보한 서열 은 단백질 특성 분석에 사용하였다.

    식물기생선충의 공통 단백질 특성 비교 분석

    PEDANT 소프트웨어 내 BLAST를 이용하여 NCBI에서 제 공하는 존재하는 유전자들과 4종의 선충에 공통으로 들어 있는 800개의 유전자들의 서열 상동성을 비교 분석하였다(Table 3). 예측된 것처럼 많은 유전자가 C. elegansB. malayi에서 밝 혀진 유전자와 높은 서열 유사성을 나타냈으며, 이러한 결과 는 다른 선충에 비해 비교적 연구가 많이 되어 있어 활용 가 능한 유전정보가 많은 결과로 생각된다. 상동성이 높은 단백 질 중 arginine kinase (Matthews et al., 2003), Hsp90 (Andrea & Lynn, 2004)과 heat shock protein 70 A (Heterodera glycines, unpublished) 그리고 calponin (Meloidogyne incognita, Castagnone-Sereno et al., 2001)의 유전자는 3종의 식물 기생 선충에 공통으로 존재하는 유전자로 선충방제를 위한 목표 유 전자로 활용이 가능 할 것으로 생각한다. 또한 많은 유전자들 이 동물 기생선충인 B. malayi와 높은 유사성을 보이는 단백 질(protein F10G7.2, DNA topoisomerase 2, EGT36104, Fulton et al., 1998), protein phosphatase PP2A regulatory subunit (NP_498162, Fulton et al., 1998), heat shock 70kDa protein F (XP_001900197, Ghedin et al., 2007), 5'-3' exoribonuclease 2, DNA-directed RNA polymerase (NP_001022450, Fulton et al., 1998), elongation factor 1-alpha (Lun, 2008)과 CHD4 protein 등은 인체 기생 선충의 방제 및 진화론적으로 유전자 기능 연구에 활용이 가능할 것으로 기대 된다. 4종류의 선충에 공통적으로 존재하는 단백질들의 아미노산 갯수 분포는 300 < aa < 999에 속하는 단백질이 가장 많이(40.9%) 존재하였 고 3,000이상의 아미노산으로 구성된 단백질도 0.2% 존재하 였다(Fig. 1(a)). 아미노산 갯수가 가장 많다고 예측된 두 개의 단백질의 e value 값은 0과 3.9e-54으로 각각 4,409개와 3,397 개의 아미노산으로 구성되어 있음을 확인 할 수 있었으나 단백 질 특성은 구명할 수 없었다. 4종류의 선충에 공통적으로 존재 하는 단백질들의 분자량 분포를 분석한 결과, 100kDa 이하로 구성된 단백질(96%)이 가장 많이 존재함을 확인할 수 있었고 (Fig. 1(b)), 5 kDa이하로 구성 된 단백질은 egg laying defective protein 4, isoform e (Dinkova et al., 2005)를 포 함하여 10개가 존재함을 알 수 있었다. 4종류의 선충에 공통 적으로 존재하는 단백질들의 pI값을 분석한 결과 4.5 < pI < 5.5 에 속하는 단백질이 27.6%로 가장 많았으며, 3.5이하의 pI 값 을 갖는 단백질(egg laying defective protein 4, isoform e, Dinkova et al., 2005)은 0.2%로 분포하고 있었으며, 10이상 의 pI 값을 갖는 단백질[40S ribosomal protein S13 (XP_ 001895245), 60S ribosomal protein L23a, Fulton et al, 1998], H1 histone isoform H1.1 (Vanfleteren et al., 1988), ribosomal protein L12 (AAF77031), 60S ribosomal protein L18a (NP_001294214, Fulton et al., 1998)은 7.6%로 주로 소포체를 구성하는 단백질이 주를 이루고 있었다(Fig. 1(c)). 또한 4종 선충에 공통으로 존재하는 막단백질들의 세포막을 통과하는 지역과 방향을 예측하여 막단백질의 특성을 분석한 결과 transmembrane을 적어도 하나를 갖는 막단백질이 43.4% 존재함을 확인할 수 있었고 transmembrane을 전혀 갖지 않은 단백질(F-actin-capping protein subunit alpha (NP_501145, Fulton et al., 1998), intraflagellar transport protein osm-1 (NP_510681, Fulton et al, 1998), elongation factor Tu GTP binding domain (NP_078856), interferon-induced doublestranded RNA-activated protein kinase inhibitor (NP_002750), Protein phosphatase 2C (XP_001902719, Ghedin et al., 2007)은 56.6%로 존재함을 확인할 수 있었다(Fig. 1(d)). 특이 하게 9개의 transmembrane을 갖는 막단백질인 ammonium transporter homolog protein 4 (NP_508783, Fulton et al., 1998)를 확인할 수 있었다.

    GO를 분석한 결과, cellular component 기능에 속하는 extracellular region에 그룹된 단백질이 2.1% 존재함을 확인할 수 있었고, molecular function 기능에 속하는 구조적 역할을 수행하는 단백질이 5% 존재함을 확인할 수 있었다. 또한 biological process에 관여하는 단백질 중 사멸에 관여하는 단 백질이 1.7% 존재함을 확인할 수 있었다(Fig. 2). 이러한 결과 를 바탕으로 선충 유전자 기능분석을 위한 표적 유전자를 선 별하고자 보다 자세한 분석을 실시할 예정이다. 효소학적 분 류 기준에 따라 단백질을 분류한 결과 oxidoreductase (27개), transferase (33개), hydrolase (28개), lyases (11개), ligases (19개)의 기능을 갖는 효소가 많이 존재함을 확인할 수 있었 다(Table 4). Oxidoreductase인 superoxide dismutase에 상응 하는 단백질의 갯수는 2개, transferase 효소인 DNA-directed RNA polymerase는 2개, hydrolase 효소인 adenosinetriphosphatase는 4개, isomerases 효소인 disulfide isomerase는 3개, ligases 효소인 ubiquitin-protein ligase는 2개였다. 분류학적으로 M. incognita는 Eukaryota >Metazoa > Ecdysozoa >Nematoda > Chromadorea > Tylenchida>Tylenchina > Tylenchoidea > Meloid ogynidae >Meloidogyninae >Meloidogyne>Meloidogyne incognita에 속하며 식물기생선충에 공통으로 존재하는 단백질의 분 류학적 정보를 UniProt 단백질 데이터베이스로 부터 taxon 알고리즘을 이용하여 추출한 결과, 예상한 대로 대부분의 단 백질들이 분류학상으로 Nematoda 문(660개)과 Chromadorea 강(660개)에 속함을 확인할 수 있었다(Table 5). 그러나 종간 에 유사성은 동물선충인 B. malayi와 토양선충인 C. elegans 에 많은 유사도를 나타내었는데, 이러한 결과는 두 선충이 비 교적 많은 유전자 정보를 포함하고 있는 결과로 사료 되며, 식 물기생선충 유전체 연구가 보다 강화되면 공통으로 존재하는 유전자는 식물기생선충에 분류학적 상동성이 높게 나타낼 것 으로 생각한다.

    적 요

    본 연구에서는 4종의 선충에 공통으로 존재하는 유전자를 발굴하고자 NCBI에서 유전체 정보를 수집하여 Geneid 프로 그램을 활용하여 각각의 유전체에 존재하는 유전자 갯수를 예 측하였고 각각의 유전자자는 COG 알고리즘을 활용하여 그룹 화하였다. BLAST를 활용하여 일대다대 방법으로 식물기생선 충에 공통으로 존재하는 ortholog를 찾았으며, coupling과 ortholog group matching 방법으로 식물기생선충에 공통된 유 전자를 구명하였다. 또한 식물기생선충에 공통으로 존재하는 단백질 특성 구명하였다. 이러한 연구는 선충의 유전자 기능 분석, 발생학 및 선충방제 등에 활용될 수 있을 것으로 기대 한다.

    • 1 3종의 선충 유전체 분석을 통한 단백질 서열의 갯수는 M. incognita (15,274), M. hapla (8,061)와 H. glycines (38,149) 로 예측되었다.

    • 2 동일한 기능을 수행할 것으로 예측되는 유전자들을 COG 그룹으로 분류한 결과 M. hapla (1,410), C. elegans (1,365), M. incognita (1,358)와 H. glycines (1,350)순서였다. COG 그룹에 포함된 유전자 갯수는 C. elegans에서 가장 많은 2,903 유전자들이 포함되었고, H. glycines (2,086), M. incognita (2,067), M. hapla (1,566) 순으로 유전자들이 속함 을 알 수 있었다.

    • 3 BLAST를 실행하여 4종에 동시에 들어 있는 단백질 특 성 분석을 실행한 결과, 단백질의 아미노산 갯수는 300 < aa < 999에 속하는 단백질이 가장 많이 존재하였고 단백 질 분자량은 100 kDa 이하로 구성된 단백질(96%)이 많이 존 재함을 확인할 수 있었고 pI값은 4.5 < pI < 5.5에 속하는 단백 질이 27.6%로 가장 많았다.

    • 4 GO 분석의 결과 세포 기능에 관여하는 단백질이 531개 (22.2%), 결합 기능에 관여하는 단백질이 533개(48.3%)과 세 포내 과정 기능에 관여하는 단백질이 552개(18.9%) 존재함을 확인할 수 있었다.

    ACKNOWLEDGMENT

    본 논문은 농촌진흥청 연구비(PJ01086903)에 의해서 지원되 었습니다.

    Figure

    KSIA-28-259_F1.gif

    Biochemical characterization of common proteins predicted among the four nematode genomes. The distribution of protein length (a), molecular weight (b), isoelectric point (c) and number of transmembrane domains (d).

    KSIA-28-259_F2.gif

    Assignment of Gene Ontology (GO) terms for common proteins. Most protein sequences classified as main components, such as cellular component (A), biological process (B) and molecular function (C) are indicated. Individual GO categories may have multiple mappings. Percentage shows the total categories annotated under each component.

    Table

    The number of genes predicted from four nematode genomes

    COG analysis of common proteins predicted in four nematode genomes

    Comparison of most conserved nematode genes between M. incognita and other studied nematodes (Caenorhabditis spps and parasitic nematodes)

    Selected E.C number classification of proteins coded by genes of nematodes. The E.C. numbers were obtained from UniProt database hits. The number of genes associated with each E.C. class are detailed in the sorting column. The selected E.C. numbers have a minimum of at least two hits

    Classification of genes based on their phylogeny. Taxonomic classifications were obtained from UniProt database using taxon algorithm

    Reference

    1. Abad P , Gouzy J , Aury J M , Castagnone-Sereno P , Danchin E G (2008) Genome sequence of the metazoan plantparasitic nematode Meloidogyne incognita , Nat. Biotechnol, Vol.26 ; pp.909-915
    2. Altschul S F , Madden T L , Schaffer A A , Zhang J , Zhang Z , Miller W , Lipman D J (1997) Gapped BLAST and PSIBLAST: a new generation of protein database search programs , Nucleic Acids Res, Vol.25 ; pp.3389-3402
    3. Andrea M S , Lynn K C (2004) Molecular characterization and phylogenetic evaluation of the Hsp90 gene from selected nematodes , Journal of Nematology, Vol.36 ; pp.466-480
    4. Ashburner M , Lewis S E (2002) On ontologies for biologists: the Gene Ontology - uncoupling the web , Novartis Found Symp, Vol.247 ; pp.66-80
    5. Bakhetia M , Charlton W , Atkinson H J , McPherson M J (2005) RNA interference of dual oxidase in the plant nematode Meloidogyne incognita , Mol. Plant-Mic. Inter, Vol.18 ; pp.1099-1106
    6. Bakhetia M , Urwin P E , Atkinson H J (2008) Characterization by RNAi of pioneer genes expressed in the dorsal pharyngeal gland cell of Heterodera glycines and the effects of combinatorial RNAi , Int. J. Parasitol, ; pp.1589-1597
    7. Bird D M , Koltai H (2000) Plant parasitic nematodes: habitats, hormones, and horizontally-acquired genes , J Plant Growth Regul, Vol.19 ; pp.183-194
    8. Castagnone-Sereno P , Leroy F , Abad P (2001) cDNA cloning and expression analysis of a calponin gene from the plant-parasitic nematode Meloidogyne incognita , Molecular & Biochemical Parasitology, Vol.112 ; pp.149-152
    9. Dinkova T D , Keiper B D , Korneeva N L , Aamodt E J , Rhoads R E (2005) Translation of a small subset of Caenorhabditis elegans mRNAs is dependent on a specific eukaryotic translation initiation factor 4E isoform , Molecular and Cell Biology, Vol.25 ; pp.100-113
    10. Frishman D , Mokrejs M , Kosykh D , Kastenmüller G , Kolesov G , Zubrzycki I , Gruber C , Geier B , Kaps A , Albermann Volz K , Wagner C , Fellenberg M , Heumann K , Mewes HW (2003) The PEDANT genome database , Nucleic Acids Research, Vol.31 ; pp.207-211
    11. Fulton L , Courtney L , Fulton R , Godfrey J , Lindsay T G etal (1998) The C. elegans genome sequencing consortium. Genome sequence of C. elegans: a platform for investigating biology , Science, Vol.282 ; pp.2012-2018
    12. Ghedin E , Wang S , Spiro D , Caler E , Zhao Q (2007) Draft genome of the filarial nematode parasite Brugia malayi , Science, Vol.317 ; pp.1756-1760
    13. Guigó R , Knudsen S , Drake N , Smith T J (1992) Prediction of gene structure , Mol Biol, Vol.226 ; pp.141-157
    14. Hannon G J (2002) RNA interference , Nature, Vol.418 ; pp.244-251
    15. Huang G , Allen R , Davis E L , Baum T J , Hussey R S (2006) Engineering broad root-knot resistance in transgenic plants by RNAi silencing of a conserved and essential root-knot nematode parasitism gene , Proc. Natl. Acad. Sci. U.S.A, Vol.103 ; pp.14302-14306
    16. Hofmann K , Stoffel W (1993) TMbase-A database of membrane spanning proteins segments , Biol. Chem. Hoppe-Seyler, Vol.374 ; pp.166
    17. Lee Y , Sultana R , Pertea G , Cho J , Karamycheva S , Tsai J , Parvizi B , Cheung F , Antonescu V , White J , Holt I , Liang F , Quackenbush J (2002) Cross-referencing eukaryotic genomes: TIGR Orthologous Gene Alignments (TOGA) , Genome Res, Vol.3 ; pp.493-502
    18. Lun D H (2008) Genetic tests of ancient asexuality in root knot nematodes reveal recent hybrid origins , BMC Evolutionary Biology, Vol.8 ; pp.194
    19. Matthews B F , MacDonald M H , Thai V K , Tucker M L (2003) Molecular characterization of arginine kinases in the soybean cyst nematode (Heterodera glycines) , Journal of Nematology, Vol.35 ; pp.252-258
    20. Martin D , Berriman M M , Barton G J (2004) GOtcha: a new method for prediction of protein function assessed by the annotation of seven genomes , BMC Bioinformatics, Vol.5 ; pp.178
    21. Martin J , Abubucker S , Heizer E , Taylor C M , Mitreva M (2012) Nematode.net update 2011: addition of data sets and tools featuring next-generation sequencing data , Nucleic Acids Research, Vol.40 ; pp.D720-D728
    22. Opperman C H , Bird D M , Williamson V M , Rokhsar D S , Burke M , Cohn J , Cromer J , Diener S , Gajan J , Graham S , Houfek T D , Liu Q , Mitros T , Schaff J , Schaffer R , Schollt E , Sosinski B R , Thomas V P , Windham E (2008) Sequence and genetic map of Meloidogyne hapla: A compact nematode genome for plant parasitism , Proc. Natl. Acad. Sci. U.S.A, Vol.105 ; pp.14802-14807
    23. Rosso M N , Jones J T , Abad P (2009) RNAi and functional genomics in plant parasitic nematodes , Annu Rev Phytopathol, Vol.47 ; pp.207-232
    24. Rosso M N , Dubrana M P , Cimbolini N , Jaubert S , Abad P (2005) Application of RNA interference to root-knot nematode genes encoding esophageal gland proteins , Mol. Plant Microbe. Interact, Vol.18 ; pp.615-620
    25. Shingles J , Lilley C J , Atkinson H J , Urwin P E (2007) Meloidogyne incognita: molecular and biochemical characterisation of a cathepsin L cysteine proteinase and the effect on parasitism following RNAi , Exp. Parasitol, Vol.115 ; pp.114-120
    26. Sindhu A S , Maier T R , Mitchum M G , Hussey R S , Davis E L , Baum T J (2009) Effective and specific in planta RNAi in cyst nematodes: expression interference of four parasitism genes reduces parasitic success , J. Exp. Bot, Vol.60 ; pp.315-324
    27. Tatusov R L , Koonin E V , Lipman D J (1997) A genomic perspective on protein families , Science, Vol.278 ; pp.631-637
    28. Timmons L , Fire A (1998) Specific interference by ingested dsRNA , Nature, Vol.395 ; pp.854
    29. Timmons L , Court D L , Fire A (2001) Ingestion of bacterially expressed dsRNAs can produce specific and potent genetic interference in Caenorhabditis elegans , Gene, Vol.263 ; pp.103-112
    30. Trudgill D L , Blok V C (2001) Apomictic, polyphagous rootknot nematodes: exceptionally successful and damaging biotrophic root pathogens , Annu. Rev. Phytopathol, Vol.39 ; pp.53-77
    31. Vanfleteren J R , Van Bun S M , Van Beeumen J J (1988) The primary structure of the major isoform (H1.1) of histone H1 from the nematode Caenorhabditis elegans> , Biochem J, Vol.255 ; pp.647-652
    32. Williamson V M , Kumar A (2006) Nematode resistance in plants: the battle underground , Trends Genet, Vol.22 ; pp.396-340