Tổng quan tình hình nghiên cứu về DNA mã vạch trên thế giới hiện nay

DNA mã vạch, một khái niệm được đưa ra bởi Heber (2003), là trình tự nucleotide của một chuỗi DNA ngắn, có cùng nguồn gốc tổ tiên (orthologous), trong đó có vùng ít bị thay đổi (rất ổn định – bảo thủ) và có vùng dễ thay đổi trong quá trình tiến hóa. Dựa vào mức độ thay đổi trong trình tự DNA này để đánh giá sự sai khác di truyền giữa các sinh vật. Như vậy, DNA mã vạch là một phương pháp định danh mới sử dụng một hoặc nhiều đoạn DNA chuẩn ngắn nằm trong hệ genome của sinh vật đang nghiên cứu, nhằm xác định sinh vật đó thuộc về loài nào. Sau khoảng 10 năm nghiên cứu và phát triển DNA mã vạch, đến nay các nhà khoa học đã công bố hơn hàng nghìn công trình khoa học trên các tạp chí khoa học chuyên ngành, với hơn 3.483.696 trình tự mã vạch DNA ở 215.513 loài sinh vật, trong đó động vật có 144.402 loài, thực vật có 54.478 loài, nấm và các dạng sinh vật khác có 16.633 loài. Nhiều kết quả nghiên cứu đã cho thấy, có nhiều đoạn DNA đặc trưng được sử dụng làm DNA mã vạch, các đoạn DNA mã vạch có thể là những đoạn DNA nằm ở trong nhân như: 18S, 5,6S, 26S, 5S và vùng ITS; nằm ở ty thể như: Cytb và vùng kiểm soát (control region); nằm ở lục lạp như: matK, rcbL, atpβ, ndnF (Cuenoud, 2002; Kress et al., 2008; Aron et al., 2008; Spooner et al., 2009). Có khoảng 8 locus gen đã được sử dụng làm mã vạch DNA ở các loài thực vật, bao gồm cả hệ gen nhân và hệ gen lục lạp (vùng xen atpF-atpH, gen matK, gen rbcL, gen rpoC1, vùng xen psbK-psbI, vùng xen trnH-psbA và vùng gen nhân ITS).

Li et al. (2018) đã thực hiện nhiều phân tích so sánh trên 10 bộ gen lục lạp khác nhau của các loài hồng ăn trái thuộc chi Thị (Dyospyros) thu thập từ vườn thực vật Bắc Kinh (Beijing Botanical Garden, Chinese Academy of Sciences) và Ngân hàng gen hồng Quốc gia (khoa Nông nghiệp, trường đại học Tây Bắc A&F, Dương Lâm, tỉnh Thiểm Tây, Trung Quốc). Tám vùng gen có độ đa hình cao bao gồm trnH-psbA, rps16-trnQ, rpoB-trnC, rps4-trnT-trnL, ndhF, ndhF-rpl32-trnL, ycf1a, và ycf1b đã được tìm thấy. Các trình tự tiềm năng này có thể được phát triển thành chỉ thị DNA lục lạp nhằm nhận biết các cá thể ở cấp độ trên loài.

D’Agostino et al. (2018) đã giải mã trình tự đầy đủ của bộ gen lạp thể từ 8 loài thuộc chi Ớt (Capsicum). Các phân tích so sánh cho thấy được độ đa dạng cao, kết quả là do các đột biến điểm và đột biến chèn hoặc mất đoạn (InDels) tạo ra. Trong đó, accD, ndhB, rpl20, ycf1, và ycf2 là các gen giá trị nhất. Các trình tự đa hình được tìm thấy đã mở ra triển vọng phát triển chỉ thị phân tử hữu ích cho việc phân biệt các loài trong chi Capsicum.

Dillon et al. (2013) đã thực hiện đánh giá hiệu quả của 11 chỉ thị phân tử SSR trong nghiên cứu nhận diện giống loài, nhận diện cây con và bố mẹ, đồng thời phán đoán độ đa dạng di truyền quần thể. Thông qua việc kiểm tra trên nhiều giống xoài Mangifera indica L. khác nhau các chỉ thị phân tử này đã chứng tỏ được hiệu quả tối ưu trong kỹ thuật fingerprinting với trung bình 8.36 alen ở mỗi locus được nhận diện. Các chỉ thị SSR đã giúp nhận diện bố mẹ của cây lai tạo ra từ việc thụ phấn bằng tay và cả thụ phấn tự do với độ tin cậy 95%.

Mursyidin và Daryono (2016) đã thực hiện một nghiên cứu nhằm đánh giá quan hệ và độ đa dạng di truyền của các giống sầu riêng (Durio zibethinus Murr.) trồng tại Nam Kalimantan (Indonesia) dựa trên các chỉ thị phân tử RAPD. Mười một mẫu giống sầu riêng và 6 primer RAPD, bao gồm PA-01, OPA-02, OPA-07, OPA-16, OPA-18 và OPA-19 đã được sử dụng. Các mẫu sầu riêng kiểm tra cho kết quả đa dạng cao với độ đa hình 82.17%.

Vanijajiva (2011) đã tiến hành kiểm tra độ đa dạng di truyền của các giống sầu riêng (Durio zibethinus Murr.) trồng ở tỉnh Nonthaburi (Thái Lan) bằng kỹ thuật RAPD với 9 primer (OPAM-03, OPAM-12, OPAM18, OPB-01, OPB-14, OPC-01, OPC-05, OPK-05 và OPZ-03). Tổng cộng 90 đoạn DNA, kích thước dao động từ 100 đến 3000 bp đã được khuếch đại; trong số đó, 34 sản phẩm được kết luận đa hình.

Rosmaina et al. (2016) đã tiến hành đánh giá quan hệ và độ đa dạng di truyền của các giống sầu riêng (Durio zibethinus Murr.) của Indonesia dựa trên các chỉ thị phân tử RAPD. Sáu primer bao gồm OPT-09, OPO-05 OPY-16, OPY-15, OPD-08 và OPY-14 cho kết quả nhận diện tốt nhất trên 5 giống sầu riêng: Bakul, Ome Kampar, Tembaga, Sijantung và Keong Mas.

Siew et al. (2018a) đã sử dụng chỉ thị phân tử SSR để nghiên cứu khác biệt di truyền của 27 giống sầu riêng nằm trong bộ sưu tập giống của trường đại học Putra Malaysia. Dựa trên các trình tự DNA tìm thấy từ GenBank, bảy cặp primer đã được thiết kế để khuếch đại các vùng SSR. Kết quả cho thấy độ đa dạng cao giữa các mẫu sầu riêng kiểm tra. Các vân tay DNA (DNA fingerprints) đặc thù đã được tìm thấy cho 21 trên tổng số 27 giống sầu riêng nghiên cứu nhờ 5 (trên tổng số 7) chỉ thị phân tử SSR cho độ đa hình cao. Kết quả nghiên cứu này không những chứng tỏ tính khả thi của các chỉ thị phân tử SSR trong kỹ thuật DNA fingerprinting trên mẫu giống sầu riêng mà còn đặt ra thách thức mới trong công tác xác định cá thể ở cấp độ dưới loài.  

Wang et al. (2018) đã tiến hành nghiên cứu bộ gen lục lạp của giống cỏ Conyza bonariensis [L.] Cronquist (flaxleaf fleabane), một giống cỏ dại khó kiểm soát phổ biến ở nhiều nước trên thế giới, mục tiêu nhằm tìm ra những mã vạch DNA mới và sử dụng toàn bộ bộ gen lục lạp như một siêu mã vạch (super-barcode) phục vụ kỹ thuật nhận diện phân tử. Từ trình tự có được, một mã vạch DNA hữu hiệu, rps16 và trnQ-UUG, đã được thiết kế và thành công phân biệt được ba loài Conzya phổ biến (C. bonariensis, C. canadensisC. sumatrensis). Các phân tích phả hệ dựa trên bộ gen lục lạp của C. bonariensis, C. canadensis và 18 loài thuộc họ Cúc (Asteraceae)đã chứng minh được tiềm năng của bộ gen lục lạp như một siêu mã vạch thực vật có thể phân biệt các loài có quan hệ di truyền gần.

Nemecková et al. (2018) đã tiến hành phân tích genotyping sử dụng các chỉ thị phân tử SSR, phân tích phân tử trình tự ITS1-5.8S-ITS2 và sự phân phối nhiễm sắc thể của các trình tự ribosome DNA nhằm đánh giá độ đa dạng di truyền của các giống chuối vùng cao Đông Phi (East African highland bananas (EAHBs)). Kết quả kiểm tra kiểu gen với 19 chỉ thị SSR cho thấy các giống chuối nghiên cứu thuộc 4 nhánh trong phân tích phả hệ. Các phân tích trình tự vùng ITS (internal transcribed spacer regions) đã chứng minh được mối quan hệ của các giống chuối EAHBs với Musa acuminataM. Schizocarpa. Kết quả đưa ra khả năng các giống chuối EAHBs có nguồn gốc từ một dòng lai đơn với bố mẹ là M. acuminata ssp. Zebrina và ssp. Banksii.

Gálvez-López et al. (2009) đã tiến hành phân tích độ đa dạng và quan hệ di truyền của 112 mẫu giống xoài (Mangifera indica) bản địa thu từ 16 bang khác nhau của Mexico và 4 mẫu đối chứng (3 giống xoài Ataulfo, Manila và Tommy, và một loài xoài khác Mangifera odorata) bằng chỉ thị phân tử AFLP (amplified fragment length polymorphism) và SSR (simple sequence repeat). Cả AFLP và SSR đều cho thấy độ tương đồng di truyền cao giữa các quần thể xoài và tạo thành hai nhóm chính gồm xoài từ vùng duyên hải vịnh Mexico và từ các vùng duyên hải hay ngoài khơi Thái Bình Dương. Độ đa dạng di truyền cao nhất được phát hiện trong các cá thể ở từng bang. Giá trị dị hợp dao động từ thấp (0.38) đến trung bình (0.68). Các dữ liệu thu được cho thấy hiện tượng thụ phấn tự nhiên hay cảm ứng (natural or induced pollination) thường xảy ra trên xoài dẫn đến việc phân ly cũng như tái tổ hợp di truyền đóng vai trò chính yếu trong quá trình đa dạng hóa di truyền của các quần thể xoài Mexico. AFLP được đánh giá cho hiệu quả mạnh mẽ hơn so với SSR trong phân tích quan hệ di truyền giữa các giống xoài bản địa của Mexico.

Siew et al. (2018) đã sử dụng 25 primer ISSR (inter-simple sequence repeat) với mục tiêu đánh giá mức độ đa dạng di truyền của 27 giống sầu riêng từ 4 vườn trái cây của trường đại học Putra Malaysia. Mười hai trên tổng số 25 primer sử dụng cho kết quả 133 đoạn DNA khuếch đại rõ ràng và trong đó có 122 sản phẩm được đánh giá là đa hình. Các primer đã được thiết kế để khuếch đại 4 vùng DNA lục lạp (vùng spacer giữa các gen trnL-trnF, atpB-rbcL và trnH-psbA và một phần gen matK). Trong đó, vùng spacer gen trnL-trnF và gen matK mặc dù được khuếch đại thành công trong phản ứng PCR nhưng không cho kết quả đa hình, thậm chí khi sử dụng các mẫu sầu riêng từ Việt Nam.

Fitmawati et al. (2017) đã tiến hành phân tích và so sánh trình tự nucleotide của các giống xoài khác nhau thuộc chi Mangifera từ vùng trung tâm Sumatra dựa trên vùng spacer giữa gen trnL và trnF. Kết quả cho thấy một nhóm đơn ngành (monophyletic) gồm hai nhánh tách biệt M. kemanga khỏi các loài khác bao gồm M. foetida, M. odorata, M. laurinaMangifera sp. Ngoài ra, nghiên cứu cũng cho thấy M. kemanga là loài gần với tổ tiên nhất và cũng là loài đầu tiên xuất hiện ở vùng trung tâm Sumatra.

Hidayat et al. (2012) đã sử dụng gen mã hóa maturaseK nằm trên bộ gen lục lạp để phân tích 19 loài thuộc chi Mangifera thu thập từ Indonesia và Thái Lan. Phân tích phả hệ cho thấy matK có thể nhận diện và chia chi Mangifera thành ba nhóm chính. Ngoài ra, mã vạch matK có khả năng nhận diện các giống xoài đến từ Thái Lan. Kết quả phân tích còn cho thấy sự khác biệt trong trình tự gen matK của hai loài M. laurina và M. macrocarpa giữa Indonesia và Thái Lan.

Yu et al. (2011) đã tiến hành nghiên cứu nhằm tìm ra một chỉ thị mã vạch DNA thích hợp cho việc nhận diện loài. Bốn vùng mã hóa của bộ gen lạp thể bao gồm matK, rpoB, rpoC1 và rbcL thu thập từ 59 mẫu vật thuộc nhóm cam chanh (Citrus group) và những cây họ hàng gần đã được sử dụng. matK cho hiệu quả tốt nhất so với các vùng khác trong khi rpoB và rpoC1 không cho kết quả khác biệt rõ ràng, còn rbcL cho kết quả phân tích với hiệu quả trung bình.

Pagliaccia et al. (2015) sử dụng chỉ thị phân tử AFLP để kiểm tra độ đa dạng di truyền cũng như định danh lại nhiều mẫu thanh long khác nhau. Nhiều giống thanh long mặc dù được đặt tên khác nhau nhưng kết quả phân tích cho thấy có độ tương đồng cao.

Fazekas et al. (2008) so sánh 8 vùng mã vạch thực vật có nguồn gốc từ bộ gen lục lạp và một vùng từ bộ gen ty thể để đánh giá hiệu quả của chúng trong việc phân biệt các nhóm đơn ngành (monophyly) từ 92 loài thuộc 32 chi thực vật trên cạn khác nhau. Các chỉ thị phân tử nằm trên bộ gen lục lạp bao gồm năm vùng mã hóa rpoB (rpoC1, rbcL, matK và 23S rDNA) và 3 vùng không mã hóa (trnH-psbA, atpF-atpH và psbK-psbI). Các vùng trình tự trong nghiên cứu có khả năng khác nhau khi phân biệt loài, khả năng khuếch đại và hiệu quả giải trình tự. Độ phân tích locus đơn dao động từ 7% (23S rDNA) đến 59% (trnH-psbA). Độ hồi phục trình tự phụ thuộc chủ yếu vào hiệu quả khuếch đại (85-100% trên các locus lục lạp) còn đối với matK đòi hỏi nhiều công sức hơn để đạt được độ hồi phục thích hợp (88% khi sử dụng 10 cặp primer) matK, psbK-psbI và trnH-psbA gặp vấn đề trong việc giải trình tự hai chiều. Nếu bỏ qua các vấn đề kỹ thuật trong hiệu quả khuếch đại và giải trình tự thì việc kết hợp nhiều chỉ thị phân tử lục lạp khác nhau có thể đem lại lợi ích hết sức rõ ràng trong việc nhận diện loài.

Tripathi et al. (2013) đã tiến hành kiểm tra độ hữu hiệu của 5 locus mã vạch thực vật (rbcL, matK, ITS, trnH-psbA và ITS2) trên 300 mẫu cây trồng nhiệt đới. rbcL là locus tốt nhất với khả năng khuếch đại trong PCR và giải trình tự. ITS và trnH-psbA là hai locus cho hiệu quả thứ nhì sau rbcL. Khả năng phân biệt và nhận diện loài của ITS dao động từ 24,4% đến 74,3%, từ 25,6% đến 67,7% đối với trnH-psbA phụ thuộc vào dữ liệu và phương pháp sử dụng matK và ITS2 cho hiệu quả khuếch đại PCR kém nhất. Độ phân tích loài khi dùng ITS2 và rbcL dao động từ 9,0-48,7% và 13,2-43,6%. Việc kết hợp giữa ITS và trnH-psbA cho hiệu quả nhất định trong phân tích đa dạng di truyền, đặc biệt đối với các loài thực vật nhiệt đới, khi so sánh với độ hiệu quả chuẩn của chương trình mã vạch DNA được báo cáo ở thời điểm hiện tại. Việc sử dụng rbcL và matK không cho hiệu quả tốt khi sử dụng làm mã vạch cho cái loài thực vật nhiệt đới.

Hướng nghiên cứu xây dựng cơ sở dữ liệu DNA mã vạch đang được nhiều quốc gia và nhiều nhà khoa học trên thế giới rất quan tâm phát triển, đặc biệt trong những năm gần đây và sẽ là một xu thế nghiên cứu trong thời gian tới. DNA mã vạch được xem là một công cụ mới, hỗ trợ có hiệu quả trong nghiên cứu về phân loại, phát hiện loài mới, giám định loài và các mẫu có nguồn gốc từ sinh vật sống hoặc đã chết thậm chí đã qua chế biến, vì vậy mã vạch DNA có rất nhiều ứng dụng trong nghiên cứu cũng như thực tiễn (Nimis, 2010; Bruni, 2010; Bell, 2011; Hebert, 2003; Lahaye, 2008; Liu, 2010). Ưu điểm của công nghệ này là định danh loài nhanh chóng. Nếu xây dựng mẫu chuẩn thì trong vòng 4 giờ đã cho kết quả rất chính xác. Có thể phát triển và áp dụng nó ở các tổ chức hoạt động trong lĩnh vực kiểm định.

          Như vậy dựa trên các nghiên cứu cho thấy các trình tự rbcL, matK, ITS, trnH-psbA, atpF-atpH, psbK-psbI có thể xác định được sự khác biệt trong trình tự của các loài thực vật. Do đó, các trình tự này sẽ được sử dụng để xác định vùng trình tự đặc trưng của dâu Hạ Châu.

Tài liệu tham khảo

D’Agostino, N., Tamburino, R., Cantarella, C., and Carluccio, V. D., Sannino, L., Cozzolino, S., Cardi, T., and Scotti, N. (2018) The Complete Plastome Sequences of Eleven Capsicum Genotypes: Insights into DNA Variation. Genes. 9(10): 503.

Dillon, N.L., Bally, I.S.E., Hucks, L.A., Wright, C.L., Innes, D.J., and Dietzgen, R.G. (2013). Implementation of SSR markers in mango breeding in Australia. Acta horticulturae. 992(992): 259-267.

Fazekas, A.J., Burgess, K.S., Kesanakurti, P.R., Graham, S.W., Newmaster, S.G., Husband, B.C., Percy, D.M., Hajibabaei, M., and Barrett, S.C.H. (2008) Multiple Multilocus DNA Barcodes from the Plastid Genome Discriminate Plant Species Equally Well. PLoS ONE. 3(7): e2802. doi:10.1371/journal.pone.0002802

Fitmawati, Fauziah, R., Hayati, I., Sofiyanti, N., Inoue, E., and Matra, D.D. (2017). Phylogenetic analysis of Mangifera from central region of Sumatra using trnL-F intergenic spacer. 18: 1035–1040.

Gadissa, F., Tesfaye, K., Dagne, K., and Geleta, M. (2018) Genetic diversity and population structure analyses of Plectranthus edulis (Vatke) Agnew collections from diverse agro- ecologies in Ethiopia using newly developed EST-SSRs marker system. BMC Genetics. 19(92):  1–15.

Gálvez-López, D., Hernández-Delgado, S., González-Paz, M., Becerra-Leor, E.N., Salvador-Figueroa, M., and Mayek-Pérez, N. (2009) Genetic analysis of mango landraces from Mexico based on molecular markers. Plant Genetic Resources: Characterization and Utilization. 7(3): 244-251.

Hidayat, T., Pancoro, A., Kusumawaty, D., and Eiadthong, W. (2012) Development matK Gene as DNA Barcode to Assess Evolutionary Relationship of Important Tropical Forest Tree Genus Mangifera. Jurnal Teknologi (Sciences & Engineering). 59: 17–20.

Lange, C., Goeke, D.F., Bourdôt, G.W., Lamoureaux, S.L., Podolyan, A., and Houliston, G.J. (2018) Molecular markers for Nassella trichotoma (Poaceae) to study genetic variation in New Zealand. 1: 3–7.

Li, W., Liu, Y., Yang, Y., Xie, X., Lu, Y., Yang, Z., and Jin, X. (2018) Interspecific chloroplast genome sequence diversity and genomic resources in Diospyros. 1–11. Miguel, S.F. (2009) Genetic analysis of mango landraces from Mexico based on molecular markers.

Mursyidin, D.H., and Daryono, B.S. (2016) Genetic Diversity of Local Durian (Durio zibethinus Murr.) Cultivars of South Kalimantan’s Province Based on RAPD Markers. AIP Conference Proceedings. 1755(1) 10.1063/1.4958483.

Nemecková, A., Christelová, P., Cížková, J., Nyine, M., Van den houwe, I., Svacina, R., Uwimana, B., Swennen, R., Doležel, J., and Hribová, E. (2018) Molecular and Cytogenetic Study of East African Highland Banana. Front. Plant Sci. 9:1371. doi: 10.3389/fpls.2018.01371

Nyine, M. (2018) Molecular and Cytogenetic Study of East African Highland Banana. 9: 1–13.

Pagliaccia, D., Vidalakis, G., Douhan, G.W., Lobo, R., Tanizaki, G., Extension, C., and County, S.D. (2015) Genetic Characterization of Pitahaya Accessions Based on Amplified Analysis. 50: 332–336.

Rosmaina, Warino, J., Suhaida, and Zulfahmi (2016) Genetic variability and relationship among durian cultivars (Durio zibethinus Murr.) in Thekampar, Indonesia assessed by RAPD markers. Pak. J. Biotechnol. 13(2): 87-94.

Siew, G.Y., Ng, W.L., Salleh, M.F., Tan, S.W., Ky, H., Banu, N., et al. (2018b) Assessment of the Genetic Variation of Malaysian Durian Varieties using Inter-Simple Sequence Repeat Markers and Chloroplast DNA Sequences. 41: 321–332.

Siew, G.Y., Ng, W.L., Tan, S.W., Alitheen, N.B., Tan, S.G., and Yeap, S.K. (2018a) Genetic variation and DNA fingerprinting of durian types in Malaysia using simple sequence repeat (SSR) markers. 1–18.

Tripathi, A.M., Tyagi, A., Kumar, A., Singh, A., and Singh, S. (2013) The Internal Transcribed Spacer (ITS) Region and trnhH- psbA Are Suitable Candidate Loci for DNA Barcoding of Tropical Tree Species of India. 8.

Vanijajiva, O. (2011) Genetic variability among durian (Durio zibethinus Murr.) cultivars in the Nonthaburi province, Thailand detected by RAPD analysis. J. Agri Tech. 7(4): 1107–1116.

Wang, A., Wu, H., Zhu, X., Lin, J., Schneeweiss, G.M., Werner, T., and Braukmann, A. (2018) Species Identification of Conyza bonariensis Assisted by Chloroplast Genome Sequencing. 9: 1–8.

Yu, J., Yan, H., Lu, Z. and Zhou, Z. (2011). Screening potential DNA barcode regions of chloroplast coding genome for Citrus and its related genera. Scientia Agricultura Sinica, 44: 341-348.

Nguyễn Thị Vân

Đăng ngày: 12/11/2020