Nguồn gốc người Việt: Nghiên cứu mới về bộ gen, di truyền và tổ tiên

Tổ tiên người Việt là ai? Đâu là nguồn gốc người Việt? Gen người Việt không trùng với người Trung Quốc và nghiên cứu hệ gen của dân tộc Kinh và 21 dân tộc khác của Việt Nam giúp làm sáng tỏ điều gì về đa dạng di truyền của người Việt Nam?
Sputnik

Các nhà khoa học vẫn đang miệt mài đi tìm câu trả lời cho câu hỏi: Tổ tiên người Việt là ai? Trên thực tế, vấn nguồn gốc tổ tiên người Việt vốn là một vấn đề nhạy cảm, phức tạp, gây nhiều tranh cãi, cần nhiều hơn nữa những bằng chứng khách quan về nghiên cứu bộ gen di truyền của người Việt.

Tổ tiên người Việt là ai? Công bố nghiên cứu bộ gen người Việt gây sốc

Oxford University Press mới đây có đăng tải thông tin về nghiên cứu liên quan đến di truyền của người Việt Nam, đề cập nghiên cứu của GS. Nông Văn Hải, Viện Nghiên cứu hệ gen, Viện Hàn lâm Khoa học và Công nghệ Việt Nam cùng với GS, Mark Stoneking, Viện Max Planck về Nhân chủng học tiến hóa phân tích dữ liệu mới đa hình đơn phân tử trên toàn bộ hệ gen của người Kinh và 21 dân tộc khác ở Việt Nam.

Trước đó, tài năng của các nhà khoa học Việt Nam cũng được khẳng định khi giải mã thành công hệ gen của virus SARS-CoV-2 trên hệ máy giải trình tự thế hệ mới.

Sự đa dạng di truyền của người Việt Nam

Việt Nam có sự đa dạng về ngôn ngữ và dân tộc, chiếm vị trí quan trọng ở Đông Nam Á lục địa (MSEA). Việt Nam, với đường biên giới dài, tiếp giáp với Trung Quốc, Lào và Campuchia, có sự đa dạng về địa lý phong phú, và khả năng tiếp cận rộng rãi giữa sự di cư của con người với các đồng bằng sông Hồng và sông Mê Kông, cũng như một đường bờ biển dài.

Công bố quốc tế về giải trình tự gen người Việt gây bất ngờ

Người hiện đại (về mặt giải phẫu) đã sớm định cư ở MSEA từ ít nhất 65 nghìn năm trước và gắn liền với sự hình thành của một nền văn hóa truyền thống săn bắn hái lượm được gọi là Văn hóa Hòa Bình. Kể từ thời kỳ đồ đá mới, có niên đại khoảng 4.000-5.000 năm trước, sự chuyển đổi và đa dạng hóa văn hóa đã xảy ra nhiều lần, cuối cùng dẫn đến sự đa dạng văn hóa lớn trong MSEA ngày nay.

Theo Tổng cục Thống kê Việt Nam, Việt Nam có dân số hơn 96 triệu người gồm 54 dân tộc chính thức; với 110 ngôn ngữ khác nhau được sử dụng. Cho đến nay, có hàng trăm nhóm ngôn ngữ học ở MSEA, các ngôn ngữ nói thuộc 5 nhóm ngôn ngữ (ngữ hệ) chính: Nam Á (Austro-Asiatic - AA), Nam Đảo (Austronesian - AN), Hmông-Miền (Hmong-Mien - HM), Thái - Kadai (Tai-Kadai - TK) và Hán-Tạng (Sino-Tibetan- ST)

Tuy nhiên, sự đa dạng di truyền của Việt Nam vẫn chưa được khám phá hết, đặc biệt là với dữ liệu toàn bộ bộ gen, bởi vì các nghiên cứu trước đây chỉ tập trung chủ yếu vào nhóm người chiếm đa số là người Kinh.

Tổ tiên người Việt: Nghiên cứu hệ gen của người Kinh và 21 dân tộc Việt Nam

Các nhà khoa học phát hiện ra loại gen ở một người phụ nữ giúp bà không cảm thấy đau đớn
Vừa qua, trong một bài báo mới được xuất bản được công bố trên tạp chí Molecular Biology and Evolution1 (Q1, IF~15, xếp top 2 về sinh học phân tử và tiến hóa), GS Nông Văn Hải, Viện Nghiên cứuhệ gen (Viện Hàn lâm KHCN Việt Nam) và GS Mark Stoneking, Viện Max Planck về Nhân chủng học tiến hóa cùng với các đồng nghiệp đã phân tích dữ liệu mới đa hình đơn phân tử (single nucleotide polymorphisms – SNP) trên toàn bộ hệ gen của người Kinh và 21 dân tộc khác ở Việt Nam, thuộc cả năm ngữ hệ chính ở Đông Nam Á, cùng với dữ liệu đã được công bố trước đây từ nhóm cư dân lân cận và các mẫu vật cổ.

“Chúng tôi thấy rằng các nhóm dân tộc Việt Nam có sự đa dạng di truyền từ nhiều nguồn khác nhau, có liên quan đến sự chia sẻ tổ tiên không đồng nhất trong mỗi nhóm ngôn ngữ”, GS. Nông Văn Hải cho biết.
“Tuy nhiên, sự đa dạng về ngôn ngữ không hoàn toàn phù hợp với sự đa dạng di truyền, đã có sự tương tác sâu rộng giữa các nhóm người H'mông và Tai-Kadai, và một trường hợp có khả năng khuếch tán văn hóa trong đó một số nhóm thuộc ngữ hệ Nam Á đã chuyển sang nói thứ tiếng thuộc ngữ hệ Nam Đảo”, nhà nghiên cứu Dang Liu nói thêm.

Trên phạm vi toàn cầu, tín hiệu mạnh nhất ngăn cách hầu hết các nhóm Ấn Độ với các nhóm Đông Á. Họ cũng tìm thấy bằng chứng cho thấy nhóm người Kinh, vốn là trọng tâm của các nghiên cứu trước đây, có thể không phản ánh sự đa dạng của người Việt Nam.

Dân số Việt Nam: Đông dân thứ 15 thế giới, thứ ba ở Đông Nam Á

Trong các nhóm tiếng Việt hiện đại, các cá nhân trong cùng một gia đình ngôn ngữ hầu hết được đặt cùng nhau. Trong các họ ngôn ngữ này, các nhóm ST, HM và TK hầu hết được tách ra khỏi các nhóm AA và AN. Các nhóm dân tộc học Việt Nam nói chung có xu hướng thể hiện mối quan hệ gần gũi nhất với các nhóm Đài Loan và miền Nam Trung Quốc.

"Nhìn chung, kết quả nghiên cứu của chúng tôi nhấn mạnh tầm quan trọng của việc lấy mẫu của các nhóm dân tộc khác nhau nhằm xây dựng hoàn chỉnh dữ liệu hệ gene, từ đó cung cấp những hiểu biết mới về sự đa dạng di truyền và lịch sử của một khu vực đa sắc tộc, mà Việt Nam là ví dụ điển hình”, tác giả Mark Stoneking cho biết.
“Trái ngược với các nghiên cứu trước đây về nguồn gốc bản địa của người Việt Nam, chúng tôi tìm thấy bằng chứng đã có sự tiếp xúc rộng rãi, trong các khoảng thời gian khác nhau, giữa người Việt Nam và các nhóm khác”, GS Mark Stoneking nói thêm.

Nguồn gốc người Việt: Vấn đề cực kỳ phức tạp

Đây được xem là nghiên cứu đầy đủ nhất cho đến nay, sử dụng các phương pháp hiện đại trong phân tích dữ liệu hệ gen, nhằm làm rõ sự đa dạng phong phú về mặt di truyền của người Việt Nam.

Bác sĩ Việt khó tin Trung Quốc biến đổi gen người chống HIV

Trước đó, tác giả Hà Văn Tấn, trong công trình Theo dấu các văn hóa cổ (NXB Xã hội) cũng đề cập đến “Giả thuyết bản địa” cho rằng nguồn gốc chính từ người Việt bản địa, vốn là chủ nhân của các nền văn hóa thời kỳ đồ đá tại Việt Nam từ 7-20 Ka BP (Kilo annum before present), ngàn năm trước.

TS. Nguyễn Việt, Trung tâm Tiền sử Đông Nam Á nêu quan điểm cho rằng, câu hỏi nguồn gốc người Việt là một vấn đề cực kỳ phức tạp và ngành gen hay các ngành khác cũng chỉ như “Thầy bói xem voi”.

“Không chỉ người Việt có nhu cầu tìm nguồn gốc, ngay gần nước ta, Thái Lan, Trung Quốc cũng đang tìm nguồn gốc chính mình”, TS. Nguyễn Việt chia sẻ.

Trên thực tế, nhiều nước đã xây dựng bộ dữ liệu gen rất đồ sộ, thậm chí có “câu lạc bộ các nước giải trình tự 100.000 đến 1 triệu bộ gen”. Còn với số lượng mẫu ít như Việt Nam hiện có, khó có thể khẳng định được điều gì về nguồn gốc ngay tại thời điểm hiện nay.

Việc cho rằng gen người Việt không trùng với gen người Trung Quốc chỉ dựa trên nghiên cứu hệ gene của người Kinh, trong khi đó người Việt gồm rất nhiều tộc người khác. Nghiên cứu hệ gen của cả 22 dân tộc cho phép nhìn nhận khách quan hơn, khoa học hơn về nguồn gốc người Việt.

“Tất cả các lĩnh vực, lịch sử, ngôn ngữ, địa lý, các ngành khoa học nói chung cùng nỗ lực mới dần dần làm le lói câu trả lời cho câu hỏi chúng ta là ai, chúng ta từ đâu đến. Nếu không có phân tích bộ gen khảo cổ thì không giải quyết được gì”, GS. Nông Văn Hải bày tỏ.
Bí mật hệ gen người Việt dần hé lộ?

Trước đó, năm 2019, Viện Hàn lâm Khoa học và Công nghệ Việt Nam đã công bố kết quả nghiên cứu hệ gen người Việt. Cụ thể, ngày 2/10/2019, Viện Hàn lâm Khoa học và Công nghệ Việt Nam đã tổ chức Hội thảo giới thiệu một số kết quả nghiên cứu hệ gen người trong thời gian vừa qua.

Việt Nam chưa cho phép chỉnh sửa gen trên người

Sau biết bao cố gắng, nỗ lực của các nhà khoa học, những kết quả đầu tiên của Việt Nam về hệ gen người đã được thế giới công nhận. Một số kết quả nổi bật về giải trình tự toàn bộ hệ gen người Việt Nam và người bệnh trong những năm gần đây đã được công bố trên các tạp chí quốc tế có uy tín như Human Mutation, Scientific Reports, Gene…

Các khía cạnh nghiên cứu về hệ gien người Việt Nam như: giải trình tự và phân tích hệ gen người Việt Nam, nghiên cứu biến đổi gen ảnh hưởng của chất độc da cam/dioxin lên sức khỏe người, giám định gen tìm hài cốt liệt sĩ, phân tích hệ gen biểu hiện phục vụ chẩn đoán và điều trị bệnh hiếm gặp đều đã gặt hái được những thành công đáng khích lệ.

Cụ thể, như đã công bố, các nhà khoa học của Viện Nghiên cứu hệ gen với công nghệ giải trình tự gen thế hệ mới đã triển khai giải trình tự toàn bộ hệ gen của 43 cá thể, trong đó có 10 cá thể người khoẻ mạnh làm trình tự tham chiếu và 33 người thuộc 11 gia đình (bố mẹ và con) có người bố bị phơi nhiễm dioxin và con bị bệnh.

Điều đáng nói là Viện đã giải trình tự toàn bộ hệ gen ti thể và toàn bộ vùng không trao đổi chéo (vùng đặc hiệu giới tính nam, MSY) của nhiễm sắc thể Y của 609 cá thể.

Đối với việc nghiên cứu về sự đa dạng di truyền người Việt, nhóm nghiên cứu đã giải mã 609 hệ gen ty thể hoàn chỉnh từ các cá thể của 17 dân tộc thuộc 5 ngữ hệ. Phân tích phát sinh chủng loại của tổng số 2.742 trình tự, bao gồm 609 trình tự người Việt Nam cùng với 2.133 trình tự khác từ các dân tộc cư trú trên lục địa Đông Nam Á và Đài Loan (Trung Quốc).

Qua đó, các nhà khoa học Việt Nam đã phát hiện được 111 dòng nhánh (lineages) mới DNA ty thể của Việt Nam khoảng 2,5-3 ngàn năm về trước, trùng với nền Văn hóa Đông Sơn, và do vậy có thể liên quan đến sự mở rộng nền văn hoá theo xu hướng nông nghiệp.

Đây là bằng chứng khoa học mới, đầu tiên trên thế giới về di truyền phân tử người liên quan đến khoảng thời gian ra đời của nền văn hoá Đông Sơn.

Phát hiện mới này đã được công bố trên tạp chí Scientific Reports. Mục tiêu của đề tài còn có giải trình tự hoàn chỉnh hệ gien các thành viên của một số gia đình (bố mẹ và các con), phục vụ cho các nghiên cứu lâu dài về hệ gen người Việt Nam.

Dân số Việt Nam sẽ là 104 triệu người vào năm 2030

Thêm vào đó, Viện cũng đã và đang tiến hành giải trình tự toàn bộ hệ gen biểu hiện của hơn 600 người thuộc các nhóm bệnh khác nhau như tim mạch, ung thư thực quản, ung thư võng mạc, chậm phát triển trí tuệ, tự kỷ, bệnh Parkinson, các bệnh hiếm gặp, các bệnh chưa xác định rõ nguyên nhân.

Các nhà khoa học cũng đã xác định được nguyên nhân di truyền của các bệnh hiếm, mở rộng được phổ đột biến gen gậy bệnh trên các bệnh nhân mắc bệnh hiếm ở Việt Nam như: xiro niệu, seckel, glycogen, bệnh chuyển hóa ure.

Kết quả nghiên cứu hiện đang được ứng dụng hiệu quả trong việc xác định nguyên nhân gây ra những bệnh di truyền hiếm gặp trên các bệnh nhi tại Bệnh viện Nhi Trung ương, góp phần hỗ trợ các bác sĩ trong chẩn đoán và điều trị bệnh, phục vụ công tác tư vấn di truyền cho các gia đình có tiền sử bệnh muốn sinh con.

Dự án nghiên cứu hệ gen người Việt nhận được sự quan tâm của các cấp lãnh đạo Đảng và Nhà nước, Bộ Khoa học – Công nghệ và Viện Hàn Lâm khoa học và Công nghệ Việt Nam, đồng thời được nhiều chuyên gia hàng đầu về nghiên cứu hệ gen, công nghệ gen của các nước như Mỹ, Anh, Pháp, Đức, Nhật Bản cùng hợp tác nghiên cứu.

Việt Nam giải mã thành công hệ gen coronavirus (SARS-CoV-2)

Còn một thông tin rất đáng chú ý nữa chính là việc các nhà khoa học thuộc Viện Công nghệ Sinh học, Viện Hàn lâm Khoa học và Công nghệ Việt Nam cùng với Viện Pasteur TP.HCM đã giải mã thành công hệ gen của virus SARS-CoV-2 trên hệ máy giải trình tự thế hệ mới.

Xác định nhóm người có nguy cơ tử vong cao hơn khi nhiễm COVID-19

Kết quả giải trình tự hệ gen của virus SARS-CoV-2 bằng công nghệ giải trình tự SMRT mà không cần hệ gen tham chiếu cho thấy Viện Công nghệ sinh học có khả năng ứng dụng công nghệ giải trình tự hiện đại trong việc giải mã tác nhân gây bệnh mới trong tình hình cấp thiết một cách nhanh chóng và hiệu quả (cả quá trình từ việc lập thư viện cDNA, giải trình tự, lắp ráp và chú giải gen chỉ mất 2 ngày), đáp ứng khả năng ứng biến khi một dịch bệnh hoàn toàn mới xảy ra mà không phải chờ đợi vào hỗ trợ của cộng đồng quốc tế.

Trong khuôn khổ chương trình hợp tác Viện Pasteur TP.HCM đảm trách các bước liên quan đến nuôi chủng virus phân lập từ bệnh nhân nhiễm SARS-CoV-2 trên tế bào VeroE6, sau đó tách chiết ARN của virus và tổng hợp cDNA mạch đôi từ ARN (ADN bổ sung).

Viện Công nghệ sinh học sử dụng kỹ thuật giải trình tự đoạn dài đơn phân tử theo thời gian thực trên hệ thiết bị giải trình tự thế hệ mới PacBio SEQUEL để giải trình tự hệ gene của virus SARS-CoV-2 dựa trên cDNA của chủng virus do Viện Pasteur TPHCM cung cấp.

Việt Nam đang chạy đua để không có ca tử vong vì Covid-19

Chia sẻ về kết quả giải mã thành công trình tự hệ gen virus SARS-CoV-2, GS.TS Nông Văn Hải, Viện Nghiên cứu Hệ Gen, Viện Hàn lâm KH&CN Việt Nam cho biết, nhờ kết quả giải trình tự gen có thể thấy virus lan truyền như thế nào, tốc độ lan truyền tại các thời điểm và ước tính được số lượng người có thể bị nhiễm bệnh.

“Các giải trình tự gene SARS-CoV-2 là yếu tố quan trọng để thiết kế và đánh giá các xét nghiệm chẩn đoán, để dò và truy dấu sự tiến triển của dịch bệnh cũng như nhận diện các lựa chọn can thiệp tiềm năng. Dùng để thiết kế phương thức điều trị và văcxin, đồng thời cho phép hiểu sâu hơn về các liệu pháp và văcxin hữu hiệu nhất có thể thay đổi như thế nào khi virus tiến hóa”, GS.TS Nông Văn Hải nhấn mạnh.

Trong nghiên cứu này, kết quả lắp ráp và chú giải hệ gen cho ra đủ và chính xác các trình tự mã hóa gene của virus SARS-CoV-2. Kết quả kiểm chứng khi so sánh với các trình tự tham chiếu của NCBI và trình tự các chủng virus SARS-CoV-2 do Viện Pasteur TP.HCM và Viện Vệ sinh Dịch tễ Trung ương đăng ký trên Dữ liệu thế giới (GISAID) cho thấy trình tự lắp ráp của Viện Công nghệ sinh học có độ chính xác cao, tương đồng gần 100% với các trình tự tham chiếu. Đây thực sự là điều rất đáng mừng đối với các nhà khoa học Việt Nam.

Thảo luận