Giải trình tự ADN là quá trình xác định tình tự các bazo nucleotide (As, Ts, Cs và Gs) trong một đoạn phân tử ADN. Việc giải trình tự toàn bộ hệ gene nhất là của các sinh vật có số lượng ADN lớn là cực kỳ phức tạp. Việc này đòi hỏi cắt phân tử ADN hệ gen thành nhiều mảnh nhỏ hơn, sau đó giải trình tự và sắp xếp các mảnh nhỏ này thành chuỗi thành một chuỗi dài hơn hoặc toàn bộ một nhiễm sắc thể. Vì vậy trước đây việc giải trình tự toàn bộ hệ gen mất rất nhiều thời gian và công sức. Tuy nhiên, hiện nay nhờ có vào các phương pháp mới đã được phát triển trong hai thập kỷ qua, việc giải trình tự toàn bộ hệ gen diễn ra nhanh chóng và rất chính xác, chi phí cho giải trình tự toàn bộ hệ gen cũng rẻ hơn.
Các phương pháp giải trình tự ADN
Sanger sequensing
Giải trình tự ADN theo phương pháp Sanger được phát triển bởi nhà hoá sinh học người Anh Fred Sanger và cộng sự vào năm 1977. Phương pháp này thường được sử dụng để giải trình tự các đoạn ADN ngắn dưới 900 base.
Thành phần cho trình tự Sanger
Giải trình tự ADN theo Sanger thực hiện các bước giống kỹ thuật PCR. Do đó thành phần của phản ứng cũng bao gồm những chất cần thiết để nhân bản DNA, hay cho phản ứng chuỗi polymerase (PCR), sao chép DNA trong ống nghiệm. Bao gồm:
Một enzyme DNA polymerase
Một primer, là một đoạn ngắn của DNA sợi đơn kết hợp với mẫu DNA và hoạt động như một “khởi đầu” cho polymerase
4 nucleotide DNA (dATP, dTTP, dCTP, dGTP)
Trình tự DNA
Ngoài ra, để thực hiện phương pháp Sanger cần phải bổ sung thêm một thành phần đặc biệt khác là:
Dideoxy nucleotide của cả 4 loại bazo nito (ddATP, ddTTP, ddCTP, ddGTP).
Các dideoxy nucleotide tương tự các nucloeotide hoặc deoxy thông thường. Tuy nhiên, chúng thiếu nhóm hydroxyl ở đầu 3’ của phân tử đường. Nhóm 3’-OH hoạt dộng như một cái móc, cho phép một nucleotide mới được thêm vào chuỗi. Khi nucleotide dideoxy được thêm vào chuỗi, không có nhóm 3’-OH nên nucleotide không được thêm vào, phản ứng tổng hợp sẽ dừng lại. Do đó khi thực hiện phản ứng PCR với tám thành phần nucletide như trên sẽ tạo ra các chuỗi ADN có độ dài hơn kém nhau 1 base. Các phân tử ADN này sau đó được biến tính và chạy điện di, để xác định trình tự.
Phương pháp sắp xếp trình tự Sanger
Đoạn DNA cần xác định trình tự được trạo dòng vào vector tách dòng. Sau đó thực hiện đồng thời 4 phản ứng tổng hợp DNA trong 4 ống nghiệm khác nhau . Mỗi phản ứng là hỗn hợp gồm: DNA cần giải trình tự gắn trong vector, DNA mồi, enzyme DNA polymerase, 1% ddNTP đánh dấu đồng vị phóng xạ cho mỗi phản ứng và 4 loại dNTP. Thực hiện phản ứng tổng hợp, các đoạn DNA được tổng hợp có độ dài khác nhau do phân tử ddNTP sẽ gắn ngẫu nhiên làm dừng phản ứng và nhận biết bằng phương pháp điện di.
Sản phẩm của 4 ống nghiệm cũng được phân ly trên cùng một bản gel thực hiện hình phóng xạ có thể quan sát được các băng vạch DNA trên bản gel. Căn cứ vào vị trí các vạch quan sát được trên bản gel mà xác định trình tự các nucleotide trong gel theo chiều từ 5 -3 từ dưới lên trên
GIẢI TRÌNH TỰ ADN
Tiến bộ và hạn chế
Giải trình tự Sanger có thể thực hiện với các đoạn DNA tương đối dài (khoảng 900 cặp base). Phương pháp này thường được sử dụng để sắp xếp các DNA riêng lẻ, như plasmid vi khuẩn hoặc DNA được sao chép trong PCR.
Tuy nhiên, giải trình tự ADN theo phương pháp Sanger là tốn kém và không hiệu quả cho các dự án có quy mô lớn hơn, như trình tự toàn bộ hệ gen hay metagenome.
Giải trình tự ADN thế hệ mới: Pyrosequensing 454
Porysequending 454 do 2 nhà khao học Nyren và Ronaghi của Viện Kỹ thuật Stockholm (Thuỵ Điển) phát minh và được phát triển bởi Công ty 454 Life Science, là một hệ thống giải trình tự DNA 2 bước có độ tương đồng cao với dung lượng lớn hơn rất nhiều so với hệ thống giải trình tự Sanger.
Nguyên lý
Kỹ thuật dựa trên nguyên lý “giải trình tự bằng tổng hợp” bao gồm: khởi động một sợi DNA đã được giải trình tự và giải trình tự sợi bổ sung bằng phản ứng với enzyme. Đây là hệ thống có thể khuếch đại một số lượng lớn các đoạn DNA trong giếng picotiter. Nguyên lý “giải trình tự bằng việc tổng hợp” cũng được dựa trên việc nhận biết các pyrophosphate (PPi) được giải phóng trong quá trình gắn nucleotide, tạo ra một tín hiệu ánh sáng, hiệu quả hơn kỹ thuật kết thúc chuỗi bằng dideoxynucleotide.
Phương thức hoạt động
454 pyrosequensing là một phương pháp tạo ra nhiều đoạn DNA có sự tương đồng cao. Đầu tiên, DNA được cắt thánh các đoạn đầu bằng và được gắn các oligonucleotide adaptor vào cả hai đầu. Từng đoạn này sau đó gắn với một hạt thuỷ tinh và sẽ được khuếch đại bằng PCR trong các giọt nhũ dầu-nước, tạo ra nhiều bản sao đoạn DNA trên mỗi hạt thuỷ tinh. Sau đó các hạt thuỷ tinh được giữ trong các giếng picotiter trên một cơ chất dạng sợi và giải trình tự.
Quá trình giải trình tự diễn ra qua 5 bước. Đầu tiên, sợi khuôn, một sản phẩm PCR sợi đơn, được lai với một primer giải trình tự và sau đó được ủ với các enzyme DNA polymerase, ATP sulfurylase, luciferase và apyrase cũng như các cơ chất adenosine 5’ phosphosulfate (APS) và luciferin. Khi dNTP đầu tiên được bắt cặp bổ sung, nó được gắn với sợi DNA khuôn nhờ DNA polymerase và kèm theo sẽ giải phóng một PPi. PPi được biến đổi thành ATP nhờ enzyme ATP sulfyrelase cùng với sự tham gia của APS, sau đó một phản ứng được xúc tác bởi luciferase sẽ biến đổi luciferin thành oxyluciferin – tạo ra ánh sáng nhìn thấy,có độ sáng tương ứng với lượng ATP tạo thành. Ánh sáng này được nhận biết bởi một camera và phân tích bởi một chương trình phần mềm.
Apyrase làm suy biến các nucleotide không bắt cặp và ATP. Sau quá trình làm suy biến, phản ứng bắt đầu lại với nucleotide khác được gắn vào. Sau một quá trình liên tục, sợi DNA bổ sung được tổng hợp xong và việc giải trình tự nucleotide được xác định từ các đỉnh tín hiệu dựa trên “dấu vết của program”.
Ưu điểm và hạn chế
454 pyrosequengsing có tính linh hoạt cao khi kết cặp primer, phân tích được nhiều đột biến, dữ liệu và thông tin trình tự được tập hợp đầy đủ. Kỹ thuật có tính nhạy cao hơn hẳn so với phương pháp giải trình tự truyền thống với độ chính xác là 99,9% với các đoạn 200 base và 99% với các đoạn 400 base. Hệ thống giải trình tự được 400-600 triệu bp trong 10 giờ vì vậy giá thành thấp hơn so với phương pháp Sanger.
Tuy nhiên, chiều dài đoạn đọc ngắn (khoảng 300~500 nucleotide).