Giải trình tự nanopore là công nghệ giải trình tự thế hệ thứ ba với lợi thế về đoạn đọc dài, dữ liệu thu nhận theo thời gian thự (real-time) và khả năng phát hiện trực tiếp các biến đổi trên base (modification).
Ngày 09/08/2024, nhóm nghiên cứu của BGI/MGI đã tung ra một ấn phẩm in trước (preprint) trên BioRxiv về một hệ thống giải trình tự nanopore với tên gọi CycloneSEQ (Hình 1). Rất có thể BGI/MGI đã có kế hoạch để ra mắt hệ thống này trong một vài năm tới.

Nguyên lý hoạt động
CycloneSEQ có nguyên lý hoạt động giống với công nghệ giải trình tự của Oxford Nanopore Technologies (ONT), đó là dựa vào sự thay đổi tín hiệu dòng điện khi các phân tử DNA mạch đơn (ssDNA) đi qua nanopore. Bốn loại base khác nhau (A, T, G, C) sẽ cho ra sự thay đổi tín hiệu dòng điện khác nhau, từ đó các thuật toán máy học (mechine learning) có thể phân tích để đưa ra trình tự DNA.
Thông lượng & thời gian
Thử nghiệm khi giải trình tự bộ gene E. coli cho thấy một mẻ chạy của CycloneSEQ có thể kéo dài hơn 4 ngày (Hình 2c), lượng dữ liệu thu được hơn 50Gb (Hình 2d). Đây là một điểm sáng của sản phẩm, bởi vì đối với công nghệ giải trình tự nanopore thì thời gian mẻ chạy càng dài sẽ càng có lợi bởi vì dữ liệu sẽ được thu nhận liên tục theo thời gian.

Chất lượng giải trình tự
Thử nghiệm khi giải trình tự bộ gene người sử dụng mẫu là dòng tế bào HG002 cho thấy chiều dài đoạn đọc trung bình là 19.2kb, với N50 = 33.6kb (Hình 3a). Hệ thống CycloneSEQ có độ dài đoạn đọc cao hơn công nghệ SMRT của PacBio, nhưng vẫn thua xa giải pháp Ultralong read của ONT.
Chất lượng đoạn đọc (read quality) trung bình của CycloneSEQ vào khoảng Q14 (Hình 3b). Điều này cho thấy BGI/MGI cần nhiều nỗ lực để theo kịp độ chính xác của các sản phẩm long-read khác trên thị trường.

Tài liệu tham khảo
Zhang, Jia-Yuang, et al. “A single-molecule nanopore sequencing platform.” BioRxiv (2024).