Một Số Vấn Đề Về Di Truyền Phân Tử

KỸ THUẬT PHÂN TÍCH ADN VÀ PROTEIN
I. Các kỹ thuật phân tích axit nucleic

1. Điện di phân tích ADN và ARN
Có nhiều phương pháp khác nhau có thể được sử dụng để phân tích
ADN và ARN, nhưng cho đến nay điện di trên gel là phương pháp được sử
dụng phổ biến hơn cả nhờ ưu điểm nhanh và tương đối đơn giản. Nguyên tắc
của phương pháp là do: dưới tác động của điện trường, các phân tử ADN
(thường tích điện âm) khác nhau về kích thước, điện tích, mức độ cuộn xoắn
và dạng phân tử (mạch thẳng hay mạch vòng) sẽ di chuyển qua hệ mạng của
gel từ cực âm (cathode) sang cực dương (anode) với tốc độ di chuyển khác
nhau. Vì vậy, chúng dần dần tách nhau ra trên trường điện di, qua đó người ta
có thể thu thập và phân tích được từng phân đoạn ADN hoặc gen riêng rẽ.
Trên điện trường các phân đoạn ADN có kích thước càng nhỏ càng có tốc độ
di chuyển trên điện trường nhanh hơn. Sau khi điện di kết thúc, các phân tử
ADN có thể quan sát thấy nhờ sử dụng các thuốc nhuộm phát huỳnh quang,
chẳng hạn như ethidium (chất này gắn kết với ADN bằng cách cài vào khe ở
giữa các nucleotit). Mỗi một băng điện di thường phản ánh một tập hợp các
phân tử ADN có cùng kích thước.
Có hai loại vật liệu làm gel được sử dụng phổ biến trong điện di, đó là
agarose và polyacrylamid. Trong đó, gel polyacrylamid có khả năng phân
tách cao, nhưng khoảng kích thước ADN có thể phân tích hẹp. Vì vậy, điện di
trên gel polyacrylamid có thể phân tách được các phân đoạn ADN khác nhau
thậm trí chỉ một cặp nucleotit (1 bp) duy nhất, nhưng thường chỉ để phân tích
các đoạn ADN kích thước vài trăm bp. Còn gel agarose có khả năng phân tách
thấp hơn đối với các phân đoạn ADN kích thước nhỏ, nhưng rất hiệu quả khi
phân tách các phân đoạn ADN kích thước lớn tới hàng chục hoặc hàng trăm
kb (1 kb = 1000 bp).
Các phân đoạn ADN kích thước lớn không thể “lọt” qua các lỗ có kích
thước nhỏ trên các bản gel, kể cả gel agarose. Thay vào đó, chúng sẽ “trườn”
qua mạng lưới của gel bằng việc đầu này của phân tử đi trước, còn đầu kia
theo sau. Kết quả là các phân đoạn ADN kích thước lớn (từ 30 đến 50 kb) có
tốc độ di chuyển trên điện trường gần như tương đương và khó phân tách
được bằng phương pháp điện di thông thường. Đối với các phân đoạn ADN
kích thước lớn như vậy, người ta có thể phân tách bằng việc sử dụng phương
pháp điện di xung trường (pulsed-field gel electrophoresis). Trong phương
pháp này, người ta sử dụng 2 cặp điện cực nằm chéo góc trên bản điện di
(Hình 10.2). Việc “bật” và “tắt” luân phiên 2 cặp điện cực sẽ làm cho các
phân đoạn ADN lớn thay đổi chiều di chuyển như mình họa trên hình vẽ. Các
phân đoạn ADN có kích thước càng lớn càng chậm hơn trong quá trình thay
đổi chiều di chuyển. Nhờ vậy, các phân đoạn có kích thước khác nhau sẽ phân
tách ra khỏi nhau trong quá trình di chuyển. Kỹ thuật điện di xung trường
27
trong thực tế có thể sử dụng để xác định được kích thước đầy đủ của nhiễm
sắc thể vi khuẩn, hoặc nhiễm sắc thể các loài sinh vật nhân chuẩn bậc thấp,
như nấm men. Những loài này có kích thước hệ gen khoảng vài Mb.
Điện di không những có thể phân tách các phân đoạn ADN khác nhau
về kích thước mà cả về hình dạng và cấu hình không gian của chúng. Các
phân tử ADN ở dạng mạch vòng giãn xoắn hoặc bị “đứt gãy” ở một số
nucleotit di chuyển chậm hơn trên trường điện di so với các phân tử ADN ở
dạng mạch thẳng có cùng khối lượng. Tương tự như vậy, các phân tử ADN ở
dạng siêu xoắn, kích thước và thể tích thu nhỏ thường di chuyển nhanh hơn
trên trường điện di so với các phân tử ADN dạng mạch vòng giãn xoắn hoặc
có mức độ cuộn xoắn thấp hơn có cùng khối lượng.
Kỹ thuật điện di cũng được sử dụng để phân tách các phân tử ARN. Các
phân đoạn ADN sợi kép mạch thẳng có cấu trúc bậc hai đồng nhất nên tốc độ
di chuyển trên trường điện di tương quan tỉ lệ thuận với khối lượng phân tử
của chúng. Cũng giống như ADN, các phân tử ARN cũng thường tích điện
âm, nhưng ngoài cấu trúc cơ bản ở dạng mạch đơn, các cấu trúc bậc 2 và 3
của phân tử ARN có ảnh hưởng đến tốc độ di chuyển của chúng trên trường
điện di. Để hạn chế điều này, thông thường người ta phải xử lý ARN với một
số hóa chất ngăn cản sự hình thành các liên kết cục bộ trong phân tử ARN,
chẳng hạn như glyoxal. Hợp chất này liên kết với nhóm -NH 2 trong các bazơ
nitơ và ngăn cản sự kết cặp của các nucleotit. Các phân tử ARN được xử lý
glyoxal không hình thành được các cấu trúc bậc 2 và 3 vì vậy có tốc độ di
chuyển trên trường điện di dường như đơn thuần phụ thuộc vào khối lượng
phân tử của chúng. Cùng nguyên tắc tương tự, chúng ta sẽ thấy ở phần sau
của chương này điện di có thể sử dụng để phân tách các phân tử protein.
2. Sử dụng enzym giới hạn trong phân tích ADN
Hầu hết các phân tử ADN trong tự nhiên đều lớn hơn nhiều so với kích
thước có thể thao tác và phân tích một cách thuận lợi trong phòng thí nghiệm.
Trong các tế bào, phần lớn các nhiễm sắc thể thường là một phân tử ADN dài
chứa hàng trăm thậm trí hàng nghìn gen khác nhau. Vì vậy, để có thể phân lập
và phân tích từng gen, người ta phải cắt các phân tử ADN kích thước lớn
thành các phân đoạn nhỏ. Công việc này được thực hiện bởi một nhóm các
enzym đặc biệt gọi là enzym giới hạn.
Tất cả các enzym giới hạn đều có hai đặc tính: 1) nhận biết một trình tự
đặc hiệu trên phân tử ADN (gọi là trình tự giới hạn); và 2) cắt bên trong phân
tử ADN tại vị trí đặc hiệu (hoặc ngay tại vị trí giới hạn như đối với nhóm
enzym giới hạn loại II; hoặc cách vị trí giới hạn một số nucleotit nhất định
như đối với các nhóm enzym giới hạn thuộc các nhóm I và III). Trong các
nhóm enzym giới hạn, nhóm thường được dùng trong các nghiên cứu di
truyền phân tử và kỹ nghệ gen là nhóm II nhờ vị trí và trình tự cắt của chúng
được xác định rõ. Trong phạm vi giáo trình này, vì vậy chúng ta chỉ đề cập
28
đến việc ứng dụng của nhóm enzym giới hạn này. Các trình tự giới hạn của
enzym nhóm II thường gồm 4 - 8 bp, thông thường có tính đối xứng và vị trí
cắt thường nằm trong trình tự giới hạn này. Ví dụ như enzym giới hạn EcoRI
được tìm thấy ở vi khuẩn E. coli có trình tự giới hạn là 5’-GAATTC-3’ với vị
trí cắt ở giữa G và A. Tên enzym gồm 3 ký tự đầu chỉ tên loài vi khuẩn mà từ
đó enzym được tìm thấy (Eco = Escherichia coli), các ký tự sau chỉ tên của
chủng vi khuẩn và số thứ tự của enzym được tìm thấy ở loài vi khuẩn đó
(EcoRI là enzym giới hạn đầu tiên được tìm thấy ở E. coli).
Một enzym giới hạn có trình tự giới hạn gồm 6 bp giống EcoRI thông
thường được trông đợi sẽ có trung bình một vị trí cắt trong một đoạn trình tự
có kích thước khoảng 4 kb (bởi theo nguyên tắc xác suất tại một vị trí nhất
định xác suất để có một loại nucleotit nhất định là 1/4, vì vậy xác suất để có
một trình tự nhất định gồm 6 bp sẽ là 1/46 = 1/4096). Giả sử có một phân tử
ADN mạch thẳng có 6 vị trí cắt của enzym EcoRI (hình 10.3). Việc cắt phân
tử ADN này bằng EcoRI sẽ cho ra 7 phân đoạn ADN khác nhau. Do đó, khi
điện di trên gel sản phẩm cắt, 7 phân đoạn ADN sẽ phân tách nhau ra do
chúng khác nhau về khối lượng (vì chúng khác nhau về thành phần và trình tự
các nucleotit). Như vậy, một phân đoạn ADN sẽ tương ứng với một vùng của
phân tử ADN ban đầu.
Việc sử dụng một enzym giới hạn khác, chẳng hạn HindIII cũng có
trình tự giới hạn gồm 6 bp, nhưng có trình tự giới hạn thay đổi (5’-AAGCTT-
3’) sẽ cho ra các sản phẩm cắt khác với khi sử dụng EcoRI (với cùng phân tử
ADN ban đầu). Như vậy, việc sử dụng đồng thời nhiều enzym giới hạn sẽ tạo
ra một kiểu hình phổ điện di các phân đoạn cắt giới hạn đặc thù đối với từng
gen phân tích.
Đối với một số enzym giới hạn khác, chẳng hạn như Sau3A1 (tìm thấy
ở vi khuẩn Staphylococcus aureus) có trình tự giới hạn ngắn hơn (5’-GATC-
3’), nên tần số cắt của chúng thường cao hơn các enzym có trình tự giới hạn
dài. Theo xác suất, Sau3A1 có trung bình 1 vị trí cắt trong một đoạn trình tự
khoảng 250 bp (1/44 = 1/256). Ngược lại, enzym NotI có trình tự giới hạn dài
(5’-GCGGCCGC-3’) trung bình cứ một đoạn trình tự dài khoảng 65 kb, mới
có 1 vị trí cắt (1/48 = 1/65536).
Các enzym giới hạn không chỉ khác nhau về trình tự giới hạn và độ dài
đoạn trình tự giới hạn đặc trưng của chúng, mà chúng còn khác nhau về cách
“cắt” phân tử ADN. Chẳng hạn như enzym HpaI tạo ra các phân tử ADN
dạng đầu bằng (đầu tù), còn các enzym EcoRI, HindIII và PstI cắt phân tử
ADN tạo ra các phân đoạn có đầu dính (xem hình 10.4). Sở dĩ gọi là “đầu
dính” bởi phần các trình tự ở hai đầu sau khi được enzym cắt ra bổ trợ với
nhau theo nguyên tắc Chargaff và vì vậy chúng có xu hướng “dính” trở lại với
nhau, hoặc với các phân tử ADN được cắt bởi cùng một loại enzym giới hạn.
29
Tính chất này được ứng dụng rộng rãi trong công nghệ ADN tái tổ hợp và các
kỹ thuật tách dòng phân tử.
3. Các phương pháp lai phân tử và mẫu dò
Như đã trình bày ở Chương I (mục 4.3), các phân tử ADN sợi kép có
một tính chất đặc biệt là khả năng biến tính (phân tách thành hai mạch đơn) và
hồi tính (hai mạch đơn có trình tự bổ trợ có xu hướng liên kết trở lại khi vắng
mặt các tác nhân gây biến tính). Khả năng liên kết bổ trợ giữa các bazơ nitơ
cũng cho phép hai mạch ADN có nguồn gốc khác nhau nhưng có trình tự bổ
trợ liên kết với nhau trong điều kiện phù hợp (về nhiệt độ, độ pH, lực ion, …)
để tạo nên một phân tử ADN mới. Hiện tượng liên kết như vậy cũng có thể
xảy ra giữa hai mạch ADN với nhau, hoặc giữa hai mạch ARN hoặc giữa
ADN và ARN. Phân tử axit nucleic sợi kép mới hình thành được gọi là phân
tử lai và quá trình kết cặp giữa các bazơ thuộc hai mạch đơn axit nucleic có
nguồn gốc khác nhau theo nguyên tắc bổ trợ như vậy được gọi là quá trình
lai phân tử.
Nhiều kỹ thuật trong nghiên cứu di truyền phân tử được dựa trên
nguyên tắc lai phân tử. Chẳng hạn, bằng nguyên tắc này người ta có thể dùng
một trình tự ADN biết trước để xác định một trình tự bổ trợ tương ứng có
trong hệ gen của mẫu phân tích. Phân đoạn ADN có trình tự biết trước dùng
trong phản ứng lai như vậy được gọi là mẫu dò. Các mẫu dò có thể có nguồn
gốc từ các phân đoạn ADN trong tự nhiên hoặc được tổng hợp theo nguyên
tắc hóa học, và để nhận biết được chúng, các mẫu dò thường được đánh dấu
với các chất phóng xạ hoặc phát huỳnh quang (ở đây, gọi tắt là chất phát
quang).
Có hai phương pháp đánh dấu mẫu dò ADN. Phương pháp thứ nhất
dùng nguyên tắc tổng hợp hóa học phân tử ADN mới với tiền chất là các phân
tử đánh dấu. Phương pháp thứ hai là gắn một phân tử đánh dấu vào đuôi của
một trình tự ADN có sẵn. Chẳng hạn, bằng việc sử dụng enzym
polynucleotide kinase, người ta có thể bổ sung nhóm phosphat  của ATP vào
nhóm 5’-OH của một phân tử ADN định đánh dấu. Nếu nhóm phosphat này
được đánh dấu bằng đồng vị phóng xạ 32P thì phân tử ADN sẽ được dánh dấu
phóng xạ.
Phương pháp đánh dấu ADN thứ hai (sử dụng các tiền chất đánh dấu)
thường được thực hiện dựa trên phản ứng PCR, hoặc đôi khi chỉ cần sử dụng
các đoạn mồi ngắn rồi cho enzym ADN polymerase thực hiện phản ứng kéo
dài chuỗi. Các tiền chất đánh dấu được sử dụng thường là 1 trong 4 loại
nucleotit được cải biến thành dạng được đánh dấu bằng cách gắn với các
nhóm chất phát quang hoặc nguyên tử phóng xạ. Với phương pháp này,
khoảng 25% nucleotit trong phân tử ADN được đánh dấu và điều đó đủ đáp
ứng hầu hết các nhu cầu nghiên cứu khác nhau.
30
Các phân tử ADN đánh dấu với các tiền chất phát quang được phát hiện
bằng cách chiếu xạ mẫu ADN với ánh sáng UV có bước sóng phù hợp và đo ở
bước sóng phát xạ tương ứng. Các phân tử ADN được đánh dấu phóng xạ
thường được phát hiện bằng cách chụp mẫu ADN với phim tia X, hoặc đo
bằng máy khuếch đại tín hiệu hạt  từ các nguyên tố phóng xạ 32P và 35S (đây
là hai nguyên tố phóng xạ được sử dụng phổ biến để dánh dấu ADN).
Trong các nghiên cứu di truyền học phân tử hiện nay, có nhiều cách để
xác định các phân đoạn ADN và ARN đặc hiệu dựa trên các phương pháp lai.
ở đây, chúng ta chỉ đề cập đến hai phương pháp được dùng phổ biến:
3.1 Xác định các phân đoạn ADN và ARN bằng điện di và mẫu dò
Phương pháp sử dụng mẫu dò kết hợp với điện di là một phương pháp
cơ bản có thể giúp xác định mức độ phổ biến hoặc kích thước của một đoạn
trình tự ADN hoăc ARN được quan tâm nghiên cứu. Chẳng hạn như bằng kỹ
thuật này, người ta có thể xác định và so sánh được mức biểu hiện của một
gen ở các loại tế bào và mô khác nhau thông qua định lượng bản phiên mã
mARN tương ứng của gen đó tại các tế bào và mô tương ứng; hay như để xác
định kích thước của một đoạn ADN cắt giới hạn mang trình tự gen được quan
tâm nghiên cứu.
Giả sử chúng ta cắt hệ gen của nấm men bằng enzym giới hạn EcoRI và
cần xác định được kích thước của phân đoạn ADN cắt giới hạn mang trình
gen A. Sản phẩm ADN tổng số sau khi được cắt bằng EcoRI sẽ tạo ra một số
lượng lớn các phân đoạn có kích thước xấp xỉ 4 kb (vì 4 6 = 4096 bp). Vì vậy,
nếu đem sản phẩm cắt giới hạn nhuộm với EtBr, thì sản phẩm điện di sẽ là
một dải các phân đoạn liên tục có kích thước xấp xỉ 4 kb, và không thể xác
định được chính xác phân đoạn nào mang gen A. Trong trường hợp đó, kỹ
thuật thẩm tách Southern (còn gọi là lai Southern) có thể được dùng để xác
định phân đoạn mang gen đó. Lúc này, người ta sẽ đem sản phẩm cắt giới hạn
ngâm vào một dung dịch có tính kiềm để làm biến tính các phân đoạn ADN
sợi kép. Các phân đoạn này sau đó được chuyển sang một màng tích điện
dương gọi là màng “thẩm tách” theo hình thức “đóng dấu”. Nghĩa là các phân
đoạn ADN định vị trên màng thẩm tách sẽ tương ứng với các phân đoạn định
vị trên gel điện di. Các phân đoạn ADN gắn trên màng thẩm tách sau đó được
ủ với mẫu dò là phân đoạn ADN chứa một đoạn trình tự đặc trưng bổ trợ với
trình tự của gen A. Quá trình ủ được tiến hành trong điều kiện về nhiệt độ và
nồng độ muối tương ứng với sự biến tính và hồi tính của axit nucleic. Trong
điều kiện như đó, các mẫu dò sẽ chỉ lai đặc hiệu với phân đoạn ADN mang
gen A. Do các phân đoạn gen có kích thước thường lớn hơn nhiều so với mẫu
dò, nên khả năng hồi tính khó xảy ra hơn khả năng lai với mẫu dò. Sau đó,
nhờ phương pháp phóng xạ tự chụp (mẫu dò được đánh dấu phóng xạ), các
phân đoạn ADN bắt cặp với các mẫu dò có thể được xác định và phân lập rõ
31
ràng. Các phân đoạn này chính là các phân đoạn mang trình tự gen A cần
phân tích.
Một phương pháp tương tự như vậy cũng có thể được áp dụng trực tiếp
để phân tích các sản phẩm phiên mã của gen là mARN, và được gọi là
phương pháp thẩm tách Northern (lai Northern). Tuy vậy, vì so với ADN
các phân tử mARN thường có kích thước ngắn hơn (khoảng 5 kb), nên trong
thẩm tách Northern, các phân tử mARN không cần cắt bằng enzym giới hạn
(nếu có cắt thì số vị trí cắt giới hạn của một enzym trên phân tử mARN
thường thấp). Các phân tử mARN sau khi phân tách bằng điện di được chuyển
lên màng tích điện dương và lai với các mẫu dò ADN có trình tự bổ trợ tương
ứng thường được đánh dấu phóng xạ (trong trường hợp này, sản phẩm lai là
do sự kết cặp của các bazơ nitơ thuộc hai mạch ARN và ADN có trình tự bổ
trợ).
Trong thực tiễn nghiên cứu, phương pháp thẩm tách Northern thường
được sử dụng để định lượng một loại phân tử mARN nhất định nào đó có
trong một mẫu phân tích, hơn là để xác định kích thước của nó. Lượng mARN
được xác định được xem như thông số cơ bản phản ánh mức độ biểu hiện của
gen mã hóa tương ứng. Chẳng hạn như, bằng phương pháp thẩm tách
Northern, các nhà nghiên cứu có thể đánh giá được ảnh hưởng của một tác
nhân phiên mã nào đó đến sự biểu hiện của một gen nhất định khi tiến hành so
sánh lượng mARN do gen đó mã hóa có trong các tế bào được xử lý và không
được xử lý với tác nhân phiên mã. Tương tự như vậy, kỹ thuật này cho phép
xác định và so sánh mức độ biểu hiện của các gen khác nhau ở các loại tế bào,
mô và cơ quan khác nhau của cùng một cơ thể trong cùng một giai đoạn hoặc
ở các giai đoạn khác nhau của quá trình phát triển cơ thể.
Trong kỹ thuật thẩm tách Northern, mẫu dò thường được đưa vào phản
ứng lai với một lượng dư vừa đủ để đảm bảo lượng phân tử lai tạo thành
tương ứng với lượng mARN có mặt trong các mẫu nghiên cứu. Hay nói cách
khác, qua lượng sản phẩm lai, có thể định lượng được lượng mARN.
Nguyên lý của các phương pháp lai Northern và Southern cũng chính là
cơ sở của các kỹ thuật phân tích gen bằng vi dãy phản ứng (microarray)
được phát triển và ngày các được sử dụng rộng rãi trong các nghiên cứu di
truyền học phân tử gần đây. Trong các phương pháp microarray, các mẫu dò
thường là các đoạn cADN được tạo ra từ việc phiên mã ngược các phân tử
mARN tương ứng được tách chiết từ các mô hoặc tế bào. Các mẫu dò này sau
đó được tiến hành lai với một dãy các phân tử ADN, trong đó mỗi dãy thường
liên quan đến một hoặc một số gen khác nhau trong cơ thể sinh vật nghiên
cứu. Cường độ biểu hiệu của sản phẩm lai (nhờ sự có mặt của các phân tử
đánh dấu) ở các dãy khác nhau sẽ góp phần phản ánh mức độ biểu hiện khác
nhau của các gen phân tích.
4. Tách dòng phân tử và xây dựng thư viện hệ gen
32
4.1. Khái niệm chung về tách dòng phân tử và thư viện hệ gen
Tách dòng phân tử (molecular cloning) là khái niệm chỉ một nhóm các
phương pháp được sử dụng để: i) phân lập một một trình tự gen (ADN) đặc
hiệu từ hỗn hợp các phân tử ADN ban đầu được tách chiết từ các mẫu sinh
học vốn có cấu trúc phức tạp, kích thước lớn; và ii) khuếch đại (sao chép)
trình tự lên một số lượng lớn đủ để có thể tiến hành phân tích về cấu trúc và
chức năng của gen tương ứng.
Khả năng tinh sạch các đoạn gen (ADN) đặc hiệu có số lượng đủ lớn là
cần thiết để có thể “thao tác” các đoạn gen đó vì các mục tiêu nghiên cứu
khác nhau. Chẳng hạn, từ các phân đoạn ADN được tách dòng, người ta có
thể tạo ra các phân tử ADN tái tổ hợp mang các phân đoạn ADN mang nguồn
gốc khác nhau. Các phân tử ADN tái tổ hợp mới có thể làm thay đổi mức độ
biểu hiện bình thường của một gen (chẳng hạn bằng việc dung hợp giữa một
trình tự mã hóa của một loài này với trình tự promoter của một loài khác)
hoặc thậm chí mã hóa tổng hợp một loại protein “dung hợp” mới (protein lai)
mang các trình tự axit amin từ các protein có nguồn gốc khác nhau. Hiện nay,
các kỹ thuật tách dòng phân tử (bao gồm cả PCR) đã trở thành các công cụ
thiết yếu trong nghiên cứu về sự điều hòa và biểu hiện của các gen và hệ gen
ở các loài sinh vật khác nhau.
Quá trình tách dòng ADN và tạo nên các phân tử ADN tái tổ hợp điển
hình thường liên quan đến việc sử dụng các véctơ là trình tự mang thông tin
điều khiển hoạt động nhân lên (khuếch đại) và/hoặc biểu hiện trong tế bào của
phân tử ADN tái tổ hợp mang đoạn ADN cài (đoạn trình tự được phân lập)
bao gồm trình tự gen được quan tâm nghiên cứu. Các “công cụ” chính để tạo
nên các phân tử ADN tái tổ hợp là các enzym giới hạn giúp cắt các phân tử
ADN tại các vị trí xác định và các enzym nối cho phép ghép nối các phân
đoạn ADN có nguồn gốc khác nhau với nhau. Bằng việc tạo nên các phân tử
ADN tái tổ hợp có thể tự nhận lên trong tế bào chủ, một đoạn ADN cài xác
định nào đó có thể được phân lập, tinh sạch và nhân lên thành một số lượng
lớn các bản sao.
Tiếp theo đây, chúng ta sẽ mô tả bằng cách nào các phân tử ADN được
cắt, tái tổ hợp và nhân lên, đồng thời đề cập đến việc xây dựng thư viện hệ
gen gồm tập hợp các phân tử ADN lai chứa các đoạn cài xuất phát từ một hệ
gen cần được thiết lập để phục vụ cho việc nghiên cứu, phân tích một hệ gen.
Thông thường một thư viện hệ gen được thiết lập bằng việc sử dụng chung
cùng một loại véctơ mang các phân đoạn ADN cài khác nhau. Chúng ta sẽ
thấy bằng cách nào các phân đoạn ADN đặc hiệu có thể được xác định và
phân lập từ các thư viện hệ gen.
4.2. Tách dòng ADN trong các véctơ plasmit
Sau khi một phân đoạn ADN được cắt khỏi một phân tử ADN có kích
thước lớn hơn bằng enzym giới hạn, phân đoạn ADN đó cần được “cài” vào
33
một véctơ để có thể nhân lên. Hay nói cách khác là một phân đoạn ADN cần
được cài vào một phân tử ADN thứ hai (véctơ) để có thể nhân lên được trong
tế bào chủ như đã nói ở trên. Cho đến nay, tế bào chủ được sử dụng rộng rãi
nhất để nhân lên các đoạn ADN trong công nghệ ADN tái tổ hợp là vi khuẩn
E. coli.
Các véctơ ADN điển hình thường có 3 đặc tính:
1) Chúng phải chứa một trình tự khởi đầu sao chép (tái bản), cho phép
chúng tự sao chép độc lập với nhiễm sắc thể của tế bào chủ.
2) Chúng phải mang một dấu chuẩn chọn lọc cho phép dễ dàng xác định
và phân lập được các tế bào mang véctơ tái tổ hợp (mang đoạn ADN
cài) với các tế bào không mang véctơ tái tổ hợp.
3) Có vị trí cắt của một hoặc nhiều enzym giới hạn khác nhau. Đây
chính là vị trí cài của phân đoạn ADN cần tách dòng vào véctơ.
Véctơ tách dòng phổ biến nhất là các phân tử ADN sợi kép, mạch vòng
kích thước nhỏ (khoảng 3 kb) được gọi là các plasmit. Các véctơ này phần lớn
có nguồn gốc từ các loài vi khuẩn và một số từ các sinh vật nhân chuẩn đơn
bào (nấm men). Trong nhiều trường hợp, các phân tử ADN này trong tự nhiên
đã mang sẵn các gen mã hóa tính kháng chất kháng sinh. Như vậy, các
plasmid trong tự nhiên đã có sẵn hai thuộc tính là: khả năng tự sao chép trong
tế bào chủ và có trình tự dấu chuẩn chọn lọc. Ngoài ra, các véctơ plasmit còn
một ưu điểm nữa là chúng có thể đồng thời tồn tại nhiều bản sao trong tế bào.
Điều này có thể giúp khuếch đại và phân lập được một số lượng lớn một phân
đoạn ADN nào đó từ một quần thể tế bào nhỏ.
Trước đây, một số véctơ plasmit chỉ có một vị trí cắt của enzym giới
hạn duy nhất. Cùng với thời gian, cấu trúc của các véctơ plasmit được cải tiến
theo hướng cắt bỏ bớt các trình tự không cần thiết và gắn thêm vào đoạn trình
tự có thể được cắt bằng nhiều loại enzym giới hạn khác nhau. Vị trí trên véctơ
mang đoạn trình tự như vậy được gọi là vị trí đa tách dòng (polycloning
site). Có những vị trí đa tách dòng hiện nay có kích thước ngắn (vài trăm bp)
nhưng có thể được cắt bởi trên 20 loại enzym giới hạn khác nhau. Nhờ đặc
tính này, một véctơ có thể được dùng để tách dòng nhiều phân đoạn ADN có
nguồn gốc khác nhau. Trên cơ sở các nguyên tắc tương tự, ngoài véctơ
plasmit, hiện nay người ta đã phát triển được nhiều loại véctơ khác nhau có
nguồn gốc phagơ, hoặc lai giữa vi khuẩn - phagơ (như phagemid, cosmid …),
hoặc có nguồn gốc từ nấm men (ví dụ: YAC).
Việc cài một phân đoạn ADN vào một véctơ thường là một công việc
tương đối đơn giản. Người ta thường sử dụng cùng một loại enzym giới hạn
để cắt véctơ và đoạn ADN cài. Chẳng hạn như việc sử dụng enzym EcoRI sẽ
cắt và chuyển véctơ từ dạng “vòng” sang dạng “mạch thẳng” có hai đầu dính.
Do được cắt bởi cùng enzym giới hạn, nên đoạn ADN cài cũng có hai đầu
dính với trình tự bổ trợ với trình tự đầu dính của véctơ. Các đầu dính này sẽ
34
liên kết véctơ và đoạn ADN cài lại với nhau hình thành nên một phân tử ADN
mạch vòng mới (phân tử ADN tái tổ hợp) chỉ còn thiếu hai liên kết
phosphodieste duy nhất còn lại ở mỗi mạch. Hai liên kết này sẽ được “hàn”
kín nhờ sử dụng enzym ADN ligase trong sự có mặt của ATP. Để hạn chế khả
năng gắn kết lại của hai đầu dính của chính véctơ (vì hai đầu dính này có trình
tự bổ trợ) sau khi được cắt bởi enzym giới hạn, người ta thường cho lượng
ADN cài dư thừa so với véctơ để phần lớn các véctơ sau khi gắn lại là các
véctơ tái tổ hợp mang các đoạn ADN cài.
Một số loại véctơ không những cho phép phân lập và tinh sạch được
một phân đoạn gen nào đó, mà còn có thể điều hòa sự biểu hiện của gen nằm
trong phân đoạn ADN cài. Những véctơ như vậy được gọi là các véctơ biểu
hiện. Các véctơ này thường phải chứa trình tự promoter nằm ngược dòng sát
với vị trí cài gen. Nếu vùng mã hóa của gen (không chứa promoter) được gắn
vào véctơ theo đúng chiều khung đọc của gen, thì gen cài sẽ được phiên mã
thành mARN và dịch mã thành protein trong tế bào chủ. Các véctơ biểu hiện
thường được sử dụng để biểu hiện các gen đột biến hoặc các gen lai để tiến
hành phân tích chức năng của chúng. Chúng cũng có thể được dùng để sản
xuất một lượng lớn một loại protein nào đó vốn không thu được hiệu suất
tương tự bằng các con đường tự nhiên. Ngoài ra, các promoter trong các véctơ
biểu hiện có thể được lựa chọn sao cho sự biểu hiện của gen cài có thể được
điều hòa bằng việc bổ sung một hợp chất đơn giản vào môi trường nuôi cấy
(như một loại đường hoặc axit amin chẳng hạn). Việc có thể điều khiển chủ
động sự biểu hiện của một gen nào đó có ý nghĩa quan trọng, đặc biệt đối với
các gen gây độc.
4.3. Biến nạp các véctơ ADN vào tế bào chủ
Biến nạp là quá trình ở đó một cơ thể chủ có thể tiếp nhận một phân tử
ADN ngoại lai từ môi trường bên ngoài. Một số vi khuẩn (trong đó không có
E. coli) có khả năng biến nạp tự nhiên được gọi là các vi khuẩn khả biến di
truyền. Vi khuẩn E. coli có thể trở nên khả biến khi được xử lý với ion Ca 2+.
Mặc dù cơ chế khả biến chưa được biết đầy đủ, nhưng dường như ion Ca 2+
bao bọc lại các điện tích âm trên phân tử ADN và cho phép chúng xuyên qua
được màng tế bào. Các tế bào được xử lý với Ca2+ vì vậy được gọi là các tế
bào khả biến. Người ta có thể sử dụng một chất kháng sinh mà véctơ plasmid
mang gen dấu chuẩn mã hóa tính kháng chất kháng sinh đó để chọn lọc được
các thể mang plasmid tái tổ hợp. Các tế bào mang véctơ tái tổ hợp có thể sinh
trưởng trong môi trường chứa chất kháng sinh, trong khi các tế bào khác thì
không.
Thông thường quá trình biến nạp có hiệu suất không cao. Chỉ có một tỉ
lệ nhỏ các tế bào được xử lý biến nạp có thể tiếp nhận được plasmid tái tổ
hợp. Nhưng, chính hiệu quả biến nạp thấp giúp hầu hết các tế bào mang véctơ
tái tổ hợp thường chỉ tiếp nhận một plasmid duy nhất. Thuộc tính này giúp
35
cho các tế bào biến nạp và dòng tế bào do chúng sinh ra (do phân chia trực
phân) chỉ mang một véctơ ADN tái tổ hợp duy nhất và cho phép các nhà
nghiên cứu thể phân lập và tinh sạch được các gen hoặc hoặc sản phẩm của
các gen riêng rẽ từ hỗn hợp biến nạp mang cả các phân tử ADN khác.
4.4. Thiết lập thư viện hệ gen
Đối với các hệ gen đơn giản, kỹ thuật tách dòng thường khá đơn giản.
Chẳng hạn như với hệ gen một số virut có kích thước khoảng 10 kb, người ta
có thể trực tiếp tách chiết ADN, cắt chúng bằng enzym giới hạn rồi tiến hành
phân tích điện di. Các phân đoạn ADN tách biệt trên gel điện di được cắt khỏi
gel, tinh sạch rồi cài vào các véctơ.
Trong khi đó, đối với các hệ gen phức tạp, kích thước lớn (như hệ gen
người), việc cắt ADN tổng số bằng enzym giới hạn rồi phân tích điện di
thường dẫn đến sự hình thành một dải băng điện di liên tục do có sự phân bố
liên tục của các phân đoạn ADN được cắt giới hạn chỉ khác nhau một hoặc
một vài nucleotit. Vì vậy, để đơn giản kỹ thuật tách dòng ở những hệ gen này,
người ta thường tiến hành biến nạp toàn bộ các phân đoạn ADN (thu được sau
khi cắt bằng enzym giới hạn) vào véctơ tách dòng rồi biến nạp tất cả chúng
vào tế bào chủ, sau đó mới phân lập các dòng tế bào mang véctơ tái tổ hợp có
các đoạn cài ADN khác nhau. Tập hợp các dòng tế bào như vậy được gọi là
thư viện hệ gen. Như vậy, thư viện hệ gen là tập hợp các dòng tế bào mang
các véctơ tái tổ hợp chứa các đoạn ADN cài khác nhau có cùng nguồn gốc
sinh học.
Để thiết lập một thư viện gen, hệ gen của tế bào đích (chẳng hạn ADN
hệ gen người) được cắt bằng enzym giới hạn để tạo ra các phân đoạn ADN có
kích thước trung bình mong muốn. Kích thước các phân đoạn (đoạn cài) có
thể dao động từ 100 bp đến trên 1 Mb (đối với các phân đoạn ADN kích
thước rất lớn, phân tử ADN thường được cắt không hoàn toàn bằng một
enzym giới hạn). Các phân đoạn ADN cắt giới hạn sau đó được ủ với một loại
véctơ phù hợp (trước đó được cắt bởi cùng loại enzym giới hạn) cùng với
ADN ligase. Kết quả của bước này sẽ tạo ra một tập hợp lớn của các véctơ
mang các đoạn ADN cài khác nhau.
Người ta có thể tạo ra nhiều thư viện gen khác nhau bắt nguồn từ các
nguồn vật liệu khác nhau. Thư viện hệ gen đơn giản nhất bắt nguồn từ ADN
hệ gen tổng số được cắt bằng một enzym giới hạn duy nhất, gọi là thư viện hệ
gen. Loại thư viện này có ý nghĩa ứng dụng rõ rệt nhất nhằm giải mã trình tự
các hệ gen. Ngược lại, kỹ thuật tách dòng hệ gen được dùng để xác định một
phân đoạn gen mang vùng mã hóa một gen nhất định nào đó, thì thư viện hệ
gen chỉ tỏ ra hiệu quả đối với hệ gen chỉ chứa một phần tương đối nhỏ các
vùng không mã hóa. Đối với các hệ gen phức tạp hơn, thư viện hệ gen không
phù hợp cho việc tìm ra phân đoạn mang gen mong muốn bởi vì phần lớn các
dòng trong thư viện mang các đoạn cài thuộc các vùng không mã hóa.
36
Để có được thư viện gen mang hầu hết các đoạn cài là các vùng mã hóa,
người ta sử dụng thư viện cADN. Các bước thiết lập thư viện cADN được
minh họa trên Hình 10.9. Theo đó, trong bước đầu tiên thay vì bắt đầu từ
ADN, người ta phiên mã ngược trình tự mARN thành trình tự ADN phiên bản
(cADN). Quá trình này được gọi là quá trình phiên mã ngược và được thực
hiện nhờ một enzym ADN polymerase đặc biệt là reverse transcriptase.
Enzym này có khả năng tổng hợp ADN bắt nguồn từ phân tử ARN mạch đơn
làm khuôn ban đầu. Khi có mặt enzym reverse transcriptase, các trình tự
mARN được phiên mã ngược thành các phân tử ADN sợi kép, và những phân
tử này có thể được gắn vào các véctơ.
Để có thể phân lập được các đoạn cài riêng rẽ từ thư viện hệ gen, các tế
bào E. coli được tiến hành biến nạp với tất cả các phân đoạn trong thư viện.
Mỗi một tế bào biến nạp thường chỉ mang duy nhất một véctơ mang đoạn cài
ADN. Vì vậy, khi các tế bào nhân lên sau đó chúng sẽ sẽ tạo ra nhiều dòng tế
bào, mỗi dòng chứa nhiều bản sao của một phân đoạn trong thư viện cADN.
Khuẩn lạc được tạo ra từ các tế bào mang các trình tự ADN mong muốn có
thể được phân lập và từ đó thu lại ADN. Có một số cách để xác định các dòng
tế bào đã mang gen biến nạp. Chẳng hạn phương pháp được nêu dưới đây sử
dụng các mẫu dò ARN và/hoặc ADN để xác định các quần thể tế bào mang
một đoạn ADN nhất định nào đó.
4.5. Sử dụng lai mẫu dò để xác định các dòng tế bào trong thư viện gen
Trong phương pháp sử dụng mẫu dò, người ta sử dụng các đoạn trình tự
ADN/ARN có trình tự bổ trợ được đánh dấu và lai với các dòng tế bào mang
các đoạn gen cài khác nhau trong thư viện hệ gen. Kỹ thuật này được gọi là
phương pháp lai khuẩn lạc. Một thư viện hệ gen điển hình thường chứa
hàng ngàn đoạn cài khác nhau được mang bởi cùng một loại véctơ tách dòng.
Sau khi véctơ được biến nạp vào một chủng vi khuẩn phù hợp, các tế bào vi
khuẩn được cấy trên bề mặt đĩa petri chứa môi trường bắn rắn chứa agar. Mỗi
tế bào sau đó sẽ phát triển lên thành một khuẩn lạc riêng rẽ, và các tế bào
trong cùng một khuẩn lạc đều mang cùng loại véctơ và đoạn gen cài giống
nhau.
Trong kỹ thuật lai khuẩn lạc, người ta cũng có thể sử dụng loại màng lai
được dùng trong các phương pháp thẩm tách Southern và Northern để thu hồi
được một lượng “vết” ADN đủ cho sự kết cặp với mẫu dò. ở đây, người ta sẽ
dùng màng lai ép lên bề mặt đĩa nuôi cấy chứa khuẩn lạc và in hình chúng lên
màng lai (cùng với ADN của chúng) sao cho vị trí của các dòng tế bào trên
màng lai tương ứng với các vị trí khuẩn lạc của chúng trên đĩa petri (theo
nguyên tắc “đóng dấu”). Điều này đảm bảo cho việc khi chúng ta xác định
được một vị trí trên màng lai có kết quả “dương tính” và việc bắt cặp với mẫu
dò thì chúng ta sẽ xác định được tương ứng khuẩn lạc mang dòng tế bào chứa
véctơ tái tổ hợp mang đoạn gen cài mong muốn.
37
Màng lai được đem lai với mẫu dò như sau: người ta tiến hành xử lý
màng lai sao cho màng tế bào vỡ ra và các phân tử ADN thoát ra ngoài gắn
lên màng lai tại chính vị trí tế bào của chúng. Các màng lai sau đó được ủ với
các mẫu dò được đánh dấu từ trước trong các điều kiện giống như khi tiến
hành các kỹ thuật thẩm tách Northern hay Southern.
Trong công nghệ ADN tái tổ hợp, ngoài các véctơ plasmit có nguồn gốc
vi khuẩn, người ta còn có thể sử dụng véctơ có nguồn gốc virut
(bacteriophage), hoặc từ các sinh vật bậc cao hơn như nhiễm sắc thể nhân tạo
nấm men (YAC), hay nhiễm sắc thể nhân tạo có nguồn gốc vi khuẩn (BAC),
hoặc một số véctơ lai giữa chúng (vd: cosmid, …). Trong các véctơ có nguồn
gốc bacteriophage, phage  được sử dụng phổ biến. ADN của virut này được
cải biến và sử dụng như véctơ tách dòng. Véctơ này được sử dụng để tách
dòng các thư viện hệ gen về nguyên tắc giống hệt như khi sử dụng các véctơ
plasmit. Chỉ có một điểm khác lai khi tiến hành lai để xác định các dòng gen
biến nạp thì vị trí các mẫu dò được xác định trên màng lai tương ứng với vị trí
các vết tan thay cho vị trí các khuẩn lạc như khi sử dụng véctơ tách dòng
plasmit.
5. Tổng hợp hóa học và sử dụng các đoạn oligonucleotit
Các đoạn ADN có trình tự xác định kích thước ngắn được sử dụng
nhiều trong các nghiên cứu khác nhau của di truyền học phân tử, chẳng hạn
như sử dụng làm mồi trong các phản ứng PCR, hay dùng làm mẫu dò trong
các phương pháp lai phân tử. Các đoạn trình tự này thường được tổng hợp
theo phương pháp hóa học và được gọi là các đoạn oligonucleotit. Phương
pháp hóa học được sử dụng phổ biến nhất được tiến hành trên bề mặt cứng sử
dụng máy tự động. Tiền chất để tạo nên các nucleotit lần lượt gắn với đoạn
oligonucleotit theo trật tự nhất định được gọi là các hợp chất
phosphoamidine (xem minh họa Hình 10.10). Phản ứng kéo dài chuỗi
oligonucleotit diễn ra bằng việc gắn thêm tiền chất nucleotit mới vào phía đầu
5’, như vậy ngược chiều với phản ứng kéo dài chuỗi ADN sử dụng enzym
ADN polymerase.
Phương pháp tổng hợp hóa học có hiệu quả và độ chính xác cao khi tiến
hành tổng hợp các phân tử ADN mạch đơn có độ dài tới 30 nucleotit. Với các
thiết bị tổng hợp oligonucleotit hiện nay, một người nghiên cứu có thể dễ
dàng tổng hợp bất cứ một trình tự ADN ngắn nào đơn giản bằng cách gõ và
nhập trình tự nucleotit mong muốn vào phần mềm máy tính điều khiển máy
tổng hợp tự động. Tuy vậy, khi phân tử ADN được tổng hợp có kích thước
lớn thì độ chính xác của trình tự và độ đồng đều của sản phẩm tạo thành giảm
đi do các lỗi cố hữu mang tính kỹ thuật. Thực tế, các phân tử ADN có trình tự
dài hơn 100 nucleotit khó có thể được tổng hợp bằng các phương pháp hóa
học mà đảm bảo được số lượng và chất lượng mong muốn.
38
Các đoạn oligonucleotit kích thước ngắn ngoài các ứng dụng làm mồi
phản ứng PCR hay làm mẫu dò như được nêu ở trên, còn có thể được sử dụng
cho nhiều mục đích khác trong nghiên cứu di truyền học phân tử. Chẳng hạn
như các đoạn oligonucleotit kết cặp sai với một đoạn ADN được tách dòng có
thể được dùng để tạo ra một đột biến định vị trí. Phương pháp này, gọi là
phương pháp gây đột biến định vị trí, được thực hiện như sau: một trình tự
nucleotit nhất định được tiến hành lai với một phân đoạn ADN, ở đây đoạn
oligonucleotit được sử dụng làm mồi còn phân đoạn ADN đích được dùng
làm khuôn. Trong đoạn ADN sợi kép hình thành sẽ có một vị trí kết cặp sai,
và theo nguyên tắc PCR, các phân đoạn ADN được tạo ra trong các phản ứng
về sau đều mang đột biến tại vị trí kết cặp sai.
Các đoạn oligonucleotit cũng có thể được sử dụng theo cách tương tự
như vậy để tạo nên một điểm cắt giới hạn mới trong một phân tử ADN, để rồi
sau đó điểm cắt giới hạn này được sử dụng để cài đoạn ADN đích vào giữa
một trình tự mã hóa và một trình tự không mã hóa, hoặc sau một trình tự
promoter hay vị trí gắn của ribosom, v.v…
Như vậy, rõ ràng trong các nghiên cứu di truyền học phân tử, việc các
đoạn oligonucleotit có thể được tổng hợp theo một trình tự bất kỳ có nhiều ý
nghĩa ứng dụng quan trọng trong việc xác định và khuếch đại các đoạn ADN
đặc hiệu, để giải mã trình tự ADN, cũng như trong các nghiên cứu tạo đột
biến điểm xác định vị trí, hay sử dụng cho công nghệ ADN tái tổ hợp.
6. Phản ứng PCR
Ngoài các kỹ thuật tách dòng và khuếch đại gen sử dụng các loại tế bào
chủ, một phương pháp khuếch đại gen có hiệu quả cao giờ đây đã trở thành
một kỹ thuật phổ biến trong hầu hết các nghiên cứu di truyền học phân tử là
kỹ thuật phản ứng chuỗi trùng hợp PCR (polymerase chain reaction). Đây
là một kỹ thuật hóa sinh invitro thuần túy. Kỹ thuật PCR sử dụng enzym ADN
polymerase để tổng hợp nên các phân tử ADN mới từ trình tự của phân tử
ADN làm khuôn với tiền chất là các deoxyribonucleotit. Như đã nêu ở
Chương 2, các enzym ADN polymerase tổng hợp ADN theo chiều 5’ 3’ và
có thể xúc tác gắn nucleotit tiếp theo vào phía đầu 3’ của một trình tự
oligonucleotit có sẵn. Nghĩa là, nếu ta có một đoạn trình tự oligonucleotit đã
gắn vào một mạch ADN làm khuôn có trình tự bổ sung với trình tự của đoạn
oligonucleotit, thì enzym ADN polymerase có thể sử dụng đoạn oligonucleotit
đó làm đoạn mồi và tiếp tục kéo dài chuỗi ADN về phía đầu 3’ dựa trên trình
tự của mạch ADN làm khuôn.
Vậy, bằng cách nào người ta có thể sử dụng phản ứng PCR và enzym
ADN polymerase để khuếch đại một đoạn trình tự ADN đặc hiệu? Người ta sẽ
tổng hợp và sử dụng hai đoạn oligonuleotit. Đoạn thứ nhất có trình tự bổ sung
với đầu 5’ của một mạch phân đoạn ADN cần khuếch đại (đoạn này gọi là
mồi xuôi), còn đoạn trình tự thứ hai bổ sung với đầu 5’ của mạch đối diện
39
(mồi ngược, hình 10.11). Phân tử ADN làm khuôn sẽ được làm biến tính (bởi
nhiệt) và các mồi xuôi và môi ngược sẽ gắn vào trình tự bổ sung ở hai đầu
đoạn ADN cần khuếch đại. Với sự có mặt của các cơ chất là các
deoxyribonucleotit, enzym ADN polymerase sẽ tổng hợp và kéo dài một
mạch phân tử ADN bắt đầu từ hai đoạn mồi.
Trong chu kỳ tiếp theo, phân tử ADN lại được gây biến tính và quá
trình tổng hợp ADN được lặp lại với cùng cặp mồi. Kết quả của chu kỳ thứ
hai tạo ra 4 bản sao của phân đoạn gen mong muốn. Theo cơ chế đó, chu kỳ
biến tính và tổng hợp ADN diễn ra lặp đi lặp lại sẽ làm khuếch đại phân đoạn
ADN nằm giữa 2 trình tự mồi theo cấp số nhân (số bản sao tương ứng qua các
chu kỳ sẽ lần lượt là 2, 4, 8, 16, 32, 64, v.v…). Như vậy, chỉ cần từ một bản
sao ADN duy nhất có mặt trong một lượng mẫu nhỏ, chúng ta có thể thu được
một lượng lớn bản sao xuất phát từ bản sao đầu tiên.
Xét về một khía cạnh nào đó, kỹ thuật tách dòng ADN và PCR đều
được dùng để khuếch đại một phân đoạn ADN đặc thù lên một số lượng lớn.
Nhưng điểm khác biệt là ở chỗ, trong kỹ thuật tách dòng, chúng ta thường sử
dụng một hóa chất chọn lọc hay một thiết bị nào đó để định vị được trình tự
ADN đã được khuếch đại trong một thư viện ADN đã có sẵn gồm nhiều dòng
tế bào khác nhau, trong khi ở kỹ thuật PCR, hóa chất chọn lọc chính là cặp
mồi sẽ giúp hạn chế phản ứng khuếch đại chỉ tập trung vào đoạn ADN được
quan tâm ngay từ đầu.
7. Giải mã trình tự ADN
Trong phần này chúng ta sẽ xem xét bằng cách nào có thể xác định
được trình tự nucleotit của các phân đoạn hoặc toàn bộ phân tử ADN mong
muốn. Về một khía cạnh nào đó, có thể coi giải mã trình tự các nucleotit là
việc đánh dấu mẫu dò triệt để nhất của một hệ gen với tính chọn lọc cao.
Chúng ta sẽ xác định toàn bộ trình tự hệ gen của các cơ thể sinh vật có mức
độ cấu tạo phức tạp khác nhau từ vi khuẩn cho đến loài người, và điều này
cho phép chúng ta tìm thấy mọi trình tự đặc hiệu một cách nhanh và chính xác
thông qua việc sử dụng các phần mềm máy tính với các thuật toán phù hợp.
Hay nói cách khác, “các chất chọn lọc” của chúng ta ở đây là các chuỗi bazơ
nitơ được chúng ta nhập vào phần mềm máy tính. Do cơ sở dữ liệu về các hệ
gen ngày càng trở nên phong phú, nên ngày càng trở nên dễ dàng hơn để có
thể tìm thấy các bản sao của trình tự các hệ gen hoặc của các trình tự có liên
quan trong cùng một loài hoặc của các loài khác. Rõ ràng, việc giải mã trình
tự các nucleotit đã tạo ra một cơ sở dữ liệu khổng lồ phục vụ cho các nghiên
cứu giải mã trình tự và so sánh giữa các hệ gen được đề cập dưới đây.
Nguyên tắc giải mã trình tự ADN về cơ bản dựa trên việc phân tách các
phân đoạn ADN có kích thước khác nhau được giới hạn bởi hai đầu. Các phân
tử ADN đều giống nhau ở phần đầu 5’, nhưng kết thúc ở phía đầu 3’ có các
nucleotit khác nhau. Các thành viên của một nhóm sẽ có nucleotit ở phía đầu
40
3’ giống nhau. Như vậy, trong một nhóm sẽ bao gồm tất cả các phân tử ADN
tận cùng đầu 3’ bằng G, nhóm khác tương ứng là A, C và T. Trong mỗi nhóm
các phân tử sẽ có kích thước khác nhau phụ thuộc vào vị trí của nucleotit
tương ứng (ví dụ như G) nằm trên phân tử ADN. Các phân đoạn khác biệt về
chiều dài như vậy có thể phân tách được nhờ sử dụng kỹ thuật điện di trên gel
polyacrylamid. Chẳng hạn khi chạy hỗn hợp các phân tử ADN tận cùng đầu G
ta sẽ thu được thang các băng điện di tương ứng với các phân đoạn, trong đó
mỗi băng tương ứng với một phân đoạn có chiều dài phản ánh vị trí của
nucleotit G trên phân tử ADN….
7.1. Giải mã trình tự hệ gen vi khuẩn bằng kỹ thuật shotgun (“giải mã
từng đoạn ngẫu nhiên”)
Vi khuẩn gây bệnh kiết lị ở người Hemophilus influenza là loài sinh vật
đầu tiên được giải mã toàn bộ hệ gen. Sở dĩ hệ gen của loài này được hoàn
thành việc giải mã toàn bộ hệ gen đầu tiên là nhờ hệ gen của nó nhỏ chỉ chứa
một phân tử ADN duy nhất kích thước 1,8 Mb. Hệ gen của vi khuẩn này
được “cắt” thành các phân đoạn nhỏ có kích thước trung bình khoảng 1 kb.
Các đoạn ADN hệ gen này sau đó được tách dòng bằng các véctơ ADN
plasmit tái tổ hợp. ADN từ các dòng vi khuẩn chứa các phân đoạn ADN tái tổ
hợp riêng rẽ rồi được giải mã trình tự riêng rẽ trên các máy giải mã trình tự tự
động sử dụng phương pháp ddNTP như mô tả ở phần trên. Phương pháp này
được gọi là phương pháp giải mã trình tự kiểu “shotgun” (bắn ngẫu nhiên).
Các khuẩn lạc mang các véctơ tơ tái tổ hợp mang đoạn ADN cài ngẫu nhiên
được phân lập, xử lý và giải mã trình tự. Để chắc chắn rằng mọi nucleotit
trong hệ gen vi khuẩn đều có mặt trong các dòng vi khuẩn của thư viện hệ
gen, tổng cộng có khoảng 30.000 - 40.000 dòng tái tổ hợp khác nhau được sử
dụng và giải mã trình tự. Từ đó, tạo ra khoảng 20 Mb dữ liệu thô về hệ gen
(các phản ứng tạo ra trình tự có kích thước trung bình 600 bp, và 20 Mb = 600
bp x 33.000 dòng vi khuẩn). Dữ liệu này được gọi là vùng trình tự 10x. Bởi
vì, mỗi nucleotit trong hệ gen được đọc lặp lại khoảng 10 lần.
Phương pháp này dường như là tốn nhiều công sức, nhưng chi phí rẻ
hơn và nhanh hơn so với các phương pháp truyền thống khác. Một phương
pháp giải mã trình tự trước đây dựa trên nguyên tắc giải mã từng phân đoạn
ADN cắt giới hạn trên bản đồ vật lý của nhiễm sắc thể vi khuẩn. Một hạn chế
của kỹ thuật này là hầu hết các phân đoạn cắt giới hạn có kích thước lớn hơn
kích thước có thể giải mã trình tự hoàn toàn trong mỗi phản ứng được thực
hiện. Do vậy, để giải mã toàn bộ hệ gen, người ta phải tiến hành cắt giới hạn,
lập bản đồ và giải mã trình tự nhiều lần. Các bước này nếu lặp đi lặp lại nhiều
lần sẽ tồn nhiều thời gian hơn khi sử dụng phương pháp giải mã trình tự tự
động của các phân đoạn ADN ngẫu nhiên. Hay nói cách khác, nhờ sử dụng
phần mềm máy tính việc sắp xếp lại các phân đoạn ADN ngẫu nhiên vẫn
41
nhanh hơn nhiều việc lập bản đồ các phân đoạn cắt giới hạn trên NST vi
khuẩn.
Khoảng 30.000 đoạn trình tự ADN được giải mã trình tự ngẫu nhiên
được trực tiếp nhập vào phần mềm máy tính. Nhiều phần mềm máy tính
chuyên dụng hiện nay có thể xếp các đoạn trình tự theo đúng thứ tự dựa trên
các trình tự gối lên nhau của chúng. Sự “lắp ráp” thành trình tự của các phân
đoạn ADN ngắn cuối cùng sẽ có một trình tự liên tục duy nhất, còn được gọi
là một contig.
7.2. Kỹ thuật giải mã trình tự kiểu shotgun cho phép “ráp nối” từng
phần các trình tự hệ gen lớn
Như đã trình bày ở trên việc giải mã các đoạn trình tự ADN kích thước
khoảng 600 bp hiện nay có thể thực hiện một cách tương đối đơn giản và
nhanh chóng. ở đây, chúng ta sẽ xem bằng cách nào kỹ thuật “shortgun” được
áp dụng để giải mã trình tự các hệ gen lớn.
Chẳng hạn, nhiễm sắc thể người có kích thước trung bình khoảng
150Mb. Do vậy, mỗi đoạn trình tự ~600 bp được giải mã chỉ chiếm 0,0004%
của mỗi NST. Kết quả là để có thể xác định được trình tự đầy đủ của một
NST, người ta cần tạo ra một số lượng lớn các dữ liệu trình tự từ nhiều phân
đoạn ADN ngắn (Hình 10.16). Các phân đoạn ADN nhỏ được tạo ra từ 23
NST của hệ gen người, rồi sau đó được cắt ngắn thành một thư viện các đoạn
ADN nhỏ bằng một kỹ thuật kim áp lực (small-gauge pressurised needle).
Thông thường, có 2 hoặc 3 thư viện hệ gen chứa các đoạn trình tự có kích
thước khác nhau (tăng dần) được tạo ra, chẳng hạn tương ứng với các đoạn
trình tự có kích thước 1, 5 và 100 kb. Các phân đoạn này sau đó được tách
dòng ngẫu nhiên vào các plasmit của vi khuẩn theo phương pháp được mô tả
ở trên.
Các phân tử ADN tái tổ hợp mang các phân đoạn ngẫu nhiên của NST
người sau đó được phân lập từ các plasmit vi khuẩn rồi giải mã bằng máy giải
mã trình tự tự động. Để đảm bảo mọi nucleotit trong hệ gen đều được giải mã,
người ta phải tiến hành giải mã riêng rẽ khoảng 2 triệu phân đoạn ADN khác
nhau. Với kích thước của mỗi phân đoạn có thể giải mã chính xác khoảng 600
bp, quy trình này tạo ra dữ liệu khoảng 1 tỉ bp, hay nói các khác là gấp ~10
lần kích thước trung bình của một NST. Như đã trình bày ở trên với kỹ thuật
giải mã trình tự ở vi khuẩn, việc phân tích các mẫu với lượng trình tự gấp
khoảng 10 lần lượng ADN thực cần giải mã trình tự sẽ đảm bảo mọi phần của
NST đều được phân tích.
Quá trình tạo ra các thư viện tái tổ hợp mang các trình tự ngẫu nhiên
và một lượng lớn ADN cần phải giải mã trình tự ngẫu nhiên dường như là một
việc làm rất lãng phí. Tuy vậy, với việc sử dụng hệ thống một trăm máy giải
mã trình tự tự động gồm 384 cột sẽ cho phép phân tích 10 lần một nhiễm sắc
thể người chi tiết trong vòng 3 tuần. Phương pháp này vì vậy vẫn nhanh hơn
42
nhiều phương pháp phân lập từng phần đã biết trong NST, rồi sau đó giải mã
trình tự một tập hợp đã biết của các đoạn ADN được đặt so le. Vì vậy, bản
chất của công nghệ cốt lõi được sử dụng để thúc đẩy việc giải mã hệ gen
người dựa trên kĩ thuật giải mã trình tự ngẫu nhiên tự động, rồi sau đó sử
dụng phần mềm máy tính để sắp xếp lại các đoạn ADN khác nhau giống như
trò chơi xếp hình vậy. Việc kết hợp sử dụng máy giải mã trình tự tự động với
phần mềm máy tính đã giúp dự án giải mã toàn bộ hệ gen người kết thúc sớm
hơn nhiều năm so với kế hoạch ban đầu.
Các chương trình máy tính phức tạp được sử dụng để tập hợp các đoạn
ADN ngắn được giải mã trình tự ngẫu nhiên thành những đoạn trình tự dài
kích thước lớn kế tiếp nhau được gọi là những contig. Các đoạn trình tự nằm
gối lên nhau sẽ được phần mềm xử lý rồi nối lại với nhau thành các trình tự
lớn hơn. Kích thước của các đoạn contig phụ thuộc vào lượng trình tự đã được
giải mã. Nừu lượng trình tự giải mã càng nhiều, thì các đoạn contig càng có
kích thước lớn và khoảng cách trống chưa được giải mã càng nhỏ.
Thông thường các đoạn contig riêng rẽ thường có kích thước 50.000 -
200.000 bp. Nghĩa là ngắn hơn nhiều so với kích thước NST ở người. Tuy
vậy, các đoạn contig rất hiệu quả khi phân tích các hệ gen nhỏ. Chẳng hạn, hệ
gen của ruồi dấm (Drosophila) trung bình có mật độ 1 gen / 10 kb. Vì vậy,
một contig điển hình thường chứa vài gen liên kết với nhau. Rất tiếc là các hệ
gen lớn lại thường chứa mật độ gen thấp. Hệ gen người có mật độ trung bình
là 1 gen / 100 kb, vì vậy một contig điển hình thường không chứa được trình
tự trọn vẹn của một gen, chứ chưa nói đến là một dãy gen liên kết. Bây giờ,
chúng ta sẽ nói đến bằng cách nào các đoạn contig tương đối ngắn có thể
được lắp ráp lại thành các đoạn khung có kích thước 1-2Mb.
7.3. Phương pháp giải mã trình tự đầu cuối cho phép lắp ráp các contig
thành các đoạn khung ở các hệ gen kích thước lớn
Một khó khăn lớn gặp phải khi thiết lập các đoạn contig là sự xuất hiện
của các đoạn ADN lặp lại. Các đoạn trình tự này làm việc ráp nối trở nên khó
khăn và phức tạp do các đoạn ADN không liên kết (từ các NST khác nhau)
nhưng có thể bị xếp thành các đoạn trình tự nằm gối lên nhau do chúng có
cùng trình tự lặp lại. Một phương pháp được sử dụng để khắc phục trở ngại
này là kĩ thuật giải mã phần nối trình tự đầu cuối. Kỹ thuật này tương đối
đơn giản nhưng hiệu quả mà nó mang lại cao.
Ngoài việc ADN hệ gen được dùng để tạo nên một thư viện các đoạn
ADN ngắn nhằm giải mã trình tự ngẫu nhiên, thì chính ADN hệ gen đó đồng
thời được dùng để tạo nên các đoạn ADN tái tổ hợp mang các đoạn có kích
thước lớn, thường có kích thước 3 - 100 kb. Giả sử chúng ta có một mẫu ADN
từ một NST người. Một phần của mẫu này được dùng để tạo nên các phân
đoạn có kích thước 1 kb, trong khi một phần khác được dùng để tạo nên các
phân đoạn có kích thước 5 kb. Kết quả của quá trình đó là người ta thu được 2
43
thư viện hệ gen khác nhau, một mang các đoạn cài kích thước ngắn, còn thư
viện kia là các đoạn cài kích thước lớn (xem Hình 10.16).
Tiếp theo, người ta sử dụng các đoạn mồi “đa năng” (có tính chọn lọc
thấp) có thể gắn vào phần đoạn nối giữa plasmit và hai vùng biên của đoạn
ADN cài kích thước lớn. Mỗi một phản ứng giải mã trình tự cho phép tạo ra
thông tin về trình tự của một đoạn kích thước khoảng 600 bp ở hai đầu của
một đoạn cài bất kỳ. Một bản ghi nhớ sẽ ghi chép lại các trình tự ở hai đầu của
cùng một phân đoạn kích thước lớn. Việc dùng phần mềm sau đó cho thấy
một trình tự được tìm thấy ở contig A, còn trình tự kia được tìm thấy ở contig
B. Nếu contig A và B cùng có các trình tự có mặt trong một phân đoạn kích
thước khoảng 5 kb thì có thể giả thiết chúng cùng xuất xứ từ một vùng của
một NST. Trong khi đó hầu hết các phân đoạn ADN lặp lại thường có kích
thước nhỏ hơn 2-3 kb. Vì vậy, các đoạn trình tự ADN đầu cuối xuất xứ từ các
đoạn cài ~5kb là đủ để nối các contig bị ngắt quãng bởi các đoạn ADN có
trình tự lặp lại.
Các nghiên cứu ban đầu thường chỉ tạo ra các đoạn contig có kích thước
nhỏ hơn 500 kb. Để thu được dữ liệu từ các đoạn có trình tự dài, có kích
thước vài Mb hoặc dài hơn, người ta cần dữ liệu từ các trình tự đầu cuối từ
các phân đoạn ADN lớn có kích thước ít nhất là 100 kb. Các đoạn ADN này
có thể thu được từ bằng một véctơ tách dòng đặc biệt gọi là nhiễm sắc thể
nhân tạo vi khuẩn - BAC (bacterial artificial chromosome). Nguyên tắc các
đoạn này được dùng để tạo nên thông tin của các trình tự dài là giống như
trường hợp sử dụng các đoạn 5 kb được mô tả ở trên. Các đoạn mồi được
dùng để xác định trình tự ~600kb ở hai đầu của đoạn cài BAC. Các trình tự
này sau đó được “xếp hàng” so với trình tự của các contig khác nhau, và được
xếp vào cùng một đoạn khung nếu chúng cùng chia sẽ các trình tự đồng thời
có mặt trong một BAC. Việc sử dụng BAC cho phép sắp xếp nhiều đoạn
contig khác nhau vào cùng một đoạn khung duy nhất có kích thước tới vài Mb
(Hình 10.17).
Chất lượng của việc ráp nối hệ gen là một phép đo kích thước đoạn
khung trung bình. Những đoạn khung nào có kích thước từ 1 Mb trở lên được
tìm thấy được xem là có kết quả ráp nối tốt. Ví dụ như, ở loài cá bể dẹt
(Tetraodontidae) có kích thước hệ gen 800 Mb, và trình tự ráp nối của toàn hệ
gen này gồm 500 đoạn khung khác nhau, như vậy mỗi đoạn khung có kích
thước trung bình 1,6 Mb. Một “hiệu quả” ráp nối cao như vậy cũng tạo thuận
lợi cho nhiều phân tích di truyền khác, chẳng hạn như có thể dễ dàng xác định
được tất cả các vùng mã hóa của hệ gen. Khi Bill Clinton và Tony Blair thông
báo kết quả giải mã hệ gen người năm 2000, kích thước trung bình của các
đoạn khung là 2 Mb. Điều này là đủ để có thể tin cậy về số gen ước lượng có
trong hệ gen (xấp xỉ 30.000 gen).
7.4. Phân tích mở rộng hệ gen
44
Đối với các hệ gen nhỏ như của vi khuẩn hay các loài sinh vật nhân
chuẩn đơn giản, việc xác định các trình tự mã hóa protein thường có thể ngoại
suy trực tiếp từ kết quả giải mã trình tự, mà thực chất là thông qua việc xác
định các ORF. Mặc dù không phải tất cả các ORF (đặc biệt là các ORF ngắn)
đều thực sự là các gen mã hóa protein, thì việc xác định như vậy thường cũng
rất hiệu quả, việc khó khăn hơn thường là việc xác định được chức năng của
các gen đó hoặc sản phẩm (protein) của nó.
Việc xác định được vùng mã hóa protein ở hệ gen các loài động vật vốn
phổ biến chứa cấu trúc exon - intron thực tế phức tạp hơn nhiều. Trong trường
hợp này, người ta phải sử dụng “một loạt” các công cụ tin sinh học để xác
định được các gen và thành phần di truyền của các hệ gen phức tạp. Các
chương trình máy tính đã được lập trình để có thể xác định được các vùng có
tiềm năng mã hóa protein dựa trên một số tiêu chí nhất định, bao gồm sự xuất
hiện của các ORF được chặn bởi các vị trí cắt ở hai đầu (Hình 10.18) và gần
kề một trình tự khởi đầu phiên mã (promoter). Tuy vậy, các chương trình
phân tích gen này đến nay vẫn chưa hoàn thiện để có thể khẳng định sự chính
xác là 100%. Một tỉ lệ khoảng 3/4 số gen có thể được xác định bằng phương
pháp này, nhưng cũng có rất nhiều gen bị bỏ sót; và thậm chí chi tiết hơn
trong một gen, một số trình tự exon cũng có thể bị bỏ sót.
Một hạn chế đáng kể nữa của các chương trình tìm gen hiện nay là đôi
khi không xác định được đầy đủ các promoter. Ví dụ như một promoter lõi
điển hình ở động vật đa bào có kích thước khoảng 60 bp, chứa các trình tự
định dạng (motif), như TATA, INR và DPE, là những motif cần thiết cho sự
gắn vào của phức hệ khởi động TFIID và phức hệ phiên mã của enzym ARN
Polymerase II. Đáng tiếc là trình tự của yếu tố khởi đầu phiên mã lõi này có
mức độ biến đổi rất lớn. Mặc dù trong khi phức hệ khởi đầu phiên mã của tế
bào đủ “thông minh” để xác định được những trình tự này, thì đến nay con
người chưa đủ “thông minh” để viết được các chương trình máy tính cho phép
xác định được đầy đủ các promoter lõi dạng này. Tất nhiên, hiện nay các nhà
sinh tin học đang tiếp tục hoàn thiện các chương trình phần mềm để đến một
ngày nào đó chúng ta có thể xác định, phân tích được tất cả các thuộc tính của
gen đã nêu ở trên, bao gồm các yếu tố promoter lõi, các ORF, các điểm cắt và
tái tổ hợp gen, v.v… để xác định được đúng và đầy đủ các gen mã hóa
protein.
Phương pháp quan trọng nhất để kiểm chứng các gen mã hóa protein
suy đoán và xác định các gen bị bỏ sót bởi các phần mềm máy tính là sử dụng
dữ liệu cADN (Hình 10.18). cADN được tạo ra theo nguyên tắc phiên mã
ngược (Hình 10.19) từ các phân tử mARN hoàn thiện, vì vậy nó phản ánh
đúng các trình tự exon thực sự. Các phân tử cADN được dùng để tạo ra cơ sở
dữ liệu EST, hay còn gọi là nhãn xác định trình tự biểu hiện (expressed
sequence tag), thực chất là các đoạn trình tự ngắn được trích ra từ một trình tự
45
cADN đã biết. Các trình tự cADN ngẫu nhiên (có thể là trình tự đầy đủ hay
các trình tự một phần EST) được xác định bằng sử dụng phương pháp giải mã
trình tự ngẫu nhiên rồi được đối chiếu với các đoạn khung của hệ gen. Các
vùng tương ứng với các EST được xác định là các exon, còn các vùng nằm
giữa các exon tương ứng với các intron (mặc dù, nguyên tắc cắt intron khác
nhau có thể sử dụng một exon không có mặt trong cADN hay EST được giải
mã trình tự). Các thông tin giải mã trình tự cADN và EST cũng giúp tìm được
sự liên kết giữa các contig, giữa các đoạn khung và giữa chúng với nhau.
Chẳng hạn như giả sử có một phân tử cADN được phiên mã từ một gen kích
thước rất lớn có chiều dài intron là 100 kb hoặc hơn. Có hai đoạn khung cùng
chứa các trình tự khác nhau của phân tử cADN chung này, thì nhiều khả năng
chúng là các vùng liên kết của hệ gen và biểu hiện là các đoạn của cùng một
gen.
8. Phân tích so sánh các hệ gen
Việc so sánh hệ gen giữa các loài động vật khác nhau là cơ sở trực tiếp
để đánh giá sự biến đổi về cấu trúc gen và trình tự của chúng xuất hiện trong
quá trình tiến hóa (Hình 10.18). Việc so sánh các hệ gen như vậy đồng thời
cùng giúp khẳng định chắc chắn hơn về các vùng gen mã hóa protein trong
một hệ gen của loài nào đó. Ví dụ như các exon của các gen đồng tiến hóa có
mức độ bảo thủ cao hơn nhiều so với các intron. Việc so sánh hệ gen người và
chuột đã tìm thấy nhiều exon có tính bảo thủ cao. Việc so sánh giữa các hệ
gen cũng đồng thời giúp xác định các trình tự exon ngắn (hay tìm thấy ở phần
đầu 5’ của gen và vùng promoter lõi) vốn thường bị sót khi xác định bằng
phần mềm máy tính.
Một trong những khám phá nổi bật của phép phân tích so sánh các hệ
gen là việc tìm ra sự phổ biến của tính bảo thủ liên kết giữa các gen trên
cùng NST. ở người và chuột, sự bảo thủ của tính liên kết giữa các gen trên
cùng NST là rất phổ biến (Hình 10.19). Trong nhiều trường hợp, tính bảo thủ
này được tìm thấy ở cả các loài rất xa nhau trong quá trình tiến hóa, ví dụ như
ở loài cá bể dẹt có tổ tiên chung với các loài động vật có vú từ 400 triệu năm
trước đây. Hiện tượng phổ biến của sự bảo thủ trong tính liên kết của nhiều
gen cho thấy có nhiều khả năng các gen “láng giềng” cùng dùng chung các
trình tự điều hòa gen. Một điều tra dùng phần mềm máy tính gần đây tìm thấy
trong một đoạn NST có kích thước 100 - 200 kb ở ruồi dấm Drosophila có 10
- 20 gen liên kết có hình thức điều hòa sự biểu hiện giống hệt nhau. ở ruồi
dấm có khoảng 500 - 1000 đoạn NST duy trì sự liên kết bảo thủ này có thể là
do các gen liên kết cùng phụ thuộc vào các trình tự điều hòa chung ở vùng
NST đó.
Các trình tự mã hóa protein không chỉ là các vùng của hệ gen được giới
hạn về chức năng. Các trình tự điều hòa (vị trí gắn của các yếu tố phiên mã và
các yếu tố điều hòa hoạt động gen, như các yếu tố tăng cường enhancer)
46
thường có tính bảo thủ cao. Các trình tự này thường được xác định là các trình
tự không mã hóa protein ngắn và bảo thủ. Ví dụ một chương trình máy tính
gọi là VISTA (không phải hệ điều hành gần đây của Microsoft) khi phân tích
hệ gen ở nhiều loài khác nhau tìm thấy sự bảo thủ ở ở tỉ lệ 70% trong một
đoạn trình tự phân tích 50 - 75 bp đối với một số trình tự ADN có vai trò điều
hòa (Hình 10.20). Hai loài cá bể dẹt và chuột cùng có khoảng 10.000 các đoạn
trình tự không mã hóa ngắn giống nhau, rất có thể chúng là các trình tự tăng
cường đặc trưng mô. Tuy vậy, cả hai loài này, đặc biệt ở chuột, dường như có
nhiều trình tự điều hòa bị bỏ sót khi sử dụng phần mềm máy tính để phân tích
trình tự gen. Người ta đã xác định được ở loài động vật bậc thấp Ciona
intestialis có chứa khoảng 20.000 các trình tự enhancer, và vì vậy không có gì
là ngạc nhiên nếu người và chuột sẽ có khoảng 50.000 - 100.000 các trình tự
enhancer trong hệ gen.
Các phương pháp được sử dụng để xác định các trình tự tăng cường dựa
trên việc xác định các vị trí liên kết của các yếu tố hoạt hóa hoặc ức chế phiên
mã. Việc xác định được các trình tự điều hòa trong phân tử ADN còn là thách
thức lớn hơn so với việc xác định được các trình tự mã hóa protein bởi các
trình tự điều hòa không bị hạn chế bởi các nguyên lý của mã di truyền. Vì
vậy, dường như việc phải phối hợp nhiều phương pháp sinh tin học và chương
trình máy tính là cần thiết để có thể xác định được các trình tự ADN điều hòa
trong toàn bộ hệ gen.
Công cụ phần mềm phân tích hệ gen được sử dụng rộng rãi nhất hiện
nay là BLAST (basic local alignment tool). Có một số cải biến khác nhau
trong các chương trình BLAST, tuy vậy tất cả các chương trình này đều có
các đặc điểm chung là tìm được những vùng giống nhau giữa các gen mã hoa
protein khác nhau (Hình 10.21). Có nhiều cách để tìm dữ liệu từ BLAST. Một
trong những cách đó là sử dụng công cụ tìm kiếm hệ gen hoặc các hệ gen đối
với tất cả các trình tự protein được dự đoán trước gọi là “querry sequence”.
Chẳng hạn như ví dụ sau: gen eve mã hóa trong một protein điều hòa phiên
mã thiết yếu cho sự phân hóa tế bào ở phôi Drosophila. Protein Eve có 376
axit amin. Vùng chức năng của protein này nằm giữa các axit amin 71 - 130.
Khi sử dụng trình tự của 60 axit amin này để tìm kiếm, kết quả cho thấy hệ
gen Drosophila có 75 gen mã hóa chứa trình tự này. Như vậy, chương trình
BLAST đã nhanh chóng xác định được một loạt các gen có chức năng tương
tự. Trong trường hợp này này, các gen mã hóa protein điều hòa có dạng motif
gắn kết ADN đặc trưng là xoắn - uốn - xoắn.
Một cách khác để khai thác cơ sở dữ liệu của BLAST là tra cứu theo
trình tự nucleotit. Chẳng hạn như trong thí dụ trên, người ta có thể sử dụng
tương ứng trình tự 180 bp mã hóa cho hộp định loại gen (homeobox).
Tóm lại, việc trình tự các hệ gen đầy đủ của các loài khác nhau ngày
càng tăng lên đã cung cấp một cơ sở dữ liệu ngày càng phong phú và đầy đủ
47
cho các nghiên cứu hệ gen học so sánh. Ngày càng có nhiều các chương trình
máy tính được phát triển và hoàn thiện để khai thác vốn thông tin di truyền
đang ngày càng được tạo ra đầy đủ hơn qua các chương trình giải mã ADN tự
động.
II. Các kỹ thuật phân tích protein
1. Chuẩn bị dịch chiết tế bào để tinh sạch protein
Việc phân lập và tinh sạch được các loại protein riêng rẽ có ý nghĩa
quyết định đến khả năng tìm hiểu được chức năng của chúng. Mặc dù trong
một số trường hợp, chúng ta có thể nghiên cứu chức năng của protein ở dạng
hỗn hợp phức tạp, nhưng phần lớn những nghiên cứu này thường dẫn đến
những kết luận “mù mờ”. Chẳng hạn như khi chúng ta nghiên cứu về hoạt tính
của một enzym ADN polymerase trong một hỗn hợp protein thô (chẳng hạn từ
dịch phân giải tế bào), các enzym ADN polymerase và protein thành phần
khác cũng có thể ảnh hưởng đến hiệu suất tổng hợp ADN quan sát được trong
thực nghiệm. Vì vậy, việc tinh sạch các protein là một bước quan trong trong
quá trình tìm hiểu về chức năng của chúng.
Mỗi một protein thường có một số đặc tính riêng làm việc tinh sạch
chúng thường có tính đặc thù. Điều này thì trái ngược với ADN, vốn cơ bản
giống nhau về cấu trúc và thành phần, chỉ khác nhau về trình tự của các
nucleotit. Các bước tinh sạch từng loại protein thường dựa trên các đặc tính
đặc thù của nó về kích thước, hình dạng, điện tích và nhiều khi là chức năng
của chúng.
Vật liệu khởi đầu cho hầu hết các quá trình tinh sạch protein từ sinh vật
là các dịch chiết tế bào. Không giống ADN vốn có tính phục hồi cao trong các
điều kiện nhiệt độ sống khác nhau, thì protein rất dễ bị biến tính và phá hủy
sau khi bị giải phóng ra khỏi tế bào. Vì lý do này, hầu hết quá trình chuẩn bị
các dịch chiết và tinh sạch protein được tiến hành ở nhiệt độ lạnh (4 oC). Có
một số cách chuẩn bị dịch chiết tế bào. Các tế bào có thể phân giải bằng sử
dụng chất tẩy, các lực làm vỡ thành tế bào, xử lý với dung dịch nhược trương
(làm tế bào trương lên do nước đi vào và vỡ ra), hoặc thay đổi đột ngột áp
suất. Điểm chung của tất cả các phương pháp là làm thành tế bào vỡ ra và các
protein được giải phóng. Trong một số trường hợp, các tế bào được chuyển về
trạng thái đông lạnh trước khi được nghiền bằng những máy nghiền mẫu trong
phòng thí nghiệm.
2. Sử dụng sắc ký cột trong tinh chế protein
Phương pháp chiết xuất và tinh sạch protein phổ biến nhất là sắc ký cột.
Trong trường hợp này, các phân đoạn protein được cho chạy qua cột nhồi
bằng các hạt agarose hoặc polyacrylamit nhỏ được cải biến cho phù hợp. Có
một số phương án khác nhau trong việc sử dụng cột tách chiết và tinh sạch
protein. Các quy trình khác nhau được thiết lập có thể khác nhau do đặc tính
khác nhau của các loại protein. ở đây mô tả ba phương pháp. Trong hai
48
phương pháp đầu, protein được phân lập dựa vào kích thước và tính tích điện
của chúng. Tóm tắt về các phương pháp này được nêu trên Hình 10.22.
Sắc ký trao đổi ion: Trong phương pháp này, các phân tử protein được
phân lập dựa trên điện tích ion hóa bề mặt của chúng bằng việc sử dụng các
vật liệu làm cột là các hạt mang các nhóm chức tích điện âm hoặc dương (đây
còn được gọi là pha tĩnh). Các phân tử protein tương tác yếu với các hạt
(chẳng hạn như một phân tử protein tích điện dương được cho chạy qua cột
mang các hạt tích điện âm) sẽ được hồi lưu khi sử dụng một dung dịch muỗi
loãng chảy qua cột sau đó (dung dịch chạy mẫu được gọi là pha động). Các
phân tử tương tác với pha động càng mạnh, càng cần dung dịch hàm lượng
muối cao để hồi lưu mẫu (bởi muối làm “trung hòa” các vùng mang điện tích
và vì vậy cho phép các phân tử protein được giải phóng khỏi cột. Bằng việc
tăng dần nồng độ muối trong các dung dịch đệm thu hồi mẫu, các phân tử
protein khác nhau, kể cả các phân tử có đặc tính tích điện gần giống nhau
cũng được phân tách thành các phân đoạn khác nhau khi chúng được hồi lưu
từ cột.
Sắc ký lọc gel: Kỹ thuật này cho phép phân tách các loại protein trên cở
sở đặc điểm khác nhau của các loại protein về hình dạng và kích thước. Khác
với trong kỹ thuật sắc ký trao đổi ion, các hạt được sử dụng để nhồi cột trong
kỹ thuật này không mang các nhóm tích điện mà thay vào đó là mang các lỗ
có kích thước khác nhau. Các phân tử protein càng nhỏ càng có nhiều khả
năng thâm nhập vào tất cả các lỗ; vì vậy, thời gian chạy qua cột dài hơn và
thời gian hồi lưu muộn hơn. Ngược lại, các phân tử protein kích thước càng
lớn càng có thời gian hồi lưu (chạy qua toàn bộ cột) sớm hơn.
Đối với mỗi loại cột, các phân đoạn sắc ký được thu ở các nồng độ muối
khác nhau hoặc ở các thời gian hồi lưu khác nhau để thu được từng loại
protein được quan tâm nghiên cứu. Các phân đoạn có hoạt tính protein được
quan tâm cao nhất sẽ được tích lũy và tiến hành tinh sạch bổ sung.
Độ tinh sạch của sản phẩm protein sẽ tăng lên khi các phân đoạn protein
được chạy qua nhiều cột sắc ký khác nhau. Thông thường một cột sắc ký đơn
lẻ không đủ để tinh sạch được một loại phân tử protein mong muốn nào đó dù
quá trình sắc ký được lặp đi lặp lại nhiều lần, thay vào đó người ta thường
phải áp dụng một chuỗi các bước kỹ thuật để có thể thu được một phân đoạn
chứa một lượng lớn loại protein cần quan tâm nghiên cứu. Chẳng hạn như, dù
có rất nhiều phân tử protein được hồi lưu trong dung dịch muối đậm đặc từ
cột tích điện dương (đối với protein tích được âm) hoặc được hồi lưu trong
sắc ký lọc gel (đối với các protein kích thước tương đối nhỏ), các kỹ thuật này
đơn lẻ thường không đủ để thu được một sản phẩm protein được tinh sạch
hoàn toàn.
3. Sắc ký ái lực hỗ trợ quá trình tinh chế protein

49
Các đặc tính đặc trưng của từng loại protein có thể được tận dụng để
giúp tinh sạch loại protein tương ứng được thuận tiện và hiệu quả hơn. Giả sử,
nếu chúng ta biết một loại protein khi hoạt động liên kết đặc hiệu với ATP, thì
có thể dùng cột sắc ký mang vật liệu gắn kết ATP để phân tách protein đó.
Chỉ có protein liên kết với ATP mới được cột giữ lại, và cho phép hầu hết các
loại protein không liên kết với ATP được chảy trôi qua cột. Kỹ thuật tinh sạch
này được gọi là sắc ký ái lực. Có nhiều hợp chất khác nhau có thể được sử
dụng để gắn kết với cột và giúp quá trình tinh sạch protein dễ dàng và hiệu
quả hơn. Các hợp chất này bao gồm cả các trình tự ADN (để tinh sạch protein
liên kết ADN) hoặc thậm trí là một loại protein để tinh sạch một loại protein
khác được biết hoặc được mong đợi có tương tác phân tử với loại protein trên.
Như vậy, để bắt đầu tinh sạch một loại protein nào đó, cần phải có những hiểu
biết cơ bản về loại protein đó và tìm cách khai thác, ứng dụng các đặc tính có
nó cho quá trình tách chiết và tinh sạch.
Một dạng rất phổ biến của sắc ký ái lực là sắc ký ái lực miễn dịch.
Trong phương pháp này, người ta gắn kháng thể đặc hiệu với protein đích lên
vật liệu làm cột sắc ký. Trong trường hợp lý tưởng, loại kháng thể này chỉ liên
kết đúng với loại protein cần quan tâm còn cho phép tất cả các loại protein
khác chảy trôi qua cột. Loại protein liên kết sau đó sẽ được thu hồi (hồi lưu)
bằng cách sử dụng dung dịch muối hoặc đôi khi là các dung dịch chất tẩy nhẹ
chảy qua cột. Khó khăn cơ bản gặp phải đối với phương pháp này là đôi khi
liên kết giữa kháng thể và protein khá bền vững đến mức phải gây biến tính
protein mới thu hồi được sản phẩm. Trong khi khác với ADN, protein sau khi
biến tính thường không có khả năng hồi tính, vì vậy protein thu được theo
cách này nhiều khi ở dạng không hoạt động chức năng và mất đi giá trị sử
dụng trong nghiên cứu.
Để tăng hiệu quả tinh sạch, các protein cũng có thể được cải biến.
Những cải biến này có thể là sự bổ sung các trình tự axit amin ngắn hoặc là
vào đầu C hoặc vào đầu N của phân tử protein cần phân tích. Những bổ sung
này, hay còn gọi là “trình tự đánh dấu” có thể tạo ra được bằng công nghệ
ADN tái tổ hợp. Các trình tự peptit đánh dấu giúp thay đổi thuộc tính của một
phân tử protein mong muốn và giúp tinh chế protein này dễ dàng hơn. Ví dụ
như, đối với một số protein người ta tiến hành bổ sung một chuỗi gồm 6
histidin giúp những protein này liên kết với Ni2+ gắn trên cột chặt hơn và dễ
phân tách hơn, trong khi thuộc tính này thường không có ở phần lớn các loại
protein khác. Ngoài ra việc sử dụng các epitop đặc hiệu (thường là một trình
tự peptit có 5 - 7 axit amin đặc hiệu xác định kháng nguyên) cũng có thể được
gắn vào phân tử protein cần tinh chế. Các cải biến này cho phép tinh sạch các
loại protein trên cơ sở nguyên tắc sắc ký ái lực miễn dịch và sử dụng dị kháng
nguyên mang các epitop được bổ sung. Điều đặc biệt là, các kháng thể và
epitop này có thể thay đổi tính liên kết kháng thể tùy thuộc vào điều kiện khác
50
nhau của môi trường (chẳng hạn, ái lực tăng khi không có Ca 2+, và ái lực giảm
khi có Ca2+). Điều này cũng giúp làm giảm ảnh hưởng của các yếu tố gây biến
tính khác.
Nguyên tắc sắc ký ái lực miễn dịch cũng có thể được dùng để làm kết
tủa nhanh một loại protein đặc hiệu nào đó (và mọi loại protein liên kết chặt
với nó) từ một dịch chiết thô. Trong trường hợp này, phản ứng kết tủa thu
được do kháng thể được gắn vào cùng loại hạt được sử dụng trong sắc ký cột.
Do các hạt này có kích thước lớn, nên chúng lắng rất nhanh xuống đáy ống
nghiệm mang theo các kháng thể và protein liên kết với chúng. Kỹthuật này
được gọi là kỹ thuật kết tủa miễn dịch, cũng là một kỹ thuật ngày càng sử
dụng phổ biến để tinh sạch nhanh protein hoặc phức hệ protein từ các dịch
chiết thô. Mặc dù nếu chỉ sử dụng phương pháp này riêng rẽ, hiếm khi thu
được sản phẩm protein được tinh sạch hoàn toàn, song phương pháp này
thường rất hiệu quả để xác định các loại phân tử protein và các hợp chất khác
(ví dụ như ADN) có tương tác với một loại protein đích nào đó.
4. Phân tích protein trên gel polyacrylamid
Các loại protein thường không mang điện tích âm đồng đều hay có cấu
trúc bậc hai đồng nhất. Thay vào đó, chúng được tạo ra từ 20 loại axit amin
khác nhau, một số chúng không mang điện tích, một số mang điện tích âm,
còn một số mang điện tích dương. Ngoài cấu trúc bậc hai, protein hoạt động
còn có các cấu trúc bậc ba, bậc bốn điển hình. Tuy vậy, nếu các protein được
xử lý với các chất tẩy ion hóa mạnh như SDS (sodium dodecyl sulphat) và
một hợp chất khử, ví dụ như mercapthoethanol, thì các cấu trúc bậc 2, 3 và 4
của phân tử protein sẽ bị phá vỡ. Nghĩa là, sau khi xử lý với SDS, protein trở
thành dạng phân tử polymer không có cấu trúc. Đồng thời, SDS tạo thành lớp
vỏ ion và làm phân tử protein trở nên tích điện âm đồng đều hơn.
Mecarptoethanol thì làm giảm các liên kết disulphit hình thành giữa các tiểu
phần cystein. Kết quả là, nếu các phân tử ADN và ARN được gây biến tính
bởi SDS và mercaptoethanol, thì sự phân tách của các loại phân tử protein
trong điện di chủ yếu là do sự khác biệt về trọng lượng và kích thước phân tử.
Sau khi điện di, các phân tử protein được nhuộm với các thuốc nhuộm liên kết
protein như Coomassie brilliant blue và quan sát. Khi không có SDS, điện di
vẫn có thể phân tách được các loại protein, nhưng lúc này còn có các yếu tố
khác nhau của các loại protein là trọng lượng phân tử, tổng điện tích và điểm
đẳng điện (xem dưới đây).
5. Định tính protein dựa trên phương pháp thẩm tách miễn dịch
(immunoblotting)
Mặc dù có bản chất khác ADN và ARN, việc xác định sự có mặt của
một loại protein trong số các protein có trong mẫu sinh học theo nguyên tắc
gần giống với các phương pháp thẩm tách (còn gọi là lai) Southern và
Northern (tương ứng với trường hợp của ADN và ARN). Tuy vậy, đối với
51
protein, phương này định tính này dựa trên dựa trên nguyên tắc miễn dịch đặc
thù của protein nên còn được gọi là phương pháp thẩm tách miễn dịch
(immunoblotting) hay phương pháp thẩm tách (lai) Western. Trong phương
pháp thẩm tách miễn dịch, các phân tử protein sau khi được phân tách trên
điện di được chuyển và gắn lên màng. Màng này sau đó được ủ trong một
dung dịch chứa kháng thể đặc hiệu với loại protein tinh sạch được quan tâm
nghiên cứu. Kháng thể sẽ tìm thấy loại protein tương ứng ở trên màng lọc và
gắn vào. Cuối cùng, bằng việc sử dụng phản ứng enzym hiện màu, người ta có
thể quan sát được vị trí kháng thể liên kết trên màng. Như vậy, tất cả các
phương pháp lai Southern, Northern và Western đều có điểm chung là sử
dụng các hợp chất chọn lọc để quan sát sự có mặt của một hoặc một số loại
phân tử đặc thù trong các hỗn hợp phức tạp.
6. Giải trình tự trực tiếp protein
Mặc dù có cấu tạo phức tạp hơn so với ADN và ARN, các phân tử
protein cũng có thể giải trình tự trực tiếp, tức là việc xác định thành phần và
thứ tự của các axit amin trên chuỗi polypeptit. Có hai phương pháp được sử
dụng phổ biến hơn cả là: 1) phương pháp biến tính Edman và 2) phương pháp
khối phổ kế tiếp. Khả năng xác định được trình tự protein có ý nghĩa quan
trong trong trong nhiều nghiên cứu về hệ protein học (proteomics) và hệ gen
học (genomics). Bởi vì với việc xác định được dù chỉ là một trình tự ngắn của
các axit amin của một phân tử protein nào đó, chúng ta có thể xác định được
gen mã hóa cho protein đó trên cơ sở đối chiếu với khung đọc mở có trong hệ
gen của nhiều loài vốn đã được giải mã hoàn toàn hoặc gần như hoàn toàn
nhưng nhưng chưa biết đầy đủ về chức năng của nhiều gen.
Phương pháp biến tính Edman là một phản ứng hóa học trong đó các
tiểu phần axit amin được giải phóng lần lượt từ đầu N của chuỗi polypeptit
(hình 10.23). Điểm mấu chốt của phương pháp này là axit amin ở tận cùng
đầu N của một chuỗi polypeptit có thể được cải biến khi xử lý với
phenylisothyocyanate (PITC) dẫn đến sự thay đổi ở gốc -amino. Axit amin
được cải biến này sau đó được cắt rời khỏi chuỗi polypeptit khi xử lý với axit
trong điều kiện không làm phá hủy phần còn lại của chuỗi polypeptit. Việc
xác định trình tự các axit amin được tiến hành dựa trên thứ tự hồi lưu của từng
axit amin được cắt khỏi chuỗi bằng kỹ thuật sắc ký lỏng hiệu năng cao HPLC
(high performance liquid chromatography), nhờ đặc điểm từng loại axit amin
có thời gian hồi lưu đặc trưng. Mỗi một vòng gây biến đổi axit amin và cắt
khỏi chuỗi polypeptit như vậy tạo ra một chuỗi polypeptit và một nhóm -
amino. Với việc lặp đi, lặp lại phản ứng cắt axit amin này sẽ cho phép xác
định được trình tự ở đầu N của một chuỗi polypeptit. Trong thực tế, chu kỳ
gây biến tính như vậy được lặp đi lặp lại từ 8 - 15 lần để xác định protein. Số
chu kỳ như vậy thông thường là đủ để xác định được một loại protein đặc thù
nào đó.
52
Phương pháp giải mã trình tự tự động dựa trên nguyên lý biến tính
Edman là một phương pháp hiệu quả và cũng đã được sử dụng rộng rãi. Tuy
vậy kỹ thuật này gặp trở ngại khi đầu N tận cùng của phân tử protein bị cải
biến về mặt hóa học (ví dụ như bởi các nhóm acetyl hoặc formyl), mà hiện
tượng này thì vốn có thể xảy ra tự nhiên trong điều kiện in vivo, hoặc trong
quá trình tách chiết và tinh sạch protein. Để khắc phục hiện tượng này, người
ta có thể sử dụng protease để cắt chuỗi polypeptit và phân tích trình tự bên
trong chuỗi.
Phương pháp khối phổ kế tiếp (MS/MS) có thể được dùng để xác định
các vùng trình tự protein khác nhau. Khối phổ là phương pháp xác định chính
xác khối lượng của các các phân tử nhỏ. Một cách vắn tắt phương pháp này
được mô tả như sau: phân tử cần phân tích được cho bay qua một thiết bị
(trong điều kiện chân không) trong điều kiện tốc độ di chuyển của nó tương
quan với tỉ số khối lượng / điện tích. Trên cơ sở này người ta có thể đo được
thời gian bay của phân tử và xác định được khối lượng của nó. Đối với các
phân tử sinh học có kích thước nhỏ như các chuỗi peptit và các phân tử
protein nhỏ, thì trọng lượng phân tử của nó có thể xác định chính xác đến
từng Dalton.
Để xác định khối lượng phân tử protein bằng phương pháp MS/MS,
trước tiên phân tử protein thường được cắt thành các đoạn peptit có trình tự
ngắn (thường dưới 20 axit amin) nhờ sử dụng enzym đặc hiệu, chẳng hạn như
trypsin. Hỗn hợp các đoạn peptit này sau đó được đưa vào phân tích khối phổ
và chúng phân tách nhau ra dựa trên tỉ số khối lượng / điện tích. Các đoạn
peptit riêng rẽ sau đó sẽ bị bắt giữ và phân đoạn thành các chuỗi peptit thành
phần. Khối lượng của mỗi peptit thành phần được xác định như minh họa trên
hình 10.24. Sự kết hợp các dữ liệu về khối lượng của các đoạn peptit thành
phần sẽ cho biết trình tự rõ ràng của phân tử protein ban đầu. Cũng giống như
trong phương pháp biến tính Edman, việc xác định được trình tự của của
khoảng 15 axit amin là đủ để so sánh với trình tự protein được luận ra từ các
trình tự ADN đã được giải mã.
Kỹ thuật MS/MS thực sự là một kỹ thuật có tính cách mạng trong việc
xác định và giải trình tự protein. Trong phương pháp này, thông thường chỉ
cần một lượng mẫu nhỏ và hơn hết là có thể phân tích hỗn hợp nhiều loại
protein đồng thời.
7. Hệ protein học (proteomics)
Việc phát triển của các kỹ thuật giải mã trình tự ADN, kết hợp với các
phương pháp tách chiết, tinh sạch và phân tích trình tự protein đã mở đường
cho sự hình thành một chuyên ngành mới gọi là hệ protein học. Hệ protein
học (proteomics) là chuyên ngành nghiên cứu về toàn bộ tập hợp protein được
một mô, tế bào hoặc cơ thể tạo ra trong các điều kiện đặc thù, phân tích mức
độ phổ biến của từng protein và sự tương tác của chúng với nhau và với các
53
phân tử khác (ví dụ như ADN) trong quá trình hoạt động của tế bào. Nếu như
các kỹ thuật phân tích vi dãy phản ứng (microarray) có thể giúp nhận biết
được sự biểu hiện của các gen trên cở sở phân tích hệ gen, thì các kỹ thuật
proteomics cho phép xác định được hình ảnh tổng thể về toàn bộ vốn protein
của một tế bào, mô hoặc cơ thể.
Hệ protein học được dựa trên ba phương pháp cơ bản: điện di hai chiều
trên gel polyacrylamid để tiến hành phân tách các protein, khối phổ để xác
định khối lượng phân tử và định tính protein (hoặc các đoạn peptit từ phân tử
protein đó), và sinh tin học để đối chiếu các phân tử protein và các đoạn peptit
với các trình tự mã hóa của chúng trong hệ gen. Một tế bào riêng lẻ thường ít
nhất tạo ra hàng nghìn loại protein khác nhau, trong khi việc sử dụng đơn lẻ
phương pháp điện di truyền thống trên gel polyacrylamid thường không đủ để
phân lập và tách biệt các protein này. Vì vậy, như tên gọi của nó, phương
pháp điện di hai chiều cho phép phân tách các phân tử protein trên gel điện di
theo hai chiều được thực hiện kế tiếp nhau.
Trong bước thứ nhất, các phân tử protein được phân đoạn dựa trên điểm
đẳng điện của chúng (theo nguyên tắc hội tụ đẳng điện). Theo nguyên tắc này,
khi một gradient pH được tạo ra từ đầu này đến đầu kia của bản điện di, thì tại
vị trí pH tương ứng làm trung hòa điện tích của một phân tử protein sẽ làm
các phân tử protein tập trung (hội tụ) tại vị trí đó. Trong bước thứ hai, các
phân tử protein tại điểm hội tụ được tiếp tục phân tách trên cơ sở khối lượng
và kích thước của chúng khi di chuyển trên trường điện di polyacrylamid đã
được gây biến tính bởi SDS như mô tả ở trên. Do các phân tử protein được
đồng thời phân tách dựa trên hai thuộc tính (điểm đẳng điện và trọng lượng
phân tử), nên hàng nghìn loại protein khác nhau có thể được phân tách khỏi
nhau trong một thí nghiệm duy nhất. Sau khi được phân đoạn theo phương
pháp điện di hai chiều, mỗi loại protein riêng biệt sẽ được đưa vào phân tích
khối phổ để xác định chính xác khối lượng phân tử. Như đã nói ở trên, để tăng
hiệu quả phân tích, thông thường protein được cắt thành các đoạn peptit nhỏ
nhờ sử dụng protease thay cho việc phân tích phân tử protein ở dạng nguyên
vẹn có phân tử lượng lớn và cấu trúc phức tạp. Kỹ thuật phân tích MS/MS cho
phép giải trình tự chi tiết của các đoạn peptit và xác định phân tử protein.
Cuối cùng, các dữ liệu về trình tự hệ gen hoàn chỉnh của một cơ thể và
các trình tự peptit từ các loại protein được quan tâm nghiên cứu sẽ được đưa
vào phân tích bằng các phần mềm sinh tin học để có thể xác định được một
trình tự mã hóa đặc thù trong hệ gen tương ứng với loại protein có chức năng
được quan tâm nghiên cứu. Như vậy, các nghiên cứu hệ gen học (genomics)
và hệ protein học (proteomics) có mối quan hệ chặt chẽ trong các nghiên cứu
di truyền học phân tử hiện đại.
54
III. Lai axit Nucleic
Lai axit nuclêic Khi phân tử ADN sợi kép gặp nhiệt độ cao hoặc một
số hợp chất gây biến tính, các mối liên kết hydro vốn
duy trì sự liên kết giữa hai mạnh đơn bị phá vỡ. Sợi kép lúc này bị biến tính
và hai mạch đơn của phân tử ADN tách nhau ra. Quá trình này được gọi là sự
biến tính của ADN. Nếu nhiệt độ sau đó được giảm xuống, hoặc tác nhân
biến tính hoá học được loại bỏ khỏi môi trường, cấu trúc ADN sợi kép được
phục hồi. Quá trình thứ hai này gọi là sự hồi tính của ADN. Trong thực tế,
các cặp phân tử axit nucleic mạch đơn nếu có phần lớn trình tự bazơ nitơ bổ
trợ với nhau đều có khả năng hình thành liên kết tạo nên phân tử axit nucleic
sợi kép. Phân tử axit nucleic sợi kép này được gọi là phân tử lai và quá trình
xảy ra được gọi là quá trình lai. Các phân tử lai có thể được tạo thành giữa
hai mạch đơn ADN, giữa mạch đơn ADN và ARN, hoặc giữa hai mạch ARN
với nhau. Đặc tính lai của các axit nucleic dựa trên nguyên tắc bổ trợ của các
nucleotit được dùng trong hàng loạt các kỹ thuật phân tích nhằm phát hiện các
trình tự ADN và ARN đặc thù được quan tâm nghiên cứu.
Các mẫu dò Việc phát hiện các trình tự axit nucleic dựa trên các kỹ
thuật lai phân tử cần đến sự có mặt của các mẫu dò.
Các mẫu dò thực chất là một phân tử ADN hay ARN có trình tự bổ trợ với
phân tử axit nucleic cần phát hiện trong mẫu nghiên cứu. Trong quá trình
phân tích , các mẫu dò trước tiên phải được làm tinh sạch và không bị lẫn với
các axit nucleic có trình tự khác. Các mẫu dò được sử dụng phổ biến là các
trình tự ADN được tách dòng hoặc được khuếch đại nhờ phản ứng PCR.
Ngoài ra, người ta cũng có thể sử dụng các đoạn oligonucleotit được tổng hợp
hóa học, hoặc các phân tử ARN thu được từ quá trình phiên mã in vitro làm
mẫu dò. Nhằm có thể phát hiện được các trình tự axit nucleic đích dựa trên
nguyên tắc liên kết bổ trợ (nguyên tắc Chargaff), các mẫu dò phải có cấu trúc
mạch đơn. Vì các mẫu dò ARN và oligonucleotit vốn có bản chất là dạng
mạch đơn, nhưng các phân tử ADN bình thường có cấu trúc sợi kép, vì vậy
phải gây biến tính thành mạch đơn để sản phẩm lai có thể hình thành. Quá
trình gây biến tính thu được bằng việc xử lý nhiệt độ cao các mẫu dò. Việc
làm lạnh nhanh sau đó sẽ làm giảm nhiệt độ tới điểm xảy ra quá trình hồi tính,
lúc này nhiệt độ phải giảm từ từ để duy trì các mẫu dò ở dạng cấu trúc mạch
đơn. Việc phát hiện các phân tử ADN đích yêu cầu mẫu dò phải được đánh
dấu với một hợp chất giúp nhận biết được sản phẩm lai. Vì vậy, một cách phổ
biến các mẫu dò được đánh dấu với các chất đồng vị phóng xạ như 32P, 35S,
55
14
C, hay 3H. Nhờ vậy, sản phẩm lai có khả năng phát xạ và có thể ghi lại được
thành hình ảnh trên phim tia X. Phương pháp này gọi là phương pháp phóng
xạ tự chụp. Để tránh các nguy cơ có thể ảnh hưởng tới sức khỏe của người sử
dụng phương pháp phân tích, người ta cũng đã phát triển một số phương pháp
đánh dấu không sử dụng chất phóng xạ. Một trong những phương pháp đó là
sử dụng các mẫu dò liên kết với hợp chất steroid digoxigenin (DIG) có thể
phát hiện được bằng các kháng thể đặc hiệu. Các kháng thể này được đánh
dấu bằng một loại thuốc nhuộm hoặc được liên kết với một enzym xúc tác
hình thành nên sản phẩm có màu để có thể nhận biết được. Gần đây hơn,
nhiềudimẫu
Điện trêndò
gelđược đánh dấu bằng các chất phát huỳnh quang cho Giếng
agarose tra
phép quan
mẫu điện di
sát và ghi hình ảnh dược dưới kính hiển vi huỳnh quang.
Các phân
đoạn ADN
Thẩm tách Southern Đây là phương
Chiều điện di pháp phân tích ADN đầutách
tiênrađược
trong
phát triển dựa trên nguyên tắc lai axit nucleic
quá trìnhvà
điện
được đặt tên theo tác giả phát minh ra nó là Ed Southern (Đại họcdiOxford).
Phương pháp thẩm tách Southern được dùng để phát hiện các phân tử Gel
agarose
ADN có trình tự đặc thù và để phân tích cấu trúc gen (Hình 5.1). Nhằm mục
đích đó, phân tử ADN cần phân tích trước hết phải được tách chiết và tinh
sạch từ
Thẩm tế mao
tách bào. dẫn
Thông thường, các đoạn ADN gen nhân được tách chiết có
kích thước lớn, khoảng 20.000 cặp bazơ nitơ (bp) hoặc thậm trí lớnLớp giấy
hơn.
thấm
Các
phân tử này được cắt thành cácthẩm
Màng phân đoạn nhờ enzym giới hạn. Các
tách enzym
Gel điện di
giới hạn có nguồn gốc vi khuẩn và có khả năng nhận biết và cắt các Cầuphân
dẫn tửdung
ADN ở một trình tự đặc hiệu (phổ biến từ 4 đến 8 cặp bazơ nitơ).dịch Việc
đệmcắt
phân tử ADN gen nhân bởi enzym giới hạn có thể tạo ra hàng nghìn các phân Dung
dịch
đoạn ADN có kích thước nhỏ. Các phân đoạn ADN này sau đó được phân đệm
tách trên gel điện di agarose. Các phân đoạn có kích thước càng lớn thì càng
gần phía đầu bản gel, trong khi các phân đoạn có kích thước càng nhỏ thì càng
Lai phân tử
gần phía cuối bản gel. Sau khi điện di, các bản gel được ngâm trong Màng
dung thẩm
dịch
tách
kiềm để làm biến tính ADN và thu được các phân đoạn ADN sợi đơn trước
khi tiến hành lai. Trong bước tiếp theo, các phân đoạn ADN đã biếnCáctínhmẫu
được dò
chuyển từ gel lên màng nylon (hoặc nitroxenllulose) để tiến hành lai
gắnvớivàocác
đoạn
Các đoạn lai
mẫu dò. Quá trình chuyển các (phátphânxạ)
đoạn ADN lên màng được gọi ADNlàđíchquáđể
trình thẩm tách. Lúc này, bản gel được đặt trên một tấm giữ gel tạo thành phân
tử lai được
đánh dấu
phóng xạ
Phóng xạ tự chụp
Các băng
tương ứng với
các đoạn ADN
56 được lai với
Phim tia X
mẫu dò
Hình 5.1. Kỹ thuật thẩm tách Southern
phẳng phía trên bể chứa dung dịch đệm. Một cầu mao dẫn làm bằng giấy lọc
được nối giữa bề mặt giữ gel và bể chứa dung dịch đệm (Hình 5.1). Màng
thẩm tách (bằng nylon hoặc nitroxenllulose) được đặt lên trên bản gel, rồi đặt
một tập giấy thấm lên trên màng thẩm tách. Quá trình thẩm tách diễn ra trong
vài giờ, khi đó dung dịch đệm từ bể chứa được thấm hút lên theo nguyên tắc
mao dẫn, bắt đầu từ cầu nối chạy qua gel và qua màng lên tới tập giấy thấm.
Sau vài giờ, một bản sao chính xác về vị trí, kích thước của các băng trên gel
sẽ xuất hiện trên màng thẩm tách. Lúc này, màng thẩm tách được lấy ra ngoài.
Các đoạn ADN trên màng sau đó được cố định bằng việc sấy ở 80 oC hoặc
bằng chiếu xạ tia UV.
Trong bước tiếp theo, màng được ủ với mẫu dò. Quá trình này được
gọi là quá trình lai và được thực hiện ở điều kiện nhiệt độ và dung dịch đệm
phù hợp đối với sự hình thành sản phẩm lai giữa mẫu dò và các phân đoạn
ADN (lúc này đã gắn trên màng thẩm tách) theo nguyên tắc bổ trợ giữa các
nucleotit. Màng lai sau đó được rửa để loại bỏ các mẫu dò thừa hoặc mẫu dò
57
liên kết không đặc hiệu nhằm chỉ giữ lại các mẫu dò liên kết đặc hiệu với các
đoạn trình tự ADN được quan tâm. Nếu như mẫu dò được đánh dấu bằng các
đồng vị phóng xạ, màng lai sẽ được hiện hình trên phim tia X theo nguyên tắc
phóng xạ tự chụp. Sau vài giờ, trên bản phim sẽ hiện lên các băng màu sẫm
tương ứng với vị trí các đoạn ADN được lai với mẫu dò. Chiều dài các phân
đoạn ADN này được tính dựa vào vị trí tương đối của chúng với thang ADN
chuẩn (marker DNA) đã biết trước kích thước. Bằng cách này, người ta có
thể xác định được đặc tính cấu trúc của một gen dựa trên kích thước và số
lượng các phân đoạn ADN phát hiện được trong phương pháp thẩm tách
Southern. Ngoài ra, phương pháp thẩm tách Southern cũng được sử dụng để
phát hiện ra các thay đổi bất thường trong cấu trúc của các gen. Chẳng hạn,
khoảng 20% các cá thể bị mắc bệnh máu khó đông là do sự thay đổi về cấu
trúc gen tổng hợp nên protein tham gia vào quá trình đông máu được gọi là
protein yếu tố VIII. Các cá thể này có thể xác định được bằng phương pháp
thẩm tách Southern. Phép phân tích có thể dùng để xác định sớm các cá thể
trong gia đình có nguy cơ bị bệnh từ giai đoạn phát triển sớm của cơ thể nhằm
có thể xác định các biện pháp phòng trừ bệnh thích hợp.
Kỹ thuật này gần giống kỹ thuật thẩm tách

Thẩm tách Northern Southern nhưng được sử dụng để phân tích ARN,
chứ không phải là ADN. ADN trong hầu hết các tế
bào của cơ thể người đều chứa các bản sao của tất cả các gen của hệ gen. Tuy
vậy, ở mỗi loại tế bào cụ thể chỉ có khoảng 15% số gen hoạt động, còn 85%
còn lại là không hoạt động. Những gen này không được phiên mã và vì vậy
không tham gia tổng hợp protein. Ngoài ra, trong các tế bào khác nhau, sự
biệt hóa hoạt động của các gen cũng khác nhau. Chẳng hạn như các gen hoạt
động trong tế bào cơ khác với các gen hoạt động trong các tế bào máu. Sự biệt
hóa hoạt động của các gen phản ánh thành phần protein khác nhau của các tế
bào. ở các tế bào cơ chẳng hạn, các loại protein vận động như actin và myosin
vốn cần thiết cho hoạt động co giãn cơ được tổng hợp mạnh và các gen mã
hóa cho chúng hoạt động rất mạnh. Ngược lại, trong các tế bào máu protein
chủ yếu là hemoglobin. Lúc này, các gen tham gia tổng hợp hemoglobin hoạt
động rất mạnh. Phương pháp thẩm tách Northern được dùng để xác định các
gen hoạt động ở các loại tế bào khác nhau thông qua sự phiên mã của các
phân tử mARN tương ứng. Các bước thực hiện của phương pháp thẩm tách
Northern là tương tự như phương pháp thẩm tách Southern. Điểm khác biệt cơ
bản duy nhất là vật liệu được sử dụng cho quá trình phân tích. Đối với phương
pháp thẩm tách Northern, người ta sử dụng ARN được tách chiết từ một loại
mô, tế bào nhất định nào đó. Hỗn hợp ARN tổng số lúc đầu sẽ chứa các phân
tử mARN thu được từ quá trình phiên mã của tất cả các gen hoạt động trong
loại mô, tế bào đó. Do các phân tử mARN khác nhau có kích thước khác nhau
58
và phù hợp với kích thước của các phân tử protein tương ứng mà chúng mã
hóa. Các phân tử mARN mã hóa cho các loại protein có mặt phổ biến trong tế
bào sẽ chiếm ưu thế hơn so với các phân tử mARN mã hóa cho các protein ít
phổ biến. Các phân tử mARN khác nhau sẽ được phân tách nhờ phương pháp
điện di trên gel agarose. Mỗi một loại phân tử ARN sẽ định vị tại một vị trí
nhất định trên gel điện di phụ thuộc vào kích thước của nó. Các phân tử
mARN càng lớn càng nằm gần phía đầu của bản gel, trong khi các phân tử
mARN càng nhỏ càng gần phía cuối bản gel. Giống như trong phương pháp
thẩm tách Southern, các gel sau đó được thẩm tách để chuyển các phân tử
mARN sang màng lai và tiến hành lai với các mẫu dò đặc hiệu tương ứng với
phân tử mARN được nghiên cứu. Màng lai sau đó cũng được rửa và chụp
bằng phim tia X. Phim này sau khi hiện hình sẽ cho thấy các băng riêng biệt
tương ứng của phân tử mARN lai với mẫu dò. Vị trí tương đối của các băng
trên gel có thể dùng để ước tính chiều dài của phân tử mARN và mức độ đậm,
nhạt của băng có thể dùng để định lượng phân tử mARN tương ứng có mặt
trong tế bào. Trong đó đó, các loại phân tử mARN có hàm lượng thấp sẽ xuất
hiện với các băng điện di nhạt, trong khi các loại mARN có hàm lượng cao sẽ
xuất hiện bằng các băng điện di đậm. Nhờ vậy, phương pháp thẩm tách
Northern không những có thể cung cấp thông tin hữu ích về các gen hoạt
động trong từng loại mô, tế bào; mà còn phản ánh mức độ biểu hiện của gen
và kích thước của các phân tử mARN tương ứng của chúng.
Sự khác biệt của kỹ thuật lai in-situ là phương pháp này

Lai in situ được sử dụng để phát hiện các trình tự axit nucleic có
mặt trong các tế bào nguyên vẹn. ứng dụng chủ yếu của
phương pháp lai in situ nhằm xác định mức độ biểu hiện của một loại phân tử
mARN đặc trưng nào đó trong từng loại tế bào riêng biệt thuộc các mô chứa
nhiều loại tế bào khác nhau. Chẳng hạn, phương pháp lai in situ được dùng để
xác định xem liệu phân tử mARN mã hóa cho insulin có phải chỉ biểu hiện
trong tế bào  của tuyến tụy hay không, v.v… Trong kỹ thuật này, các khối
mô nghiên cứu được cắt thành các lát mỏng bằng thiết bị gọi là máy cắt tiêu
bản hiển vi (microtom) và đặt lên trên lam kính hiển vi. Các mẫu dò được bổ
sung vào tiêu bản tế bào trên lam kính và được hấp thụ vào trong tế bào chất.
ở đây mẫu dò sẽ liên kết với các phân tử mARN tương ứng để hình thành nên
phức hợp lai axit nucleic. Phức hợp lai này có thể dễ dàng phát hiện nhờ chất
đánh dấu của mẫu dò và biểu hiện thành các vùng nhuộm màu trong các tế
bào khi được quan sát dưới kính hiển vi. Các mẫu dò có thể được đánh dấu
theo một số cách khác nhau. Chẳng hạn như, người ta có thể sử dụng các chất
đồng vị phóng xạ, các chất phát huỳnh quang, các enzym xúc tác phản ứng
hình thành các sản phẩm có màu, hay sử dụng steroid digoxingenin.
59
Một phương pháp cải tiến của kỹ thuật này gọi là phương pháp lai
huỳnh quang in situ (FISH = fluorescent in situ hybridization) sử dụng việc
lai mẫu dò với các nhiễm sắc thể trong tế bào nhằm xác định vị trí của một
gen nào đó trên một nhiễm sắc thể. Trong phương pháp này, các tế bào đang
phân chia ở kỳ giữa chứa các nhiễm sắc thể ở giai đoạn co ngắn cực đại với
hình dạng xác định được sử dụng để tiến hành lai. Bằng việc tiến hành lai với
các mẫu dò, người ta có thể xác định được vị trí của locut tương ứng trên
nhiễm sắc thể khi quan sát tế bào dưới kính hiển vi huỳnh quang.
IV. PCR - Phản ứng chuỗi trùng hợp
Nguyên tắc Phản ứng chuỗi trùng hợp (PCR = polymerase chain
reaction) là một kỹ thuật hữu hiệu được sử dụng rộng rãi
và có vai trò quan trọng trong hầu hết các nghiên cứu về gen hiện nay. ADN
nhiễm sắc thể trong tế bào chứa hàng ngàn gen. Điều đó làm cho việc phân
tích và phân lập một gen riêng lẻ trở nên khó khăn. Phản ứng PCR là công cụ
cho phép chúng ta sao chép nhiều lần một trình tự ADN đặc thù, thông
thường tương ứng với các gen hoặc từng phần của các gen đó, xuất phát từ
mẫu ADN nhiễm sắc thể nhờ một phản ứng enzym đơn giản. Yêu cầu duy
nhất của quá trình này là cần phải biết một số trình tự ở hai đầu của đoạn
ADN cần khuếch đại. Đoạn ADN được quan tâm nghiên cứu được nhân lên
(khuếch đại) hàng triệu lần và trở thành đoạn ADN chiếm ưu thế sau khi phản
ứng PCR kết thúc. Lượng ADN của đoạn trình tự được quan tâm nghiên cứu
lúc đó đủ lớn để có thể sử dụng trong các nghiên cứu chi tiết tiếp theo về gen
hoặc sử dụng cho mục đích thao tác di truyền liên quan đến các đoạn gen
được khuếch đại.
Thành phần phản ứng PCR

Đoạn ADN được khuếch đại nhờ phản ứng
PCR diễn ra nhờ sự thay đổi nhiệt độ của
phản ứng qua nhiều chu kỳ. Mỗi một phản ứng PCR gồm có 4 thành phần
chính:
 ADN mạch khuôn. Phân tử ADN này chứa đoạn ADN cần khuếch đại.
Phân tử ADN mạch khuôn thường là một hỗn hợp phức tạp của nhiều trình
tự ADN khác nhau vì được chiết xuất từ ADN nhiễm sắc thể. Tuy vậy, mọi
60
phân tử ADN chứa đoạn trình tự đích đều có thể sử dụng làm khuôn cho
phản ứng PCR. Phân tử ARN cũng có thể sử dụng làm mạch khuôn cho
phản ứng PCR nhờ việc sử dụng enzym sao chép ngược (reverse
transcriptase) để chuyển trình tự ARN thành trình tự ADN.
 Đoạn mồi oligonucleotit. Một phản ứng PCR thường cần một cặp mồi
oligonucleotit. Đây là những phân tử ADN mạch đơn ngắn (thường gồm
khoảng 10 - 20 bazơ nitơ) thu được nhờ quá trình tổng hợp hóa học. Các
đoạn mồi được chọn sao cho trình tự các oligonucleotit của chúng bổ trợ
với trình tự ở hai đầu đoạn ADN cần khuếch đại (trên mạch đối diện).
 ADN polymerase. Một số loại ADN polymerase được sử dụng trong phản
ứng PCR. Những enzym này là các enzym bền ở nhiệt độ cao, có thể ổn
định và hoạt động ở nhiệt độ tới 100oC. Enzym được sử dụng phổ biến nhất
là Taq ADN polymerase có nguồn gốc từ Thermus aquaticus, một loại vi
khuẩn được phát hiện ở suối nước nóng. Vai trò của ADN polymerase
trong phản ứng PCR là xúc tác quá trình sao chép các phân tử ADN.
Enzym này gắn vào chuỗi ADN mạch đơn và tổng hợp một mạch ADN
mới có trình tự bổ trợ với mạch ADN làm khuôn (mạch gốc). Tuy vậy,
enzym ADN polymerase đòi hỏi phải có một đoạn ADN mạch kép để có
thể khởi đầu phản ứng trùng hợp phân tử ADN. Trong quá trình phản ứng
PCR xảy ra, đoạn mồi oligonucleotit gắn vào hai đầu của đoạn ADN cần
khuếch đại theo nguyên tắc bổ trợ và tạo ra các vùng ADN sợi kép ngắn.
Nhờ vậy, các đoạn mồi giúp định hướng để enzym ADN polymerase tiến
hành kéo dài chuỗi polynucleotit và chỉ sao chép đoạn trình tự ADN đích.
 Các tiểu phần dNTP (deoxyribonucleotit triphosphate). Các đơn phân
tử này tương ứng với bốn loại bazơ nitơ có mặt trong phân tử ADN
(adenine, guanine, thymine và cytosine), đồng thời chúng là cơ chất hoạt
động của enzym ADN polymerase. Mỗi phản ứng PCR cần 4 loại dNTP
(dATP, dGTP, dTTP, và dCTP) như các tiểu phần cấu trúc hình thành
nên phân tử ADN nhờ hoạt động của enzym ADN polymerase.
Phản ứng PCR xảy ra như thế nào Phản ứng PCR cho phép khuếch
đại các đoạn trình tự ADN đích
thông qua nhiều chu kỳ tổng hợp ADN lập đi lập lại nhiều lần (Hình 5.9). Mỗi
một phân tử ADN đích được tổng hợp mới sau đó lại được sử dụng làm mạch
khuôn cho chu kỳ tổng hợp tiếp theo. Kết quả là lượng ADN của đoạn trình tự
đích tăng lên nhanh chóng sau mỗi chu kỳ và trở thành phân tử chiếm ưu thế
sau khi phản ứng kết thúc. Trong các chu kỳ đầu tiên, quá trình tổng hợp
61
ADN tăng lên theo hàm số mũ, nhưng ở các chu kỳ sau vì lượng ADN đích
được sao chép tăng lên và các thành phần tham gia phản ứng được sử dụng
hết, lượng ADN được khuếch đại tăng lên theo kiểu tuyến tính sau đó không
tăng lên nữa.
Mỗi một chu kỳ tổng hợp ADN liên quan đến 3 giai đoạn là biến
tính, gắn mồi, kéo dài chuỗi, trong đó mỗi giai đoạn xảy ra ở một chế độ
nhiệt khác nhau đến khi một phân tử ADN mới được tổng hợp hoàn chỉnh.
Giai đoạn biến tính

Nhiệt độ phản ứng được nâng lên trên 90oC. ở nhiệt độ này, cấu trúc
ADN xoắn kép bị biến tính và tách ra thành hai mạch đơn riêng biệt và có thể
dùng làm khuôn để tổng hợp nên phân tử ADN mới nhờ hoạt động của enzym
ADN polymerase.
Giai đoạn gắn mồi

Phản ứng được làm lạnh về nhiệt độ phù hợp cho việc gắn của các
đoạn mồi vào phân tử ADN mạch đơn làm khuôn, nhưng không làm các mạch
đơn làm khuôn liên kết trở lại với nhau thành mạch kép. Vì vậy, giai đoạn này
gọi là giai đoạn gắn mồi. Nhiệt độ của giai đoạn này có thể thay đổi (35 -
60oC) tuy thuộc vào chủng loại và số lượng các nucleotit có trong đoạn mồi.
Giai đoạn kéo dài chuỗi

Giai đoạn này diễn ra ở nhiệt độ mà enzym ADN polymerase có hoạt
tính cao. Đối với Taq polymerase, nhiệt độ này là 72oC. Nhờ sự định hướng
của đoạn mồi, enzym ADN polymerase tiến hành sao chép phân tử ADN theo
nguyên tắc kéo dài chuỗi polynucleotit dựa trên một mạch ADN làm khuôn.
Một phản ứng PCR điển hình thường gồm tổng cộng 20 - 40 chu kỳ tùy thuộc
vào lượng trình tự ADN đích có trong phân tử ADN làm khuôn. Phản ứng
PCR có thể sử dụng để khuếch đại các đoạn ADN có kích thước đến vài ngàn
cặp bazơ nitơ. Để có thể thực hiện một số lượng lớn các chu kỳ biến đổi nhiệt
độ khác nhau, phản ứng PCR được tiến hành nhờ máy biến nhiệt theo chu
kỳ (thermal cycler). Trong chu kỳ đầu tiên, các phân tử ADN được tổng hợp
đến đầu tận cùng của chuỗi ADN gốc, đó là do không có sự ngăn cản enzym
ADN polymerase tiến hành sao chép cho đến đầu tận cùng của mạch ADN
gốc. Tuy vậy, trong các chu kỳ tiếp theo phân tử ADN mới được tổng hợp có
đầu tận cùng là trình tự của đoạn mồi được sử dụng làm khuôn, và vì vậy việc
tổng hợp các phân tử ADN mới chỉ giới hạn trong đoạn trình tự được giới hạn
bởi các đoạn mồi, hay nói cách khác chỉ đoạn trình tự ADN đích được tổng
hợp.
Các ứng dụng của phản ứng PCR

62
Chu kỳ 1 Trình tự đích
ADN khuôn (sợi kép)
Biến tính ở 94oC

Kỹ thuật PCR được sử dụng rộng rãi như một phương tiện nghiên cứu giúp
tăng cường các khả năng nghiên cứu về gen. Phần lớn các nghiên cứu về di
truyền phân tử hiện nay đòi hỏi việc sử dụng kỹ thuật PCR như một kỹ thuật
đầu tay chủ yếu, hoặc để phối hợp với các phương pháp nghiên cứu (mạch
ADN khuôn khác. đơn)
Chẳng hạn như, sản phẩm PCR có thể được sử dụng để giải trình tự ADN, sử
dụng làm mẫu dò trong các phương pháp thẩm tách Southern và Northern, và
GắnPCR
để tạo ra các dòng gen mới. Kỹ thuật mồi ở 35 - 60
không chỉCđược ứng dụng trong các
o
lĩnh vực nghiên cứu sinh học và y học thực nghiệm, mà ngay cả trong các lĩnh
vực sinh học đại cương như nhân chủng học và cổ sinh vật học.
Mồi 2 Các đoạn mồi gắn vào
Mồi 1 phân tử ADN mạch đơn
Kéo dài chuỗi ở 72oC
Taq
Taq
ADN
mới
94oC
Chu kỳ 2
ADN khuôn (mạch đơn)
ADN mới
35 - 60oC
Mồi gắn vào tất cả các

mạch đơn ADN
72oC
Các phân tử ADN

tương ứng chính xác
với trình tự đích được
tạo ra
94oC
Chu kỳ 3
ADN khuôn
63
Sản phẩm ADN “dài”
Các đoạn trình tự đích
Hình 5.9. Phản ứng chuỗi trùng hợp - PCR
Sau đây là một số lĩnh vực mà kỹ thuật PCR ngày nay được sử dụng rộng
rãi và đã có những đóng góp đáng kể:
 Nghiên cứu về các bệnh di truyền. Các rối loạn bệnh lý gây ra do đột
biến gen có thể được di truyền từ bố, mẹ sang con cái. Chẳng hạn như đối
với bệnh máu khó đông và bệnh xơ nang, người ta có thể sử dụng kỹ thuật
PCR để khuếch đại các trình tự gen để sàng lọc và tìm ra các đột biến gây
bệnh. Thông tin thu được sẽ giúp cán bộ nghiên cứu hiểu biết chi tiết hơn
về nguyên nhân của các dạng bệnh lý này, đồng thời có thể giúp xác định
các cá thể mang gen gây bệnh.
 Nghiên cứu về ung thư học. PCR đã và đang được sử dụng rộng rãi trong
các nghiên cứu tìm hiểu về vai trò của gen trong quá trình phát sinh các tế
bào ung thư. Chẳng hạn như đột biến xảy ra ở các gen gây ung thư
(oncogene) hoặc các gen ức chế khối u (tumor suppressor) có thể xác định
được bằng việc khuếch đại ADN thu được từ các tế bào ung thư nhờ việc
sử dụng kỹ thuật PCR. Điều này giúp cho các nhà nghiên cứu có hiểu biết
chi tiết hơn về quá trình hình thành và phát triển của các tế bào ung thư.
64
 Nghiên cứu pháp y. Nhờ khả năng có thể khuếch đại một đoạn ADN đặc
trưng lên hàng triệu triệu lần, kỹ thuật PCR có thể được dùng để xác định
các cá thể nhờ vào mẫu ADN của cá thể đó. Chẳng hạn, các cá thể có thể
được xác định dựa trên mẫu ADN còn sót lại ở hiện trường các vụ án
mạng. Ngoài ra, kỹ thuật PCR cũng tạo điều kiện cho các nghiên cứu xác
định các “dòng vận động” của gen trong các nghiên cứu nhân chủng học và
nguồn gốc các loài, trong đó có các chủng tộc người khác nhau.
 Công nghệ sinh học. PCR giữ một vai trò quan trọng trong việc sản xuất
ra các prôtêin tái tổ hợp, chẳng hạn như insulin hay các hócmôn sinh
trưởng vốn được sử dụng làm thuốc điều trị, cũng như trong việc nghiên
cứu và phát triển các loại văcxin tái tổ hợp, ví dụ như văcxin tái tổ hợp
chống virút viêm gan B, v.v…
V. Giải trình tự ADN
Có hai nguyên lý giải trình tự các

Nguyên lý giải trình tự ADN
nucleotit của phân tử ADN đã được phát
triển, đó là phương pháp kết thúc chuỗi
dideoxy (ddNTP) của Sanger và phương pháp biến tính hóa học của Maxam
và Gilbert. Phương pháp kết thúc chuỗi (sử dụng ddNTP) hiện nay được sử
dụng thay thế cho phương pháp hóa học do kỹ thuật này hiệu quả và dễ thực
hiện hơn.
Nguyên lý của phương phápOkết thúc chuỗi dideoxy là dựa trên việc
phân tử ADN được sao chép nhờ5'hoạt CH 2 động
O của enzym ADN polymerase.
Baz¬
Việc sử dụng các phân tử nucleotit triphosphate cải tiến thành dạng
H H
dideoxynucleotit triphosphate (ddNTP)H 3'làm dừng H phản ứng tổng hợp ADN
một cách ngẫu nhiên tại vị trí tương ứng với một trong bốn loại bazơ nitơ trên
O H
mạch ADN làm khuôn. Kết quả là một dãy các phân tử ADN sai khác nhau về
O O
Các phân tử nàyPsau đó sẽ được phân tách nhờ phương
Deoxynucleotit
chiều dài được tạo ra.
pháp điện di trên gel. Trình tự của cácObazơ nitơ trên mạch ADN làm khuôn
Baz¬
được xác định bằng việc xác định loại bazơ
5'CH 2 Onitơ có mặt ở đầu tậnLiên
cùng
kết
của
mỗi phân tử ADN được tổng hợp kể từ phân H tử ngắn
H
nhất cho đến phân tử dài
phosphodieste
nhất. H 3' H
O H
O P O
O
Baz¬
5'CH 2 O
Do thiếu nhóm –OH,
Dideoxynucleoti nên liên kết 65
t H H
H 3' H phosphodieste tiếp
theo không được tạo
h H thành
Hình 5.10. Sự kết thúc tổng hợp ADN bởi dideoxynucleotit (ddNTP)
Phương pháp kết thúc chuỗi trùng hợp Phân tử ADN được giải mã
nhờ dideoxynucleotit trình tự gọi là mạch khuôn.
Phân tử này phải được làm
tinh sạch và đồng nhất, nghĩa
là nó chỉ chứa các phân tử ADN có trình tự giống hệt nhau. Các véctơ plasmid
tinh sạch chứa trình tự ADN được tách dòng hoặc các phân tử ADN được tạo
ra nhờ phản ứng PCR thường được sử dụng làm mạch khuôn. Một yêu cầu đối
với quá trình giải mã trình tự sử dụng phương pháp kết thúc chuỗi trùng hợp
là phân tử ADN phải ở trạng thái mạch đơn là dạng có thể sao chép bởi enzym
ADN polymerase. Trước đây, việc này có thể thực hiện nhờ việc tách dòng
phân tử ADN bằng véctơ phagơ M13. Khi véctơ phagơ tái tổ hợp được dùng
để lây nhiễm vi khuẩn E. coli, nó tạo ra các bản sao của trình tự ADN được
tách dòng ở trạng thái mạch đơn và vì vậy có thể sử dụng để làm mạch khuôn
cho quá trình giải mã trình tự. Gần đây, người ta thường sử dụng phương pháp
đơn giản hơn nhiều là gây biến tính ADN bằng việc xử lý nhiệt hoặc bằng
dung dịch kiềm để thu phân tử ADN ở trạng thái mạch đơn sử dụng cho việc
giải mã trình tự, qua đó không phải tiến hành việc tách dòng phần tử. Có một
số loại ADN polymerase được sử dụng cho mục đích giải mã trình tự, bao
gồm một phần của enzym ADN polymerase I của E. coli gọi là đoạn Klenow,
đây một enzym ADN polymerase được cải biến di truyền có nguồn gốc từ
66
phagơ T7 là Sequencase và Taq ADN polymerase vốn được sử dụng trong
phản ứng PCR.
ADN khuôn (mạch đơn)
Trình tự mạch ADN tổng hợp mới
Phản ứng
1
 ddATP
Phản ứng
2
 ddTTP
Phản ứng
3
 ddGTP
Phản ứng
4
 ddCTP
Hình 5.11. Giải mã trình tự theo nguyên tắc kết thúc chuỗi bởi dideoxynucleotit (ddNTP)
Tất cả các enzym ADN polymerase yêu cầu phải có một vùng ADN
sợi kép ngắn ở đầu để có thể khởi đầu việc xúc tác tổng hợp phân tử ADN dựa
trên trình tự nucleotit trên mạch đơn làm khuôn. Vì vậy, phản ứng giải mã
trình tự phải được bổ sung bằng các phân tử ADN mạch đơn ngắn gọi là các
đoạn mồi oligonucleotit được tạo ra bằng phương pháp tổng hợp hóa học.
Các đoạn mồi được chọn sao cho trình tự các nucleotit của nó bổ trợ với trình
tự ADN mạch khuôn. Nhờ vậy, các đoạn mồi có thể gắn vào mạch ADN làm
khuôn tạo nên một vùng ngắn ADN cấu trúc mạch kép, đó là điểm phản ứng
giải mã trình tự bắt đầu diễn ra. Để giải mã trình tự một phân tử ADN, người
ta chuẩn bị 4 phản ứng enzym riêng biệt. Mỗi phản ứng bao gồm: phân tử
ADN làm khuôn ở trạng thái mạch đơn, ADN polymerase, đoạn mồi, hỗn hợp
bốn loại deoxyribonucleotit triphosphate (dNTP) là đơn phân tử cấu thành nên
phân tử ADN trong phản ứng trùng hợp, và một loại nucleotit cải tiến được
gọi là dideoxyribonucleotit triphosphate (ddNTP). Có bốn loại ddNTP khác
67
nhau tương ứng với bốn loại bazơ nitơ trong phân tử ADN. Các phân tử
ddNTP khác với dNTP ở chỗ không có nhóm hydroxyl (-OH) ở vị trí C-3’ của
phân tử đường pentoza. Phân tử ddNTP có thể liên kết được vào chuỗi ADN
đang được trùng hợp nhờ hoạt tính của enzym ADN polymerase, nhưng vì
thiếu nhóm -OH ở vị trí C-3’, liên kết phosphodiester không được hình thành
với nucleotit ở vị trí kế tiếp. Vì vậy, quá trình kéo dài chuỗi ADN bị dừng lại
(Hình 5.10). Có thể nói ddNTP là yếu tố kìm hãm phản ứng tổng hợp ADN.
Vì mỗi một trong bốn phản ứng giải mã trình tự chứa một loại ddNTP khác
nhau, nên phụ thuộc vào loại ddNTP nào có mặt trong phản ứng, quá trình
tổng hợp ADN sẽ kết thúc ở vị trí của nucleotit đó. Vào mọi thời điểm trong
quá trình tổng hợp ADN, enzym ADN polymerase có thể xúc tác phản ứng
liên kết của dNTP vào chuỗi polynuleotit đang được tổng hợp, lúc đó phản
ứng kéo dài chuỗi tiếp tục xảy ra, hoặc nó có thể xúc tác để ddNTP liên kết
vào chuỗi đang được mở rộng, nhưng trong trường hợp đó phản ứng tổng hợp
ADN bị dừng lại. Kết quả cuối cùng là mỗi một trong số 4 phản ứng giải mã
trình tự sẽ tạo ra một dãy các phân tử ADN có kích thước khác nhau, và mỗi
phân tử sẽ có trình tự được kết thúc tại vị trí có mặt của bazơ nitơ tương ứng
trên phân tử ADN mạch khuôn (Hình 5.11). Ví dụ như trong phản ứng giải mã
trình tự chứa ddATP, một dãy các phân tử ADN sẽ được tổng hợp trong đó
mỗi phân tử sẽ kết thúc ở vị trí của A (adenin) tương ứng với vị trí của T trên
mạch khuôn.
Khi phản ứng giải mã trình tự kết thúc, các phân tử ADN mới được
tổng hợp được phân tách nhờ phương pháp điện di trên gel polyacrylamid với
sản phẩm của 4 phản ứng giải mã được chạy trên các giếng gần nhau cùng
lúc. Bằng việc bổ sung thêm dNTP được đánh dấu phóng xạ nhờ các đồng vị
lưu huỳnh và phốt pho, các phân tử ADN được tổng hợp sẽ có hoạt tính phóng
xạ, vì vậy có thể phát hiện được khi đưa bản gel polyacrylamide lên tấm phim
chụp tia X. Phương pháp này gọi là phương pháp phóng xạ tự chụp. Sau khi
xử lý phim tia X, một dãy các băng điện di hiện lên trên bề mặt của phim
tương ứng với 4 dải điện di chạy từ 4 giếng của 4 phản ứng giải mã trình tự
khác nhau. Trình tự của mạch ADN khuôn nhờ vậy có thể xác định bằng việc
đọc từ các băng có kích thước nhỏ nhất lần lượt đến các băng có kích thước
lớn hơn liền kề (Hình 5.12).
68
Hình 5.12. Thang giải mã trình tự ADN
Mặc dù nguyên lý cơ bản của phương pháp

Giải trình tự ADN tự động giải mã trình tự không thay đổi, nhưng kỹ
thuật này được phát triển lên thành một kỹ
thuật tự động, bao gồm một hệ thống bán tự động trong đó công việc điện di sản
phẩm ADN khuếch đại và việc việc phát hiện cũng như phân tích các phản ứng
giải mã trình tự được thực hiện bởi một hệ thống thiết bị do máy tính điều khiển.
Với thiết kế như vậy, bốn loại ddNTP được đánh dấu bằng các loại thuốc nhuộm
màu khác nhau thông qua liên kết cộng hóa trị. Chỉ cần thực hiện một phản ứng
giải mã trình tự duy nhất và sản phẩm tạo ra là một dãy các phân tử ADN mà
phân tử này chỉ dài hơn phân tử kia một nucleotit duy nhất được đánh dấu bằng
thuốc nhuộm có màu tương ứng nằm ở vị trí cuối cùng của chuỗi polynuleotit.
Các sản phẩm ADN được khuếch đại sau đó được điện di trên gel polyacrylamid.
Nucleotit cuối cùng nằm trên chuỗi phát ra ánh sáng huỳnh quang khi được chiếu
bằng nguồn sáng laser và được ghi nhận bằng một thiết bị dò có sẵn trong hệ
thống. Nhờ vào bước sóng của ánh sáng phát ra, thiết bị dò có thể xác định được
nucleotit cuối cùng trong mỗi chuỗi polynucleotit đồng thời xây dựng một “bức
tranh toàn cảnh” về thành phần và trình tự các nucleotit của phân tử ADN được
khuếch đại.
Phương pháp giải mã trình tự ADN tự động có nhiều ưu thế vượt trội so
với các phương pháp truyền thống hoặc phương pháp hóa học (thực hiện bằng
tay). Mỗi một phản ứng giải mã trình tự đối với một mẫu chỉ đòi hỏi một ống
nghiệm đựng mẫu và chạy trên một dải điện di duy nhất, trong khi số lượng này
trong phương pháp truyền thống là bốn. Đặc tính này kết hợp với khả năng phát
hiện và phân tích mẫu tự động giúp làm tăng tốc độ giải mã trình tự và dung
lượng dữ liệu có thể quản lý khai thác một cách rõ rệt.
Phân tích trình tự ADN được giải mã Giải mã trình tự ADN là một
trong những kỹ thuật nền tảng
của lĩnh vực di truyền học phân tử và ngày càng được sử dụng rộng rãi trong các
nghiên cứu. Điểm quan trọng của kỹ thuật này là khả năng xác định thông tin liên
quan đến thành phần của ADN. Trong những năm gần đây lượng thông tin liên
quan đến trình tự ADN được xác định ở các loài sinh vật khác nhau đã tăng lên
nhanh chóng, đến mức những thông tin này phải được quản lý dưới dạng các
ngân hàng dữ liệu, trong đó có các ngân hàng dữ liệu EMBL ở Châu Âu và
Genbank ở Mỹ. Các ngân hàng dữ liệu này chứa các trình tự của các gen và hệ
69
gen người cũng như của nhiều loài sinh vật khác nhau được các nhóm nghiên cứu
khác nhau trên thế giới tìm ra. Những thông tin về trình tự ADN trong các ngân
hàng dữ liệu như vậy hiện nay có thể dễ dàng truy cập và tải về miễn phí thông
qua mạng Internet.
Việc giải mã trình tự ADN giúp tạo ra một lượng số liệu khổng lồ. Để
giúp cho việc phân tích các trình tự được dễ dàng hơn, người ta sử dụng một số
phần mềm chuyên dụng. Chẳng hạn như phần mềm GCG của Đại học
Wisconsin, v.v… cho phép phân tích nhanh chóng các đặc tính quan trọng của
các trình tự ADN, như vị trí cắt của enzym giới hạn, mã bộ ba mở đầu, các mã bộ
ba kết thúc, khung đọc, phần giao nhau giữa exon - intron và các trình tự gen điều
hòa. Các gen này cũng cho phép so sánh các trình tự mới được phát hiện với các
trình tự đã có trong ngân hàng dữ liệu và qua đó cho biết mức độ giống nhau,
khác nhau và mối quan hệ của các gen này.
Việc phát triển các hệ thống giải mã trình tự ADN tự động đã giúp việc xác
định trình tự ADN của toàn bộ hệ gen một số loài sinh vật quan trọng trở nên dễ
dàng hơn. Cho đến nay toàn bộ hệ gen của E. coli (4,6 x 106 bp), nấm men S.
cereviseae (2,3 x 107 bp), người (6,4 x 109 bp) và một số loài sinh vật khác đã
được xác định. Ngoài ra, dự án giải mã trình tự hệ gen cơ bản của người đến nay
cũng đã hoàn thành.
V. Các bệnh di truyền
Các bệnh di truyền Có một nhóm đa dạng các bệnh lý và rối loạn gây
ra do các đột biến gen và sự thay đổi bất thường của
nhiễm sắc thể. Các rối loạn có bản chất di truyền và có thể chia làm 3 nhóm
chính:
Các sai hỏng đơn gen
Các sai hỏng đơn gen còn được gọi là các rối loạn di truyền Mendel
(Mendelian disorders), các rối loạn đơn gen (monogenic disorders), hay các
rối loạn đơn locut (single locus disorders). Đây là một nhóm các dạng bệnh
lý gây ra do sự có mặt của một gen đột biến trong cơ thể bị bệnh. Đột biến
gen làm thay đổi thông tin mã hóa của gen đó và, hoặc dẫn đến việc tạo ra
phân tử protein bị sai hỏng về chức năng, hoặc thậm trí ức chế hoàn toàn sự
tổng hợp protein mà gen đó mã hóa. Sự thiếu hụt protein do đột biến gen gây
70
nên sự biểu hiện của các trạng thái bệnh lý. Đột biến gen có thể được di
truyền giữa các thế hệ (từ bố, mẹ sang con, cháu) hoặc xuất hiện một cách tự
phát (de novo) trong tế bào sinh dục (tinh trùng hoặc trứng) trong cơ thể bố
hoặc mẹ, và sau thụ tinh, đứa trẻ hình thành mang đột biến trong mọi tế bào.
Các rối loạn nhiễm sắc thể
Có các dạng bệnh lý gây ra do sự mất đi hoặc thêm vào một hoặc một
số nhiễm sắc thể, hay do sự thay đổi cấu trúc của nhiễm sắc thể. Phần lớn các
rối loạn bất thường về nhiễm sắc thể xuất hiện ngay trong các tế bào sinh dục
của cơ thể bố hoặc mẹ, nhưng cũng có những trường hợp gây ra do di truyền
từ thế hệ trước. Các dạng bất thường về số lượng nhiễm sắc thể (biến dị số
lượng nhiễm sắc thể) có thể biểu hiện bằng sự tăng lên số lượng bộ nhiễm sắc
thể đơn bội (hiện tượng đa bội thể), hoặc do sự thêm và hoặc mất đi của từng
nhiễm sắc thể riêng lẻ (hiện tượng lệch bội). Các dạng bất thường về cấu trúc
nhiễm sắc thể có thể gây ra do sự đứt gẫy nhiễm sắc thể liên quan đến các
hiện tượng mất đoạn, lặp đoạn hoặc đảo đoạn nhiễm sắc thể.
Các rối loạn đa nhân tố
Đây là một nhóm gồm nhiều bệnh phổ biến, ví dụ như đái tháo đường,
các bệnh mạch vành và phần lớn các dị tất bẩm sinh. Các bệnh này gây ra do
ảnh hưởng của nhiều gen theo các cơ chế bệnh lý phức tạp cho đến nay chưa
được hiểu biết đầy đủ, nhưng được biết có liên quan đến sự tương tác của
nhiều gen với nhau, hoặc giữa các gen với các yếu tố môi trường.
Trong khoảng 20 năm qua, nhờ sự phát triển của công nghệ ADN tái
tổ hợp, đã có nhiều phát hiện mới mang tính bước ngoặt liên quan đến các
bệnh lý do rối loạn đơn gen gây ra. Thông tin được nêu trong phần dưới đây
liên quan đến một số rối loạn bệnh lý như vậy.
Hình thức di truyền Các rối loạn di truyền đơn gen được truyền từ thế
hệ bố, mẹ sang thế hệ con, cháu. Có ba hình thức
di truyền phổ biến: di truyền trội trên nhiễm sắc thể thường, di truyền lặn
trên nhiễm sắc thể thường và di truyền liên kết nhiễm sắc thể X (Bảng
6.1).
Trong trường hợp bệnh di truyền do alen trội nằm trên nhiễm sắc thể
thường quy định, việc truyền một alen gây bệnh từ bố hoặc mẹ sang con là đủ
để cá thể con biểu hiện bệnh. Các cá thể bị bệnh có một alen bình thường và
một alen đột biến gây bệnh được gọi là các thể dị hợp tử. Các cá thể này có
nguy cơ truyền cho 50 % số con alen đột biến và biểu hiện bệnh (Hình 6.1a).
Trong trường hợp bệnh di truyền do alen lặn nằm trên nhiễm sắc thể
thường quy định, cá thể biểu hiện bệnh phải mang đủ một cặp alen đột biến
71
gây bệnh, một bắt nguồn từ bố, một từ mẹ. Cá thể biểu hiện bệnh trong trường
hợp này gọi là cá thể đồng hợp từ về alen đột biến. Các cá thể dị hợp tử với
một alen gây bệnh không biểu hiện bệnh nhưng có khả năng truyền alen gây
bệnh sang 50% số cá thể con. Đối cả bố và mẹ là các cá thể dị hợp tử mang
alen lặn gây bệnh trên nhiễm sắc thể thường, một phần tư số con biểu hiện
bệnh, một phần tư bình thường và một nửa số cá thể con là thể mang alen gây
bệnh nhưng không biểu hiện bệnh (Hình 6.1b).
Trong trường hợp bệnh di truyền liên kết với nhiễm sắc thể X, gen đột
biến gây bệnh chỉ xuất hiện trên nhiễm sắc thể X. Do con đực chỉ có một
nhiễm sắc thể X duy nhất, việc truyền alen đột biến sang cá thể con giới đực
là đủ để cá thể này biểu hiện bệnh. Các cá thể đực biểu hiện bệnh gọi là các cá
thể dị giao tử. Các con cái có hai nhiễm sắc thể X vì vậy thường không biểu
hiện bệnh do phần lớn các gen đột biến gây bệnh nằm trên nhiễm sắc thể X là
các alen lặn. Đối với các con cái là cá thể mang gen gây bệnh nhưng không
biểu hiện bệnh, 50% con đực thế hệ con có nguy cơ bị bệnh và 50% con cái là
thể mang gen gây bệnh nhưng không biểu hiện bệnh (Hình 6.1c).
Để có sự cân bằng giữa con đực và con cái về lượng sản phẩm do gen
nằm trên nhiễm sắc thể X mã hóa, trong tự nhiên có hiện tượng một trong hai
nhiễm sắc thể X trong tế bào con cái bị bất hoạt. Quá trình này được gọi là
hiện tượng Lyon hóa (giả thiết Lyon) và thường diễn ra trong quá trình phát
triển của phôi. Trong mỗi tế bào, nhiễm sắc thể X bị bất hoạt được “chọn”
một cách ngẫu nhiên. Tuy vậy, một số con cái là thể mang gen gây bệnh nằm
trên nhiễm sắc thể X có thể biểu hiện bệnh ở mức độ nhẹ do sự bất hoạt của
nhiễm sắc thể X bình thường.
(a)
Alen bình
thường
Alen đột biến
Bị bệnh Bình thường
Cá thể đực
Cá thể cái
(b) Bị bệnh Bình thường Bị bệnh Bình thường
(c)
Thể mang Thể mang Bình thường Thể mang
Bị bệnh Thể Thể Bình thường Bị bệnh Bình thường Thể Bình thường
mang mang mang
Hình 6.1. (a) Alen trội trên NST thường. Sự di truyền của một alen đột biến duy nhất ( a) đều
dẫn đến sự biểu hiện của bệnh. (b) Alen lặn trên NST thường. Các cá thể bị bệnh phải mang
72
hai alen đột biến (aa). Các cá thể dị hợp tử (Aa) là các thể mang. (c) Alen liên kết NST X, đối
với các thể mang là cái, 50% số cá thể con giới đực bị bệnh, và 50% số cá thể con giới cái là
thể mang.
Sai hỏng đơn gen Có nhiều bệnh di truyền do gen đơn quy định xuất
hiện ở người (Bảng 6.1). Các bệnh này có các đặc
điểm biểu hiện đa dạng khác nhau và hậu quả đối với các cá thể bị bệnh cũng
khác nhau tùy thuộc vào mức độ quan trọng của gen bị đột biến và bản chất
của loại đột biến xuất hiện. Một số bệnh, như bệnh máu khó đông, gây nên
các triệu chứng bệnh có thể điều trị được, nhưng các bệnh khác chẳng hạn
như hội chứng múa giật Huntington, đến nay chưa có biện pháp điều trị triệt
để và người bệnh thường chết khi còn trẻ.
Các bệnh di truyền do đơn gen quy định thường xuất hiện với tần số
tương đối thấp nằm trong khoảng giữa 0,01 đến 5,0 trường hợp trong 1000 em
bé sơ sinh (xem Bảng 1). Tần số các rối loạn di truyền này thường khác nhau
trong các chủng tộc người khác nhau. Chẳng hạn, tần số bệnh nhân bị xơ nang
là cao nhất ở các nước Bắc Âu, bệnh thiếu máu hồng cầu hình liềm xảy ra với
tần số cao nhất ở Châu Phi và bệnh -thalassemia phổ biến hơn cả trong các
quần thể Châu á. Đối với các bệnh di truyền đơn gen phổ biến nhất ở người
đến nay đã xác định và tách dòng được gen gây bệnh đồng thời xác định được
các đột biến gây bệnh.
Bảng 6.1. Một số bệnh lý di truyền đơn gen

Bệnh lý Tần số trên 1000 trẻ sơ Hình thức Gen đột Đặc điểm
sinh di truyền biến
Máu khó 0,1 Liên kết Nhân tố VIII Chảy máu bất
đông dạng A NST X thường
Máu khó 0,03 Liên kết Nhân tố IX Chảy máu bất
đông dạng B NST X thường
Loạn dưỡng 0,3 Liên kết Dystrophin Hao mòn cơ
cơ Duchene NST X
Loạn dưỡng 0,05 Liên kết Dystrophin Hao mòn cơ
cơ Becker NST X
Hội chứng 0,5 Liên kết FMR1 Chậm phát
NST X yếu NST X triển trí tuệ
Bệnh múa 0,5 Trội, trên Hungtingtin Chứng tâm
giật NST thường thần phân liệt
Huntington
U sơ thần 0,4 Trội, trên NF-1,2 Ung thư
73
kinh NST thường
Hội chứng 0,05 Lặn, trên Các gen Thiếu máu
thalassemi NST thường globin
Thiếu máu 0,1 Lặn, trên  - globin Thiếu máu;
hồng cầu NST thường Thiếu máu cục
hình liềm bộ
Phenylketo 0,1 Lặn, trên Phenylalanin Không có khả
niệu NST thường e- năng chuyển
hydroxylase hóa
phenylalanin
Xơ nang 0,4 Lặn, trên CFTR Bệnh hỏng
NST thường phổi tích lũy và
các triệu chứng
khác
Các đột biến trong sai hỏng đơn gen Có thể chia các loại đột biến tạo
ra các alen gây bệnh thành hai
loại chính: các đột biến điểm liên
quan đến sự thay đổi của một bazơ nitơ duy nhất và các đột biến lớn liên
quan đến sự thay đổi trình tự ADN với kích thước lớn hơn. Đối với mỗi loại
bệnh, có thể có vài dạng đột biến khác nhau. Ngoài ra, các cá thể bị bệnh cũng
có thể cùng lúc mang các gen đột biến khác nhau. Ví dụ, có khoảng 20%
trường hợp bị bệnh máu khó động dạng A do kết quả của đột biến lớn gây ra.
Các trường hợp còn lại là do các dạng đột biến điểm mà đến nay các nhà
nghiên cứu đã tìm ra và mô tả 250 kiểu đột biến khác nhau.
Các đột biến điểm

Các đột biến điểm gây nên các bệnh di truyền có thể chia thành một số
kiểu sau:
(1) Các đột biến sai nghĩa (misense mutations). Đây là những thay đổi của
các nucleotit trên phân tử ADN gây nên sự thay đổi bộ ba mã hóa cho một
axit amin dẫn đến sự thay thế bởi một loại axit amin khác trên phân tử protein.
Các đột biến sai nghĩa gây nên những hậu quả khác nhau đối với phân tử
protein được mã hóa. Do hiện tượng thoái hóa của mã di truyền, những thay
đổi liên quan đến vị trí bazơ thứ ba trong bộ ba mã hóa thường không có ảnh
hưởng đến phân tử protein. Ngoài ra, nhiều sự thay đổi thành phần bazơ nitơ
dẫn đến sự thay thế của axit amin có đặc tính tương tự có thể không làm thay
đổi chức năng và hoạt tính của phân tử protein. Chẳng hạn như đột biến ở bộ
ba mã hóa CTT thành ATT làm thay thế axit amin kị nước là leucin bằng
74
isoleucin cũng là một axit amin kị nước khác. Tuy vậy, có nhiều ví dụ cho
thấy các đột biến sai nghĩa làm thay đổi rõ rệt chức năng của phân tử protein
được mã hóa và vì vậy gây nên các bệnh di truyền. Trong số này có thể kể đến
đột biến thay thế A bằng T trong gen mã hóa -globin, một trong các chuỗi
polypeptit hình thành nên phân tử hemoglobin. Đột biến này làm thay đổi bộ
ba số sáu của gen thay đổi từ GAG mã hóa cho axit glutamic thành GTG mã
hóa cho valin. Đột biến này gây nên bệnh thiếu máu hồng cầu hình liềm do
các tế bào hồng cầu bị biến dạng thành hình liềm do thay đổi sự kết dính của
các phân tử hemoglobin. Các tế bào hồng cầu hình liềm có tuổi thọ ngắn gây
nên hiện tượng thiếu máu và nằm trong các mao mạch làm giảm khả năng
cung cấp máu tới các cơ quan (chứng thiếu máu cục bộ).
(2) Các đột biến vô nghĩa. Đây là những thay đổi của các nucleotit trên phân
tử ADN làm chuyển một mã bộ ba mã hóa axit amin thành một mã bộ ba kết
thúc vì vậy quá trình phiên mã sẽ kết thúc sớm hơn bình thường và dẫn đến sự
hình thành phân tử protein có kích thước ngắn hơn. Các đột biến vô nghĩa
thường gây hậu quả nghiêm trọng đối với phân tử protein được mã hóa, đặc
biệt khi nó xuất hiện gần đầu 5’ của gen. Nhiều bệnh di truyền khác nhau đã
được xác định có liên quan đến các đột biến vô nghĩa. Ví dụ như đột biến C
thành T ở bộ ba số 39 trong gen mã hóa -globin làm thay đổi mã bộ ba bình
thường CAG quy định glutamin thành TAG là một bộ ba mã kết thúc. Đột
biến này gây nên sự kết thúc phiên mã sớm của phân tử mARN mã hóa cho
-globin dẫn đến sự thiếu hụt một chuỗi polypeptit  và gây nên dạng bệnh lý
gọi là -thalassemia với triệu chứng bệnh thiếu máu do phân tử hemoglobin
bình thường không được tạo thành.
(3) Các đột biến dịch khung. Những đột biến này xảy ra do sự thêm vào hay
mất đi của một hay một số bazơ nitơ làm thay đổi khung đọc và một tập hợp
các bộ ba mã hóa mới được hình thành kể từ điểm đột biến xảy ra. Đột biến
dịch khung cũng thường gây nên hậu quả nghiêm trọng đối với phân tử
protein được mã hóa, đặc biệt khi đột biến xuất hiện gần đầu 5’ của gen.
Nhiều bệnh lý được mô tả liên quan đến đột biến dịch khung. Chẳng hạn đột
biến dịch khung đã được tìm thấy là nguyên nhân gây nên bệnh máu khó đông
ở nhiều bệnh nhân mắc căn bệnh này. Trong đó bao gồm các trường hợp do
mất đi 4 bazơ nitơ gây nên sự thay đổi khung đọc từ bộ ba mã hóa thứ 50 và
một đột biến thêm 10 bazơ làm thay đổi khung đọc từ bộ ba mã hóa thứ 38.
Cả hai kiểu đột biến này đều gây triệu chứng bệnh nghiêm trọng.
(4) Đột biến vị trí cắt intron. Đây là những đột biến làm thay đổi trình tự tín
hiệu ở gần đầu 3’ hoặc 5’ của các đoạn intron dẫn đến việc cắt intron sai trong
quá trình hoàn thiện phân tử mARN ở sinh vật nhân chuẩn. Các đột biến kiểu
này cũng có thể xảy ra bên trong intron tạo nên điểm cắt intron mới và vì vậy
cũng dẫn đến sự cắt sai trình tự intron. Một loạt các đột biến vị trí cắt intron
75
được tìm thấy liên quan đến đột biến gen -globin làm thiếu hoàn toàn các
chuỗi -globin trong các cơ thể đồng hợp tử và gây bệnh -thalassemia.
(5) Đột biến trình tự gen điều hòa. Các đột biến này xảy ra tương đối hiếm
và ảnh hưởng đến việc điều hòa hoạt động của gen, thường hoặc làm giảm
hoặc làm tăng mức độ biểu hiện của gen. Một đột biến như vậy đã được xác
định trong trình tự chỉ huy của gen mã hóa protein đông máu (là protein yếu
tố IX) cũng là một nguyên nhân gây nên bệnh máu khó đông. Các cá thể
mang đột biến này không tạo được protein yếu tố IX và bị chảy máu một cách
bất thường. Thông thường, triệu chứng bệnh thường mất đi sau tuổi dậy thì
nhờ hócmôn steroid kích thích sự biểu hiện của gen này.
Các đột biến lớn
Có nhiều bệnh lý gây ra do các đột biến liên quan đến một trình tự dài
các nucleotit trên phân tử ADN. Phần lớn các đột biến này có ảnh hưởng
nghiêm trọng đến chức năng của gen và gây bệnh nặng.
(1) Các đột biến mất đoạn. Sự mất đi của gen có thể biểu hiển với mức độ
kích thước khác nhau, từ một vài bazơ nitơ đến toàn bộ gen, thậm trí nhiều
gen cùng lúc. Sự mất đi hoàn toàn của các gen mã hóa -globin gây nên bệnh
-thalassemia (bệnh mất khả năng sản xuất hemoglobin bình thường). Ví dụ
như, sự mất một phần gen mã hóa dystrophin gây nên bệnh mòn cơ, bệnh loạn
dưỡng cơ; hay sự mất đi một bộ ba mã hóa duy nhất trong gen tổng hợp
protein điều hòa độ dẫn xuyên màng trong bệnh xơ nang CFTR (cystic
fibrosis transmembrane conductance regulator) là nguyên nhân gây bệnh gặp
phải ở 70% số bệnh nhân bị bệnh xơ nang.
(2) Các đột biến thêm đoạn. Nhiều đột biến thêm đoạn đã được ghi nhận. Ví
dụ như một trường hợp một bệnh nhân bị máu khó đông dạng A hiếm gặp có
nguyên nhân gây bệnh là do sự thêm vào gen mã hóa yếu tố VIII một trình tự
lặp lại gọi là yếu tố LINE.
(3) Các đột biến thay thế đoạn gen. Cũng có nhiều đột biến thay thế đoạn
gen gây nên bệnh di truyền đã được ghi nhận. Ví dụ như một đột biến gây
bệnh máu khó đông dạng A xảy ra do sự tái tổ hợp giữa các trình tự nằm trong
vùng intron thứ 22 của gen mã hóa yếu tố VIII và các trình tự lặp lại kép dọc
theo nhiễm sắc thể X. Do một lỗi xảy ra trong quá trình tái tổ hợp, gen mã hóa
yếu tố VIII bị cắt thành 2 mảnh tách biệt nhau bởi hàng triệu cặp bazơ nitơ,
làm mất hoàn toàn chức năng của gen này.
(4) Các đột biến lặp lại bộ ba nucleotit. Một dạng đột biến gen hiếm gặp
liên quan đến các trình tự lặp lại từng bộ ba nucleotit kém bền vững. Trong
quá trình giảm phân xảy ra hiện tượng số lượng bản sao các trình tự lặp lại
từng bộ ba nucleotit tăng lên trong các tế bào sinh dục dẫn đến sự biểu hiện
của bệnh trong các thế hệ sau. Cơ chế dẫn đến hiện tượng lặp lại nhiều lần của
các trình tự nucleotit và nguyên lý gây bệnh cho đến nay chưa được biệt rõ.
76
Sự tăng lên số lượng các trình tự lặp lại tìm thấy liên quan đến một số bệnh di
truyền bao gồm bệnh múa giật Hungtington.
Trong các dạng bệnh lý di truyền do gen

Phát hiện cá thể mang bệnh
lặn quy định, các cá thể dị hợp tử mang
alen đột biến gây bệnh nhưng không
biểu hiện triệu chứng bệnh lý và có thể truyền alen gây bệnh đó sang thế hệ
con. Nếu cả hai bố, mẹ đều là những cá thể mang dị hợp tử mang alen lặn gây
bệnh thì 1/4 số con sinh ra có khả năng mang cả hai alen gây bệnh và biểu
hiện bệnh. Vì vậy, việc xác định được các cá thể mang alen gây bệnh sẽ là cơ
sở cho việc tư vấn di truyền trong hôn nhân.
Các cá thể mang alen gây bệnh có thể xác định được bằng phương
pháp dò gen, theo đó các alen đột biến được xác định và hình thức di truyền
của chúng giữa các thế hệ trong một dòng họ được theo dõi. Phương pháp dò
gen sử dụng những biến dị tự nhiên trong các trình tự ADN của hệ gen người.
Việc so sánh một trình tự gen giữa một nhóm cá thể thường biểu hiện sự biến
đổi trong trình tự ADN theo kiểu thay thế của các bazơ nitơ. Chẳng hạn trong
một trình tự ADN nhất định, ở một số cá thể là nucleotit C, trong khi ở một số
cá thể khác là T. Những biến đổi như vậy gọi là tính đa hình và là kết quả
của những đột biến xảy ra trong phân tử ADN. Tính đa hình xảy ra rất phổ
biến và xuất hiện với tần số khoảng 1/100-150 bazơ nitơ dọc suốt hệ gen. Khi
chúng xảy ra trong các trình tự mã hóa của gen, chúng sẽ gây nên các bệnh di
truyền và trở thành đối tượng của quá trình chọn lọc. Khi chúng xuất hiện
trong các trình tự không mã hóa, chúng thường không gây nên những hậu quả
nghiêm trọng cho cơ thể sinh vật nhưng có xu hướng tích lũy theo thời gian.
Một số dạng đa hình biểu hiện trong các trình tự đích của enzym giới hạn. Phụ
thuộc vào các nucleotit được thay thế, một trình tự cắt của một enzym giới
hạn nào đó có thể xuất hiện hoặc mất đi. Tính đa hình xuất hiện ở vị trí cắt
của enzym giới hạn gọi là tính đa hình độ dài đoạn phân cắt giới hạn
RFLP (restriction fragment length polymorphism). RFLP là một công cụ hiệu
quả khi được sử dụng làm dấu chuẩn của các gen và có thể xác định được nhờ
phương pháp thẩm tách Southern. Nếu một phân tử ADN hệ gen được cắt bởi
một enzym giới hạn, kích thước của các đoạn ADN được tạo ra sẽ biến đổi
tùy thuộc vào việc xuất hiện hay vắng mặt của vị trí cắt giới hạn. Kiểu hình
các đoạn cắt được xác định bởi phương pháp thẩm tách Southern đối với
ADN của các cá thể khác nhau là khác nhau phụ thuộc vào sự có mặt hay
vắng mặt của các trình tự giới hạn (Hình 6.2). Kiểu hình các đoạn cắt giới hạn
cũng cho phép phân biệt hai alen khác nhau cùng có mặt trong một cơ thể.
Thông qua việc phân tích ADN của một cá thể bị bệnh, người ta có thể xác
định được tính đa hình có liên quan đến một alen đột biến hay không, cũng
như có thể xác đinh được hình thức di truyền của alen gây bệnh. Bằng việc
77
phân tích kiểu hình đoạn phân cắt giới hạn của các thành viên trong một gia
đình, có thể xác định được các cá thể con không biểu hiện bệnh mang alen
bình thường hoặc có mang alen gây bệnh, qua đó phân biệt được các các thể
mang alen gây bệnh.
Kỹ thuật dò gen cũng được sử dụng để thực hiện phép chẩn đoán tiền
sản để xác định trạng thái của bào thai trước khi sinh. Một mẫu ADN của bào
thai có thể được phân tích theo dấu chuẩn RFLP sử dụng kỹ thuật thẩm tách
Southern để xác định xem bào thai đó là bình thường, hay là thể dị hợp tử
hoặc đồng hợp tử về alen gây bệnh.
Việc sử dụng kỹ thuật RFLP nhằm xác định các cá thể mang các bệnh
di truyền dù sao cũng bị hạn chế do tính biến dị ADN tại các điểm phân cắt giới
hạn thường là thấp. Chỉ có hai trình tự có thể xuất hiện ở một vị trí RFLP vì vậy
trong nhiều trường hợp các alen đột biến và alen bình thường có cùng trình tự ở
vị trí đó nên không phân biệt được. Trong những trường hợp này, việc xác định
cá thể mang alen gây bệnh không thực hiện được. Hạn chế này của kỹ thuật
RFLP có thể được khắc phục nhờ việc sử dụng các trình tự lặp lại liên tục vì
những trình tự này có mức độ biến dị cao hơn.
TGATCA – bị cắt bởi Bcl I

(a) hoặc TCATCA – không bị cắt bởi
B B BcI I B
0,5 kbp 2 kbp 1 kbp
B = vị trí cắt của enzym giới Gen X RFLP

hạn Bcl I nhận biết bởi
Bcl I
ADN sau khi được cắt bởi Bcl
I, được lai với mẫu dò gen X
(b) và phân tích đa hình bằng
thẩm tách Southern
3 kbp
2 kbp
1 kbp
ảnh phõng
0,5 kbp xạ tự chụp
1 2
78
Hình 6.2. (a) Gen X có một dấu chuẩn RFLP được nhận biết bởi enzym giới hạn BcII. (b)
Trong cá thể đồng hợp tử, kỹ thuật thẩm tách Southern tạo 3 phân đoạn (đường chạy điện di 1:
có kích thước tương ứng là 2, 1, và 0,5 kbp) khi có mặt vị trí cắt của BclI và 2 phân đoạn
(đường chạy điện di 2, có kích thước tương ứng là 3 và 0,5 kbp) khi vắng mặt vị trí cắt của
enzym giới hạn BclI.
Các trình tự lặp lại (9 –

R 70 bp) R Cá thế thứ
nhất:
Trình tự duy VNTR Trình tự duy 5 lần lặp lại
nhất nhất
R = vị trí cắt của enzym giới
hạn
R R Cá thế thứ hai:
7 lần lặp lại
R Cắt ADN bằng enzym R Cá thế thứ hai:

giới hạn 11 lần lặp lại
Thẩm tách Southern
ảnh phõng
xạ tự chụp
1 2 3
Hình 6.3. Chỉ thị đa hình VNTR có thể phát hiện được bằng kỹ thuật thẩm tách Southern
và sử dụng để phân biệt các cá thể (sơ đồ trên đây minh họa ở cá thể đồng hợp tử).
Trình tự duy Trình tự duy

nhất nhất Cá thế thứ nhất: 5 lần
CACACACA
lặp lại
CA
Cá thế thứ hai: 9 lần
CACACACACACACAC
lặp lại
ACA
CACACACACACACACACACAC Cá thế thứ ba: 13 lần

ACACA lặp lại
Sử dụng kỹ thuật PCR với cặp mồi đặc

hiệu ở trình tự vùng biên của đoạn trình
tự lặp lại VNTR
79
1 2 3
Gel
polyacrylamid
Hình 6.4. Đoạn trình tự lặp lại CA với số lượng biến động có thể được khuếch đại nhờ
phản ứng PCR và phân tích trên gel polyacrylamid. Các cá thể khác nhau có thể phân biệt
được nhờ độ dài đoạn ADN được khuếch đại (sơ đồ này minh họa cá thể đồng hợp tử).
Bên cạnh các trình tự xuất hiện một bản sao duy nhất, hệ gen người
còn chứa một tỷ lệ lớn các trình tự lặp lại và xuất hiện thành từng cụm trong
đó phổ biến là các trình tự ngắn lặp đi lặp lại nhiều lần (xem mục II.D). Số lần
lặp lại của các trình tự này có mức độ biến động lớn giữa các cá thể. Các trình
tự lặp lại đầu tiên được xác định là các trình tự ngắn có chiều dài biến động
giữa 9 và 70 bp và xếp thành một chuỗi liên tục từ đầu đến cuối cụm trình tự
lặp lại. Các cụm trình tự ADN gồm các trình tự ngắn lặp lại như vậy gọi là
cụm trình tự lặp lại liên tiếp với số lượng biến đổi VNTR (variable number
tandem repeats) hay còn gọi là trình tự ADN tiểu vệ tinh (minisatelite
DNA). Số lần lập lại trọng mỗi khối VNTR khác nhau giữa các cá thể giao
động từ một vài bản sao đến hàng trăm bản sao khác nhau. Bằng việc cắt phân
tử ADN nhờ enzym giới hạn ở hai đầu (vùng biên) của cụm VNTR, các đoạn
ADN có chiều dài khác nhau được phát hiện nhờ kỹ thuật thẩm tách Southern
(Hình 6.3). Một loại trình tự lặp lại phổ biến khác được gọi là các trình tự lặp
lại CA, hay còn gọi là các trình tự ADN lặp lại vi vệ tinh (microsatellite
DNA). Trong trường hợp này, trình tự lặp lại là cặp nucleotit CA thường xuất
hiện thành cụm có số lần lập lại giao động trong khoảng 10 - 60 lần dọc suốt
hệ gen. Người ta sử dụng kỹ thuật PCR để khuếch đại đoạn trình tự lặp lại CA
để thu các phân tử ADN có chiều dài khác nhau rồi phân tách chúng trên gel
điện di (Hình 6.4). Các hai loại trình tự lặp là CA và VNTR có thể sử dụng
như những gen đánh dấu và dùng để xác định các cá thể mang alen gây bệnh
di truyền giống như cách người ta sử dụng kỹ thuật RFLP.
Một nhược điểm của kỹ thuật dò gen là cần phải phân tích cả các
thành viên khác trong gia đình của người mang alen. Điều này là một khó
khăn vì có thể không có đầy đủ các thành viên trong gia đình có mặt hoặc sẵn
sàng tham gia vào nghiên cứu. Một phương pháp khác nhằm có thể dò gen
gây bệnh là xác định các cá thể mang alen gây bệnh bằng việc xác định các
đột biến gây bệnh. Phương pháp này không đòi hỏi việc phân tích các thành
80
viên khác nhau trong một gia đình, và nhờ vậy quá trình phân tích đơn giản
hơn. Tuy vậy, trong phương pháp này trước tiên cần phải xác định đột biến có
liên quan, và đôi khi việc này gặp khó khăn nếu gen có liên quan gây bệnh có
kích thước lớn.
VI. Kỹ thuật di truyền và Công nghệ sinh học
Hai thuật ngữ này được

Kỹ thuật di truyền và công nghệ sinh học dùng để chỉ lĩnh vực nghiên
cứu sử dụng các kỹ thuật
ADN tái tổ hợp để chuyển gen (biến nạp gen) từ cơ thể (hoặc loài) này sang
cơ thể (hoặc loài) khác. Kỹ thuật biến nạp gen có hai ứng dụng quan trọng:
thứ nhất, nó có thể cho phép tạo ra một số lượng lớn protein mang hoạt tính
sinh học. Trong số này bao gồm các protein được sử dụng làm thuốc chữa
bệnh (Bảng 6.2) và các protein hoặc enzym được sử dụng trong công nghiệp
(Bảng 6.3). Thứ hai, quá trình chuyển gen được sử dụng để tạo ra các cơ thể
mới (thực vật, động vật và vi sinh vật) mang các đặc tính mong muốn, chẳng
hạn như cây trồng có khả năng kháng sâu hoặc thuốc trừ cỏ. Các ứng dụng
này của kỹ thuật di truyền và công nghệ sinh học có tiềm năng thương mại lớn
và đã góp phần hình thành và phát triển của ngành công nghiệp sinh học
Bảng 6.2. Các protein tái tổ hợp có nguồn gốc người được dùng làm dược phẩm
Tên protein ứng dụng điều trị bệnh

1-antitrypsin Phù thũng
Calcitonin Còi xương
Chorionic gonadotropin Vô sinh
Erythropoietin Thiếu máu
Protein yếu tố VIII Máu loãng (khó đông máu)
Insulin Tiểu đường
Interferon (, , ) Bệnh do viêm nhiễm virut, ung thư
Interleukin Ung thư
Protein hoạt hóa plasminogen mô Huyết khối
Hócmôn sinh trưởng Chậm lớn
Bảng 6.3. Các enzym tái tổ hợp được sử dụng trong công nghiệp
Tên protein Lĩnh vực ứng dụng

Rennin Sản xuất phomát
-amylase Sản xuất bia
Bromelain Làm mềm thịt, làm trong nước giải
khát
Catalase Chất chống oxy hóa thực phẩm
Cellulase Sản xuất glucoza và cồn
81
Lipase Sản xuất phomát
Protease Làm thuốc tẩy
Một trong những mục đích cơ

Sự biểu hiện của các protein tái tổ hợp bản của kỹ thuật di truyền và
công nghệ sinh học là sản xuất
ra các loại protein sinh học hữu ích. Quá trình này là kết quả biểu hiện các gen
được tách dòng trong các tế bào chủ khác nhau. Các tế bào chủ này có thể là
các tế bào vi khuẩn, nấm men, đông vật hay thực vật. Sự biểu hiện của các
protein tái tổ hợp thường đòi hỏi một véctơ đặc biệt được gọi là véctơ biểu
hiện chứa trình tự ADN điều khiển quá trình phiên mã và dịch mã của gen
trong tế bào chủ. Trong véctơ biểu hiện có thể còn bao gồm một số trình tự
đặc biệt khác, như trình tự đảm bảo tính ổn định của protein biểu hiện hoặc
điều khiển tế bào tiết protein ra môi trường để dễ dàng thu nhận. Nhằm đạt
hiệu suất thu protein cao, người ta thường dùng véctơ plasmid do véctơ này
có thể đồng thời xuất hiện nhiều bản sao trong tế bào chủ. Các điều kiện môi
trường cần thiết để thu được hiệu suất biểu hiện của từng loại protein là khác
nhau, vì vậy đối với từng loại protein thường phải nghiên cứu xác định các
điều kiện tối ưu cho quá trình phiên mã và dịch mã. Cũng chính vì vậy, đến
nay nhiều hệ thống biểu hiện protein khác nhau đã được tìm ra và phát triển.
Việc sử dụng công nghệ ADN tái tổ hợp để sản xuất protein đã tạo
điều kiện cho sự hình thành các dạng cải biến của các phân tử protein tự
nhiên. Quá trình này được gọi là kỹ thuật cải biến protein. Các trình tự gen
được làm biến đổi nhờ phương pháp gọi là gây đột biến in-vitro để sau đó
tạo ra các trình tự polypeptit với thành phần và vị trí các axit amin thay đổi so
với dạng nguyên thủy, dẫn đến sự thay đổi các đặc tính và thuộc tính của
protein. Kỹ thuật cải biến protein cũng được dùng để tạo ra các dạng biến đổi
của protein thông thường, chẳng hạn nhằm làm tăng tính bền nhiệt của
protein, hoặc đối với enzym làm thay đổi tính đặc hiệu cơ chất của chúng.
Những hệ thống biểu hiện

Hệ thống biểu hiện protein ở vi khuẩn protein tái tổ hợp đầu tiên đều
sử dụng tế bào vi khuẩn là tế
bào chủ. Trong đó, vi khuẩn E. Coli có khả năng sản xuất nhiều loại protein
với tốc độ nhanh và chi phí thấp được sử dụng rộng rãi hơn cả. Cho đến nay,
các hệ thống biểu hiện nhờ tế bào vi khuẩn vẫn có vai trò quan trọng và được
sử dụng rộng rãi để sản xuất phần lớn các loại protein quan trọng ở quy mô
công nghiệp (Bảng 6.2 và 6.32).
82
Các véctơ biểu hiện protein ở vi khuẩn có một số đặc điểm cơ bản như
sau (Hình 6.15):
Điểm khởi đầu sao

chép
Dấu chuẩn chọn
lọc (kháng kháng
sinh) Trình tự kết thúc phiên
mã
Tín hiệu
gắn đuôi
poly(A)
Véctơ biểu hiện
plasmid
Trình tự khởi đầu
A
sao chép Điểm kết
TG
(promoter) thúc dịch
mã
Trình tự khởi đầu phiên mã
Vị trí ribosom bắt đầu liên ATG

Khung đọc mở ORF
kết (mang gen cần biểu
Điểm khởi đầu dịch hiện)
mã
Hình 6.15. Đặc điểm của các véctơ biểu hiện plasmid.
 Một trình tự khởi đầu phiên mã (promotor) nằm ở phía trước trình tự gen
tách dòng có chức năng khởi đầu phiên mã. Việc chọn lọc trình tự khởi
đầu phiêna mã có ái lực cao với ARN polymerase sẽ đảm bảo cho hiệu
suất phiên mã cao.
 Một trình tự là tín hiệu kết thúc phiên mã nằm phía sau trình tự gen tách
dòng.
 Một trình tự gắn ribosom (còn gọi là trình tự Shine-Dalgarno) nằm phía
sau vị trí bắt đầu phiên mã. Mức độ tổng hợp protein phụ thuộc vào ái lực
của ribôxôm đối với trình tự này.
 Trình tự gen được tách dòng thường có bộ ba khởi đầu phiên mã AUG ở
đầu 3’ và bộ ba kết thúc phiên mã ở đầu 5’. Nằm ở giữa là một khung đọc
mở. Một điểm quan trọng là khung đọc mở đó phải đảm bảo để sản phẩm
biểu hiện của gen là trình tự mong đợi của các axit amin. Các véctơ
thường được sử dụng đồng thời để biểu hiện các trình tự gen tách dòng
83
theo một số cách khác nhau, nhờ vậy một trong ba khung đọc có thể được
biểu hiện tùy theo yêu cầu.
 Các véctơ cho phép sự kích hoạt phiên mã của gen tái tổ hợp. Trong khi
đó, việc biểu hiện liên tục một protein nào đó có thể sẽ tiêu tốn một phần
lớn năng lượng của tế bào và có thể gây ảnh hưởng đến các hoạt động sống
khác của tế bào. Do đó, quá trình biểu hiện protein tái tổ hợp là hiệu quả
hơn nếu quá trình đó có thể “bật” hoặc “tắt” theo yêu cầu. Vì lý do này,
phần lớn các hệ thống biểu hiện được thiết kế theo kiểu được kích hoạt bởi
việc bổ sung một phân tử nhỏ nào đó vào môi trường nuôi cấy vi khuẩn,
thông thường là một cơ chất nào đó. Một số hệ thống biểu hiện khác được
kích hoạt bởi nhiệt độ môi trường nuôi cấy.
Các protein được biểu hiện trong tế bào vi khuẩn thường kém bền do
sự biến tính gây ra bởi protease của tế bào chủ. Nhờ sự thay đổi trình tự của
véctơ, ví dụ như việc bổ sung một hoặc một số axit amin vào đầu tần cùng N
của phân tử protein, mà các protein tái tổ hợp có thể được bảo vệ tránh khỏi
quá trình biến tính này. Các axit amin đó lại có thể được sử dụng như dấu
hiệu để dễ dàng tinh sạch protein tái tổ hợp thông qua việc sử dụng các kháng
thể tương ứng kết hợp với protein biểu hiện trên gel điện di. Các véctơ được
thiết kế sao cho phần axit amin gắn thêm này có thể được loại bỏ nhờ phản
ứng enzym hoặc phản ứng hóa học khởi phân tử protein tái tổ hợp sau khi quá
trình tinh sạch kết thúc.
Hiệu suất tổng hợp protein thường được tăng cao nhờ việc sử dụng các
véctơ plasmid, bởi chúng có thể đồng thời tồn tại nhiều bản sao trong tế bào
chủ. Tuy vậy, nếu số bản sao quá lớn thì có thể gây hiện tượng mất ổn định và
plasmid có thể bị loại thải khỏi tế bào chủ: các tế bào này có xu hướng phát
triển nhanh hơn các tế bào còn chứa plasmid và tỏ ra có ưu thế trong môi
trường dẫn đến hiệu suất biểu hiện protein tổng cộng giảm đi. Để khắc phục
tính mất ổn định của plasmid, người ta thiết kế một số véctơ có khả năng liên
kết với nhiễm sắc thể của tế bào chủ, lúc đó chúng trở nên ổn định hơn, mặc
dù hiệu suất biểu hiện của protein có thể bị giảm đi do số bản sao của gen tái
tổ hợp ít hơn.
Mặc dù các hệ thống tế bào

Hệ thống biểu hiện ở sinh vật nhân chuẩn vi khuẩn có thể biểu hiện
thành công nhiều loại
protein có nguồn gốc sinh vật nhân chuẩn, nhưng có những loại protein thuộc
kiểu này tỏ ra kèm bền hoặc mất hoạt tính sinh học do hệ thống tế bào vi
khuẩn thiếu ổn định hơn hoặc thiếu quá trình hoàn thiện protein sau phiên mã,
chẳng hạn như quá trình glycosyl hóa, giống như ở tế bào sinh vật nhân
84
chuẩn. Hơn nữa, các loại protein được biểu hiện trong tế bào vi khuẩn đôi khi
bị nhiễm với các hợp chất độc làm chúng trở nên không còn phù hợp để sử
dụng làm thuốc cho người và động vật. Vì vậy, người ta đã xây dựng các hệ
thống biểu hiện dựa trên các tế bào chủ có nguồn gốc từ sinh vật nhân chuẩn
để có thể sản sinh ra các phân tử protein mang các đặc tính giống với dạng
nguyên thủy của nó trong tự nhiên.
Các véctơ biểu hiện của sinh vật nhân chuẩn về cơ bản có nhiều đặc
tính tương đồng với các véctơ có nguồn gốc vi khuẩn (Hình 6.15). Chúng
cũng bao gồm một trình tự promotor, các trình tự tín hiệu điều khiển quá trình
phiên mã và dịch mã. Một số thuộc tính bổ sung đặc trưng của véctơ sinh vật
nhân chuẩn bao gồm các trình tự tín hiệu điều khiển quá trình hoàn thiện
ARN và protein, chẳng hạn như quá bổ sung đuôi poly(A) sau phiên mã.
Các véctơ có thể tồn tại một cách độc lập với hệ gen tế bào chủ như
trường hợp plasmid, hoặc liên kết vào nhiễm sắc thể của tế bào chủ. Một số
véctơ được gọi là các véctơ con thoi có các trình tự của vi khuẩn cho phép
việc thao tác và nhân véctơ diễn ra dễ dàng trong tế bào vi khuẩn, sau đó
chúng được chuyển vào các tế bào sinh vật nhân chuẩn để biểu hiện protein.
Có ba loại tế bào chủ sinh vật nhân chuẩn được sử dụng: các tế bào
nấm men, các tế bào côn trùng và tế bào động vật có vú.
Nấm men
Nấm men Saccharomyces cerevisiae được sử dụng rộng rãi để biểu
hiện các protein có nguồn gốc sinh vật nhân chuẩn. Một số đặc tính của nấm
men này đặc biệt phù hợp với vai trò là tế bào chủ. Điều kiện nuôi cấy tế bào
nấm men tương đối đơn giản và nhiều đặc điểm sinh lý và di truyền của chúng
đã được nghiên cứu kỹ. Chúng có khả năng tiến hành quá trình hoàn thiện
protein sau phiên mã và giải phóng protein ra môi trường giúp quá trình tinh
sạch dễ dàng hơn. Hơn nữa, bản thân nấm men có cấu trúc plasmid gọi là 2
plasmid có thể sử dụng làm véctơ tách dòng. ADN ngoại lai có thể biến nạp
vào nấm men theo các phương pháp khác nhau, chẳng hạn thông qua quá trình
dung hợp tế bào trần, hoặc nhờ kỹ thuật xung điện xử lý các tế bào dưới dòng
điện ngắn có hiệu điện thế cao. Các véctơ biểu hiện của nấm men có thể tồn
tại trong các tế bào như các plasmid (các véctơ episom) hoặc kết hợp vào hệ
gen của tế bào chủ. Các véctơ episom có hiệu suất biểu hiện protein cao
nhưng có xu hướng kém ổn định khi nuôi cấy ở quy mô lớn. Ví dụ về các
protein tái tổ hợp được sản xuất bởi hệ thống tế bào nấm men là insulin của
người được sử dụng trong điều trị bệnh nhân tiểu đường, và kháng nguyên bề
mặt virut viêm gan B được dùng làm vắcxin.
Các tế bào côn trùng
Baculovirut là nhóm virut lây nhiễm ở động vật không xương sống,
trong đó có các loài côn trùng. Các virut này thích nghi với tập tính sống sử
dụng các véctơ biểu hiện của sinh vật nhân chuẩn. Các tế bào côn trùng được
85
sử dụng làm tế bào chủ và đặc biệt thích hợp nhờ các protein do chúng tạo ra
được glycosyl hóa giống với dạng tự nhiên của các protein động vật có vú.
Baculovirut chứa một gen mã hóa cho một loại protein gọi là polyhedrin vốn
được phiên mã dưới sự điều khiển của một promotor hoạt động cực mạnh. Do
gen này không bắt buộc cần có cho sự sao chép hệ gen virut nên nó có thể
được cắt bỏ và thay thế vào đó là gen tái tổ hợp được quan tâm. Véctơ của
baculovirut chứa gen tái tổ hợp được chuyển vào tế bào chủ để biểu hiện
thành sản phẩm protein thông qua việc lây nhiễm. Các protein tái tổ hợp đã
được sản xuất nhờ việc sử dụng hệ thống baculovirut có thể kể đến bao gồm
hócmôn erythropoietin được sử dụng trong điều trị bệnh thiếu máu, hay hợp
chất kháng virut -interferon.
Các tế bào động vật có vú
Các protein được sử dụng làm thuốc để điều trị bệnh ở người phải
giống với dạng tự nhiên của nó. Trong nhiều trường hợp, protein tái tổ hợp
chỉ được tổng hợp và hoàn thiện sau phiên mã một chính xác như dạng tự
nhiên khi được biểu hiện trong tế bào chủ là tế bào động vật có vú. Vì lý do
đó, người ta đã phát triển các hệ thống biểu hiện ở tế bào động vật có vú khác
nhau. Các véctơ động vật có vú thường là các véctơ con thoi và có thể nhân
lên dễ dàng trong tế bào vi khuẩn. Việc chuyển véctơ vào tế bào chủ thu được
bằng kỹ thuật kết tủa Ca2+ hoặc bằng phương pháp xung điện. Nhiều loại
protein tái tổ hợp khác nhau của người được sử dụng làm thuốc đã được sản
xuất nhờ hệ thống biểu hiện của tế bào động vật có vú. Trong số các sản phẩm
đó, có các hócmôn sinh trưởng, protein gây đông máu, yếu tố VIII, -
interferon và erythropoietin.
Các phương pháp chọn, tạo giống

Kỹ thuật di truyền thực vật truyền thống ở thực vật đã đóng góp
nhiều thành công trong việc tạo ra
nhiều giống cây trồng có năng suất cao, phẩm chất tốt. Tuy vậy, kỹ thuật di
truyền hứa hẹn là phương pháp có thể trực tiếp cải biến các đặc tính sinh
học. Các loài thực vật đặc biệt thích hợp cho việc tiến hành thao tác di truyền
do các tế bào thực vật có tính toàn năng. Điều này có nghĩa là một cá thể
thực vật hoàn chỉnh có thể được tái sinh từ một tế bào được cải biến di truyền
duy nhất. Nếu cây tái sinh hữu thụ, thì gen mang đặc tính được cải tiến đó sẽ
có trong hạt và vì vậy các cây mang đặc tính di truyền được cải tiến sẽ tiếp tục
được sản sinh qua các thế hệ thông qua quá trình lai tạo.
Người ta đã phát triển các phương pháp khác nhau để tiến hành biến
nạp gen ở thực vật. Trong đó, phương pháp điển hình được xây dựng dựa trên
Ti plasmid vốn có sẵn trong vi khuẩn đất Agrobacterium tumefaciens. Trong
86
tự nhiên, vi khuẩn này có khả năng gây nhiễm các loài cây hai lá mầm (nghĩa
là tất cả các loài cây trồng trừ ngũ cốc) và gây nên sự phát triển của tế bào
kiểu khối u, gọi là nốt sần, ở rễ. Quá trình biến nạp gen vào tế bào thực vật là
nhờ đặc tính của Ti plasmid. Trong Ti plasmid, có một vùng trình tự gọi là T-
ADN có khả năng liên kết vào nhiễm sắc thể tế bào thực vật chủ. Sau đó, sự
biểu hiện của các gen nằm trong vùng T-ADN được thực hiện trong tế bào
chủ. Trên cơ sở nguyên lý đó, các véctơ chuyển gen ở thực vật được tạo ra từ
Ti plasmid của vi khuẩn A. tumefaciens. Theo đó các gen ngoại lai được
chuyển vào tế bào thực vật thông qua việcc gắn những gen này vào vùng T-
ADN của Ti plasmid. Hệ thống truyền gen này rất hiệu quả nhưng có hạn chế
là chủ yếu được áp dụng cho các cây hai lá mầm vốn dễ dàng bị lây nhiễm bởi
vi khuẩn. Ngoài ra, còn có một số phương pháp chuyển gen khác ở thực vật
đã và đang được nghiên cứu và phát triển. Một trong những phương pháp đơn
giản và cũng khá hiệu quả là phương pháp dùng “súng bắn gen”. Trong đó,
ADN thường được phủ trên bề mặt các hạt kim loại nặng có tính trơ cao như
vàng và volfram, rồi được “bắn” vào tế bào thực vật nhờ áp lực của khí Heli.
Những tế bào mang gen tái tổ hợp thành công sau đó sẽ được chọn lọc, tái
sinh và sử dụng tiếp tục cho quá trình lai tạo và sản xuất giống.
Sau đây là một số đặc tính sinh học có giá trị đã được tạo ra nhờ kỹ thuật
chuyển gen ở thực vật.
Tính kháng sâu bệnh

Nhờ kỹ thuật di truyền, các giống cây trồng khác nhau có khả năng
kháng sâu bệnh đã được tạo ra. Về cơ bản, có thể chia làm hai hướng chính.
Hướng thứ nhất sử dụng việc chuyển một gen có nguồn gốc từ vi khuẩn
Bacillus thuringiensis mã hóa cho một protein gọi là protoxin (hay còn gọi tắt
là Bt) vốn gây độc ở nhiều loài sâu bệnh. Gen này đã được biến nạp thành
công vào cây cà chua, nhưng khả năng kháng bệnh của cây hạn chế do mức
độ biểu hiện của gen Bt thấp. Hướng thứ hai liên quan đến việc làm thay đổi
mức độ biểu hiện của các protein ức chế protease làm ảnh hưởng đến khả
năng tiêu hóa mô thực vật của sâu bệnh.
Tính kháng các bệnh virut

Kỹ thuật di truyền cũng đã và đang được sử dụng để phát triển các cơ
chế kháng bệnh virut mới. Chẳng hạn như, các trình tự gen đối mã tương ứng
với gen virut được tiến hành biến nạp vào thực vật để ngăn cản sự biểu hiện
hệ gen của virut. Tuy vậy hướng nghiên cứu này chỉ đạt được hiệu quả thành
công trong một số trường hợp. Một phương pháp khác tỏ ra hiệu quả và thành
công hơn liên quan đến việc chuyển một gen mã hóa cho protein vỏ virut.
Mặc dù, đến nay cơ chế của tính kháng virut ở thực vật khi có sự biểu hiện
của protein vỏ virut chưa được khẳng định chắc chắn.
87
Tính kháng thuốc diệt cỏ
Mặc dù thuốc diệt cỏ được sử dụng rộng rãi, ước tính hàng năm
khoảng 10% sản lượng nông nghiệp toàn cầu bị mất đi do sự phát triển của cỏ
dại. Hơn nữa, phần lớn các thuốc diệt cỏ có giá thành đắt, độc với môi trường,
đôi khi gây chết cây trồng và các loài cỏ khác. Kỹ thuật di truyền cho phép
chuyển các gen kháng chất diệt cỏ vào thực vật nhờ vậy, người ta có thể dễ
dàng diệt các dạng cỏ dại một cách chọn lọc. Glyphosate là một chất diệt cỏ
được sử dụng rộng rãi nhờ cơ chế ức chế enzym tổng hợp axit amin ở thực
vật. Khả năng kháng với glyphosate được tạo ra nhờ việc chuyển gen mã hóa
cho enzym tổng hợp axit amin không bị ảnh hưởng của chất diệt cỏ
glyphosate.
Một số đặc tính nông học khác được cải tiến ở thực vật nhờ kỹ thuật di
truyền gồm có khả năng chín chậm (ví dụ: ở cà chua) để thời gian bảo quan
sau thu hoạch có thể kéo dài hơn, tính kháng các điều kiện bất lợi của môi
trường (như hạn hán, đất nhiễm mặn, v.v…), hoặc làm tăng giá trị dinh dưỡng
của sản phẩm. Do các tế bào thực vật thường dễ nuôi cấy và có khả năng tái
sinh ở dạng sinh khối lớn, chúng có tiềm năng được sử dụng để sản xuất các
loại protein tái tổ hợp. Vì vậy, một hướng nghiên cứu trong công nghệ sinh
học là sử dụng các tế bào thực vật như các nồi phản ứng sinh học
(bioreactor). Đã có những thành công nhất định theo hướng nghiên cứu này.
Trong số đó, các kháng thể đơn dòng đã được sản xuất thành công từ các dòng tế
bào thực vật được chuyển gen.
Đến nay, các phương pháp chọn tạo giống động

Động vật chuyển gen vật truyền thống đã được áp dụng rộng rãi để tạo ra
các giống vật nuôi mang các đặc tính mong muốn
như làm tăng năng suất sữa, tăng tốc độ sinh trưởng, v.v… Nhưng đối với
nhiều tính trạng, việc lai tạo nhằm đạt được một tính trạng mới thường làm
thay đổi các tính trạng khác đang có. Hiện nay, với sự hỗ trợ của kỹ thuật di
truyền, người ta có thể chuyển gen quy định một tính trạng mong muốn trực
tiếp vào động vật. Các động vật được cải tiến di truyền theo phương pháp đó
được gọi là động vật chuyển gen (transgenic animal), còn gen ngoại lai được
gọi là gen biến nạp (transgene).
88
Phôi chuột
giai đoạn 8
tế bào
Véct
Tế bào phôi
ơ
chuột được lây Gen cần chuyển
nhiễm bởi (gen biến nạp)
retrovirut mang
gen cần chuyển
Phôi sau khi

được cải biến di
truyền được
cấy vào chuột
cái
Chuột mẹ
Chuột thế
hệ con,
cháu mang
gen biến
nạp
Hình 6.16. Kỹ thuật chuyển gen ở động vật sử dụng véctơ retrovirut.
Các gen biến nạp có thể được chuyển vào tế bào động vật theo một số cách.
Trong đó, các gen biến nạp được chuyển vào tế bào trứng đã thụ tinh hoặc vào
tế bào ở giai đoạn đầu của quá trình phát triển của phôi. Các phôi sau khi
được biến đổi được cấy truyền vào tử cung của một con mẹ, ở đó trứng mang
gen tái tổ hợp sẽ phát triển thành một cá thể được cải biến di truyền.
Các véctơ retrovirut
Các retrovirut có thể được sử dụng để tiến hành lây nhiễm các tế bào ở
giai đoạn đầu của quá trình phát triển của phôi (Hình 6.16). Nhờ các véctơ
retrovirut, các gen biến nạp được chuyển vào tế bào chủ và kết hợp với hệ gen
nhân của tế bào chủ. Nhưng vì kích thước véctơ thường nhỏ, nên kích thước
gen biến nạp thường bị hạn chế. Ngoài ra, việc sử dụng các véctơ retrovirut
thường đòi hỏi các nguyên tắc an toàn sinh học.
Phương pháp vi tiêm (microinjection)
89
Phương pháp này sử dụng việc tiêm trực tiếp ADN vào trong nhân của
tế bào trứng đã thụ tinh dưới kính hiển vi (Hình 6.17). Mặc dù phương pháp
này đỏi hỏi sự tỉ mỉ, chính xác và có nhiều thao tác khó về mặt kỹ thuật,
phương pháp này đến nay vẫn là phương pháp được sử dụng rộng rãi nhất ở
động vật.
Các tế bào phôi gốc

Các tế bào chuột ở giai đoạn đầu của quá trình phát triển của phôi có
khả năng biệt hoá thành tất cả các loại tế bào khác được gọi là tế bào phôi gốc
ES (embryogenic stem cells). Những tế bào này có thể được tách ra và tiến
hành nuôi cấy. Trong phòng thí nghiệm, người ta có thể biến nạp gen vào các
tế bào ES rồi tiến hành cấy chuyển trở lại vào tử cung con cái đang mang thai
để phôi tiếp tục phát triển thành cá thể động vật chuyển gen (Hình 6.18).
Các động vật chuyển gen được sử dụng làm công cụ trong các nghiên cứu và
sản xuất protein tái tổ hợp. Ba ứng dụng chính của chúng có thể kể đến như
sau:
Thu trứng đã thu tinh

từ chuột cái sau khi
giao phối
Tế bào trứng đã thụ Nhân tế

tinh bào
Pipét giữ tế Đầu kim vi

bào tiêm
Gen cần biến

nạp
Cấy tế bào
trứng đã biến
đổi gen trở lại
chuột cái
90
Hình 6.17. Chuyển gen ở động vật bằng kỹ thuật vi tiêm (microinjection).
1) Tìm hiểu chức năng gen

Công nghệ chuyển gen ở chuột được hoàn thiện vào những năm 1980.
Kể từ đó đến nay, người ta đã chuyển thành công hàng trăm gen vào chuột.
Thông qua việc theo dõi các đặc tính của các cá thể biến nạp gen, người ta có
thể tìm hiểu và phát hiện ra các chức năng của gen biến nạp. Điều này giúp
làm sáng tỏ nhiều chức năng và cơ chế điều hòa hoạt động của gen. Một kỹ
thuật liên quan đến định hướng nghiên cứu này là tiến hành chuyển gen để
làm ”bất hoạt” hoạt động của gen khác, gọi là kỹ thuật knock-out. Các cá thể
có gen bị bất hoạt sẽ thiếu những chức năng nhất định, qua đó người ta có thể
biết thông tin về chức năng của gen đó.
2) Mô hình nghiên cứu các bệnh ở người

Các động vật chuyển gen có thể được tạo ra để mô phỏng các bệnh ở
người nhờ việc làm ”hỏng” các gen nhất định nào đó. Toàn bộ mô hình
nghiên cứu ở động vật có thể giúp nghiên cứu làm rõ cơ chế gây bệnh ở
người, cũng như có thể sử dụng để sàng lọc và đánh giá các loại dược phẩm
mới có tiềm năng chữa bệnh tương ứng. Hướng ứng dụng này đã từng được
sử dụng để phát triển các mô hình nghiên cứu bệnh Alzheimer và chứng viêm
khớp.
3) Sản xuất các protein tái tổ hợp

Kỹ thuật chuyển gen vào cừu và dê đã được thực hiện nhằm sản xuất
một số loại protein người trong Nuôituyến
cấy sữa. Việc sản xuất protein tái tổ hợp
theo phương pháp này có một số ưu điểm. Sữa luôn được đổi mới, có thể
được sản xuất với lượng lớn và việc thu sản phẩm không làm ảnh hưởng tới
Tế bào phôi
sức sống của conchuột
Túi phôi vật.vàCác
tế bàoloại protein được biểu hiện có gốcđặc
(ES)tính giống với
(Đầu quá trình phát triển
dạng tự nhiên của người và dễ dàng tinh
phôi)
sạch do trong thành phần sữa chỉ
Chuyển gen
chứa một số lượng ít các loại protein khác. Một
biến nạp vào số loại protein đã được sản
tế bào phôi Gen biến nạp
xuất theo phương pháp này bao gồm proteingốc yếu tố IX và 1-antitrypsin.
Cấy truyền
trở lại vào túi
phôi
Cấy túi phôi

vào chuột cái 91
Hình 6.18. Chuyển gen ở động vật thông qua tế bào phôi gốc (ES).
92

Một Số Vấn Đề Về Di Truyền Phân Tử

Uploaded by

Copyright:

Available Formats

You might also like

Một Số Vấn Đề Về Di Truyền Phân Tử

Uploaded by

Document Information

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Một Số Vấn Đề Về Di Truyền Phân Tử

Uploaded by

Copyright:

Available Formats

KỸ THUẬT PHÂN TÍCH ADN VÀ PROTEIN

I. Các kỹ thuật phân tích axit nucleic

3. Sắc ký ái lực hỗ trợ quá trình tinh chế protein

Kỹ thuật này gần giống kỹ thuật thẩm tách

Sự khác biệt của kỹ thuật lai in-situ là phương pháp này

IV. PCR - Phản ứng chuỗi trùng hợp

Thành phần phản ứng PCR

Giai đoạn biến tính

Giai đoạn gắn mồi

Giai đoạn kéo dài chuỗi

Các ứng dụng của phản ứng PCR

Biến tính ở 94oC

Kéo dài chuỗi ở 72oC

Mồi gắn vào tất cả các

Các phân tử ADN

V. Giải trình tự ADN

Có hai nguyên lý giải trình tự các

ADN khuôn (mạch đơn)

Trình tự mạch ADN tổng hợp mới

Mặc dù nguyên lý cơ bản của phương pháp

V. Các bệnh di truyền

(b) Bị bệnh Bình thường Bị bệnh Bình thường

Bảng 6.1. Một số bệnh lý di truyền đơn gen

Các đột biến điểm

Trong các dạng bệnh lý di truyền do gen

TGATCA – bị cắt bởi Bcl I

B = vị trí cắt của enzym giới Gen X RFLP

Các trình tự lặp lại (9 –

R Cắt ADN bằng enzym R Cá thế thứ hai:

Trình tự duy Trình tự duy

CACACACACACACACACACAC Cá thế thứ ba: 13 lần

Sử dụng kỹ thuật PCR với cặp mồi đặc

VI. Kỹ thuật di truyền và Công nghệ sinh học

Hai thuật ngữ này được

Tên protein ứng dụng điều trị bệnh

Tên protein Lĩnh vực ứng dụng

Một trong những mục đích cơ

Những hệ thống biểu hiện

Điểm khởi đầu sao

Trình tự khởi đầu phiên mã

Vị trí ribosom bắt đầu liên ATG

Mặc dù các hệ thống tế bào

Các phương pháp chọn, tạo giống

Tính kháng sâu bệnh

Tính kháng các bệnh virut

Đến nay, các phương pháp chọn tạo giống động

Phôi sau khi

Các tế bào phôi gốc

Thu trứng đã thu tinh

Tế bào trứng đã thụ Nhân tế

Pipét giữ tế Đầu kim vi

Gen cần biến

1) Tìm hiểu chức năng gen

2) Mô hình nghiên cứu các bệnh ở người

3) Sản xuất các protein tái tổ hợp

Cấy túi phôi

You might also like