Download as pdf or txt
Download as pdf or txt
You are on page 1of 50

Machine Translated by Google

36 Gabriela Bitencourt-Ferreira và Walter Filgueira de Azevedo Jr.

Lý thuyết khóa khóa cổ điển về tính đặc hiệu của enzyme sẽ hướng dẫn chúng

ta khám phá mô phỏng lắp ghép phối tử protein thế giới hấp dẫn này [14]. Tuy

nhiên, chúng tôi sẽ không hạn chế việc gắn các enzyme vì có thể khám phá ý tưởng

cơ bản về việc lắp chìa khóa vào ổ khóa cho bất kỳ protein nào.

Chúng ta có thể hình dung vấn đề gắn kết phối tử protein-như một vấn đề tối

ưu hóa, trong đó chúng ta cố gắng tìm vị trí tối ưu cho phối tử phân tử nhỏ vào

cấu trúc protein. Phương pháp lắp ghép protein-li-gand là phương pháp phổ biến

nhất để thiết kế thuốc có sự hỗ trợ của máy tính. Cách tiếp cận này đã được áp

dụng rộng rãi để khám phá thuốc kể từ đầu những năm 1980 [15], và sự gia tăng

sức mạnh tính toán cũng như sự sẵn có của cấu trúc protein là những yếu tố chính

cho sự phát triển của lĩnh vực này.

Thông thường, với một trạm làm việc khiêm tốn sẽ thực hiện các mô phỏng

của hàng nghìn phối tử tiềm năng đối với cấu trúc protein.

Sự sẵn có của các chương trình lắp ghép nguồn mở [16–22] giúp thực hiện các dự

án lắp ghép protein-ligand [23–39] với ngân sách thấp. Hơn nữa, việc tích hợp

các chương trình lắp ghép trong quy trình làm việc cho phép chúng tôi thực hiện

mô phỏng lắp ghép theo cách thống nhất, tạo điều kiện thuận lợi cho việc mô

phỏng và phân tích kết quả lắp ghép [40].

Nếu chúng ta xem xét các chương trình lắp ghép phối tử protein hiện tại,

thì tất cả chúng đều có chung một thiết kế phổ quát, độc lập với việc lựa chọn

thuật toán được triển khai trong một ứng dụng cụ thể. Bất kỳ chương trình lắp

ghép protein-li-gand nào cũng bao gồm ít nhất một thuật toán tìm kiếm và chức

năng tính điểm. Nhiều chương trình cung cấp nhiều thuật toán tìm kiếm, ví dụ:

AutoDock4 cung cấp bốn thuật toán tìm kiếm: thuật toán di truyền, thuật toán di

truyền Lamarckian, tìm kiếm cục bộ và ủ mô phỏng [16–19]. Mặt khác, một chương

trình ghép nối như Glide [41–43] cung cấp nhiều chức năng tính điểm. Một số

chương trình có thể kết hợp các thuật toán tìm kiếm và chức năng tính điểm,

chẳng hạn như chương trình Molegro Virtual Docker (MVD) [44, 45].

Trong chương trình MVD, chúng tôi có bốn thuật toán tìm kiếm (tiến hóa vi

phân, tiến hóa đơn giản, đơn giản lặp và tối ưu hóa tổ kiến) và bốn chức năng

tính điểm (Điểm MolDock, Điểm MolDock với GRID, Điểm thực vật và Điểm thực vật với

GRID ). Các chức năng tính điểm dựa trên lưới có sẵn trong chương trình MVD nhanh

hơn MolDock và Plants Scores vì chúng tính toán các giá trị thế năng trên lưới khối

[44] trước khi mô phỏng lắp ghép.

2 Tương tự với Lý thuyết Chìa khóa-Khóa

Như chúng tôi đã dự đoán trong phần giới thiệu của chương này, chúng tôi sẽ coi

việc mô phỏng việc ghép nối phối tử protein-protein như một bài toán khóa-khóa.

Chúng ta hãy xem phối tử của mục tiêu protein là chìa khóa và vị trí liên kết của
Machine Translated by Google

Chương trình lắp ghép hoạt động như thế nào 37

Hình 1 Sự hình thành phức hợp protein-phối tử dưới góc nhìn của mô hình khóa-khóa. Ở đây chúng tôi hiển thị bề

mặt protein và phối tử. Chúng tôi sử dụng chương trình MVD [44] để tạo ra hình này

cấu trúc protein như một chiếc khóa Hình 1 thể hiện sự tương tác giữa
protein-phối tử dưới góc nhìn của lý thuyết khóa-khóa. Có thể hình dung toàn
bộ ý tưởng về mô phỏng lắp ghép phối tử protein thông qua sự tương tự với
lý thuyết khóa-khóa. Nó đơn giản như việc cố gắng nhét chìa khóa vào ổ khóa.

Từ góc độ thực tế, cần xem xét rằng người thí nghiệm đang cố tra chìa
khóa vào ổ khóa đã bị bịt mắt. Chúng ta cũng hãy nghĩ rằng người thực
nghiệm đang ở gần cửa.
Lúc đầu cầm chìa khóa bằng tay phải, sau đó dùng tay trái để xác định vị
trí ổ khóa. Từ việc biết được vị trí của ổ khóa, việc di chuyển chiếc chìa
khóa có thể đến gần ổ khóa và sau đó chỉ cần điều chỉnh một chút là người
thực nghiệm có thể đút nó vào ổ khóa.

Sự tương tự này không xem xét các chi tiết nhỏ của cơ chế bên trong của khóa,

tương tự như sự phù hợp cảm ứng [14] của vị trí liên kết do tương tác với phối tử.

Có thể mô phỏng những điều chỉnh nhỏ do phối tử liên kết vào cấu trúc protein thông

qua tính linh hoạt của chuỗi bên axit amin.

Rõ ràng là phép tính gần đúng khóa-khóa với mô phỏng lắp ghép phối tử
protein-protein là một mô hình đơn giản. Tuy nhiên, nó là đủ để có một
cái nhìn thô sơ về những gì đang diễn ra trong quá trình mô phỏng lắp
ghép protein-li-gand. Chúng tôi chơi đùa với một chiếc chìa khóa và di
chuyển nó về phía ổ khóa mô phỏng phần đế của phối tử ở vị trí liên kết.
Chúng tôi có thể đóng vai trò là thuật toán tìm kiếm của chương trình lắp
ghép với bàn tay giữ chiếc chìa khóa nơi chúng tôi chơi với chiếc chìa
khóa này để cố gắng tìm vị trí của nó trên ổ khóa. Nó khá đơn giản và trong một số trường
Machine Translated by Google

38 Gabriela Bitencourt-Ferreira và Walter Filgueira de Azevedo Jr.

khía cạnh cơ bản của mô phỏng, một sự gần đúng hợp lệ cho vấn đề thực
tế. Ví dụ: bất kỳ thuật toán tìm kiếm nào cũng cố gắng sắp xếp phối tử
vào vị trí liên kết được chỉ định của protein.
kết cấu.

3 Việc gắn đế không phải là vấn đề về khóa-khóa

Đối với tương tác phối tử-protein, lý thuyết khóa-khóa là sự đơn giản
hóa quá mức của vấn đề thực tế. Ví dụ, protein không phải là cấu trúc
cứng nhắc. Điều này cũng đúng với trang web ràng buộc của nó. Để có cái
nhìn thực tế, chúng tôi xem xét tính linh hoạt của chuỗi bên axit amin.
Để minh họa, chúng ta hãy phân tích các góc quay trong chuỗi bên của
tryptophan (Hình 2), chúng ta có hai góc quay bổ sung (φ1 và φ2): góc ω
liên quan đến các nguyên tử chuỗi chính mà chúng ta thường không xem xét
trong protein –mô phỏng lắp ghép phối tử.
Việc bổ sung tính linh hoạt của chuỗi bên của axit amin sẽ làm tăng
đáng kể nhu cầu của máy tính đối với một mô phỏng nhất định. Một khả
năng để giảm độ phức tạp của hệ thống phối tử protein là tập trung vào
các axit amin ở vị trí liên kết. Ví dụ, trong Hình 3, chúng ta có một
quả cầu lắp ghép tập trung ở túi liên kết ATP của kinase phụ thuộc
cyclin protein 2. Đối với mô phỏng lắp ghép phối tử protein-- này, chúng
tôi hạn chế tính linh hoạt đối với các chuỗi bên bên trong quả cầu lắp
ghép . Chúng tôi giữ hệ thống protein bên ngoài quả cầu lắp ghép như
một vật thể cứng nhắc.
Mỗi góc xoay bổ sung được thêm vào là một mức độ tự do bổ sung cho
hệ thống được mô phỏng. Chúng ta biết rằng protein không phải là thực
thể khô; chúng tương tác với các yếu tố dung môi và đồng yếu tố mà
chúng tôi không thêm vào phép tính gần đúng khóa khóa. Cuối cùng, bản
thân phối tử không nhất thiết phải là một cấu trúc cứng nhắc. Các góc
quay được nên được đưa vào dưới dạng bậc tự do bổ sung. Hình 4 cho thấy
một phối tử điển hình trong đó chúng tôi làm nổi bật các góc xoay trong cấu trúc.

Hình 2 Các góc quay (φ1 và φ2) trong axit amin tryptophan. Chúng tôi sử dụng
chương trình MVD [44] để tạo ra hình này
Machine Translated by Google

Chương trình lắp ghép hoạt động như thế nào 39

Hình 3. Quả cầu lắp ghép có tâm tại vị trí hoạt động của kinase phụ thuộc cyclin 2.

Chúng tôi đã sử dụng chương trình MVD [44] để tạo ra hình này

Hình 4 Các góc quay (φs) trong phối tử. Chúng tôi sử dụng chương trình MVD [44] để

tạo ra hình này

Tóm lại, sự tương tự giữa khóa-khóa rất hữu ích để giải thích
quá trình tổng thể xảy ra trong quá trình mô phỏng lắp ghép.
Tuy nhiên, chúng ta nên nhớ rằng cấu trúc phối tử protein là hệ
thống phân tử sinh học phức tạp cần được phân tích cẩn thận nếu
chúng ta muốn tạo ra một mô hình tính toán đáng tin cậy cho chúng.

4 Thuật toán tìm kiếm

Toàn bộ ý tưởng đằng sau thuật toán tìm kiếm trong bất kỳ mô
phỏng lắp ghép phối tử protein nào là cung cấp một kỹ thuật tính
toán để khám phá hướng tương đối của phối tử vào liên kết.
Machine Translated by Google

40 Gabriela Bitencourt-Ferreira và Walter Filgueira de Azevedo Jr.

túi. Các thuật toán như vậy phải cho phép quét toàn bộ túi liên
kết và cũng xem xét tính linh hoạt của phối tử và đôi khi của
chuỗi bên của axit amin được tìm thấy trong túi liên kết. Việc
tăng độ phức tạp của hệ thống được mô phỏng với mức độ tự do
cao hơn (số góc quay) đã làm tăng thời gian mô phỏng.

Các thuật toán tìm kiếm thành công nhất cho mô phỏng lắp ghép
là những thuật toán dựa trên tính toán tiến hóa như thuật toán
di truyền có sẵn trong chương trình AutoDock và tiến hóa vi phân
có sẵn trong chương trình MVD. Các phương pháp heuristic như
vậy có ưu điểm là nhanh hơn các thuật toán tìm kiếm như tìm kiếm
toàn diện. Mặt khác, vì các thuật toán lấy cảm hứng từ sinh học
này là ngẫu nhiên nên việc áp dụng chúng phải luôn được thực
hiện cẩn thận vì tất cả chúng đều phụ thuộc vào hạt giống ngẫu
nhiên được sử dụng để tạo ra quần thể ban đầu của các thuật toán tiến hóa.

5 chức năng chấm điểm

Các hàm tính điểm là các phép tính gần đúng để dự đoán ái lực
liên kết với phối tử protein. Hầu hết sự phát triển hiện đại của
chức năng tính điểm để dự đoán ái lực liên kết phối tử protein
và ứng dụng của chúng vào việc lựa chọn tư thế ứng viên do
thuật toán tìm kiếm tạo ra bắt đầu từ công trình tiên phong của
Bo¨hm vào đầu những năm 1990 [46 –51]. Các chương trình lắp
ghép như AutoDock, AutoDock Vina và MVD sử dụng các chức năng
tính điểm theo kinh nghiệm hoạt động rất giống với các ý tưởng
do Bo¨hm đề xuất.
Chúng ta hãy xem xét rằng chúng ta biểu thị ái lực liên kết phối tử
protein-protein bằng năng lượng liên kết tự do Gibbs đối với các phức
hợp phối tử protein-protein (ΔG). Hàm tính điểm theo kinh nghiệm cố
gắng ước tính mối quan hệ ràng buộc thử nghiệm (ΔGe) gần đúng thông qua
mô hình hồi quy trong đó chúng tôi sử dụng dữ liệu thử nghiệm để xác
định trọng số tương đối của từng thuật ngữ trong phương trình hồi quy.
Dưới đây chúng tôi có một hàm tính điểm chung theo kinh nghiệm để minh
họa các vấn đề cơ bản đằng sau sự phát triển của nó,

N M N M
ΔGt ¼ α0 þ α1 X X V vdw,i,j þ α2 X X V Hbond,i,j
tôi¼1
j¼1 tôi¼1
j¼1

N M N M
þ α3 X X V elec,i,j þ α4 X X V desol,i,j ð1Þ
tôi¼1
j¼1 tôi¼1
j¼1

trong đó ΔGt là ái lực liên kết lý thuyết, α0 là hằng số hồi


quy, α1 là trọng số tương đối của số hạng tương tác van der
Waals (Vvdw), α2 là trọng số tương đối của số hạng liên kết
hydro (VHbond), α3 là trọng số tương đối của số hạng thế tĩnh
điện (Velec) và α4 là trọng số tương đối của số hạng thế thế
khử (Vdesol). Có thể bổ sung thêm nhiều số hạng năng lượng khác vào
Machine Translated by Google

Chương trình lắp ghép hoạt động như thế nào 41

mô hình hồi quy, nhưng ý tưởng là như nhau. Chương trình ghép nối
phối tử protein AutoDock4 [19] sử dụng một biến bổ sung trong biểu
thức. (1) để đánh giá số góc quay (NTorsion) trong phối tử.

Trong việc ghép nối phối tử protein, người ta thường xem xét số
lượng góc xoắn liên quan đến số hạng năng lượng entropic.
Các tổng được lấy cho các nguyên tử từ phối tử (i) và protein (j) bên
trong bán kính ngưỡng được xác định trước. Trong phương trình trên,
N chỉ số lượng nguyên tử phối tử và M chỉ số lượng nguyên tử protein.
Chúng tôi có thể áp dụng các hàm tính điểm này để chọn tư thế tốt nhất
do thuật toán tìm kiếm tạo ra hoặc đánh giá ái lực liên kết đối với
bất kỳ phức hợp phối tử protein protein nào.

6 Tổng quan

Để có cái nhìn tổng hợp về cách thức hoạt động của các chương trình
lắp ghép phối tử protein, chúng ta sẽ xem xét tình huống lý tưởng khi
chúng ta có một tập hợp các cấu trúc tinh thể có sẵn ái lực liên kết
thực nghiệm. Tọa độ nguyên tử cho các phức hợp phối tử thụ thể có sẵn
tại Ngân hàng Dữ liệu Protein (PDB) [52–54] và dữ liệu ái lực liên kết
có sẵn tại MOAD [55], BindingDB [56] và PDBbind [57]. Hình 5 minh họa
các bước chính liên quan đến dự án lắp ghép này.

Hình 5 Sơ đồ này nêu bật tất cả các bước của phương pháp tiếp cận hiện đại đối với mô phỏng lắp ghép phối tử protein.

Ở đây, ρ biểu thị hệ số tương quan Spearman


Machine Translated by Google

42 Gabriela Bitencourt-Ferreira và Walter Filgueira de Azevedo Jr.

Bước đầu tiên trong dự án lắp ghép của chúng tôi là lựa chọn
các kết cấu sử dụng trong dự án. Hầu hết các mô phỏng lắp ghép đều dựa
trên các cấu trúc được xác định bằng kỹ thuật đo độ cao nhiễu xạ tia X
và kỹ thuật cộng hưởng từ hạt nhân. Hơn thế nữa,
chúng ta có thể sử dụng các mô hình tương đồng dựa trên các cấu trúc thí nghiệm

trong những mô phỏng như vậy. Thậm chí có thể sử dụng cấu trúc ab initio như một

thụ thể. Tuy nhiên, vì bản thân việc lắp ghép là một công cụ tính toán
phương pháp luận, sẽ an toàn hơn nếu dựa vào các cấu trúc thử nghiệm
để mô phỏng lắp ghép. Khi một cấu trúc hoặc một tập hợp các cấu trúc đã
đã được chọn, các bước tiếp theo liên quan đến việc xác nhận việc lắp ghép
giao thức. Các bước này cần được thực hiện cẩn thận để hỗ trợ
để phân tích sâu hơn về phức hợp phối tử protein được tạo ra trong
mô phỏng lắp ghép.
Đầu tiên, chúng ta phải trả lời những câu hỏi quan trọng để đánh giá
hiệu suất của một chương trình lắp ghép. (1) Là chương trình lắp ghép
có thể khôi phục vị trí tinh thể của phối tử? (2) Là
chương trình lắp ghép có thể dự đoán mối quan hệ ràng buộc phối
tử với hiệu suất hợp lý?
Đối với câu hỏi đầu tiên, chúng tôi thường đánh giá gốc của đế cắm-
độ lệch bình phương trung bình (RMSD), được tính bằng phương trình. (2)
ffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiff

N
2 2 2
P ½ðxx,i xp,iÞ þ ðyx,i yp,iÞ þ ðzx,i zp,iÞ
RMSD ¼ tôi¼1
ð2Þ
vuuut
N

trong đó xx, yx và zx là tọa độ thực nghiệm của phối tử,

và xp, yp và zp là tọa độ nguyên tử của vị trí


được tạo ra bởi mô phỏng lắp ghép. Chúng tôi gọi tư thế là vị trí do máy tính tạo ra cho

phối tử. Khi tính tổng, chúng tôi xem xét các nguyên tử N không phải hydro trong cấu

trúc phối tử. Vì vậy, rõ ràng là lý tưởng sẽ là RMSD ¼ 0,0 A˚ Hầu hết
.

trong số các nhà nghiên cứu tham gia phát triển chương trình lắp
ghép cho rằng RMSD 2.0 A˚ là có thể chấp nhận được [40].
Vì phần lớn các chương trình lắp ghép tạo ra nhiều hơn
một tư thế, theo thông lệ, người ta sẽ đánh giá độ chính xác của việc lắp ghép tất cả

tư thế được tạo ra cho một mô phỏng lắp ghép. Phương trình sau
xác định độ chính xác lắp ghép (DA) như sau:

DA ¼ fl þ 0:5 f l f h ð3Þ

trong đó fl là phân số mà RMSD lắp ghép nhỏ hơn


hơn l và fh là tỷ lệ các tư thế mà RMSD lắp ghép được thực hiện
nhỏ hơn h, trong đó l < h [58, 59].
Sau khi chọn giao thức lắp ghép tốt nhất, chúng ta có thể trả lời
câu hỏi thứ hai, khi xem xét hiệu suất dự đoán của
các chương trình lắp ghép để tính toán ái lực liên kết phối tử, việc
đánh giá chuyển tiếp chủ yếu dựa trên phân tích thống kê các hệ số tương quan.
Ví dụ: hệ số tương quan Spearman (ρ) được tính
giữa các mối quan hệ ràng buộc được dự đoán và tính toán [60]. Để đánh giá
Machine Translated by Google

Chương trình lắp ghép hoạt động như thế nào 43

hiệu suất dự đoán của chức năng tính điểm, chúng tôi ước tính mối quan hệ
ràng buộc cho tất cả các tệp PDB trong tập hợp các cấu trúc. Hệ số tương
quan giữa các mối quan hệ ràng buộc được dự đoán và thử nghiệm quyết định
sự thành công của phương pháp tính toán. Nó được kỳ vọng sẽ có ρ > 0,5.

Sau khi chúng tôi xác định giao thức lắp ghép, bạn có thể áp dụng
giao thức đó để xác định phối tử tiềm năng mới, được đặt tên ở đây là lượt
truy cập. Để tìm ra điểm nhấn, chúng tôi thường cố gắng gắn các phân tử
nhỏ có sẵn trong cơ sở dữ liệu như ZINC [61, 62]. Quá trình quét cơ sở
dữ liệu về các phân tử nhỏ bằng cách sử dụng mô phỏng lắp ghép được gọi
là sàng lọc ảo [7, 8]. Có thể thử nghiệm hàng nghìn, thậm chí hàng triệu
phân tử để cố gắng tìm ra chất kết dính mới tiềm năng với mục tiêu
protein. Người ta thường tập trung vào mô phỏng sàng lọc ảo các ứng viên
có triển vọng bằng cách sử dụng bộ dữ liệu sản phẩm tự nhiên hoặc thử tái
sử dụng thuốc để giảm mức sử dụng máy tính. Quy trình này cố gắng sử dụng
một loại thuốc đã được phê duyệt để điều trị một căn bệnh khác [63], chẳng
hạn như sử dụng aspirin để điều trị ung thư [26].

7 Bài tập lắp ghép

Để làm nổi bật các khái niệm chính được mô tả trong chương này, chúng ta
sẽ xem xét mô phỏng việc ghép nối phối tử protein của mục tiêu protein.
Chúng tôi lấy ví dụ về nghiên cứu về kinase phụ thuộc cyclin 2. Enzyme này là mục

tiêu thiết yếu để phát triển thuốc chống ung thư [64–74]. Để chạy mô phỏng, chúng

tôi sử dụng chương trình MVD [44]. Bước đầu tiên trong bất kỳ mô phỏng lắp ghép nào

là xác thực giao thức lắp ghép; như chúng tôi đã giải thích trong các phần trước,

chúng tôi có thể đánh giá hiệu suất lắp ghép bằng cách sử dụng RMSD và DA.

Chúng tôi đã xem xét cấu trúc tinh thể của CDK2 phức hợp với
roscovitine (mã truy cập PDB: 2A4L) [75]. Chúng tôi đã sử dụng kết hợp
thuật toán tìm kiếm tiến hóa vi phân với chức năng tính điểm Mol-Dock
[44]. Trong mô phỏng lắp lại, mô phỏng lắp ghép để khôi phục vị trí tinh
thể của phối tử, chúng tôi đã tạo ra 50 tư thế. Chúng tôi hiển thị tư thế
có điểm thấp nhất trong Hình 6.

Trong hình 6, chúng ta thấy tư thế (màu xám đậm) gần với vị trí tinh thể của

phối tử (màu xám nhạt). Đối với mô phỏng này, chúng ta có RMSD là 0,97 A˚, giá trị

,
này nằm dưới giới hạn được đề xuất là 2,0 A˚. Chúng tôi có thể đạt được xác nhận
sâu hơn thông qua việc áp dụng giao thức lắp ghép này cho các cấu trúc tinh thể bổ

sung của CDK2 phức tạp với các phối tử khác nhau. Quy trình như vậy được gọi là lắp

ghép đồng bộ [40]. Một bộ RMSD lắp ghép như vậy có thể được sử dụng để tính toán độ

chính xác của việc lắp ghép như được chỉ ra trong biểu thức. (3). Giá trị lý tưởng

của độ chính xác lắp ghép phải cao hơn 50%. Sau khi xác thực giao thức lắp ghép

này, chúng tôi có thể sử dụng bộ dữ liệu phân tử hữu cơ để điều tra khả năng liên

kết
Machine Translated by Google

44 Gabriela Bitencourt-Ferreira và Walter Filgueira de Azevedo Jr.

Hình 6 Kết quả lắp lại kết cấu 2A4L sử dụng chương trình MVD [44]

các chất ức chế tiềm năng mới. Để làm như vậy, chúng tôi áp dụng giao thức đã được

phê duyệt và sử dụng các giá trị của hàm tính điểm để đánh giá các lượt truy cập

tốt nhất trong số tất cả các mục có sẵn trong tập dữ liệu.

8 Colophon

Chúng tôi đã sử dụng chương trình MVD [44] để tạo Figs. 1–4 và 6.

Chúng tôi đã tạo Hình 5 bằng Microsoft PowerPoint 2016. Chúng tôi đã thực hiện các

mô phỏng lắp ghép phối tử protein được báo cáo trong chương này bằng cách sử dụng

Máy tính để bàn có bộ nhớ 4GB, ổ cứng 1 TB và Intel® Core® i3-2120 @ 3.30 Bộ xử lý

GHz chạy Windows 8.1.

9 nhận xét cuối cùng

Mô phỏng lắp ghép phối tử protein-protein đã được sử dụng rộng rãi trong ba thập kỷ

qua và đã trở thành phương pháp tính toán chính trong thiết kế thuốc có sự hỗ trợ

của máy tính. Xem xét sự bùng nổ về số lượng cấu trúc protein có sẵn tại PDB, chúng

ta có thể nói rằng chúng ta đang sống trong thời kỳ hoàng kim cho mô phỏng lắp ghép

phân tử. Các tọa độ nguyên tử của các phức chất phối tử protein dọc theo dữ liệu

ái lực liên kết thử nghiệm có sẵn từ phép đo nhiệt lượng chuẩn độ đẳng nhiệt (ITC)

[76–78] giúp có thể phát triển và huấn luyện một thế hệ chức năng tính điểm mới và

cũng để kiểm tra độ chính xác của việc lắp ghép của các thuật toán tìm kiếm một

cách rộng rãi. Việc xác nhận mô phỏng lắp ghép đáng tin cậy là bắt buộc. Do đó,

chúng ta nên lấy sơ đồ được mô tả trong Hình 1 làm quy tắc chung cho bất kỳ ai

thực hiện mô phỏng lắp ghép. Cần đặc biệt chú ý đến các hệ thống sinh học mà
Machine Translated by Google

Chương trình lắp ghép hoạt động như thế nào 45

thông tin về mối quan hệ ràng buộc và cấu trúc có sẵn [79–109], cho phép
chúng tôi khám phá các chức năng tính điểm và giao thức gắn kết khác
nhau và xác thực chúng bằng cách sử dụng dữ liệu thử nghiệm làm hướng dẫn.
Sự phát triển gần đây trong kỹ thuật học máy đã mang lại những công cụ
mới cho cộng đồng quan tâm đến nghiên cứu lắp ghép [23–32]. Thông qua
việc áp dụng các kỹ thuật học máy có giám sát, chúng ta có thể phát
triển các chức năng tính điểm nhắm mục tiêu vào các hệ thống sinh học
quan tâm. Ví dụ: chúng ta có thể huấn luyện hàm tính điểm như được mô
tả bởi biểu thức. (1) để tối ưu hóa hiệu suất dự đoán của chúng cho hệ
thống phối tử protein quan tâm. Những cách tiếp cận như vậy đã cho thấy
hiệu suất dự đoán vượt trội khi so sánh với các chức năng tính điểm
truyền thống [40].
Hầu hết các mô phỏng lắp ghép đều coi thụ thể là một vật thể cứng
nhắc, bỏ qua những thay đổi về hình dạng do liên kết phối tử. Để khắc
phục vấn đề này, chúng tôi có thể kết hợp việc lắp ghép phối tử protein
với mô phỏng động lực phân tử [110–114], trong đó cấu trúc ban đầu cho
nghiên cứu động lực phân tử đến từ mô phỏng lắp ghép. Sự kết hợp các
phương pháp tính toán như vậy không chỉ giải quyết tính linh hoạt của
phức hợp phối tử protein mà còn nghiên cứu tính ổn định của phối tử
trong quá trình mô phỏng động lực phân tử, chứng thực cấu trúc thu được
bằng cách lắp ghép phân tử.

Sự nhìn nhận

Công việc này được hỗ trợ bởi các khoản tài trợ từ CNPq (Brazil)
(308883/ 2014-4). Nghiên cứu này được tài trợ một phần bởi Coordenac¸a˜o
de Aperfeic¸oamento de Pessoal de Nivel Superior—Brasil (CAPES)— Mã Tài
chính 001. GB-F thừa nhận sự hỗ trợ từ học bổng PUCRS/ BPA. WFA là nhà
nghiên cứu cao cấp của CNPq (Brazil)
(Số quy trình: 308883/2014-4 và 309029/2018-0).

Người giới thiệu

1. Azevedo LS, Moraes FP, Xavier MM, Pantoja EO, 5. de Azevedo WF Jr, Dias R (2008) Phương pháp tính toán
Villavicencio B, Finck JA và cộng sự (2012) ái lực liên kết phối tử. Mục tiêu ma túy Curr 9:1031–
Những tiến bộ gần đây về mô phỏng lắp ghép phân tử được 1039
áp dụng để phát triển thuốc. Thông tin sinh học Curr
7:352–365
6. Dias R, de Azevedo WF Jr (2008) Thuật toán lắp ghép phân
2. Lengauer T, Rarey M (1996) Phương pháp tính toán lắp tử. Mục tiêu ma túy Curr 9:1040–1047
ghép phân tử sinh học. Curr Opin Struct Biol 6:402–406
3. Breda A, Basso LA, Santos DS, 7. de Azevedo WF Jr (2010) MolDock áp dụng cho sàng lọc ảo
de Azevedo Jr WF (2008) Sàng lọc ảo các loại thuốc: chức dựa trên cấu trúc. Mục tiêu ma túy Curr 11:327–334 8. de
năng tính điểm, lắp ghép và thiết kế thuốc. Curr Thuốc Azevedo WF Jr (2010) Sàng lọc ảo
hỗ trợ tính toán Des 4:265–272 4. de Azevedo WF Jr (2008) dựa trên cấu trúc. Mục tiêu về Thuốc Curr 11:261–263
Tương tác giữa thuốc và protein. Mục tiêu ma

túy Curr 9:1030

9. de Avila MB, de Azevedo WF (2014) Khai thác dữ liệu kết


quả lắp ghép. Ứng dụng vào
Machine Translated by Google

46 Gabriela Bitencourt-Ferreira và Walter Filgueira de Azevedo Jr.

3-dehydroquinate dehydratase. Curr Bioinf 9:361–379 đối với phức hợp protein-ligand. Hóa lý sinh học 240:63–
69

10. Kitchen DB, Decornez H, Furr JR, Bajorath J (2004) Lắp ghép 24. de A' vila MB, de Azevedo WF Jr (2018)
và chấm điểm trong sàng lọc ảo để phát hiện thuốc: phương Phát triển các mô hình học máy để dự đoán sự ức chế 3-
pháp và ứng dụng. Nat Rev Drug Discov 3:935–949 11. Fischer dehydroquinate dehy-dratase. Chem Biol Drug Des 92:1468–
E (1890) Ueber die optischen Isome-ren des 1474 25. Russo S, de Azevedo WF (2019) Những tiến bộ

Traubezuckers, der Glucons€aure und der Zuckers€aure. Ber Dtsch trong hiểu biết về thụ thể cannabinoid 1—tập trung vào tương
Chem Ges 23:2611–2624 tác của các chất chủ vận nghịch đảo. Curr Med Chem.
https://doi.org/ 10.2174/0929867325666180417165247 26.
Amaral MEA, Nery LR, Leite CE, de Azevedo Junior WF,

12. Fischer E (1894) Einfluss der Cấu hình auf die Wirkung Campos MM (2018) Tác dụng tiền lâm sàng của metformin

der Enzyme. Ber Dtsch Chem Ges 27:2985–2993 và aspirin trên dòng tế bào của các phân nhóm ung thư vú khác
nhau.

13. Koshland DE Jr (1994) Lý thuyết ổ khóa và lý thuyết phù


hợp cảm ứng. Angew Chem Int Ed Engl 33:2375–2378
Đầu tư thuốc mới 36:782–796 27. Levin

14. Jorgensen WL (1991) Mô hình ổ khóa và chìa khóa bị rỉ NMB, Pintro VO, Bitencourt-Ferreira-G, Mattos BB, Silve'rio

sét khi liên kết protein-phối tử. Khoa học 254:954–955 AC, de Azevedo Jr WF (2018) Phát triển chức năng tính

điểm nhắm mục tiêu CDK để dự đoán ràng buộc sự giống


nhau. Biophys Chem 235:1–8 28. Freitas PG, Elias TC,
15. Kuntz ID, Blaney JM, Oatley SJ, Langridge R, Ferrin TE
Pinto IA, Costa LT, de Carvalho
(1982) Một cách tiếp cận hình học đối với các tương tác
giữa đại phân tử-phối tử. J Mol Biol 161:269–288 16. PVSD, Omote DQ và cộng sự (2018)

Goodsell DS, Olson AJ (1990) Tự động


Phương pháp tính toán để phát hiện các phân tử hóa thực
gắn các chất nền vào protein bằng cách ủ mô phỏng. Protein
vật có mục tiêu điều trị tiềm năng đối với protein PKCZ.
8:195–202 17. Morris GM, Goodsell DS, Huey R, Olson AJ
Lett Drug Des Discovery 15:488–499 29. Pintro VO,
(1996) Phân phối tự động việc ghép
Azevedo WF (2017) Tối ưu hóa quy trình
nối các phối tử linh hoạt với protein: các ứng dụng song
sàng lọc ảo. Hướng tới chức năng tính điểm đa thức dựa trên
song của AutoDock 2.4. J Comput Aided Mol Des 10:293–304
mục tiêu cho protease HIV-1. Comb Chem High Throughput
Screen 20:820–827 30. de A' vila MB, Xavier MM, Pintro
VO, de Aze-vedo WF (2017) Các kỹ thuật học máy được
giám sát để dự đoán mối quan hệ ràng
18. Morris GM, Goodsell DS, Halliday RS, Huey R, Hart WE,
buộc. Một nghiên cứu về kinase phụ thuộc cyclin 2. Biochem
Belew RK và cộng sự (1998)
Bio-phys Res Commun 494:305–310 31. Heck GS, Pintro VO,
Lắp ghép tự động bằng thuật toán di truyền lamarckian
Pereira RR, de A' vila MB, Levin NMB, de Azevedo WF
và hàm năng lượng tự do liên kết theo kinh nghiệm. J
(2017)
Comput Chem 19:1639–1662

19. Morris GM, Huey R, Lindstrom W, Sanner MF, Belew RK,


Goodsell DS và cộng sự (2009)
AutoDock4 và AutoDockTools4: ghép nối tự động với tính Các phương pháp học máy có giám sát được áp dụng để dự
đoán ái lực liên kết với phối tử. Curr Med Chem 24:2459–
linh hoạt của thụ thể chọn lọc. J Comput Chem 30:2785–
2470
2791 20. Trott O, Olson AJ (2010) AutoDock
32. Levin NM, Pintro VO, de A' vila MB, de Mat-tos BB, De
Vina: cải thiện tốc độ và độ chính xác của việc gắn đế với
Azevedo WF Jr (2017) Hiểu cơ sở cấu trúc của việc ức chế
chức năng tính điểm mới, tối ưu hóa hiệu quả và đa luồng.
kinase phụ thuộc cyclin. Những mảnh ghép mới trong câu đố
J Comput Chem 31:455–461
phân tử. Mục tiêu ma túy Curr 18:1104–1111

21. Yang JM, Chen CC (2004) GEMDOCK: một phương pháp tiến
33. Teles CB, Moreira-Dill LS, Silva Ade A, Facundo VA, de
hóa chung cho việc lắp ghép phân tử. Protein 55:288–304
Azevedo WF Jr, da Silva LH và cộng sự (2015) Một Lupane-
22. Yang JM, Shen TW (2005) Một cách
triterpene được phân lập từ Combretum leprosum Mart.
tiếp cận tiến hóa dựa trên dược điển để sàng lọc các chất
Chiết xuất từ trái cây cản trở sự phát triển nội bào của
điều biến thụ thể estrogen chọn lọc. Protein 59:205–220 Leishmania (L.) amazonensis trong ống nghiệm. BMC bổ sung

thay thế Med 15:165

23. Bitencourt-Ferreira G, de Azevedo Jr WF (2018) Phát triển


mô hình học máy để dự đoán năng lượng liên kết tự do
Gibbs
Machine Translated by Google

Chương trình lắp ghép hoạt động như thế nào 47

34. Coracini JD, de Azevedo WF Jr (2014) Shiki-mate 47. Bo¨hm HJ (1994) Sự phát triển của hàm tính điểm thực
kinase, protein đích để thiết kế thuốc. nghiệm đơn giản để ước tính hằng số liên kết cho phức
Curr Med Chem 21:592–604 hợp phối tử protein có cấu trúc ba chiều đã biết. J
Comput Aided Mol Des 8:243–256 48. Bo¨hm HJ (1996) Hướng
35. Moraes FP, de Azevedo WF Jr (2012) Nhắm mục tiêu vị
trí imidazoline trên monoamine oxidase B thông qua mô tới thiết kế tự động các phối tử protein tổng

phỏng lắp ghép phân tử. J Mol Model 18:3877–3886 36. hợp có thể tiếp cận được: peptide, amid và peptidomi-metics.
Soares MB, Silva CV, Bastos TM, J Comput Aided Mol Des 10:265–272

Guimara˜es ET, Figueira CP, Smirlis D và cộng sự (2012)


Hoạt tính chống Trypanosoma cruzi của nicotinamide.

Acta nhiệt đới 12:224–229 49. Stahl M, Bo¨hm HJ (1998) Phát triển các chức năng lọc để

37. Vianna CP, de Azevedo WF Jr (2012) Xác định các chất ghép nối phối tử protein. J Mol Graph Model 16:121–132

ức chế Mycobacteria lao shikimate kinase tiềm năng mới 50. Klebe G, Bo¨hm HJ (1997) Các yếu
thông qua mô phỏng lắp ghép phân tử. J Mol Model 18:755– tố năng lượng và entropic xác định ái lực liên kết trong
764 phức hợp phối tử protein. J Tiếp nhận tín hiệu truyền
Res 17:459–473

38. Sa' MS, de Menezes MN, Krettli AU, Ribeiro IM,


Tomassini TC, Ribeiro dos Santos R và cộng sự (2011) 51. Bo¨hm HJ, Banner DW, Weber L (1999)
Hoạt tính chống sốt rét của physalins B, D, F và G. J Sự kết hợp kết hợp và hóa học kết hợp: thiết kế các
Nat Prod 74:2269–2272 39 Canduri F, Perez PC, chất ức chế trombin không chứa peptide mạnh. J Comput

Caceres RA, de Azevedo WF Jr (2008) CDK9 là mục tiêu tiềm Aided Mol Des 13:51–56

năng để phát triển thuốc. Med Chem 4:210–218 40. Xavier


MM, Heck GS, de Avila MB, Levin NM, Pintro VO, 52. Berman HM, Westbrook J, Feng Z, Gilliland G, Bhat TN,

Carvalho NL và cộng sự (2016) Weissig H và cộng sự (2000)


Ngân hàng dữ liệu protein Axit nucleic Res 28:235–242

SAnDReS một công cụ tính toán để phân tích thống kê


kết quả lắp ghép và phát triển các chức năng tính 53. Berman HM, Battistuz T, Bhat TN, Bluhm WF, Bourne PE,
điểm. Màn hình thông lượng cao Comb Chem 19:801–812 Burkhardt K và cộng sự (2002)
41. Friesner RA, Murphy RB, Repasky Ngân hàng dữ liệu protein Acta Crystallogr D Biol

MP, Frye LL, Greenwood JR, Halgren TA và cộng sự (2006) Crystallogr 58:899–907 54. Westbrook

J, Feng Z, Chen L, Yang H, Ber-man HM (2003) Ngân hàng dữ liệu

Trượt cực kỳ chính xác: lắp ghép và ghi điểm kết hợp mô protein và bộ gen cấu trúc. Axit nucleic Res 31:489–491

hình vỏ bọc kỵ nước cho các phức hợp phối tử protein. J 55. Hu L, Benson ML, Smith RD, Lerner MG, Carlson HA (2005)

Med Chem 49:6177–6196 Binding MOAD

(mẹ của tất cả các cơ sở dữ liệu). Protein 60:333–340 56. Liu

42. Halgren TA, Murphy RB, Friesner RA, Beard HS, Frye LL, T, Lin Y, Wen X, Jorrisen RN, Gilson MK (2007) BindingDB:

Pollard WT và cộng sự (2004) Glide: một cách tiếp cận cơ sở dữ liệu có thể truy cập trên web về ái lực

mới để lắp ghép và ghi điểm nhanh chóng, chính xác. 2. liên kết phối tử protein được xác định bằng thực nghiệm. Axit
Yếu tố làm phong phú trong sàng lọc cơ sở dữ liệu. J nucleic Res 35:198–201
Med Chem 47:1750–1759 43. Friesner RA, Banks

JL, Murphy RB, Halgren TA, Klicic JJ, Mainz DT và cộng sự


(2004) Glide: một cách tiếp cận mới để ghép nối và ghi
điểm nhanh chóng, chính xác. 1. Phương pháp và đánh 57. Wang R, Fang X, Lu Y, Wang S (2004) Cơ sở dữ liệu
giá độ chính xác của việc lắp ghép. J Med Chem 47:1739– PDBbind: tập hợp các ái lực liên kết cho các phức hợp
1749 phối tử protein có cấu trúc ba chiều đã biết. J Med
44. Thomsen R, Christensen MH (2006) Mol-Dock: một kỹ thuật Chem 47:2977–2980

mới để lắp ghép phân tử có độ chính xác cao. J Med Chem


49:3315–3321 58. Ballante F, Marshall GR (2016) Một chiến lược kết hợp tự
động để lựa chọn tư thế ràng buộc và đánh giá vị trí gắn
45. Heberle' G, de Azevedo WF Jr (2011) kết trong thiết kế thuốc dựa trên cấu trúc. J Chem Inf
Các thuật toán lấy cảm hứng từ sinh học được áp dụng Model 56:54–72 59. Vieth M, Hirst JD, Kolinski A,
cho mô phỏng lắp ghép phân tử. Curr Med Chem 18:1339– Brooks CL III (1998) Đánh giá các chức năng năng lượng cho
1352
việc lắp ghép linh hoạt. J Comput Chem 19:1612–1622 60.
46. Bo¨hm HJ (1993) Một công cụ tính toán mới để thiết kế Zar JH (1972) Kiểm tra ý nghĩa của hệ số tương quan
thuốc dựa trên cấu trúc tự động. J Mol Công nhận 6:131– cấp bậc giáo sĩ. J Am Stat PGS 67:578–580
137
Machine Translated by Google

48 Gabriela Bitencourt-Ferreira và Walter Filgueira de Azevedo Jr.

61. Irwin JJ, Shoichet BK (2005) ZINC--một miễn phí 74. Volkart PA, Bitencourt-Ferreira G, Souto AA,
cơ sở dữ liệu về các hợp chất có sẵn trên thị de Azevedo WF (2019) Phụ thuộc vào cyclin
trường để sàng lọc ảo. J Chem Inf kinase 2 trong lão hóa tế bào và ung thư. MỘT
Mô hình 45:177–182 đánh giá về cấu trúc và chức năng. Thuốc Curr

62. Irwin JJ, Sterling T, Mysinger MM, Bolstad Mục tiêu 20(7):716–726. https://doi.org/10.

ES, Coleman RG (2012) ZINC: một công cụ miễn phí để 2174/1389450120666181204165344

khám phá hóa học cho sinh học. J Chem Inf 75. De Azevedo WF, Leclerc S, Meijer L,
Mẫu 52:1757–1768 Havlicek L, Strnad M, Kim SH (1997) Purine ức chế

63. Ashburn TT, Thor KB (2004) Tái định vị thuốc: xác phản ứng cắn của kinase phụ thuộc cyclin

định và phát triển các công dụng mới chất tương tự: cấu trúc tinh thể của cdk2 của con người

đối với các loại thuốc hiện có. Nat Rev Thuốc Discov tạo phức với roscovitine. Hóa sinh Eur J
3:673–683 243:518–526

64. Morgan DO (1995) Nguyên tắc điều chỉnh CDK. Thiên 76. de Azevedo WF Jr, Dias R (2008) Các phương pháp
nhiên 374:131–134 thử nghiệm để đánh giá động lực nhiệt của tương
tác thuốc-protein. Thuốc Curr
65. Murray AW (1994) Phụ thuộc vào cyclin
Mục tiêu 9:1071–1076
kinase: bộ điều chỉnh chu kỳ tế bào và hơn thế nữa.
Hóa sinh 1:191–195 77. Ma W, Yang L, He L (2018) Tổng quan về
phương pháp phát hiện hằng số phân ly cân bằng
66. Kim SH, Schulze-Gahmen U, Brandsen J, de
KD của tương tác thuốc-thụ thể. J Pharm Anal
Azevedo Junior WF (1996) Cơ sở kết cấu
8:147–152
để ức chế hóa học CDK2. Tế bào Prog
Chu kỳ Res 2:137–145 78. Falconer RJ (2016) Ứng dụng của phép đo nhiệt
lượng chuẩn độ đẳng nhiệt—nghiên cứu và
67. De Azevedo WF Jr, Mueller-Dieckmann HJ,
phát triển kỹ thuật từ năm 2011 đến năm 2015.
Schulze-Gahmen U, Worland PJ, Sausville E,
J Mol Công nhận 29:504–515
Kim SH (1996) Cơ sở cấu trúc cho tính đặc hiệu
và hiệu lực của chất ức chế flavonoid ở người 79. de A' vila MB, Bitencourt-Ferreira G, de Aze-vedo

CDK2, một kinase chu trình tế bào. Proc Natl Acad Sci WF Jr (2019) Cơ sở cấu trúc để ức chế Enoyl-[Acyl
Hoa Kỳ 93:2735–2740 Carrier Protein]
Reductase (InhA) từ Mycobacteria tuber-culosis.
68. Canduri F, de Azevedo WF Jr (2005) Cơ sở cấu trúc của
sự tương tác giữa các chất ức chế với Curr Med Chem. https://doi.org/10.
2174/0929867326666181203125229
kinase phụ thuộc cyclin 2. Tính toán Curr
Thuốc hỗ trợ Des 1:53–64 80. Pereira JH, Canduri F, de Oliveira JS, da Sil-
veira NJ, Basso LA, Palma MS và cộng sự (2003)
69. Krystof V, Cankar P, Frysova' I, Slouka J,
Nghiên cứu tin sinh học cấu trúc của EPSP
Kontopidis G, Dzuba'k P và cộng sự (2006) 4-ary-
synthase từ Mycobacteria bệnh lao.
lazo-3,5-diamino-1 H-pyrazole CDK chất ức chế:
Biochem Biophys Res Cộng đồng
Nghiên cứu SAR, cấu trúc tinh thể phức tạp
312:608–614
với CDK2, tính chọn lọc và hiệu ứng tế bào. J
Med Chem 49:6500–6509 81. Borges JC, Pereira JH, Vasconcelos IB, dos
Santos GC, Olivieri JR, Ramos CH và cộng sự
70. De Bondt HL, Rosenblatt J, Jancarik J, Jones
(2006) Phosphate đóng cấu trúc dung dịch của 5-
HD, Morgan DO, Kim SH (1993) Crystal
enolpyruvylshikimate-3-phos-phate synthase (EPSPS)
cấu trúc của kinase phụ thuộc cyclin 2. Bản chất
363:595–602 từ Mycobacteria
bệnh lao. Sinh lý sinh học Arch
71. Schulze-Gahmen U, De Bondt HL, Kim SH 452:156–164
(1996) Cấu trúc tinh thể có độ phân giải cao của
82. Marques MR, Pereira JH, Oliveira JS, Basso
kinase phụ thuộc cyclin của con người 2 với và
không có ATP: vùng nước bị ràng buộc và tự nhiên LA, de Azevedo WF Jr, Santos DS và cộng sự (2007)
Sự ức chế 5-enolpyruvylshikimate-3-
phối tử làm hướng dẫn thiết kế chất ức chế. J Med
Hóa học 39:4540–4546 phosphate synthase như một mô hình để phát triển
các loại thuốc chống vi trùng mới. Mục tiêu ma
72. de Azevedo WF Jr (2016) Bài viết lấy ý kiến:
túy Curr 8:445–457
nhắm mục tiêu nhiều kinase phụ thuộc cyclin
83. Marques MR, Vaso A, Neto JR, Fossey MA,
(CDK): một chiến lược mới cho việc lắp ghép phân tử
Oliveira JS, Basso LA và cộng sự (2008) Động lực học
học. Mục tiêu ma túy Curr 17:2
của cấu hình do glyphosate gây ra
73. Leopoldino AM, Canduri F, Cabral H,
sự thay đổi của Mycobacteria bệnh lao 5-enol-
Junqueira M, de Marqui AB, Apponi LH
pyruvylshikimate-3-phosphate synthase
et al (2006) Phân tích biểu hiện, tinh chế và
(EC 2.5.1.19) được xác định bằng trao đổi hydro-
lưỡng sắc tròn của CDK9 ở người.
đơteri và khối lượng phun điện
Protein Expr Purif 47:614–620
quang phổ. Hóa sinh 47:7509–7522
Machine Translated by Google

Chương trình lắp ghép hoạt động như thế nào 49

84. de Azevedo WF Jr, Canduri F, dos Santos Acta Crystallogr D Biol Crystallogr
DM, Silva RG, de Oliveira JS, de Carvalho 61:856–862

LP và cộng sự (2003) Cấu trúc tinh thể của con người 95. Silva RG, Pereira JH, Canduri F, de Azevedo
purine nucleoside phosphorylase ở độ phân giải WF Jr, Basso LA, Santos DS (2005) Động học
2,3A. Biochem Biophys Res Cộng đồng và cấu trúc tinh thể của phosphorylase nucleo-
308:545–552
side purine của con người trong phức hợp với 7-
85. dos Santos DM, Canduri F, Pereira JH, Vini-cius methyl-6-thio-guanosine. Sinh lý sinh học Arch
Bertacine Dias M, Silva RG và cộng sự (2003) 442:49–58
Cấu trúc tinh thể của nucleoside purine của con người 96. de Azevedo WF Jr, Canduri F, Basso LA,
phosphorylase tạo phức với acyclovir. Bio-chem Palma MS, Santos DS (2006) Xác định
Biophys Res Commun 308:553–559 cơ sở cấu trúc cho tính đặc hiệu của phối tử
86. Filgueira de Azevedo W Jr, Canduri F, Mar- bằng cách sử dụng sàng lọc tinh thể. Sinh lý
angoni dos Santos D, Pereira JH, Dias MV, sinh hóa tế bào 44:405–411
Silva RG và cộng sự (2003) Cơ sở cấu trúc để 97. Ducati RG, Basso LA, Santos DS, de Azevedo
ức chế PNP ở người bằng immucillin-H. Bio-chem WF Jr (2010) Tinh thể học và lắp ghép
Biophys Res Commun 309:917–922 nghiên cứu về purine nucleoside phosphorylase
87. Filgueira de Azevedo W Jr, dos Santos GC, từ Mycobacteria bệnh lao. Bioorg
dos Santos DM, Olivieri JR, Canduri F, Silva Med Chem 18:4769–4774
RG và cộng sự (2003) Lắp ghép và góc nhỏ 98. Pereira JH, Vasconcelos IB, Oliveira JS,
Nghiên cứu tán xạ tia X của nucleoside purine Caceres RA, de Azevedo WF Jr, Basso LA
phosphorylase. Biochem Biophys Res Comm-mun và cộng sự (2007) Shikimate kinase: một mục
309:923–928
tiêu tiềm năng để phát triển các chất đọc mới. Curr
88. de Azevedo WF Jr, Canduri F, dos Santos Mục tiêu ma túy 8:459–468
DM, Pereira JH, Bertacine Dias MV, Silva 99. Delatorre P, Rocha BA, Souza EP, Oliveira
RG và cộng sự (2003) Cấu trúc tinh thể của con người TM, Bezerra GA, Moreno FB và cộng sự (2007)
PNP tạo phức với guanine. Biochem Bio-phys Res Cấu trúc của lectin từ Canavalia Gladiata
Commun 312:767–772 hạt giống: những hiểu biết sâu sắc về cấu trúc mới cho
89. da Silveira NJ, Uchoˆa HB, Canduri F, Pereira các phân tử cũ. Cấu trúc BMC Biol 7:52

JH, Camera JC Jr, Basso LA và cộng sự (2004) 100. Canduri F, de Azevedo WF (2008) Protein
Nghiên cứu tin sinh học cấu trúc của PNP từ tinh thể học trong khám phá thuốc. Thuốc Curr
Schistosoma mansoni. Res sinh hóa sinh học Mục tiêu 9:1048–1053
Công xã 322:100–104
101. Canduri F, Perez PC, Caceres RA, de Aze-vedo WF
90. Canduri F, dos Santos DM, Silva RG, Mendes Jr (2007) Protein kinase làm mục tiêu
MA, Basso LA, Palma MS và cộng sự (2004) Cấu cho các loại thuốc hóa trị liệu chống ký sinh trùng. Curr
trúc của phức hợp purine nucleoside phosphoryl- Mục tiêu ma túy 8:389–398
lase của con người với inosine và ddI.
102. Dias MV, Borges JC, Ely F, Pereira JH,
Biochem Biophys Res Cộng đồng
Canduri F, Ramos CH và cộng sự (2006)
313:907–914
tổng hợp chorismate từ Mycobacteria
91. Nolasco DO, Canduri F, Pereira JH, Corti-no'z bệnh lao. J Struct Biol 154:130–143
JR, Palma MS, Oliveira JS và cộng sự (2004)
103. Dias MV, Ely F, Palma MS, de Azevedo WF
Cấu trúc tinh thể của PNP từ Myco-vi khuẩn lao ở độ
Jr, Basso LA, Santos DS (2007) Hợp xướng
phân giải 1,9A. Bio-chem Biophys Res Commun 324:789–794
synthase: một mục tiêu hấp dẫn để phát triển
thuốc chống lại các bệnh mồ côi. Thuốc Curr
92. Canduri F, Fadel V, Dias MV, Basso LA, Mục tiêu 8:437–444
Palma MS, Santos DS và cộng sự (2005) Crystal
104. de Azevedo WF Jr (2011) Mục tiêu protein cho
cấu trúc PNP của con người phức tạp với
phát triển thuốc chống lại Mycobacteria
hypoxanthine và ion sunfat. Biochem Bio-phys bệnh lao. Curr Med Chem 18:1255–1257
Res Commun 326:335–338
105. Dias MV, Faı'm LM, Vasconcelos IB, de Oli-veira
93. Canduri F, Fadel V, Basso LA, Palma MS,
JS, Basso LA, Santos DS và cộng sự (2007)
Santos DS, de Azevedo WF Jr (2005) Mới
Tác dụng của các ion magiê và clorua
cơ chế xúc tác cho purine nucle-oside và shikimate về cấu trúc của shikimate
phosphorylase của con người. Res sinh hóa sinh học
kinase từ Mycobacteria bệnh lao. Acta
Cộng đồng 327:646–649
Crystallogr Sect F Struct Biol Crystal Commun
94. Canduri F, Silva RG, dos Santos DM, Palma 63:1–6
MS, Basso LA, Santos DS và cộng sự (2005) Cấu
106. de Azevedo WF Jr, Ward RJ, Canduri F,
trúc phức hợp PNP của con người với các phối tử.
Soares A, Giglio JR, Arni RK (1998) Crystal
Cấu trúc của piratoxin-I: một canxi-
Machine Translated by Google

50 Gabriela Bitencourt-Ferreira và Walter Filgueira de Azevedo Jr.

phospholipase độc lập, gây độc cho cơ 110. de Azevedo WF Jr (2011) Mô phỏng động lực học
A2-tương đồng từ Bothrops pirajai phân tử của các mục tiêu protein được xác định trong
nọc độc. Chất độc 36:1395–1406 Mycobacterium tuberculosis. Curr Med Chem
18:1353–1366
107. Bezerra GA, Oliveira TM, Moreno FB, de
Souza EP, da Rocha BA, Benevides RG và cộng sự 111. Sforc¸a ML, Oyama S Jr, Canduri F, Lorenzi
(2007) Phân tích cấu trúc của Canavalia mar- CC, Pertinhez TA, Konno K và cộng sự (2004)
itima và Canavalia Gladiata lectins kết hợp với Quá trình carboxyamid hóa ở đầu C thay đổi như thế nào
các dimannoside khác nhau: mới Hoạt động sinh học của peptide từ nọc độc
những hiểu biết sâu sắc về sự hiểu biết của của loài ong đơn độc eumenine. Hóa sinh
mối quan hệ cấu trúc - hoạt tính sinh học 43:5608–5617

lectin cây họ đậu. J Struct Biol 160:168–176 112. de Azevedo WF Jr, Canduri F, Fadel V, Teo-doro
108. Delatorre P, Rocha BA, Gadelha CA, Santi-Gadelha LG, Hial V, Gomes RA (2001) Mô hình phân tử cho
T, Cajazeiras JB, Souza EP và cộng sự phức hợp nhị phân của uropepsin
(2006) Cấu trúc tinh thể của lectin từ và pepstatin. Biochem Biophys Res Comm-mun
Canavalia maritima (ConM) ở dạng phức hợp 287:277–281
với trehalose và maltose cho thấy có liên quan
113. Salmaso V, Moro S (2018) Kết nối sự gắn kết phân
đột biến ở lectin giống ConA. Cấu trúc sinh học J tử với động lực học phân tử trong quá trình khám
154:280–286
phá quá trình nhận biết phối tử-protein: một
109. Ra'dis-Baptista G, Moreno FB, de Lima Tổng quan. Mặt trận Pharmacol 9:923

Nogueira L, Martins AM, de Oliveira TD, 114. Kontoyianni M, Lacy B (2018) Hướng tới
Toyama MH và cộng sự (2006) Crotacetin, một cuốn tiểu thuyết sự hiểu biết tính toán của phân tử
Nọc độc rắn tương đồng lectin loại C của con-vulxin, thể sự công nhận trong quá trình chuyển hóa cyto-chrome
hiện khả năng kháng vi khuẩn không thể đoán trước Sinh P450 của con người. Curr Med Chem
lý sinh hóa
hoạt
tế bào 25:3353–3373
động. 44:412–423
Machine Translated by Google

Chương 4

SANDReS: Công cụ tính toán để lắp ghép

Gabriela Bitencourt-Ferreira và Walter Filgueira de Azevedo Jr.

trừu tượng

Kể từ đầu những năm 1980, chúng tôi đã chứng kiến sự tiến bộ đáng kể trong việc phát triển và ứng dụng
các chương trình lắp ghép để đánh giá các tương tác phối tử protein. Hầu hết các ứng dụng này đều có
mục tiêu là xác định các chất kết dính mới tiềm năng với mục tiêu protein. Một tiến bộ đáng chú ý khác
đang diễn ra trong việc xác định cấu trúc của phức hợp phối tử protein, chủ yếu sử dụng phương pháp
tinh thể nhiễu xạ tia X. Xem xét những phát triển này, chúng tôi có một kịch bản thuận lợi cho việc tạo
ra một công cụ tính toán tích hợp vào một quy trình công việc tất cả các bước liên quan đến mô phỏng lắp
ghép phân tử. Chúng tôi đã nghĩ đến những mục tiêu này khi phát triển chương trình SANDReS. Chương trình
này cho phép tích hợp tất cả các tính năng tính toán liên quan đến nghiên cứu lắp ghép hiện đại vào một
quy trình làm việc. SAnDReS không chỉ thực hiện mô phỏng lắp ghép mà còn đánh giá một số giao thức lắp
ghép cho phép lựa chọn phương pháp tiếp cận tốt nhất cho hệ thống protein nhất định. SAnDReS là môi
trường tính toán miễn phí và mã nguồn mở (Giấy phép Công cộng GNU) để chạy mô phỏng lắp ghép. Ở đây,
chúng tôi mô tả sự kết hợp giữa SAnDReS và AutoDock4 để mô phỏng việc ghép nối phối tử protein. AutoDock4
là một chương trình miễn phí đã được áp dụng cho hơn một nghìn mô phỏng lắp ghép phối tử-thụ thể. Tập
dữ liệu được mô tả trong chương này có sẵn để tải xuống tại https://github.com/azevedolab/sandres

Từ khóa SANDReS, AutoDock4, Docking, Liên kết ái lực, Thiết kế thuốc, Nhận dạng phân tử

1. Giới thiệu

Kể từ giữa những năm 1980 và đầu những năm 1990, nhiều nhóm nghiên cứu
đã báo cáo thành công các nghiên cứu thiết kế thuốc dựa trên cấu trúc [1–
3]. Những nghiên cứu tiên phong này đã sử dụng cấu trúc đồ họa tinh thể
nhiễu xạ tia X của các phức hợp liên quan đến mục tiêu protein và một
phân tử hữu cơ nhỏ liên kết với nó. Việc phân tích thông tin thực nghiệm
này cho phép các nhà nghiên cứu xác định cơ sở cấu trúc của các tương
tác phối tử-protein. Khi sức mạnh tính toán tăng lên, việc thực hiện
phân tích các loại thuốc mới tiềm năng có mục tiêu là protein thông qua
phương pháp silico cũng khả thi. Trong số các công cụ tính toán được
sử dụng để giải quyết vấn đề thiết kế và phát triển thuốc, mô phỏng việc
lắp ghép phối tử protein-protein là một trong những phương pháp được
sử dụng nhiều nhất. Trong kỹ thuật này, chúng tôi mô phỏng sự liên kết
của một phân tử nhỏ với vị trí liên kết của cấu trúc protein.

Walter Filgueira de Azevedo Jr. (ed.), Màn hình lắp ghép để khám phá thuốc, Phương pháp sinh học phân tử, tập. 2053,
https://doi.org/10.1007/978-1-4939-9752-7_4, © Springer Science+Business Media, LLC, một phần của Springer Nature 2019

51
Machine Translated by Google

52 Gabriela Bitencourt-Ferreira và Walter Filgueira de Azevedo Jr.

Sự phát triển của phương pháp lắp ghép phối tử protein bắt đầu vào đầu những

năm 1980 [4]. Sau khi có sẵn các công cụ tính toán, kỹ thuật in silico đã được áp

dụng thành công để phát triển nhiều loại thuốc được phê duyệt bao gồm thuốc ức chế

protease HIV-1 [5–10]. Nói chung, chúng ta có thể nói rằng việc thiết kế thuốc đã

tiến bộ đáng kể từ việc sử dụng các phương pháp tiếp cận silico, ngày nay là phương

pháp tiếp cận đầu tiên trong khám phá thuốc [11, 12].

Hơn nữa, ứng dụng mô phỏng lắp ghép có thể xác định các chất kết dính với

nhiều mục tiêu protein [13–23]. Song song với sự phát triển của công nghệ lắp ghép,

chúng ta cũng chứng kiến sự bùng nổ về số lượng phức hợp protein có sẵn trong Ngân

hàng Dữ liệu Protein [24–26]. Hơn nữa, sự sẵn có của thông tin thực nghiệm về hằng

số ức chế (Ki), hằng số phân ly (Kd), nồng độ ức chế tối đa một nửa (IC50) và năng

lượng liên kết tự do Gibbs (ΔG) cung cấp một khung vững chắc về dữ liệu ái lực liên

kết và cấu trúc cho phép chúng ta để nghiên cứu cơ sở cấu trúc của sự ức chế enzym.

Dữ liệu ái lực liên kết thử nghiệm có sẵn tại MOAD [27], BindingDB [28] và PDBbind

[29].

Kịch bản thuận lợi này đã tạo điều kiện cho sự phát triển của chương trình

SAnDReS [30], chương trình cung cấp môi trường tính toán tích hợp để thực hiện mô

phỏng lắp ghép.

SAnDReS là từ viết tắt của Phân tích thống kê về kết quả lắp ghép và chức năng tính

điểm và áp dụng một cách tiếp cận khác đối với các nghiên cứu lắp ghép phân tử; nó

tập trung vào việc mô phỏng một hệ thống bao gồm một tập hợp các cấu trúc tinh thể

có sẵn dữ liệu về ái lực liên kết phối tử. Ở đây, chúng tôi đặt tên cho tập hợp các

cấu trúc tinh thể với dữ liệu ái lực liên kết này là một hệ thống sinh học. SAnDReS

cũng là một công cụ để phân tích thống kê các mô phỏng lắp ghép và đánh giá hiệu

suất dự đoán của các mô hình tính toán được phát triển để tính toán ái lực liên kết

[30]. SAnDReS được phát triển bằng Python 3, sử dụng các thư viện SciPy, NumPy,

scikit-learn [31] và Matplotlib. Trong chương này, chúng tôi tập trung vào việc sử

dụng kết hợp SANDReS-AutoDock4 để mô phỏng việc lắp ghép. AutoDock là một chương

trình gắn kết phối tử protein mạnh mẽ [32–35]. Có 1160 nghiên cứu về ứng dụng
AutoDock vào mô phỏng lắp ghép (tìm kiếm được thực hiện vào ngày 26 tháng 10 năm

2018, sử dụng từ khóa “autodock” trong PubMed).

Việc tích hợp AutoDock4 trong chương trình SAnDReS giúp thực hiện mô phỏng

lắp ghép trong một công cụ tính toán nhanh chóng và tinh tế. Chúng tôi đã sử dụng

thành công SAnDReS để nghiên cứu yếu tố đông máu Xa [30], kinase phụ thuộc cyclin

[36, 37], protease HIV-1 [38], thụ thể estrogen [39], thụ thể cannabi-noid 1 [40]

và 3- dehydroquinate dehydratase [41]. Ngoài ra, chúng tôi đã sử dụng SAnDReS để

phát triển mô hình học máy nhằm dự đoán năng lượng liên kết tự do Gibbs cho các

phức hợp protein-li-gand [42]. Trong các phần sau, chúng tôi mô tả ứng dụng SAnDReS

cho một tập hợp các thiết bị phụ thuộc cyclin


Machine Translated by Google

SANDReS: Công cụ tính toán để lắp ghép 53

kinase và nêu bật các công cụ tích hợp chính có sẵn để mô phỏng lắp ghép
và phân tích hiệu suất dự đoán của công cụ này trong phương pháp silico.

2 Bộ dữ liệu

Để giải thích cách áp dụng việc sử dụng kết hợp SAnDReS-Auto-Dock4 cho mô phỏng

lắp ghép, chúng tôi đã chọn một tập dữ liệu bao gồm kinase 2 phụ thuộc cyclin (CDK2)

có sẵn dữ liệu IC50 . Chúng tôi đã xem xét ở đây một tập dữ liệu với 89 cấu trúc
CDK đã được giải quyết. Tập dữ liệu này sẽ

ở độ phân giải tinh thể cao hơn 2,0 A˚ được gọi là bộ .

dữ liệu HR-CDK2-IC50 (cấu trúc CDK2 có độ phân giải cao với dữ liệu IC50 ).
Trước đây chúng tôi đã mô tả ứng dụng SANDReS cho tập dữ liệu lớn hơn bao
gồm 170 cấu trúc [37]. Bảng 1 hiển thị mã truy cập PDB cho tất cả các cấu
trúc trong tập dữ liệu. Enzyme này đã được nghiên cứu như một mục tiêu
protein, chủ yếu là do vai trò của nó trong việc kiểm soát sự phát triển
của chu kỳ tế bào và khả năng sử dụng các chất ức chế CDK làm thuốc chống
ung thư [43, 44]. Để biết các đánh giá gần đây, xem de Azevedo 2016 [45]
và Levin et al. 2016 [46]. Tất cả các chất ức chế trong bộ dữ liệu HR-CDK2-
IC50 đều được liên kết với túi liên kết ATP của CDK2.

3 Cài đặt SANDReS trên Windows

SANDReS là chương trình mã nguồn mở và miễn phí (Giấy phép Công cộng GNU).
Bạn có thể tải xuống mã SAnDReS từ GitHub (https://github.com/azevedolab/
sandres). Bạn cần cài đặt Python 3 trên máy tính để chạy SANDReS. Ngoài
ra, bạn cần cài đặt NumPy, Matplotlib, scikit-learn và SciPy. Bạn có thể
làm cho quá trình cài đặt dễ tiếp cận hơn bằng cách cài đặt Ana-conda. Để
cài đặt SANDReS chúng ta thực hiện theo các bước sau:

1. Cài đặt Anaconda 32 bit (https://www.anaconda.com/down


trọng tải/).

2. Tải xuống SAnDReS 1.1.0 từ GitHub (https://github.com/azevedolab/


sandres ).

3. Giải nén file nén (sandres.zip).

4. Sao chép thư mục sandres vào c:\.

5. Mở cửa sổ nhắc lệnh và gõ: cd c:\sandres rồi gõ: python


sandres1_GUI.py

Trong Hình 1, chúng ta có giao diện GUI chính SANDReS. Từ giao diện
này, chúng ta có thể dễ dàng thiết lập tất cả các tệp cần thiết để chạy
mô phỏng protein-li-gand.
Machine Translated by Google

54 Gabriela Bitencourt-Ferreira và Walter Filgueira de Azevedo Jr.

Bảng 1

Mã truy cập PDB cho tất cả các cấu trúc trong bộ dữ liệu HR-CDK2-IC50

Mã truy cập PDB Nhận dạng protein

1H00, 1H01, 1H07, 1JVP, 1OIR, 1OIT, 1PXI, 1URW, Kinase phụ thuộc cyclin của con người 2
1YKR, 2A0C, 2B52, 2B54, 2B55, 2BHE, 2BTR, 2BTS,
2C68, 2C6I, 2C6K, 2C6M, 2CLX, 2R3F, 2R3G, 2R3H,
2R3J, 2R3K, 2R3L, 2R3M, 2R3N, 2R3O, 2R3P, 2VTH,
2VTQ, 2VTR, 2VTS, 2VTT, 2VU3, 2VV9, 2 W05, 3EZR,
3EZV, 3FZ1, 3IG7, 3IGG, 3NS9, 3PJ8, 3PXZ, 3PY0,
3QQK, 3QTQ, 3QTR, 3QTS, 3QTU, 3QTW, 3QTX,
3QU0, 3R8V, 3R8Z, 3R9D, 3R9N, 3R9O, 3RAH, 3RAL,
3RJC, 3RK7, 3RK9, 3RMF, 3RNI, 3RPR, 3RPV, 3RPY,
3RZB, 3S00, 3S1H, 3SQQ, 3TI1, 3TIY, 3UNJ, 4BGH,
4FKI, 4NJ3, 4RJ3, 5D1J, 2R3I, 2R3R, 4FKL, 4GCJ

1V0O Protein kiểm soát sự phân chia tế bào 2


tương đồng từ Plasmodium falciparum

3DDQ Kinase 2 phụ thuộc cyclin của con


người phức tạp với cyclin A

Hình 1 Giao diện GUI SANDReS. Ở đây chúng tôi mô tả các nút chính được sử dụng để thực hiện mô phỏng lắp
ghép bằng SANDReS. Để mô phỏng lắp ghép bằng SAnDReS, người dùng phải dán mã truy cập PDB cho các cấu
trúc tinh thể bằng nút Tải xuống (Tải xuống! Nhập mã truy cập PDB). Sau đó người dùng tải xuống các cấu
trúc (Download!Structures). Sau khi tải xuống các cấu trúc, chúng tôi tải xuống dữ liệu mối quan hệ ràng
buộc (Tải xuống! Mối quan hệ ràng buộc). Trong bước tiếp theo, chúng tôi lọc tập dữ liệu bằng nút Pre-
Docking. Cuối cùng, chúng tôi sử dụng Docking Hub để thực hiện mô phỏng lắp ghép. Chúng tôi sử dụng nút
Ensemble Docking để đánh giá hiệu suất lắp ghép
Machine Translated by Google

SANDReS: Công cụ tính toán để lắp ghép 55

4 Tổng quan về việc sử dụng SANDReS-AutoDock4 để gắn đế

Mục tiêu của chúng tôi khi phát triển SAnDReS là có một công cụ tích hợp để mô phỏng

việc lắp ghép và phát triển các mô hình học máy để dự đoán mối quan hệ ràng buộc. Ở đây

chúng tôi tập trung vào các công cụ gắn đế của SANDReS. Chúng tôi có thể nói rằng có

hàng nghìn cách tiếp cận [47] đối với mô phỏng lắp ghép phối tử protein, nhưng nếu chúng

tôi xem xét việc lựa chọn hệ thống phân tử sinh học, mô phỏng lắp ghép phối tử protein

và các phương pháp xác nhận, thì tất cả chúng đều có chung một khuôn khổ được mô tả

dưới đây, độc lập với các chương trình được sử dụng trong mô phỏng lắp ghép phối tử

protein. Cốt lõi chung này được tìm thấy trên tất cả các chương trình lắp ghép đã được

khám phá trong quá trình phát triển SANDReS.

Chúng tôi đã thiết kế SANDReS để xử lý các tệp PDB của cấu trúc tinh thể. Người ta

đã quyết định tập trung vào thông tin tinh thể học vì phần lớn thông tin cấu trúc có sẵn

cho các phức hợp phối tử protein có các chi tiết liên kết thực nghiệm đến từ kỹ thuật

tinh thể học tia X [48]. SAnDReS được thiết kế để phân tích dữ liệu từ bất kỳ chương

trình lắp ghép phối tử protein nào; điều kiện tiên quyết duy nhất là phải có cấu trúc

pro-tein ở định dạng Ngân hàng Dữ liệu Protein (PDB), phối tử ở Định dạng Dữ liệu Cấu

trúc (SDF), dữ liệu chức năng ghép nối và tính điểm ở định dạng giá trị được phân tách

bằng dấu phẩy (CSV). Hình 2 minh họa tất cả các bước cần thiết để thực hiện mô phỏng lắp

ghép phân tử của một hệ thống sinh học bằng cách sử dụng kết hợp các chương trình

SAnDReS-AutoDock4.

Chúng tôi coi như một hệ thống sinh học là một tập hợp các cấu trúc có sẵn dữ liệu

về ái lực liên kết phối tử. Trong ví dụ của chúng tôi, bộ dữ liệu HR-CDK2-IC50 . Trong

sơ đồ, bước đầu tiên là tải xuống các hệ thống sinh học (tệp PDB và CSV). Trong phần

sau, SANDReS lọc tập dữ liệu, trong một bước được đặt tên ở đây là trước khi lắp ghép.

Dữ liệu đã lọc được gửi đến mô phỏng lắp ghép. Phiên bản hiện tại của SAnDReS tự động

tạo ra các đầu vào cần thiết để chạy AutoDock4 ngoại trừ việc chuyển đổi từ PDB sang

định dạng PDBQT. Chúng tôi đã sử dụng AutoDockTools4 [49–51] để thực hiện chuyển đổi

này. Người dùng phải chuyển đổi tệp PDB sang định dạng PDBQT trước khi chạy AutoDock4.

Phần còn lại của quá trình chạy AutoDock4 hoàn toàn tự động thông qua SANDReS. Trong

bước tiếp theo, SANDReS tiến hành lắp ghép chạy AutoDock4; giai đoạn này được đặt tên

là trung tâm lắp ghép. Các kết quả lắp ghép được gửi đến phân tích thống kê để đánh giá

hiệu suất lắp ghép của các giao thức khác nhau.

4.1 Tải xuống hệ Khi chúng tôi đã chọn mã truy cập PDB bao gồm tập dữ liệu, chúng tôi chèn các mã được

thống sinh học phân tách bằng dấu phẩy và SAnDReS tiến hành tải xuống các cấu trúc và dữ liệu mối quan

hệ ràng buộc từ PDB.


Machine Translated by Google

56 Gabriela Bitencourt-Ferreira và Walter Filgueira de Azevedo Jr.

Hình 2 Mô phỏng lắp ghép phối tử protein với SANDReS. Sơ đồ này mô tả tất cả các bước cần thiết để thực hiện

mô phỏng lắp ghép với sự kết hợp của SAnDReS–AutoDock4

4.2 Lắp ráp trước Trong giai đoạn tiền lắp ghép, chúng tôi dự định chuẩn bị PDB và CSV

các tập tin để mô phỏng lắp ghép. Đầu tiên, SANDReS kiểm tra tính toàn vẹn của

dữ liệu cấu trúc và ràng buộc. Mặc dù PDB đã được

đang thực hiện rất tốt việc tích hợp dữ liệu về cấu trúc và mối quan hệ ràng buộc,

tìm kiếm được thực hiện bằng tùy chọn công cụ nâng cao có thể trả về

Mã truy cập PDB không có sẵn dữ liệu về mối quan hệ ràng buộc.

SANDReS kiểm tra xem thông tin ràng buộc có sẵn không

cho tất cả các cấu trúc trong tập dữ liệu hay không. Cũng có thể lọc ra

tập dữ liệu và loại bỏ các phối tử lặp lại. Khi làm như vậy, chúng tôi mong đợi

để có một tập dữ liệu không có phối tử lặp lại, điều này giúp cải thiện

tính đa dạng hóa học của tập dữ liệu. Cũng có thể đánh giá các

chất lượng tổng thể của thông tin tinh thể học trong tập dữ liệu của chúng tôi.

Hơn nữa, SAnDReS có thể phân tích các tương tác phối tử protein để xác định

tất cả các cấu trúc trong tập dữ liệu. Hình 3 cho thấy số lượng tiếp xúc giữa

các phân tử trên mỗi dư lượng sử dụng khoảng cách cắt là 4,5 A˚. .

axit amin tiếp xúc trên cùng là Leu-83, một điểm tương tác được xác định trong
nhánh phân tử của cấu trúc CDK [52–59].

4.3 Trung tâm lắp ghép SANDReS cho phép chạy AutoDock4, AutoDock Vina và Mole-gro Virtual Docker (MVD).

Giao diện này tạo điều kiện cho việc chạy kết nối giúp giảm tổng thời gian phân

tích vì SANDReS

tạo tất cả các tệp đầu vào cần thiết để chạy đề cập trước đó

chương trình lắp ghép. Ở đây chúng tôi đã thực hiện mô phỏng lắp ghép bằng cách sử dụng

AutoDock4 thông qua giao diện trung tâm lắp ghép của SANDReS.

Chúng tôi có thể chọn trong số tất cả các giao thức có sẵn của AutoDock4.

Hình 4 hiển thị giao diện thiết lập đế cắm, nơi người dùng có thể
Machine Translated by Google

SANDReS: Công cụ tính toán để lắp ghép 57

Hình 3 Tương tác phối tử protein-protein cho tất cả các cấu trúc trong bộ dữ liệu HR-CDK2-IC50

đặt các tùy chọn lắp ghép khác nhau. Ví dụ: chúng tôi có thể chạy mô phỏng lắp ghép

bằng bốn thuật toán tìm kiếm: thuật toán di truyền Lamarckian (LGA), thuật toán di

truyền (GA), tìm kiếm cục bộ (LS) và ủ mô phỏng (SA). SAnDReS cũng có thể tính toán

các giá trị hàm tính điểm AutoDock cho vị trí tinh thể của phối tử bằng cách sử

dụng tùy chọn năng lượng của cấu trúc PDB (EPDB).

Tóm lại, để chạy AutoDock4 bằng SAnDReS chúng ta click vào chuỗi: AutoGrid!Set

up DPF. Cửa sổ thiết lập DPF (tệp tham số gắn đế) tạo ra các tệp đầu vào cần thiết

để chạy AutoDock4. Chúng ta phải chọn giao thức gắn đế trong menu Setup DPF và sau

đó nhấp vào nút Save DPF. Để chạy AutoDock4, chúng ta nhấp vào chuỗi: AutoDock!

Analysis.

Sau khi hoàn tất mô phỏng lắp ghép, SAnDReS có thể hợp nhất tất cả các tệp đầu ra

vào một tệp mang lại kết quả lắp ghép hoặc năng lượng của vị trí tinh thể của phối

tử cho tất cả các cấu trúc trong tập dữ liệu.

4.4 Lắp ghép bộ Trong bước này, chúng tôi có thể đánh giá hiệu suất lắp ghép. SAnDReS điều tra hai

đồng phục tính năng quan trọng của mô phỏng lắp ghép: RMSD lắp ghép và độ chính xác của việc

lắp ghép. SAnDReS trước đây đã đánh giá độ lệch bình phương trung bình gốc của việc

lắp ghép cho mọi cấu trúc trong tập dữ liệu. Chúng tôi tính toán RMSD lắp ghép như

sau:
Machine Translated by Google

58 Gabriela Bitencourt-Ferreira và Walter Filgueira de Azevedo Jr.

Hình 4 Docking-setup, giao diện của SANDReS


ffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiff

N
2 2 2
P ½ðxx,i xp,iÞ þ ðyx,i yp,iÞ þ ðzx,i zp,iÞ
RMSD ¼ tôi¼1
ð1Þ
vuuut
N

trong đó xx, yx và zx là tọa độ thử nghiệm cho phối tử và xp,


yp và zp là tọa độ nguyên tử cho vị trí được tạo ra bởi mô
phỏng lắp ghép.
Sau đó SANDReS cũng tính toán độ chính xác lắp ghép (DA). Các
phương trình dưới đây xác định độ chính xác lắp ghép (DA) như sau:
Machine Translated by Google

SANDReS: Công cụ tính toán để lắp ghép 59

DA ¼ f l 0:5 f l f h ð2Þ

trong đó fl là tỷ lệ các tư thế mà RMSD lắp ghép ít hơn


hơn l và fh là tỷ lệ các tư thế mà RMSD lắp ghép được thực hiện
nhỏ hơn h, trong đó l < h [60, 61]. SAnDReS tính toán hai hệ
số tương quan là hệ số tương quan bình phương (R2 ) và hệ số
tương quan xếp hạng Spear-man (ρ). Chúng tôi xác định R2 bởi
phương trình sau:

RSS
R2 ¼ 1 ð3Þ
TSS

Chúng tôi tính toán tổng bình phương dư (RSS) và


tổng bình phương (TSS) như sau:
N 2
RSS ¼ X yi ycalc, tôi ð4Þ
tôi¼1

N
2
TSS ¼ X ừ chào tôi ð5Þ
tôi¼1

trong đó ycalc,i là các giá trị thu được bằng cách đưa các biến
độc lập vào phương trình hồi quy thu được bằng cách sử dụng giám sát
kỹ thuật học máy có sẵn trong thư viện scikit-learn
[31]. Các biến yi là các quan sát thực nghiệm, vì
Ví dụ, log(IC50), hyi là giá trị trung bình của y và N là số
của các quan sát. Chúng tôi xác định hệ số tương quan xếp hạng
của Spearman (ρ) bằng biểu thức sau:
N
6P d2 Tôi

tôi¼1

ρ ¼ 1 2 ð6Þ
NN 1

Trong phương trình trên, số hạng di chỉ ra sự khác biệt về


thứ hạng cho một quan sát nhất định [31].
Phân tích thống kê hiệu suất lắp ghép của AutoDock4
chạy LGA cho tất cả các cấu trúc trong bộ dữ liệu HR-CDK2-IC50
chỉ ra rằng hệ số tương quan xếp hạng của Spearman dao động từ
0,139 đến 0,245 giữa RMSD lắp ghép và điểm ghi điểm
các giá trị hàm. Phân tích DA cho thấy tỷ lệ phần trăm là 88,764.
Gần 90% bộ dữ liệu HR-CDK2-IC50 hiển thị RMSD gắn đế
dưới 2,0 A˚ , điều này cho thấy rõ ràng rằng AutoDock4 là đủ
để phân tích các tương tác phối tử CDK2.
Machine Translated by Google

60 Gabriela Bitencourt-Ferreira và Walter Filgueira de Azevedo Jr.

5 Sẵn có

Chương trình SAnDReS được triển khai bằng Python 3 và có sẵn để tải
xuống theo giấy phép GNU (Giấy phép Công cộng Chung) tại https://
github.com/azevedolab/sandres.

6 Colophon

Chúng tôi đã sử dụng chương trình SANDReS để tạo Hình. 1, 3 và 4.


Chúng tôi đã tạo Hình 2 bằng Microsoft PowerPoint 2016. Chúng tôi đã
thực hiện các mô phỏng lắp ghép phối tử protein được báo cáo trong
chương này bằng cách sử dụng Máy tính để bàn có bộ nhớ 4GB, ổ cứng 1 TB
và Intel® Core® i3-2120 @ 3.30 Bộ xử lý GHz đang chạy
Windows 8.1.

7 nhận xét cuối cùng

SANDReS cho phép mô phỏng lắp ghép nhanh chóng, tích hợp và đáng tin cậy.
Sự phát triển của nó nhằm mục đích cung cấp một công cụ tính toán tích
hợp để thực hiện mô phỏng lắp ghép, phân tích các mô phỏng này và tạo ra
các mô hình học máy để dự đoán mối quan hệ ràng buộc. Trong chương này,
chúng tôi đã mô tả ứng dụng SANDReS để mô phỏng việc lắp ghép phối tử
protein-protein. Một trong những khái niệm cơ bản đằng sau SANDReS là
hệ thống sinh học [30, 38, 62–74]. SAnDReS tìm cách thực hiện việc lắp
ghép cho một tập hợp các cấu trúc tinh thể có sẵn dữ liệu về ái lực ràng
buộc. Ở đây chúng tôi gọi một tập hợp các cấu trúc tinh thể cùng với dữ
liệu ái lực liên kết là một hệ thống sinh học. Với phương pháp này,
SANDReS phù hợp cho các hệ thống sinh học có ít nhất 30 cấu trúc tinh
thể.

Để chứng minh khái niệm, chúng tôi đã nghiên cứu hệ thống sinh học
CDK2 bằng cách sử dụng một tập hợp các cấu trúc bao gồm 89 mục (Bảng 1).
Ứng dụng AutoDock4 thông qua giao diện SAnDReS có thể tạo ra kết quả với
độ chính xác lắp ghép gần 90%. Ngoài ra, giao diện tích hợp của SAnDReS
cho phép chúng tôi thực hiện mô phỏng lắp ghép phân tử một cách hiệu quả
mà không cần chỉnh sửa các tệp đầu vào cần thiết để chạy AutoDock4. Tóm
lại, SAnDReS là một công cụ tích hợp tạo điều kiện thuận lợi cho việc mô
phỏng phối tử protein và kết hợp cách tiếp cận hệ thống để phân tích các
mô phỏng lắp ghép giúp tăng thêm tính linh hoạt và tăng độ tin cậy của
mô phỏng lắp ghép. Sự phát triển của chương trình SAnDReS là kết quả
trực tiếp của các nghiên cứu kết hợp về cấu trúc và tính toán của chúng
tôi về tương tác phối tử protein [75–114]. Chúng ta có thể sử dụng
SAnDReS để nghiên cứu bất kỳ hệ thống phối tử thụ thể nào; điều kiện duy
nhất là khả năng sẵn có của cấu trúc tinh thể và thông tin liên kết
phối tử.
Machine Translated by Google

SANDReS: Công cụ tính toán để lắp ghép 61

Sự nhìn nhận

Công việc này được hỗ trợ bởi các khoản tài trợ từ CNPq (Brazil)
(308883/ 2014-4). Nghiên cứu này được tài trợ một phần bởi
Coordenac¸a˜o de Aperfeic¸oamento de Pessoal de Nivel Superior—
Brasil (CAPES)— Mã Tài chính 001. GB-F thừa nhận sự hỗ trợ từ
học bổng PUCRS/ BPA. WFA là nhà nghiên cứu cao cấp của CNPq (Brazil)
(Số quy trình: 308883/2014-4 và 309029/2018-0).

Người giới thiệu

1. Roberts NA, Martin JA, Kinchington D, Broadhurst AV, chất ức chế protease HIV-1 mới, không peptide bằng cách
Craig JC, Duncan IB và cộng sự (1990) Thiết kế hợp lý các tìm kiếm dược điển. J Med Chem 39:2047–2054
chất ức chế dựa trên peptide.
HIV proteinase 248:358– Khoa học
11. Muegge I, Bergner A, Kriegl JM (2017)
361
Thiết kế thuốc có sự hỗ trợ của máy tính tại Boehringer
2. Erickson J, Neidhart DJ, VanDrie J, Kempf DJ, Wang XC, ingelheim. J Comput Aided Mol Des 31:275–285 12. Hillisch
Norbeck DW và cộng sự (1990) A, Heinrich N,

Thiết kế, hoạt động và 2.8 cấu trúc tinh thể của chất ức Wild H (2015)
chế đối xứng C2 tạo phức với protease HIV-1. Khoa học Hóa học tính toán trong ngành dược phẩm: từ thời thơ ấu
249:527–533 3. Dorsey BD, Levin RB, McDaniel SL, đến tuổi thiếu niên.
Vacca JP, Guare JP, Darke PL và cộng sự (1994) Chem Med Chem 10:1958–1962 13. Kuntz ID

(1992) Các chiến lược dựa trên cấu trúc để thiết kế và khám
L-735,524: thiết kế một chất ức chế protease HIV mạnh và phá thuốc. Khoa học 257:1078–1082
khả dụng sinh học qua đường uống. J Med Chem 37:3443–3451

14. Shoichet BK, Stroud RM, Santi DV, Kuntz ID, Perry KM
4. Kuntz ID, Blaney JM, Oatley SJ, Langridge R, Ferrin TE (1993) Khám phá dựa trên cấu trúc của các chất ức chế
(1982) Một cách tiếp cận hình học đối với các tương tác thymidylate synthase. Khoa học 259:1445–1450
giữa đại phân tử-phối tử. J Mol Biol 161:269–288

15. Rutenber E, Fauman EB, Keenan RJ, Fong S, Furth PS, Ortiz
5. DesJarlais RL, Dixon JS (1994) Phương pháp lắp ghép dựa de Montellano PR và cộng sự (1993) Cấu trúc của chất ức
trên hình dạng và hóa học cũng như việc sử dụng nó trong chế không peptide được tạo phức với protease HIV-1. Phát
thiết kế các chất ức chế protease HIV-1. J Comput Aided triển một chu trình thiết kế thuốc dựa trên cấu trúc. J
Mol Des 8:231–242 6. Lunney EA, Hagen SE, Biol Chem 268:15343–15346
Domagala JM, Humblet C, Kosinski J, Tait BD và cộng sự (1994)

16. Zheng Q, Kyle DJ (1996) Sàng lọc tính toán các thư viện
Một chất ức chế protease HIV-1 nonpeptide mới: làm sáng tổ hợp. Bioorg Med Chem 4:631–638
tỏ chế độ liên kết và ứng dụng của nó trong thiết kế các
chất tương tự liên quan. J Med Chem 37:2664–2677 7.
17. Gschwend DA, AC tốt, Kuntz ID (1996)
Vaillancourt M, Cohen E,
Lắp ghép phân tử hướng tới khám phá thuốc. J Mol Công
Sauve' G (1995) nhận 9:175–186
Đặc điểm của các chất ức chế trạng thái động của protease
18. Finn PW (1996) Sàng lọc cơ sở dữ liệu phức hợp dựa trên máy
HIV-1. J Enzym Inhib 9:217–233 8. Gehlhaar DK, Verkhivker
tính để xác định các đầu mối mới. Drug Discov Today 1:363–
GM, Rejto PA, Sherman CJ, Fogel DB, Fogel LJ et al (1995) 370 19. Horvath D (1997) Một phương pháp sàng lọc ảo được
Nhận biết phân tử chất ức chế AG-1343 bằng protease HIV-1:
áp dụng để tìm kiếm chất ức chế trypa-nothione reductase. J Med
linh hoạt về hình dạng lắp ghép bằng chương trình tiến
Chem 40:2412–2423
hóa. Chem Biol 2:317–324 9. King BL, Vajda S, DeLisi C

(1996) Năng lượng tự do theo kinh nghiệm như một chức

năng mục tiêu trong lắp ghép và thiết


20. Toyoda T, Brobey RKB, Sano G, Horii T, Tomioka N, Itai A
kế: ứng dụng cho chất ức chế protease HIV-1. THÁNG 2 Lett
(1997) Dẫn đầu phát hiện ra các chất ức chế miền
384:87–91
dihydrofolate reductase của Plasmodium Falciparum dihydro-
folate reductase-thymidylate synthase. Bio-chem Biophys
Res Commun 235:515–519
10. Wang S, Milne GW, Yan X, Posey IJ, Nicklaus MC, Graham L
và cộng sự (1996) Khám phá về
Machine Translated by Google

62 Gabriela Bitencourt-Ferreira và Walter Filgueira de Azevedo Jr.

21. Olson AJ, Goodsell DS (1998) Lắp ghép tự động các ứng dụng của AutoDock 2.4. J Comput Aided
và tìm kiếm chất ức chế protease HIV. SAR QSAR Mol Des 10:293–304 35. Morris
Môi trường Res 8:273–285 22. Walters WP, GM, Goodsell DS, Halliday RS, Huey R, Hart WE,
Stahl MT, Murcko MA (1998) Belew RK và cộng sự (1998)
Sàng lọc ảo—tổng quan. Drug Discov Today 3:160– Việc lắp ghép tự động sử dụng thuật toán di truyền
178 23. Toney JH, Lamarckian và chức năng năng lượng tự do liên kết theo

Fitzgerald PMD, Groversharma N, Olson SH, May WJ, kinh nghiệm. J Comput Chem 19:1639–1662

Sundelof JG và cộng sự (1998)


Nhạy cảm với kháng sinh sử dụng biphenyl Tetra-zoles 36. de A' vila MB, Xavier MM, Pintro VO, de Aze-
làm chất ức chế mạnh Bacteroides fragi-lis Metallo- vedo WF (2017) Các kỹ thuật học máy có giám
BetaLactamase. Chem Biol 5:185–196 24. Berman HM, sát để dự đoán mối quan hệ ràng buộc. Một
Westbrook J, nghiên cứu về kinase phụ thuộc cyclin 2.
Feng Z, Gilliland G, Bhat TN, Weissig H và cộng sự (2000) Biochem Bio-phys Res Commun 494:305–
310 37. Levin NMB, Pintro VO, Bitencourt-Ferreira-
Ngân hàng dữ liệu protein Axit nucleic Res G, Mattos BB, Silve'rio AC, de Azevedo Jr WF
28:235–242 (2018) Phát triển của các chức năng tính điểm
25. Berman HM, Battistuz T, Bhat TN, Bluhm WF, nhắm mục tiêu CDK để dự đoán mối quan hệ ràng
Bourne PE, Burkhardt K và cộng sự (2002) buộc. Biophys Chem 235:1–8
Ngân hàng dữ liệu protein Acta Crystallogr D Biol 38. Pintro VO, Azevedo WF (2017) Tối ưu hóa quy
Crystallogr 58:899–907 26. Westbrook trình sàng lọc ảo. Hướng tới chức năng tính
J, Feng Z, Chen L, Yang H, Ber-man HM (2003) Ngân hàng dữ điểm đa thức dựa trên mục tiêu cho protease
liệu protein và bộ gen cấu trúc. Axit nucleic Res 31:489– HIV-1. Màn hình thông lượng cao Comb Chem
491 20:820–827 39. Amaral MEA, Nery
LR, Leite CE, de Azevedo Junior WF, Campos MM
27. Hu L, Benson ML, Smith RD, Lerner MG, Carlson HA (2005) (2018) Tác dụng tiền lâm sàng của metformin và
Binding MOAD (mẹ của tất cả các cơ sở dữ liệu). Protein aspirin trên các dòng tế bào của các phân nhóm
60:333–340 28. Liu T, Lin Y, Wen X, Jorrisen ung thư vú khác nhau.
Điều tra các loại thuốc mới 36:782–
RN, Gilson MK (2007) BindingDB: cơ sở dữ liệu có thể truy
cập trên web về ái lực liên kết phối tử protein được 796 40. Russo S, de Azevedo WF (2018) Những tiến
xác định bằng thực nghiệm. Axit nucleic Res 35:198–201 bộ trong hiểu biết về thụ thể cannabinoid 1—
tập trung vào tương tác giữa các chất chủ vận
nghịch đảo. Curr Med Chem. https://doi.org/
10.2174/0929867325666180417165247
29. Wang R, Fang X, Lu Y, Wang S (2004) Cơ sở dữ liệu
PDBbind: tập hợp các ái lực liên kết cho các phức hợp 41. de A' vila MB, de Azevedo WF Jr (2018)
phối tử protein có cấu trúc ba chiều đã biết. J Med Phát triển các mô hình học máy để dự đoán sự ức chế 3-

Chem 47:2977–2980 dehydroquinate dehy-dratase. Chem Biol Drug Des 92:1468–

1474 42. Bitencourt-Ferreira G, de Azevedo Jr WF (2018)

30. Xavier MM, Heck GS, de Avila MB, Levin NM, Phát triển mô hình học máy để dự đoán năng lượng liên kết tự do

Pintro VO, Carvalho NL và cộng sự (2016) Gibbs cho các phức hợp phối tử protein. Hóa lý sinh học

SAnDReS một công cụ tính toán để phân tích 240:63–69

thống kê kết quả lắp ghép và phát triển các


chức năng tính điểm. Màn hình thông lượng cao
Comb Chem 19:801–812 31. Pedregosa 43. Morgan DO (1995) Nguyên tắc điều chỉnh CDK. Thiên
nhiên 374:131–134
F, Varoquaux G, Gramfort A, Michel V, Thirion B,
Grisel O và cộng sự (2011) 44. Murray AW (1994) Kinase phụ thuộc cyclin: bộ
Scikit-learn: học máy trong python. J Mach điều chỉnh chu kỳ tế bào và hơn thế nữa.
Learn Res 12:2825–2830 Hóa sinh 1:191–195

32. Goodsell DS, Olson AJ (1990) Tự động gắn các 45. de Azevedo WF Jr (2016) Bài viết ý kiến: nhắm mục tiêu nhiều

chất nền vào protein bằng cách ủ mô phỏng. kinase phụ thuộc cyclin (CDK): một chiến lược mới cho

Protein 8:195–202 33. Goodsell nghiên cứu lắp ghép phân tử. Mục tiêu thuốc Curr 17:2 46.

DS, Morris GM, Olson AJ (1996) Levin NM, Pintro VO, de A' vila MB, de Mat-

Gắn các phối tử linh hoạt: các ứng dụng của tos BB, De Azevedo WF Jr (2017) Hiểu cơ sở cấu trúc của việc

AutoDock. J Mol Recognit 9:1–5 34. ức chế kinase phụ thuộc cyclin. Những mảnh ghép mới trong

Morris GM, Goodsell DS, Huey R, Olson AJ (1996) câu đố phân tử. Mục tiêu ma túy Curr 18:1104–1111

Phân phối tự động việc ghép nối các phối tử


linh hoạt với protein: song song
Machine Translated by Google

SANDReS: Công cụ tính toán để lắp ghép 63

47. Jaghoori MM, Bleijlevens B, Olabarriaga SD (2016) 1001 cách Kinase phụ thuộc cyclin 2. Thuốc hỗ trợ tính toán Curr
chạy AutoDock Vina để sàng lọc ảo. J Comput Aided Mol Des Des 1:53–64
30:237–249 59. Krystof V, Cankar P, Frysova' I, Slouka J, Kontopidis G,
Dzuba'k P et al (2006) Chất ức chế 4-ary-lazo-3,5-
48. Heck GS, Pintro VO, Pereira RR, de A' vila MB, Levin NMB, diamino-1 H-pyrazole CDK: nghiên cứu SAR , cấu trúc tinh
de Azevedo WF (2017) thể phức tạp với CDK2, tính chọn lọc và hiệu ứng tế bào.
Các phương pháp học máy có giám sát được áp dụng để dự J Med Chem 49:6500–6509 60. Vieth M, Hirst JD, Kolinski
đoán ái lực liên kết với phối tử. Curr Med Chem 24:2459– A, Brooks CL III (1998) Đánh giá
2470
các chức năng năng lượng cho việc lắp ghép linh hoạt. J Comput

49. Morris GM, Huey R, Lindstrom W, Sanner MF, Belew RK, Chem 19:1612–1622 61. Ballante F, Marshall GR (2016) Một
Goodsell DS, Olson AJ (2009) AutoDock4 và AutoDockTools4: chiến lược kết hợp tự động để lựa chọn tư thế ràng
lắp ghép tự động với tính linh hoạt của thụ thể chọn buộc và đánh giá lắp ghép trong thiết kế thuốc dựa trên cấu
lọc. J Comput Chem 30:2785–2791 50. Morris GM, Huey R, trúc. J Chem Inf Model 56:54–72 62. Azevedo LS, Moraes
Olson AJ (2008) Sử dụng AutoDock để ghép nối thụ thể FP, Xavier MM, Pantoja EO, Villavicencio B, Finck JA và
phối tử. Tin sinh học Curr Protoc. Chương 8:đơn vị 8.14 51. cộng sự (2012)
El-Hachem N, Haibe-Kains B, Khalil A, Kobeissy FH, Nemer
G (2017) AutoDock và AutoDockTools để gắn kết phối tử

protein: Enzyme phân tách protein tiền chất amyloid tại vị Tiến trình mô phỏng lắp ghép phân tử gần đây được áp
trí Beta 1 (BACE1) làm trường hợp nghiên cứu điển hình. dụng để phát triển thuốc. Curr Bioinf 7:352–365

63. Heberle' G, de Azevedo WF Jr (2011)


Các thuật toán lấy cảm hứng từ sinh học được áp dụng cho
Phương pháp Mol Biol 1598:391–403 52. Kim
mô phỏng lắp ghép phân tử. Curr Med Chem 18:1339–1352
SH, Schulze-Gahmen U, Brandsen J, de Azevedo Ju'nior WF (1996) 64. Vianna CP, de

Cơ sở cấu trúc của sự ức chế hóa học CDK2. Chu kỳ tế bào Azevedo WF Jr (2012) Xác định các chất ức chế Mycobacteria
Prog Res 2:137–145 53. de Azevedo WF Jr, Mueller-Dieckmann lao shikimate kinase tiềm năng mới thông qua mô phỏng
HJ, Schulze-Gahmen U, lắp ghép phân tử. J Mol Model 18:755–764

Worland PJ, Sausville E, Kim SH (1996) Cơ sở cấu trúc cho


tính đặc hiệu và hiệu lực của chất ức chế flavonoid của

CDK2 ở người , một kinase chu kỳ tế bào. Proc Natl Acad 65. Moraes FP, de Azevedo WF Jr (2012) Nhắm mục tiêu vị trí
Sci Hoa Kỳ 93:2735–2740 imidazoline trên monoamine oxidase B thông qua mô phỏng
lắp ghép phân tử. J Mol Model 18:3877–3886 66. Coracini
JD, de Azevedo WF Jr (2014) Shiki-

54. de Azevedo WF, Leclerc S, Meijer L, Havlicek L, Strnad M, mate kinase, protein đích để thiết kế thuốc.
Kim SH (1997) Ức chế sự cắn của kinase phụ thuộc cyclin
bằng chất tương tự purine: cấu trúc tinh thể của CDK2 ở Curr Med Chem 21:592–604
người được tạo phức với roscovitine. Hóa sinh Eur J
67. Teles CB, Moreira-Dill LS, Silva Ade A, Facundo VA, de
243:518–526
Azevedo WF Jr, da Silva LH và cộng sự (2015) Một Lupane-

triterpene được phân lập từ Combretum leprosum Mart.


55. de Azevedo WF Jr, Canduri F, da Silveira NJ (2002) Cơ sở chiết xuất từ trái cây cản trở sự phát triển nội bào của
cấu trúc để ức chế kinase phụ thuộc cyclin 9 bởi Leishmania (L.) amazonensis trong ống nghiệm. BMC bổ sung
flavopiridol. thay thế Med 15:165
Biochem Biophys Res Commun 293:566–571

56. Filgueira de Azevedo W Jr, Gaspar RT, Canduri F, Camera 68. Freitas PG, Elias TC, Pinto IA, Costa LT, de Carvalho
JC Jr, Freitas da Silveira NJ (2002) Mô hình phân tử của PVSD, Omote DQ và cộng sự (2018)
kinase phụ thuộc cyclin 5 tạo phức với roscov-itine. Phương pháp tính toán để phát hiện các phân tử hóa thực vật
Biochem Biophys Res Commun 297:1154–1158 57. Canduri F, có mục tiêu điều trị tiềm năng đối với protein PKCZ. Lett
Uchoa HB, de Azevedo WF Jr (2004) Mô hình phân tử của Drug Des Discovery 15:488–499 69. de Azevedo WF Jr (2010)
kinase phụ thuộc
Sàng lọc ảo dựa trên cấu trúc. Mục tiêu về
cyclin 1 được tạo phức với chất ức chế. Biochem Biophys Res Thuốc Curr 11:261–263
Commun 324:661–666

70. de Azevedo WF Jr (2010) MolDock áp dụng cho sàng lọc ảo


dựa trên cấu trúc. Mục tiêu về Thuốc Curr 11:327–334
58. Canduri F, de Azevedo WF Jr (2005) Cơ sở cấu trúc của
sự tương tác giữa các chất ức chế với
Machine Translated by Google

64 Gabriela Bitencourt-Ferreira và Walter Filgueira de Azevedo Jr.

71. Dias R, de Azevedo WF Jr (2008) Phân tử 83. Marques MR, Pereira JH, Oliveira JS, Basso
thuật toán lắp ghép. Mục tiêu thuốc Curr LA, de Azevedo WF Jr, Santos DS và cộng sự (2007)
9:1040–1047 Sự ức chế 5-enolpyruvylshikimate-3-

72. de Azevedo WF Jr, Dias R (2008) Phương pháp tính phosphate synthase như một mô hình để phát triển

toán ái lực liên kết phối tử. Mục tiêu thuốc Curr các loại thuốc chống vi trùng mới. Mục tiêu ma
túy Curr 8:445–457
9:1031–1039 84. Filgueira de Azevedo W Jr, dos Santos GC,
73. de A' vila MB, Bitencourt-Ferreira G, de Aze-vedo dos Santos DM, Olivieri JR, Canduri F, Silva

WF Jr (2018) Cơ sở cấu trúc để ức chế Enoyl- RG và cộng sự (2003) Lắp ghép và góc nhỏ

[acyl Carrier protein] Reductase Nghiên cứu tán xạ tia X của nucleoside purine

(InhA) từ Mycobacteria bệnh lao. Curr phosphorylase. Biochem Biophys Res Comm-mun
309:923–928
Med Chem. https://doi.org/10.2174/
0929867326666181203125229 85. Canduri F, Perez PC, Caceres RA, de Azevedo

74. Volkart PA, Bitencourt-Ferreira G, Souto AA, WF Jr (2007) Protein kinase làm mục tiêu cho

de Azevedo WF (2019) Phụ thuộc vào cyclin thuốc hóa trị chống ký sinh trùng. Thuốc Curr
kinase 2 trong lão hóa tế bào và ung thư. MỘT Mục tiêu 8:389–398

đánh giá về cấu trúc và chức năng. Thuốc Curr 86. Dias MV, Borges JC, Ely F, Pereira JH,
Mục tiêu 20(7):716–726. https://doi.org/10. Canduri F, Ramos CH và cộng sự (2006)
2174/1389450120666181204165344 tổng hợp chorismate từ Mycobacteria
75. Canduri F, Fadel V, Basso LA, Palma MS, bệnh lao. J Struct Biol 154:130–143

Santos DS, de Azevedo WF Jr (2005) Mới 87. Dias MV, Ely F, Palma MS, de Azevedo WF Jr,
cơ chế xúc tác cho purine nucle-oside Basso LA, Santos DS (2007) Hợp xướng
phosphorylase của con người. Res sinh hóa sinh học synthase: một mục tiêu hấp dẫn để phát triển
Cộng đồng 327:646–649 thuốc chống lại các bệnh mồ côi. Thuốc Curr

76. Filgueira de Azevedo W Jr, Canduri F, Simo˜es Mục tiêu 8:437–444


de Oliveira J, Basso LA, Palma MS, Pereira JH 88. Silva RG, Pereira JH, Canduri F, de Azevedo
et al (2002) Mô hình phân tử của shikimate WF Jr, Basso LA, Santos DS (2005) Động học
kinase từ Mycobacteria bệnh lao. Bio-chem Biophys và cấu trúc tinh thể của phosphorylase nucleo-
Res Commun 295:142–148 side purine của con người trong phức hợp với 7-
77. Canduri F, Teodoro LG, Fadel V, Lorenzi methyl-6-thio-guanosine. Sinh lý sinh học Arch
442:49–58
CC, Hial V, Gomes RA và cộng sự (2001)
của uropepsin của con người ở độ phân giải 2,45. Acta 89. Bộ hẹn giờ LF, Caceres RA, Vivan AL, Gava
Crystallogr D Biol Crystallogr 57:1560–1570 LM, Dias R, Ducati RG và cộng sự (2008) Nghiên
78. Pereira JH, Canduri F, de Oliveira JS, da Sil- cứu cấu trúc của nucleoside purine ở người

veira NJ, Basso LA, Palma MS và cộng sự (2003) phosphorylase: hướng tới chức năng tính điểm

Nghiên cứu tin sinh học cấu trúc của EPSP theo kinh nghiệm cụ thể mới. Sinh lý sinh học Arch
479:28–38
synthase từ Mycobacteria bệnh lao.
Biochem Biophys Res Cộng đồng 90. de Azevedo WF Jr (2011) Mô phỏng động lực học
312:608–614 phân tử của các mục tiêu protein được xác định trong

79. de Azevedo WF Jr, Dias R (2008) Các phương pháp Mycobacterium tuberculosis. Curr Med Chem
18:1353–1366
thử nghiệm để đánh giá động lực nhiệt của tương
tác thuốc-protein. Thuốc Curr 91. de Azevedo WF Jr (2011) Mục tiêu protein cho
Mục tiêu 9:1071–1076 phát triển thuốc chống lại Mycobacteria
bệnh lao. Curr Med Chem 18:1255–1257
80. Delatorre P, Rocha BA, Souza EP, Oliveira
TM, Bezerra GA, Moreno FB và cộng sự (2007) 92. Caceres RA, Saraiva Timmers LF, Dias R,
Cấu trúc của lectin từ Canavalia Gladiata Basso LA, Santos DS, Azevedo WF Jr
hạt giống: những hiểu biết sâu sắc về cấu trúc mới cho (2008) Mô hình phân tử và động lực học
các phân tử cũ. Cấu trúc BMC Biol 7:52 mô phỏng PNP từ Streptococcus agalac-tiae. Bioorg
81. de Azevedo WF Jr, Canduri F, dos Santos Med Chem 16:4984–4993
DM, Pereira JH, Bertacine Dias MV, Silva 93. Dias MV, Faı'm LM, Vasconcelos IB, de Oli-veira
RG và cộng sự (2003) Cấu trúc tinh thể của con người JS, Basso LA, Santos DS và cộng sự (2007)
PNP tạo phức với guanine. Biochem Bio-phys Res Tác dụng của các ion magiê và clorua
Commun 312:767–772 và shikimate về cấu trúc của shikimate

82. Canduri F, de Azevedo WF (2008) Protein kinase từ Mycobacteria bệnh lao. Acta

tinh thể học trong khám phá thuốc. Thuốc Curr Crystallogr Sect F Struct Biol Crystal Commun
63:1–6
Mục tiêu 9:1048–1053
Machine Translated by Google

SANDReS: Công cụ tính toán để lắp ghép 65

94. de Azevedo WF Jr, Ward RJ, Canduri F, Soares A, Giglio JR, 105. Arcuri HA, Canduri F, Pereira JH, da Silveira NJ, Camera

Arni RK (1998) Cấu trúc tinh thể của piratoxin-I: một Junior JC, de Oliveira JS và cộng sự (2004) Mô hình phân

chất tương đồng phospholipase A2 độc lập với canxi từ tử cho enzyme dẫn đường shikimate của Xylella fastidiosa.
nọc độc của Bothrops pirajai. Biochem Biophys Res Commun 320:979–991

Chất độc 36:1395–1406


106. Soares MB, Silva CV, Bastos TM, Guimara˜es ET, Figueira
95. Dias R, Timmers LF, Caceres RA, de Azevedo WF Jr (2008) CP, Smirlis D và cộng sự (2012) Hoạt tính chống
Đánh giá việc ghép nối phân tử bằng cách sử dụng các hàm Trypanosoma cruzi của nicotinamide.
tính điểm theo kinh nghiệm đa thức. Mục tiêu ma túy Curr Acta nhiệt đới 12:224–229
9:1062–1070 96. da Silveira NJ, Uchoˆa HB, Canduri 107. Rocha BA, Delatorre P, Oliveira TM, Bene-vides RG, Pires
F, Pereira JH, Camera JC Jr, Basso LA và cộng sự (2004) AF, Sousa AA và cộng sự (2011)
Cơ sở cấu trúc cho cả phản ứng hỗ trợ và chống viêm gây
Nghiên cứu tin sinh học cấu trúc của PNP từ Schistosoma ra bởi lectin cây họ đậu đặc hiệu mannose từ Cymbosema
mansoni. Biochem Biophys Res Commun 322:100–104 roseum. Sinh học 93:806–816

97. de Azevedo WF Jr, Dias R (2008) Đánh giá mối quan hệ ràng 108. Ducati RG, Basso LA, Santos DS, de Azevedo WF Jr (2010)

buộc phối tử bằng cách sử dụng các hàm tính điểm thực Nghiên cứu về tinh thể và lắp ghép của purine nucleoside
nghiệm đa thức. Bioorg Med Chem 16:9378–9382 phosphorylase từ Mycobacteria bệnh lao. Bioorg Med Chem
18:4769–4774

98. Bezerra GA, Oliveira TM, Moreno FB, de Souza EP, da Rocha
BA, Benevides RG và cộng sự (2007) Phân tích cấu trúc của 109. Manhani KK, Arcuri HA, da Silveira NJ, Uchoˆa HB, de

Canavalia mar-itima và Canavalia Gladiata lectins kết Azevedo WF Jr, Canduri F (2005) Mô hình phân tử của

hợp với các dimannoside khác nhau: những hiểu biết mới protein kinase 6 từ Plasmodium falciparum. J Mol Mẫu
về sự hiểu biết về mối quan hệ cấu trúc-hoạt động sinh 12:42–48
học trong cây họ đậu. J Struct Biol 160:168–176 99.
Canduri F, Fadel V, Dias MV, Basso LA, Palma MS, Santos 110. Arcuri HA, Borges JC, Fonseca IO, Pereira JH, Neto JR,
DS và cộng sự (2005) Cấu trúc tinh thể của PNP ở Basso LA và cộng sự (2008) Nghiên cứu cấu trúc của
người được tạo phức với ion hypoxanthine và sunfat. Biochem shikimate 5-dehydrogenase từ Mycobacteria bệnh lao.
Bio-phys Res Commun 326:335–338 100. Timmers LF, Pauli I, Protein

Caceres RA, de Azevedo WF Jr (2008) Cơ sở dữ liệu liên 72:720–730

kết thuốc. Mục tiêu thuốc Curr 9:1092–1099 101. Delatorre 111. Marques MR, Vaso A, Neto JR, Fossey MA, Oliveira JS, Basso
P, Rocha BA, Gadelha CA, Santi-Gadelha T, LA và cộng sự (2008) Động lực của những thay đổi về hình
Cajazeiras JB, Souza EP và cộng sự (2006) Cấu trúc tinh thể của dạng do glyphosate gây ra của Mycobacteria lao 5-enol-
một lectin từ Canavalia maritima (ConM) phức tạp với pyruvylshikimate-3-phosphate synthase (EC 2.5.1.19) được
trehalose và maltose tiết lộ đột xác định bằng phương pháp trao đổi hydro-deuterium và

biến có liên quan trong các lectin giống ConA. J Struct Biol khối phổ phun điện. Hóa sinh 47:7509–7522 112. Cavada

154:280–286 BS, Moreno FB, da Rocha BA, de Azevedo WF Jr, Castello'n


RE, Goersch GV và cộng sự (2006) nhân bản cDNA và xác

định cấu trúc tinh thể của PPL2, một endchi-tinase 1,75 và
hemagglutinin liên kết với N-acetylglucosamine từ hạt

Parkia platycephala. FEBS J 273:3962–3974 113. Arcuri HA,


Zafalon GF, Marucci EA, Bona-lumi CE, da Silveira NJ,

102. Ra'dis-Baptista G, Moreno FB, de Lima NL, Martins AM, de Machado JM (2010)

Oliveira TD, Toyama MH và cộng sự (2006) Crotacetin, một


chất tương đồng lectin loại C nọc rắn mới của convulxin,
thể hiện hoạt tính kháng khuẩn không thể đoán trước. Sinh
lý sinh hóa tế bào 44:412–423 103. Breda A, Basso LA,
Santos DS, de Azevedo Jr WF (2008) SKPDB: cơ sở dữ liệu cấu trúc của các enzym con đường

Sàng lọc ảo các loại thuốc: chức năng tính điểm, lắp ghép và shikimate. Tin sinh học BMC 11:12

thiết kế thuốc. Thuốc hỗ trợ tính toán Curr Des 4:265–272


104. Nolasco DO, Canduri F, Pereira JH, Corti-no'z JR, 114. Moreno FB, de Oliveira TM, Martil DE, Vic¸oti MM, Bezerra

Palma MS, Oliveira JS và cộng sự (2004) GA, Abrego JR và cộng sự (2008) Xác định mối liên kết bậc
bốn mới cho lectin cây họ đậu. J Struct Biol 161:133–143

Cấu trúc tinh thể của PNP từ Myco-vi khuẩn lao ở độ phân
giải 1,9A. Bio-chem Biophys Res Commun 324:789–794
Machine Translated by Google

Chương 5

Năng lượng tĩnh điện trong phức hợp protein-ligand

Gabriela Bitencourt-Ferreira, Martina Veit-Acosta


và Walter Filgueira de Azevedo Jr.

trừu tượng

Phân tích tính toán các tương tác phối tử protein protein có tầm quan trọng then chốt đối với việc thiết kế thuốc.
Việc đánh giá năng lượng liên kết phối tử cho phép chúng ta có cái nhìn thoáng qua về tiềm năng của một phân tử hữu
cơ nhỏ như một phối tử đối với vị trí liên kết của mục tiêu protein. Xem xét các chức năng tính điểm có sẵn trong
các chương trình lắp ghép như AutoDock4, AutoDock Vina và Molegro Virtual Docker, chúng ta có thể nói rằng tất cả
chúng đều dựa vào các phương trình tính tổng từng loại tương tác phối tử protein để mô hình hóa ái lực liên kết.
Hầu hết các chức năng tính điểm đều xem xét các tương tác tĩnh điện liên quan đến protein và phối tử. Trong chương
này, chúng tôi trình bày các khái niệm vật lý chính cần thiết để hiểu các tương tác tĩnh điện có liên quan đến việc
nhận dạng phân tử của phối tử bằng túi liên kết của mục tiêu protein. Hơn nữa, chúng tôi phân tích thế năng tĩnh
điện của một quần thể cấu trúc để làm nổi bật các đặc điểm chính liên quan đến tầm quan trọng của sự tương tác này
đối với ái lực liên kết.

Từ khóa Tương tác tĩnh điện, Ái lực liên kết, Thiết kế thuốc, Con đường Shikimate, Nhận dạng phân tử

1. Giới thiệu

Sự sẵn có của dữ liệu thực nghiệm về hằng số phân ly (Kd), năng lượng liên kết tự

do Gibbs (ΔG), hằng số ức chế (Ki), nồng độ ức chế tối đa một nửa (IC50), cung cấp

cơ sở vững chắc cho sự phát triển của các mô hình tính toán để dự đoán ái lực liên

kết. Dữ liệu ái lực liên kết thử nghiệm có sẵn tại các cơ sở dữ liệu như MOAD [1],

BindingDB [2] và PDBbind [3]. Hơn nữa, sự phong phú của dữ liệu cấu trúc có sẵn

trong Ngân hàng Dữ liệu Protein (PDB) [4–6] và dữ liệu liên kết được đề cập trước
đó có thể được sử dụng để tạo ra các hàm tính điểm theo kinh nghiệm nhằm dự đoán ái

lực liên kết cho các phức hợp phối tử protein dựa trên tọa độ nguyên tử của chúng.

Các hàm tính điểm là các phép tính gần đúng để dự đoán ái lực liên kết với

phối tử protein. Hầu hết sự phát triển hiện đại của chức năng tính điểm để dự đoán

ái lực liên kết phối tử protein bắt đầu từ công trình tiên phong của Bo¨hm vào đầu

những năm 1990

Walter Filgueira de Azevedo Jr. (ed.), Màn hình lắp ghép để khám phá thuốc, Phương pháp sinh học phân tử, tập. 2053,
https://doi.org/10.1007/978-1-4939-9752-7_5, © Springer Science+Business Media, LLC, một phần của Springer Nature 2019

67
Machine Translated by Google

68 Gabriela Bitencourt-Ferreira và cộng sự.

[7–12]. Các chương trình gắn đế như AutoDock [13–16], AutoDock


Vina [17, 18] và Molegro Virtual Docker (MVD) [19–21] tạo nên
việc sử dụng các chức năng tính điểm theo kinh nghiệm mà bằng cách nào đó hoạt động rất giống nhau

với những ý tưởng do Bohm đề xuất.


Một trong những chức năng tính điểm được sử dụng nhiều nhất để
đánh giá ái lực liên kết thụ thể-li-gand là chức năng tính điểm trường
lực tự do bán thực nghiệm AutoDock4 [13–16]. Một số nghiên cứu cho thấy
chức năng tính điểm này có thể thực hiện đánh giá đáng tin cậy về
năng lượng liên kết của phối tử với các thụ thể [22, 23]. Tóm
lại, Auto-Dock4 áp dụng trường lực này thông qua phép tính hai bước.
Đầu tiên, AutoDock4 đánh giá năng lượng nội phân tử của
chuyển đổi từ cấu trúc không bị ràng buộc sang cấu trúc bị ràng buộc của

phức hợp thụ thể-phối tử và sau đó tính toán liên phân tử


năng lượng của hệ thống. Chúng ta hãy xem xét rằng chúng ta biểu thị ái lực

liên kết đối với các phức hợp phối tử-thụ thể dưới dạng pKi ¼ log(Ki), trong đó
Ki là hằng số ức chế. Dưới đây chúng tôi có chức năng tính điểm
trường lực tự do bán thực nghiệm AutoDock4,

LL LL RR RR
pKi ¼ V ràng buộc
V
không bị ràng buộc
þ V giới hạn V
không bị ràng buộc

RL RL
þ V giới hạn V
không bị ràng buộc þ ΔHệ thống ð1Þ

Phương trình trên bao gồm việc đánh giá sự mất entropy xoắn khi liên kết

(ΔSsystem) và sáu cặp nguyên tử


thuật ngữ (V) trong đó L và R tương ứng đề cập đến “phối tử”
và “thụ thể” trong phức hợp thụ thể-phối tử. Cách diễn đạt
đối với entropy hình dạng bị mất khi liên kết phương trình

(ΔSsystem) như sau:

ΔHệ thống ¼ α0N tors ð2Þ

trong đó Ntors đại diện cho số lượng liên kết xoay được trong phối tử
và α0 là trọng số tương đối của số hạng này.
Hàm tính điểm theo kinh nghiệm cố gắng xấp xỉ ái lực liên
kết được tính toán (V) với ái lực liên kết thực nghiệm (pKi,
exp) thông qua mô hình hồi quy trong đó chúng tôi đã sử dụng thử nghiệm
dữ liệu để xác định trọng số tương đối của từng số hạng trong hồi quy
phương trình. Chúng tôi tính toán các thuật ngữ năng lượng theo cặp của phương trình. (1) như
sau:

Aij bij Cij Dij


V ¼ α1 X E tð Þ
r12 r6 r12 r10
tôi, j
ij ôi ! þ α2 X tôi, j ij ôi ! þ α3 X tôi, j

qiq j r2 =2σ2
þ α4 X SiV j þ S jV i e ij
ð3Þ
ε rij rij tôi, j

Trong phương trình trên, các α đại diện cho trọng số hồi quy
của các thuật ngữ năng lượng. Số hạng đầu tiên của phương trình trên tính toán
các tương tác phân tán/đẩy, đó là phương trình của
Tiềm năng Lennard-Jones [24]. Thuật ngữ thứ hai là một sửa đổi của
Machine Translated by Google

Năng lượng tĩnh điện trong phức hợp protein-ligand 69

biểu thức của tiềm năng Lennard-Jones dựa trên 12/10


tiềm năng. Nó ước tính năng lượng tương tác liên kết hydro liên phân
tử. Thuật ngữ tiếp theo là thế tĩnh điện và
cái cuối cùng chiếm khả năng phá hủy. Tiềm năng cuối cùng này

xem xét khối lượng nguyên tử (Vi hoặc Vj) nhân với độ hòa tan
tham số (Si hoặc Sj) và hàm số mũ có khoảng cách
. Trong phương trình trên, các phép tính tổng
trọng lượng của σ ¼ 3,5 A˚
hoạt động trên tất cả các cặp nguyên tử phối tử (i) và nguyên tử thụ thể (j)
ngoài ra tất cả các cặp nguyên tử trong phối tử cách nhau ba hoặc
nhiều trái phiếu hơn.

Có thể thêm nhiều số hạng năng lượng khác vào biểu thức. (3), vì
ví dụ, diện tích tiếp xúc và năng lượng lưỡng cực, nhưng ý tưởng thì giống nhau.

Các tổng được lấy cho các nguyên tử từ phối tử và protein


trong bán kính cắt được xác định trước. Chúng tôi có thể áp dụng các chức năng

tính điểm này để chọn tư thế tốt nhất được tạo bởi thuật toán tìm kiếm của một người.

chương trình lắp ghép hoặc đánh giá ái lực liên kết dựa trên cấu trúc
tinh thể đối với bất kỳ phức hợp phối tử protein nào. Một đặc điểm quan
trọng của sự phát triển của bất kỳ chức năng tính điểm nào là việc đánh giá
tương tác tĩnh điện cho hệ thống phối tử protein. Trong này
chương này, chúng ta sẽ đưa ra một cái nhìn rộng hơn về tương tác tĩnh điện.

2 Định luật Coulomb

Để có sự giải thích vật lý về tương tác tĩnh điện


có trong các phức chất phối tử protein, chúng ta hãy xem xét một hệ
thống gồm hai điện! tích điểm q1 và q2 như trong Hình 1.
!
Điện tích
q1 ở vị trí r và điện tích q2 ở vị trí r . Điểm hạn
1 2
điện tích được sử dụng ở đây là một sự trừu tượng toán học; các proton và
electron có khối lượng hữu hạn. Chúng ta coi phí điểm là phí có
kích thước rất nhỏ so với khoảng cách giữa chúng. !

Từ phân tích vectơ ở Hình 1, ta có vectơ r như sau:


12
! ! !

r ¼ r r
12 2 1

Hình 1. Một hệ gồm hai điện tích điểm


Machine Translated by Google

70 Gabriela Bitencourt-Ferreira và cộng sự.

!
Vectơ r nối q1 và q2 và trỏ từ q1 đến q2. bên trong
12
hệ đơn vị quốc tế, điện tích được đo bằng Cou-lomb (C).

Lực F 12 như sau: q1 tác dụng lên q2 được cho bởi định luật Coulomb là

! 1
q1q2 !

F ¼
ð4Þ
12 4πε0 r312 r 12

trong đó ε0 là độ thấm của chân không, và giá trị của nó xấp xỉ


8,854,10–12 C2 N1 m2 Phương
. trình trên được gọi là định luật

Coulomb và có giá trị trong không gian tự do. Xét rằng chúng ta lấy
các điện tích đúng giờ được nhúng trong các môi trường khác nhau,
chúng ta có định luật Coulomb vẫn đúng nhưng với hằng số tỷ lệ khác, như sau:

! 1
q1q2 !

F ¼
ð5Þ
12 4πεrε0 r312 r 12

trong đó đại lượng εr được gọi là độ thấm tương đối của vật liệu.
εr của nước là 80,2 ở nhiệt độ 20 C. Do đó, ta quan sát thấy lực giữa
các điện tích giảm đi khi nhúng vào
Nước.

Chúng ta hãy xem xét một hệ gồm ba điện tích điểm như trong Hình
2. Việc bổ sung điện tích thứ ba (q3) không làm thay đổi lực giữa các
điện tích q1 và q2. Hợp lực tác dụng lên điện tích q2 lúc này có hai
thành phần, đó là lực do điện tích q1 và lực bổ sung do q3. Tổng
vectơ của hai lực tác dụng lên điện tích q2 (F2) có biểu thức sau:

! 1 q2q3
q1q2 ! !

F ¼
þ
2 4πεrε0 r312 r 12 r3 r 32
32

Sắp xếp lại các số hạng, ta có phương trình của hệ gồm hai điện
tích điểm tác dụng lên điện tích thứ ba như sau:

Hình 2 Một hệ gồm ba điện tích điểm


Machine Translated by Google

Năng lượng tĩnh điện trong phức hợp protein-ligand 71

! 1 ! !
q1 q3
F ¼ r þ r
2 q2 4πεrε0 r312 12 r3 32 32

Nói chung, chúng ta có thể nói rằng các lực liên quan đến
điện tích điểm là lực cộng gộp từng cặp; do đó, nếu chúng ta xét
một hệ gồm N điện tích, với N 1 điện tích tác dụng lên điện tích
i, thì chúng ta có biểu thức sau đây cho lực tác dụng lên điện
tích điểm i,

N
! 1 q !
¼ r ð6Þ
tôi j qi X
4πεrε0 r3
ij ôi !
j6¼i

3 Thế năng tĩnh điện

Lực tĩnh điện là lực bảo toàn vì nó chỉ phụ thuộc vào vị trí
đầu và cuối. Chúng ta hãy xem xét một hệ gồm hai điện tích điểm
q và Q trong đó điện tích thử nghiệm q chuyển động về phía điện
tích điểm đứng yên Q. Trong phần trước, chúng ta đã thấy rằng
độ lớn của lực tác dụng lên điện tích thử nghiệm dương được
tính theo công thức Coulomb luật được đưa ra bởi phương trình.
(4). Thế năng tĩnh điện (U) của một điện tích điểm q tại vị trí
r từ một điện tích Q, được định nghĩa là công âm (W) do lực tĩnh
điện thực hiện để đưa từ vị trí r về vị trí r như sau:

!
!
F bác sĩ

U ¼ Zr
giới thiệu lại

!
bác sĩ ở đâu là vectơ dịch chuyển tính từ điểm tham chiếu rref trong
đó U = 0 J và vị trí r của điện tích điểm q. Tích chấm (.) có nghĩa
là ta lấy thành phần lực tác dụng dọc theo độ dịch chuyển dr. Thay
phương trình (5) vào biểu thức trên, chúng ta có,

!
!
F bác sĩ

U ¼ Zr
giới thiệu lại

1
qQ ! r qQ 1

r !¼ qQ
bác sĩ dr ¼ bác sĩ

¼ Zr 4πεrε0 r3 4πεrε0 Zr r3 4πεrε0 Zr r2

giới thiệu lại giới thiệu lại giới thiệu lại

Xét điểm tham chiếu mà chúng ta có U = 0 J tại 1,

qQ 1 r qQ 1
bạn ¼ ¼

4πεrε0 r 1 4πεrε0 r

Vậy thế năng tĩnh điện (U) của hệ gồm


của hai điện tích q và Q được cho bởi phương trình sau:
Machine Translated by Google

72 Gabriela Bitencourt-Ferreira và cộng sự.

qQ
U ¼ ð7Þ
4πεrε0r

Đối với một hệ gồm N điện tích điểm, lực tĩnh điện
thế năng (Uelectrostatic) được cho bởi biểu thức sau:

qiq j
bạn tĩnh điện ð8Þ
¼ X
tôi, j
4πεrε0rij

Phương trình trên là thuật ngữ tĩnh điện của AutoDock4

hàm tính điểm theo kinh nghiệm, trong đó chúng tôi coi ε(rij) là 4πεrε0.
Việc đánh giá ε(rij) cho các phân tử sinh học là một thách thức từ quan
điểm tính toán. Cụ thể đối với AutoDock4, ε(rij) là
được xấp xỉ bằng hàm thẩm thấu phụ thuộc khoảng cách sigmoidal, dựa trên
công trình của Mehler và Solmajer [25].

B
εð Þ¼ r A þ ð9Þ
1 þ keλBr

Trong phương trình trên, các hằng số có giá trị sau:


B ¼ εr A; εr ¼ hằng số điện môi tương đối của nước ở
25 C = 78,4; A ¼ 8,5525, λ ¼ 0,003627 và k ¼ 7,7839.
Trong các hệ thống sinh học như protein và axit nucleic, chúng ta thấy
nguyên tử được tích điện đầy đủ. Tuy nhiên, hầu hết các nguyên tử chỉ thể hiện một phần

phí. Vì lý do này, biến số phí trong giai đoạn trước


phương trình giải thích có thể có nghĩa là điện tích một phần. Có một số
các thuật toán để tính toán điện tích một phần cho các hệ thống sinh học.
Trong số các phương pháp được sử dụng nhiều nhất, chúng tôi có thể làm nổi bật một phần

Phương pháp cân bằng độ âm điện quỹ đạo (PEOE)


[26]. AutoDockTools4 [22] sử dụng thuật toán này để ước tính một phần
phí. Trong phần tiếp theo, chúng ta thảo luận về việc áp dụng các phương trình. (số 8

và 9) để xác định thế năng tĩnh điện của protein–-


phức chất phối tử.

4 Tính toán thế năng tĩnh điện cho phức hợp protein-ligand

Để minh họa các tính toán tương tác tĩnh điện của phức hợp phối tử pro-
tein, chúng tôi đã sử dụng một hệ thống sinh học bao gồm
enzyme của con đường shikimate. Con đường trao đổi chất này là mục tiêu
để phát triển thuốc diệt cỏ và thuốc kháng khuẩn [27]. Con đường Shi-
kimate đã được chứng minh là có cấu trúc và
nghiên cứu tính toán [28–65] do tính liên quan của nó đối với việc thiết kế thuốc

và phát triển.
Chúng tôi đã tìm kiếm PDB các enzyme 3-deoxy-D-arabino- heptulosonate
7-phosphate (DAHP) synthase (EC 2.5.1.54), shi-kimate kinase (EC 2.7.1.71)
và 3-dehydroquinate dehydratase
(EC 4.2.1.10) của con đường trao đổi chất này có hằng số ức chế
(Ki) dữ liệu có sẵn. Chúng tôi đã tìm thấy tổng cộng 24 tinh thể
Machine Translated by Google

Năng lượng tĩnh điện trong phức hợp protein-ligand 73

Bảng 1

Enzyme con đường Shikimate được sử dụng trong nghiên cứu này

enzym
phân loại Mã truy cập PDB

2.5.1.54 4UMA, 4UMB, 4UMC

2.7.1.71 4BQS

4.2.1.10 1H0R, 1GU1, 1V1J, 2BT4, 2C4V, 2C4W, 2XB8, 2XB9, 3N76, 3N7A, 3N86,
3N87, 3N8K, 3N8N, 4B6O, 4B6P, 4B6R, 4B6S, 4CIW, 4CIY

0,04

0,02

–0,02
điện
Tĩnh

–0,04

–0,06

–0,08
–10 –9,5 –9 –8,5 -số 8 –7,5 –7 –6,5 –6 –5,5 –5 –4,5 -4 –3,5 –3 –2,5 –2 –1,5 –1 –0,5

Nhật ký thí nghiệm(Ki )

Hình 3. Sơ đồ tán xạ log(Ki ) thực nghiệm và Uelectrostatic lý thuyết. Chúng tôi đã tạo ra âm mưu này với
chương trình Trình tạo mô hình dữ liệu Molegro (MDM) [19]

cấu trúc có sẵn dữ liệu Ki (tìm kiếm được thực hiện trên
ngày 18 tháng 12 năm 2018). Bảng 1 hiển thị mã truy cập PDB cho tất cả
cấu trúc được xác định trong PDB.

Chúng tôi đã triển khai các phương trình. (8 và 9) bằng Python (chương trình

SFSXplorer) và xem xét tính toán các khoản phí được sạc một phần bằng
AutoDockTools4 [22]. Biểu đồ tán xạ cho ái lực liên kết thực nghiệm (log(Ki))
và tĩnh điện được tính toán
thế năng Uelectrostatic được thể hiện ở Hình 3. Cấp bậc của Spearman
mối tương quan giữa log thực nghiệm (Ki) và Uelectrostatic là 0,22.
Mức độ tương quan này không đáng kể. Tuy nhiên, các tương tác tĩnh điện đã
được chứng minh là có tầm quan trọng then chốt đối với phối tử
ái lực liên kết trong các nghiên cứu gần đây tập trung vào các enzyme cụ thể
[66–75]. Mức ý nghĩa thấp có thể là do việc áp dụng
có điện thế tĩnh điện thuần túy mà không cần xem xét thêm
các tương tác như thế Lennard-Jones và liên kết hydro giữa các phân tử.

5 Colophon

Chúng tôi đã tạo ra Figs. 1 và 2 sử dụng Microsoft PowerPoint 2016. Chúng tôi
được tạo Hình 3 bằng Trình tạo mô hình dữ liệu Molegro (MDM)
Machine Translated by Google

74 Gabriela Bitencourt-Ferreira và cộng sự.

[19]. Chúng tôi đã thực hiện tính toán chức năng tính điểm được mô tả trong chương

này bằng Máy tính để bàn có bộ nhớ 4GB, ổ cứng 1 TB và bộ xử lý Intel® Core®

i3-2120 @ 3,30 GHz chạy Windows 8.1.

6 Sẵn có

SFSXplorer được triển khai bằng Python và có sẵn để tải xuống theo giấy phép GNU

tại https://github.com/azevedolab/ SFSXplorer. Tập dữ liệu shikimate có sẵn để tải

xuống tại https://azevedolab.net/receptor-ligand-systems-database.php.

7 nhận xét cuối cùng

Tóm lại, chúng ta có thể dễ dàng tính toán các tương tác tĩnh điện bằng cách sử

dụng điện từ cổ điển (Phương trình (8)) và thực hiện phương trình này bằng ngôn

ngữ máy tính cấp cao như Python. Sự sẵn có của thông tin thực nghiệm về cấu trúc và

ái lực liên kết mở ra khả năng tạo ra các hàm tính điểm nhắm mục tiêu theo enzyme

để dự đoán ái lực liên kết trong đó chúng tôi sử dụng dữ liệu thực nghiệm để hiệu

chỉnh chức năng tính điểm hoàn chỉnh cho một hệ thống sinh học cụ thể.

Sự nhìn nhận

Công việc này được hỗ trợ bởi các khoản tài trợ từ CNPq (Brazil) (308883/ 2014-4).

Nghiên cứu này được tài trợ một phần bởi Coordenac¸a˜o de Aperfeic¸oamento de

Pessoal de Nivel Superior—Brasil (CAPES)— Mã Tài chính 001. GB-F thừa nhận sự hỗ

trợ từ học bổng PUCRS/ BPA. MV-A ghi nhận sự hỗ trợ từ PUCRS/IC Jr. WFA là nhà

nghiên cứu cấp cao của CNPq (Brazil) (Mã số quy trình: 308883/2014-4 và

309029/2018-0).

Người giới thiệu

1. Hu L, Benson ML, Smith RD, Lerner MG, Carlson HA (2005) cấu trúc ba chiều. J Med Chem 47:2977–2980
Binding MOAD (Mẹ của tất cả các cơ sở dữ liệu). Protein
60:333–340 2. Liu T, Lin Y, Wen X, Jorrisen RN, 4. Berman HM, Westbrook J, Feng Z, Gilliland G,
Gilson MK (2007) BindingDB: cơ sở dữ liệu có thể truy cập Bhat TN, Weissig H và cộng sự (2000)
trên web về ái lực liên kết phối tử protein được xác định Ngân hàng dữ liệu Protein. Axit nucleic Res
bằng thực nghiệm. Axit nucleic Res 35:198–201 3. Wang R, 28:235–242
Fang X, Lu Y, Wang S (2004) Cơ sở dữ liệu PDBbind: tập 5. Berman HM, Battistuz T, Bhat TN, Bluhm WF,
hợp các ái lực
Bourne PE, Burkhardt K và cộng sự (2002)
liên kết cho các phức hợp phối tử protein đã biết Ngân hàng dữ liệu Protein. Acta Crystallogr D
Biol Crystallogr 58:899–907
Machine Translated by Google

Năng lượng tĩnh điện trong phức hợp protein-ligand 75

6. Westbrook J, Feng Z, Chen L, Yang H, Ber-man HM (2003) Ngân 20. Heberle' G, de Azevedo WF Jr (2011)
hàng Dữ liệu Protein và bộ gen cấu trúc. Axit nucleic Res Các thuật toán lấy cảm hứng từ sinh học được áp dụng cho
31:489–491 7. Bo¨hm HJ (1993) Một công cụ tính toán mới để mô phỏng lắp ghép phân tử. Curr Med Chem 18:1339–1352
thiết kế thuốc

dựa trên cấu trúc tự động. J Mol Công nhận 6:131–137 21. de Azevedo WF Jr (2010) MolDock áp dụng cho sàng lọc ảo dựa
trên cấu trúc. Mục tiêu về Thuốc của Curr 11:327–334 22.
Morris GM, Huey R,

8. Bo¨hm HJ (1994) Sự phát triển của hàm tính điểm theo kinh Lindstrom W, Sanner MF, Belew RK, Goodsell DS và cộng sự (2009)
nghiệm đơn giản để ước tính hằng số liên kết cho phức Auto-Dock4 và AutoDockTools4: Kết nối tự động với tính
hợp phối tử protein có cấu trúc ba chiều đã biết. J Com- linh hoạt của thụ thể chọn lọc. J Comput Chem 30:2785–2791

put Aided Mol Des 8:243–256 9. Bo¨hm HJ (1996) Hướng tới 23. Huey R, Morris GM, Olson AJ, Goodsell DS (2007) Trường
thiết kế tự động các phối tử protein lực năng lượng tự do bán thực nghiệm

tổng hợp có thể tiếp cận được: peptide, amid và peptidomimetic. với sự phân hủy dựa trên điện tích. J Comput Chem 28:1145–1152

J Comput Aided Mol Des 10:265–272 10. Stahl M,

Bo¨hm HJ (1998) Phát triển các chức năng lọc để ghép nối phối 24. Sự gắn kết Lennard-Jones JE (1931). Proc Phys Sóc 43:461–482
tử protein. J Mol Graph Model 16:121–132 11. Klebe G,
Bo¨hm HJ (1997) Các yếu tố năng lượng 25. Mehler EL, Solmajer T (1991) Hiệu ứng tĩnh điện trong
và entropic xác định ái lực liên kết trong phức hợp phối tử protein: so sánh mô hình điện môi và điện tích. Protein
protein. J Truyền tín hiệu tiếp nhận Res 17:459–473 12. Eng 4:903–910 26. Gasteiger J, Marsili M (1980) Lặp
Bo¨hm HJ, Banner DW, Weber L (1999) Thử nghiệm hóa học lại sự cân bằng từng phần của độ âm điện quỹ đạo—sự tiếp cận
kết hợp và lắp ghép hai cực:
nhanh chóng với điện tích nguyên tử. Tứ diện 36:3219–3228
thiết kế các chất ức chế trombin không peptide mạnh. J Comput
Aided Mol Des 13:51–56 13. Goodsell DS, Olson AJ (1990)
Tự động gắn các chất nền vào protein bằng cách ủ mô 27. Parish T, Stoker NG (2002) Con đường sinh tổng hợp axit
phỏng. Protein 8:195–202 14. Goodsell DS, Morris GM, amin thơm phổ biến là Mycobacteria lao thiết yếu.

Olson AJ (1996) TRONG

Vi sinh vật học 148:3069–3077 28.

Pereira JH, Canduri F, de Oliveira JS, da Sil-veira NJ, Basso


LA, Palma MS và cộng sự (2003)
Gắn các phối tử linh hoạt: các ứng dụng của AutoDock. J Nghiên cứu tin sinh học cấu trúc của EPSP synthase từ
Mol Recognit 9:1–5 15. Morris GM, Goodsell Mycobacteria bệnh lao. Bio-chem Biophys Res Commun

DS, Huey R, Olson AJ (1996) Phân phối tự động việc ghép nối 312:608–614 29. Arcuri HA, Canduri F, Pereira JH, da

các phối tử linh hoạt với protein: Các ứng dụng song Silveira NJ, Camera JC Jr, de Oliveira JS et al (2004)

song của AutoDock 2.4. J Comput Aided Mol Des 10:293–304


16. Morris GM, Goodsell DS, Halliday RS, Huey R, Hart WE, Các mô hình phân tử của enzyme chuyển hóa shikimate của
Belew RK và Xylella fastidiosa. Biochem Biophys Res Commun 320:979–991
30. Dias MV, Ely F, Canduri F,
cộng sự (1998)
Pereira JH, Frazzon J, Basso LA và cộng sự (2004) Kết tinh và

Việc lắp ghép tự động sử dụng thuật toán di truyền phân tích tinh thể học tia X sơ bộ của chorismate synthase

lamarckian và chức năng năng lượng tự do liên kết theo từ Mycobac-terium bệnh lao. Acta Crystallogr D Biol

kinh nghiệm. J Comput Chem 19:1639–1662 Crystallogr 60:2003–2005

17. Trott O, Olson AJ (2010) AutoDock Vina: cải thiện tốc độ và

độ chính xác của việc lắp ghép với chức năng chấm điểm mới, 31. Uchoˆa HB, Jorge GE, Freitas Da Silveira NJ, Camera JC Jr,
tối ưu hóa hiệu quả và đa luồng. J Comput Chem 31:455–461 Canduri F, De Azevedo WF Jr (2004) Parmodel: một máy chủ

18. Jaghoori MM, Bleijlevens B, Olabarriaga SD (2016) 1001 web dành cho mô hình so sánh tự động của protein. Biochem
Cách chạy Biophys Res Commun 325:1481–1486 32. Pereira JH, de

AutoDock Vina để sàng lọc ảo. J Comput Aided Mol Des 30:237–249 Oliveira JS, Canduri F, Dias MV, Palma MS, Basso

LA và cộng sự (2004) Cấu trúc của shikimate kinase từ

Mycobacteria tubercu-losis cho thấy sự liên kết của axit


shikimic. Acta Crystallogr D Biol Crystallogr 60:2310–

19. Thomsen R, Christensen MH (2006) Mol-Dock: một kỹ thuật 2319 33. Silveira NJ, Uchoˆa HB, Pereira JH, Canduri F,

mới để lắp ghép phân tử có độ chính xác cao. Basso LA, Palma MS và cộng sự (2005) Phân tử

J Med Chem 49:3315–3321


Machine Translated by Google

76 Gabriela Bitencourt-Ferreira và cộng sự.

mô hình mục tiêu protein từ Mycobacteria bệnh lao. J Mol 44. Pauli I, Caceres RA, de Azevedo WF Jr (2008)
Model 11:160–166 34. Dias MV, Borges JC, Ely F, Nghiên cứu mô hình phân tử và động lực học của Shikimate
Kinase từ Bacillus anthracis.
Pereira JH, Canduri F, Ramos CH và cộng sự (2006) Cấu trúc của
chorismate synthase từ Mycobacteria tuber. J Struct Biol Bioorg Med Chem 16:8098–8108 45. de Azevedo

154:130–143 WF Jr (2008) Tương tác giữa thuốc và protein. Mục tiêu thuốc

Curr 9:1030 46. de Azevedo WF Jr, Dias R

35. da Silveira NJ, Bonalumi CE, Ucho˜a HB, Per-eira JH, (2008) Các phương pháp tính toán để tính ái lực liên kết phối

Canduri F, de Azevedo WF (2006) tử. Mục tiêu ma túy Curr 92:1031–1039

DBMODELING: cơ sở dữ liệu được áp dụng để nghiên cứu các

mục tiêu protein từ các dự án bộ gen.


Sinh lý sinh hóa tế bào 44:366–374 36. Borges 47. Dias R, de Azevedo WF Jr (2008) Thuật toán lắp ghép phân
JC, Pereira JH, Vasconcelos IB, dos Santos GC, Olivieri JR, Ramos tử. Mục tiêu ma túy Curr 9:1040–1047
CH et al (2006) Phosphate đóng cấu trúc dung dịch của 5-

enolpyruvylshikimate-3-phosphate synthase (EPSPS) ) từ bệnh 48. Canduri F, de Azevedo WF (2008) Tinh thể protein trong khám
Mycobacteria tuberculosis. Arch Biochem Biophys 452:156–164 phá thuốc. Mục tiêu Thuốc Curr 9:1048–1053 49. Pauli I,
37. da Silveira NJF, Bonalumi CE, Arcuri HA, de Azevedo WF Timmers LF, Caceres RA,
Jr (2007) Cơ sở dữ liệu mô hình phân tử: một cách mới
Soares MB, de Azevedo WF Jr (2008) In silico và in vitro: xác
trong việc tìm kiếm các mục tiêu protein để phát triển thuốc. Curr định các loại thuốc mới. Mục tiêu ma túy Curr 9:1054–1061
Bioinf 2:1–10

50. Dias R, Timmers LF, Caceres RA, de Azevedo WF Jr (2008)

Đánh giá việc lắp ghép phân tử bằng cách sử dụng các hàm
38. Dias MV, Faı'm LM, Vasconcelos IB, de Oli-veira JS, Basso tính điểm thực nghiệm đa thức.
LA, Santos DS và cộng sự (2007) Mục tiêu thuốc Curr 9:1062–1070 51. de
Ảnh hưởng của các ion magie, clorua và shikimate lên cấu
Azevedo WF Jr, Dias R (2008) Các phương pháp thử nghiệm để đánh
trúc của shikimate kinase từ Mycobacteria bệnh lao. Acta
giá nhiệt động lực học của tương tác thuốc-protein. Curr
Crystallogr Sect F Struct Biol Cryst Commun 63:1–6
Drug Tar-gets 9:1071–1076 52. Caceres RA, Pauli I, Timmers

LF, de Azevedo WF Jr

(2008) Mô hình nhận dạng phân tử: một thách thức cần vượt qua.
39. Dias MV, Ely F, Palma MS, de Azevedo WF Jr, Basso LA, Santos
Mục tiêu ma túy Curr 9:1077–1083
DS (2007) Chorismate synthase: một mục tiêu hấp dẫn để
phát triển thuốc chống lại các bệnh mồ côi. Curr Drug Tar-
gets 8:437–444 40. Marques MR, Pereira JH, Oliveira JS,
53. Barcellos GB, Caceres RA, de Azevedo WF Jr (2009) Nghiên
Basso LA, de Azevedo
cứu cấu trúc của shikimate dehy-drogenase từ Bacillus
WF Jr, Santos DS và cộng sự (2007) Sự ức chế tổng hợp 5-
anthracis tạo phức với đồng yếu tố NADP. J Mol Model 15:147–
enolpyruvylshiki-mate-3-phosphate dưới dạng một mô hình để
155
phát triển các loại kháng sinh mới. Mục tiêu về Thuốc
Curr 8:445–457
54. de Azevedo WF Jr, Dias R, Timmers LF, Pauli I, Caceres RA,

Soares MB (2009) Công cụ định dạng sinh học để sàng lọc


thuốc chống ký sinh trùng. Mục tiêu về ma túy Curr 10:232–
41. Pereira JH, Vasconcelos IB, Oliveira JS, Caceres RA, de
239
Azevedo WF Jr, Basso LA và cộng sự (2007) Shikimate kinase:
55. Arcuri HA, Zafalon GF, Marucci EA, Bona-lumi CE, da
mục tiêu tiềm năng để phát triển các thuốc chống lao mới.
Silveira NJ, Machado JM và cộng sự (2010) SKPDB: cơ sở dữ
Mục tiêu thuốc Curr 8:459–468 42. Marques MR, Vaso A, Neto
liệu cấu trúc của các enzyme trong con đường shiki-mate.
JR, Fossey MA, Oliveira JS, Basso LA và cộng sự
Tin sinh học BMC 11:12
(2008) Động lực của những thay đổi về hình dạng do glyphosate
gây ra của Mycobacteria bệnh lao 5-enolpyruvylshiki-mate-3-
56. Hernandes MZ, Cavalcanti SM, Moreira DR, de Azevedo WF Jr,
photphat synthase (EC 2.5.1.19) được xác định bằng phương
Leite AC (2010) Nguyên tử halogen trong hóa dược hiện đại:
pháp trao đổi hydro-đơteri và phép đo khối phổ phun điện.
gợi ý cho việc thiết kế thuốc. Mục tiêu về Thuốc Curr
Hóa sinh 47:7509–7522 43. Arcuri HA, Borges JC, Fonseca
11:303–314
IO, Pereira JH, Neto JR, Basso LA và cộng sự (2008) Nghiên
cứu cấu trúc của shikimate 5-dehydrogenase từ Mycobacteria
bệnh lao. 57. De Azevedo WF Jr (2010) Sàng lọc ảo dựa trên cấu trúc. Mục
tiêu thuốc Curr 11:261–263 58. de Azevedo WF Jr (2011) Mô

phỏng động lực phân tử của các mục tiêu protein được xác định
trong Mycobacteria bệnh lao. Curr Med Chem 18:1353–1366
Protein
72:720–730
Machine Translated by Google

Năng lượng tĩnh điện trong phức hợp protein-ligand 77

59. de Azevedo WF Jr (2011) Mục tiêu protein để phát triển 68. de A' vila MB, Xavier MM, Pintro VO, de Aze-vedo WF (2017)

thuốc chống lại vi khuẩn Mycobacteria bệnh lao. Curr Med Các kỹ thuật học máy có giám sát để dự đoán mối quan hệ ràng
Chem 18:1255–1257 60. Vianna CP, de Azevedo WF Jr (2012) buộc. Một nghiên cứu về kinase phụ thuộc cyclin 2. Biochem

Xác định các chất ức chế Mycobacteria tubercu-losis shikimate Bio-phys Res Commun 494:305–310 69. Pintro VO, Azevedo WF

kinase tiềm năng mới thông qua mô phỏng lắp ghép phân tử. (2017) Tối ưu hóa quy trình sàng lọc ảo.

J Mol Model 18:755–764 61. Azevedo LS, Moraes FP, Xavier hướng tới các chức năng tính điểm đa thức dựa trên mục tiêu cho

MM, Pantoja EO, Villavicencio B, Finck JA và cộng sự (2012) protease HIV-1. Màn hình thông lượng cao Comb Chem 20: 820–

827

Những tiến bộ gần đây về mô phỏng lắp ghép phân tử được 70. Freitas PG, Elias TC, Pinto IA, Costa LT, de Carvalho
áp dụng để phát triển thuốc. Curr Bioinf 7:352–365 PVSD, Omote DQ và cộng sự (2018)
Phương pháp tính toán để phát hiện các phân tử hóa

62. Coracini JD, de Azevedo WF Jr (2014) Shiki-mate kinase, thực vật có mục tiêu điều trị tiềm năng đối với protein

protein đích để thiết kế thuốc. PKCZ. Lett Drug Des Discovery 15:488–499 71. Levin NMB,
Curr Med Chem 21:592–604 Pintro VO, Bitencourt-Ferreira G, Mattos

63. de Avila MB, de Azevedo WF (2014) Khai thác dữ liệu kết BB, Silve'rio AC, de Azevedo WF Jr (2018) Phát triển các

quả lắp ghép. Ứng dụng của 3-dehydroquinate dehydratase hàm tính điểm nhắm mục tiêu CDK để dự đoán mối quan hệ

Curr Bioinf 9:361–379 ràng buộc.

Hóa lý sinh học 235:1–8


64. Heck GS, Pintro VO, Pereira RR, de A' vila MB, Levin
NMB, de Azevedo WF (2017) Các phương pháp học máy 72. Amaral MEA, Nery LR, Leite CE, de Azevedo WF Jr, Campos

siêu trực quan được áp dụng cho ái lực liên kết phối MM (2018) Tác dụng tiền lâm sàng của metformin và

tử trước dict. Curr Med Chem 24:2459–2470 aspirin trên dòng tế bào của các phân nhóm ung thư vú
khác nhau. Đầu tư thuốc mới 36:782–796 73. de A' vila
MB, de Azevedo WF Jr
65. de A' vila MB, Bitencourt-Ferreira G, de Aze-vedo WF Jr
(2018) Cơ sở cấu trúc để ức chế men khử Enoyl-[Acyl (2018) Phát triển mô hình học máy để dự đoán sự ức chế 3-

Carrier Protein] (InhA) từ Mycobacteria bệnh lao. Curr dehydroquinate dehydratase.

Med Chem. https://doi.org/10.2174/ 0929867326666181203125229


66. Xavier MM, Heck GS, de Avila MB, Levin NM, Pintro VO, Thuốc Chem Biol Des 92:1468–1474 74. Volkart

Carvalho NL và cộng sự (2016) PA, Bitencourt-Ferreira G, Souto AA, de Azevedo WF (2019) Kinase

phụ thuộc cyclin 2 trong lão hóa tế bào và ung thư. Đánh
giá về cấu trúc và chức năng. Mục tiêu ma túy Curr 20(7):716–

SAnDReS một công cụ tính toán để phân tích thống kê 726. https://doi.org/10. 2174/1389450120666181204165344 75.

kết quả lắp ghép và phát triển các chức năng tính điểm. Bitencourt-Ferreira G, de Azevedo WF Jr (2018) Phát triển

Màn hình thông lượng cao Comb Chem 19:801–812 67. Levin mô hình học máy để dự đoán năng lượng liên kết tự

NM, Pintro VO, de A' vila MB, de do Gibbs cho các phức hợp phối tử protein. Hóa lý sinh học 240:63–

Mattos BB, De Azevedo WF Jr (2017) Tìm hiểu cơ sở cấu trúc 69

của việc ức chế kinase phụ thuộc Cyclin. mảnh ghép mới
trong câu đố phân tử. Mục tiêu ma túy Curr 18:1104–
1111
Machine Translated by Google

Chương 6

Tiềm năng Van der Waals trong phức hợp protein

Gabriela Bitencourt-Ferreira, Martina Veit-Acosta


và Walter Filgueira de Azevedo Jr.

trừu tượng

Lực Van der Waals là yếu tố quyết định sự hình thành phức hợp protein-phối tử. Các mô hình vật lý dựa trên
thế năng Lennard-Jones có thể ước tính tương tác van der Waals với độ chính xác đáng kể và độ phức tạp
tính toán cho phép ứng dụng của nó vào mô phỏng lắp ghép phân tử và sàng lọc ảo cơ sở dữ liệu lớn về các
phân tử hữu cơ nhỏ. Một số hàm tính điểm theo kinh nghiệm được sử dụng để đánh giá tương tác protein-
phối tử gần đúng với tương tác van der Waals với thế năng Lennard-Jones. Trong chương này, chúng tôi
trình bày các khái niệm chính cần thiết để hiểu các tương tác van der Waals liên quan đến việc nhận biết
phân tử phối tử bằng túi liên kết của mục tiêu protein. Chúng tôi mô tả thế năng Lennard-Jones và ứng dụng
của nó để tính toán thế năng cho một quần thể cấu trúc nhằm làm nổi bật các đặc điểm chính liên quan đến
tầm quan trọng của sự tương tác này đối với ái lực liên kết.

Từ khóa tương tác van der Waals, tiềm năng Lennard-Jones, ái lực gắn kết, thiết kế thuốc,
Con đường Shikimate

1. Giới thiệu

Các mô hình tính toán hiện đại để dự đoán ái lực liên kết dựa trên
tọa độ nguyên tử của phức hợp phối tử protein cần đánh giá các
tương tác nguyên tử-nguyên tử không liên kết theo cách tiếp cận mạch
lạc về mặt vật lý. Đối với các đánh giá gần đây, xin vui lòng xem
ref. 1–5. Xem xét các ứng dụng để thiết kế thuốc có sự hỗ trợ của máy
tính chẳng hạn như lắp ghép phối tử protein, yếu tố quyết định chính
là độ phức tạp tính toán của thuật toán được sử dụng để đánh giá ái
lực liên kết [6–15]. Do đó, việc tăng độ phức tạp của mô hình vật lý
để dự đoán ái lực liên kết sẽ tạo ra một mô hình lý thuyết đòi hỏi
nhiều sức mạnh tính toán hơn. Các phương pháp hiện đại để dự đoán
ái lực liên kết phối tử protein phải xem xét những hạn chế của việc
thêm tính hiện thực vật lý vào mô hình tính toán.
Các công trình tiên phong của nhiều nhóm nghiên cứu đã thiết lập
nên khuôn khổ lý thuyết và thực nghiệm cho nghiên cứu thiết kế thuốc
dựa trên cấu trúc [16–18]. Những sáng kiến nghiên cứu sử dụng tia X

Walter Filgueira de Azevedo Jr. (ed.), Màn hình lắp ghép để khám phá thuốc, Phương pháp sinh học phân tử, tập. 2053,
https://doi.org/10.1007/978-1-4939-9752-7_6, © Springer Science+Business Media, LLC, một phần của Springer Nature 2019

79
Machine Translated by Google

80 Gabriela Bitencourt-Ferreira và cộng sự.

tinh thể học nhiễu xạ có thể giải quyết các cấu trúc của
phức hợp liên quan đến mục tiêu protein và một phân tử hữu cơ nhỏ
bị ràng buộc với nó. Việc phân tích tiếp theo những dữ liệu này giúp chúng ta có thể

xác định cơ sở cấu trúc cho các tương tác giữa các phân tử. BẰNG
sức mạnh tính toán tăng lên, nó cũng có thể thực hiện
phân tích các loại thuốc mới có mục tiêu là protein thông qua kỹ thuật
silico. Trong số những kỹ thuật được sử dụng trong thiết kế thuốc và
phát triển, mô phỏng lắp ghép protein-ligand là một trong những
các phương pháp tính toán được sử dụng nhiều nhất [19, 20].
Sự tiến bộ của các phương pháp lắp ghép phân tử bắt đầu từ đầu
những năm 1980 [21]. Khi các chương trình lắp ghép phân tử có sẵn,
trong phương pháp silico đã được sử dụng thành công để khám phá
thuốc mới bao gồm thuốc ức chế protease HIV-1 (EC 3.4.23.16)
[22–27]. Một tính năng chính của tất cả các mô phỏng lắp ghép là đánh giá
ái lực liên kết dựa trên tọa độ nguyên tử của
phức hợp protein-ligand. Các công cụ tính toán để đánh giá chúng
các phức hợp phải nhanh để cho phép đánh giá tính toán của
hàng ngàn vị trí cho một phối tử nhất định. Việc sử dụng lượng tử
phương pháp cơ học có thể tạo ra các mô hình vật lý mạch lạc để
tính toán ái lực liên kết. Mặt khác, cơ học lượng tử
phương pháp xử lý hệ thống phân tử sinh học với hàng nghìn nguyên tử
đòi hỏi sức mạnh tính toán cao hơn [28–37] so với cổ điển
cách tiếp cận.
Cuộc giằng co giữa sự gắn kết vật lý và độ phức tạp tính toán của
thuật toán có một đường chuyển động phụ thuộc vào
về sức mạnh tính toán có sẵn để tạo ra
mô hình dự báo. Khi sức mạnh tính toán tăng lên, độ phức tạp của thuật
toán có thể cao hơn để bao gồm các
tương tác trong mô hình tương tác protein-phối tử. Tuy nhiên, những xung
đột lợi ích giữa vật lý và độ phức tạp tính toán có một số dấu mốc trong
lịch sử của
phát triển các mô hình tính toán để dự đoán tương tác giữa nguyên tử-
nguyên tử [38]. Trong chương này, chúng ta tập trung vào van der Waals
tương tác và sự gần đúng của nó bằng thế năng Lennard-Jones.
Để minh họa ứng dụng của thế Lennard-Jones, chúng ta
đã tính toán các tương tác van der Waals cho một tập hợp các cấu trúc địa
lý tinh thể mà dữ liệu ái lực liên kết thử nghiệm
có sẵn.

2 tương tác van der Waals

Có thể có một cách giải thích ngây thơ về tương tác van der Waals
thông qua một thí nghiệm tưởng tượng liên quan đến hai quả bóng khí hình
cầu. Chúng tôi lấy những quả bóng bay này ban đầu cách nhau một khoảng
r tổng bán kính của chúng. Chúng ta có thể coi rằng chúng ta nắm giữ cả hai
bong bóng, mỗi tay một quả. Vì họ ở xa nhau
mặt khác, chúng ta có thể nhanh chóng di chuyển những quả bóng bay. Chúng ta có thể nói rằng
Machine Translated by Google

Tiềm năng Van der Waals trong phức hợp protein 81

thế năng của hệ này, hai quả bóng bay của chúng ta, bằng 0 khi khoảng cách “giữa các
quả bóng” bằng r tổng bán kính của chúng. Bây giờ hãy xem xét việc chúng ta di

chuyển những quả bóng bay vừa đủ gần để tiếp xúc với nhau. Từ giờ trở đi, nếu chúng

ta nhất quyết muốn chúng gần đúng, chúng ta phải dùng một lực để đưa chúng lại gần

hơn. Bây giờ chúng ta có năng lượng tiềm tàng tích cực. Chúng ta có thể coi những

quả bóng bay của mình như những nguyên tử; khi chúng ở xa nhau, thế năng của hệ bằng

0 và khi chúng ta ước chừng chúng, chúng ta đạt đến thế năng dương. Thí nghiệm

tưởng tượng này nắm bắt được ý tưởng cơ bản về sự tương tác giữa hai nguyên tử.

Chúng ta hãy có một cái nhìn thực tế hơn về các tương tác nguyên tử-nguyên tử

không liên kết; chúng ta xét một hệ gồm hai nguyên tử hình cầu (nguyên tử 1 và 2)

cách nhau một khoảng r và có bán kính lần lượt là r1 và r2 . Trong tình huống này,

vị trí của electron của nguyên tử 1 ở khoảng cách xa nhất so với nguyên tử 2 ngay
lập tức tạo ra sự thiếu điện tích âm của nguyên tử 1 trong vùng gần nguyên tử 2.

Chúng ta có thể coi sự vắng mặt của điện tích âm này như một điện tích dương tương

đối.

Về mặt vật lý, chúng ta có một lưỡng cực điện tức thời ở nguyên tử 1. Điện tích

dương này trong nguyên tử 1 thu hút các electron từ nguyên tử 2, tạo ra tương tác

thuận lợi nếu các nguyên tử không ở quá gần hoặc quá xa nhau. Chúng ta di chuyển cả

hai nguyên tử càng gần thì thế năng của hệ càng cao vì chúng ta phải tác dụng chống

lại lực đẩy của các electron trong cả hai nguyên tử. Khi cả hai nguyên tử ở khoảng

cách r tổng bán kính van der Waals (r1 + r2) (Hình 1a), chúng ta có thế năng gần

bằng 0. Thế năng cực tiểu là khi khoảng cách giữa các nguyên tử bằng tổng bán kính

của chúng; chúng tôi gọi khoảng cách này là khoảng cách cân bằng (reqm) (Hình 1b).

Khi chúng ta di chuyển các nguyên tử lại gần hơn, chúng ta có thế năng dương (Hình

1c). Hình 1d minh họa sự biến đổi của thế năng (V) là hàm số của khoảng cách giữa

các hạt nhân (r).

3 Tiềm năng Lennard-Jones

Mô tả ban đầu về điện thế Lennard-Jones có từ năm 1931 [38]. Phép tính gần đúng tinh

tế này cho tương tác nguyên tử-nguyên tử không liên kết hiện diện trong một số

trường lực dành riêng cho việc đánh giá tương tác phối tử-protein, chẳng hạn như

các hàm được tính toán bởi AMBER ff99 [ 39, 40], AutoDock 4 [41], TreeDock [42 ]

và ReplicaOpter [43], để đề cập đến một số.

Để hiểu sâu hơn về mô hình tương tác nguyên tử-nguyên tử, chúng ta hãy xem xét

một hệ thống gồm hai nguyên tử không liên kết cách nhau bởi khoảng cách giữa các hạt

nhân r. Thế năng của hệ gồm hai nguyên tử này có thể được biểu diễn dưới dạng hàm

của r, như sau:


Machine Translated by Google

82 Gabriela Bitencourt-Ferreira và cộng sự.

Hình 1 Tương tác nguyên tử-nguyên tử không liên kết. (a) Trong trường hợp này, chúng ta có khoảng cách hạt nhân r r1 + r2.

(b) Bây giờ chúng ta có hệ thống cách nhau một khoảng cách cân bằng (reqm). (c) Khi chúng ta di chuyển các nguyên tử lại gần hơn,

đám mây điện tử của chúng chồng lên nhau, các hạt nhân tích điện dương trở nên ít được che chắn bởi các điện tích âm và

hai nguyên tử đẩy nhau. (d) Đồ thị biến thiên của thế năng (V) so với

khoảng cách hạt nhân (r)

Aebr C 6
V rð Þ¼ ð1Þ
r r6

trong đó A, b và C6 là các tham số dành riêng cho cặp cụ thể


nguyên tử và phải được xác định bằng thực nghiệm [44–46]. phương trình. (1)
được đặt tên là thế Buckingham [44]. Thuật ngữ đầu tiên của phương trình. (1) là
6
thời hạn là
chịu trách nhiệm về năng lượng trao đổi đẩy và –r

liên quan đến sự tương tác hấp dẫn. Trong một số điểm thực nghiệm
các hàm số mũ thường được tính gần đúng như sau:

MỘT C12
ebr ð2Þ
r r12

Do đó, thế năng có thể được tính gần đúng bằng cách sử dụng
biểu thức sau:

Cn Cm
V rð Þ ¼ Cnrn Cmrm ð3Þ
rn rm

trong đó m và n là các số nguyên, còn Cn và Cm là các hằng số có


các giá trị dựa trên sự phân tách cân bằng giữa hai nguyên tử
và độ sâu của giếng năng lượng.
Nói chung, phương trình. (3) được thực hiện tính toán như sau:
Machine Translated by Google

Tiềm năng Van der Waals trong phức hợp protein 83

Hình 2 Lennard-Jones 12-6 tiềm năng nitơ-oxy

tôi N N tôi

nmεr phương trình


nmεr phương trình

V LJð Þ r ð4Þ
rn rm

trong đó VLJ là thế năng Lennard-Jones, ε là độ sâu giếng


của hàm thế năng, và reqm là khoảng cách cân bằng giữa hai nguyên tử.
Các số m và n là số nguyên được lấy
là n = 12 và m = 6 đối với thế Lennard-Jones ban đầu.
Hình 2 minh họa thế năng Lennard-Jones tiêu chuẩn đối với NO
sự tương tác. Mặc dù hình thức tính toán của phương trình. (4) đã được
áp dụng thành công cho một số hệ thống phân tử sinh học [39–43], ứng
dụng phương trình. (1) (dạng mũ-6) đã cho thấy hiệu suất dự đoán vượt
trội trong việc đánh giá các chế độ liên kết nguyên gốc trong
các hệ thống phân tử sinh học như kinase phụ thuộc cyclin (CDK) và
protease [47]. CDK và protease đều là protein quan trọng
mục tiêu phát triển thuốc [48–61].
Sự thay đổi như vậy của hiệu suất dự đoán với loại
hệ thống phân tử sinh học phù hợp với khái niệm tính điểm
không gian hàm [3]. Tóm lại, chúng tôi thấy sự tương tác giữa protein-phối tử là một

kết quả của mối quan hệ giữa không gian protein [62] và
không gian hóa học [63], và chúng tôi đề xuất tiếp cận các tập hợp này như một
hệ thống phức tạp độc đáo, nơi ứng dụng tính toán
các phương pháp luận có thể góp phần thiết lập các nguyên tắc vật lý
để hiểu cơ sở cấu trúc cho tính đặc hiệu của phối tử
cho protein. Chúng tôi đề xuất sử dụng sự trừu tượng của một toán học
không gian bao gồm các mô hình tính toán vô hạn để dự đoán phối tử
ái lực ràng buộc, được đặt tên ở đây là không gian hàm tính điểm. Bằng cách sử dụng
Machine Translated by Google

84 Gabriela Bitencourt-Ferreira và cộng sự.

kỹ thuật học máy có giám sát, chúng ta có thể khám phá không gian hàm
tính điểm này để xây dựng mô hình tính toán nhắm mục tiêu
hệ thống sinh học cụ thể.

4 Tính toán tiềm năng Lennard-Jones cho phức hợp Protein-Ligand

Để minh họa các tính toán tương tác van der Waals của các phức hợp pro-
tein-ligand, chúng tôi đã sử dụng một hệ thống sinh học bao gồm
enzyme của con đường shikimate. Con đường trao đổi chất này là mục tiêu
để phát triển thuốc diệt cỏ và thuốc kháng khuẩn [64]. Các
con đường shikimate đã được đệ trình để có cấu trúc và cường độ cao
nghiên cứu tính toán [65–102] do tính liên quan của nó đối với thuốc
thiết kế và phát triển.
Chúng tôi đã tìm kiếm Ngân hàng Dữ liệu Protein (PDB) [103–105] để tìm
enzyme DAHP (3-Deoxy-D-arabinoheptulosonate 7-phosphate)
synthase (EC 2.5.1.54), shikimate kinase (EC 2.7.1.71) và
3-dehydroquinate dehydratase (EC 4.2.1.10) của quá trình trao đổi chất này
tuyến đường có sẵn dữ liệu về hằng số ức chế (Ki) . Chúng tôi
đã tìm thấy tổng cộng 23 cấu trúc tinh thể mà dữ liệu Ki
có sẵn (tìm kiếm được thực hiện vào ngày 18 tháng 12 năm 2018). Bảng 1
hiển thị mã truy cập PDB cho tất cả các cấu trúc được xác định trong PDB.

Chúng tôi đã triển khai phương trình. (4) bằng Python (chương trình SFSXplorer) và

được xem xét các tham số Lennard-Jones 12–6 tự nhất quán của
trường lực bán thực nghiệm AutoDock 4 [41]. Sự tán xạ
biểu đồ cho ái lực liên kết thực nghiệm (log(Ki)) và giá trị được tính toán
thế năng VLJ được biểu diễn trên Hình 3. Mối tương quan bậc Spearman

Bảng 1

Danh sách protein được sử dụng trong nghiên cứu này

Mã truy cập PDB

4UMA, 4UMB, 4UMC, 4BQS, 1H0R, 1GU1, 1V1J, 2BT4, 2C4W, 2XB8, 2XB9, 3N76, 3N7A, 3N86,
3N87, 3N8K, 3N8N, 4B6O, 4B6P, 4B6R, 4B6S, 4CIW, 4CIY

40

20

–20

–40

–60
–9,5 –9 –8,5 -số 8 –7,5 –7 –6,5 –6 –5,5 –5 –4,5 –4 –3,5 –3 –2,5 –1,5 –2

Hình 3 Biểu đồ phân tán của VLJ dựa trên log thử nghiệm (Ki ). Chúng tôi đã tạo biểu đồ này bằng chương trình Molegro Data

Người tạo mô hình (MDM) [134, 135]


Machine Translated by Google

Tiềm năng Van der Waals trong phức hợp protein 85

giữa log thử nghiệm (Ki) và VLJ là 0,51 ( giá trị p = 0,01).
Mức độ tương quan này là đáng kể. Hơn nữa, các tương tác van der
Waals đã được chứng minh là có tầm quan trọng then chốt đối với ái
lực liên kết phối tử trong một số nghiên cứu tập trung vào nhiều
loại protein khác nhau [106–133].

5 Sẵn có

SFSXplorer được triển khai bằng Python và có sẵn để tải xuống theo
giấy phép GNU tại https://github.com/azevedolab/ SFSXplorer. Tập dữ
liệu shikimate có sẵn để tải xuống tại https://azevedolab.net/receptor-
ligand-systems-database.php.

6 Colophon

Chúng tôi đã tạo Hình 1 bằng Microsoft PowerPoint 2016. Chúng tôi đã
sử dụng SFSXplorer để tạo Hình 2. Chúng tôi đã tạo Hình 3 bằng
Molegro Data Modeller (MDM) [134, 135]. Chúng tôi đã thực hiện tính
toán chức năng tính điểm được mô tả trong chương này bằng cách sử
dụng Máy tính để bàn có bộ nhớ 4 GB, ổ cứng 1 TB và bộ xử lý Intel®
Core® i3-2120 @ 3,30 GHz chạy Windows 8.1.

7 nhận xét cuối cùng

Các tương tác Van der Waals có thể được tính toán trực tiếp bằng
cách sử dụng thế Lennard-Jones và được triển khai bằng ngôn ngữ máy
tính cấp cao như Python. Sự sẵn có của thông tin thực nghiệm về cấu
trúc và ái lực liên kết mở ra khả năng tạo ra các hàm tính điểm nhắm
mục tiêu theo enzyme để dự đoán trước ái lực liên kết trong đó dữ
liệu thực nghiệm được sử dụng để hiệu chỉnh chức năng tính điểm hoàn
chỉnh cho một hệ thống sinh học cụ thể.

Sự nhìn nhận

Công việc này được hỗ trợ bởi các khoản tài trợ từ CNPq (Brazil)
(308883/ 2014-4). Nghiên cứu này được tài trợ một phần bởi
Coordenac¸a˜o de Aperfeic¸oamento de Pessoal de Nivel Superior—Brasil
(CAPES)— Mã Tài chính 001. GB-F thừa nhận sự hỗ trợ từ học bổng PUCRS/
BPA. MV-A ghi nhận sự hỗ trợ từ PUCRS/IC Jr. WFA là nhà nghiên cứu
cấp cao của CNPq (Brazil) (Mã số quy trình: 308883/2014-4 và
309029/2018-0).
Machine Translated by Google

86 Gabriela Bitencourt-Ferreira và cộng sự.

Người giới thiệu

1. Wang C, Greene D, Xiao L, Qi R, Luo R (2018) Những phát nhận diện và phát hiện thuốc. Curr Top Med Chem 18:1737–
triển và ứng dụng gần đây của phương pháp MMPBSA. Front 1744 14. Sotriffer C (2018) Việc
Mol Biosci 4:87
kết nối các phối tử cộng hóa trị: những thách thức và cách
tiếp cận. Mol Thông báo 37:e1800062
2. Cappel D, Sherman W, Beuming T (2017)
Tính toán nhiệt động lực học của nước tại vị trí liên 15. Leelananda SP, Lindert S (2016) Phương pháp tính toán
kết của protein—ứng dụng của WaterMap vào việc phát hiện trong phát hiện thuốc. Beilstein J Org Chem 12:2694–2718
thuốc. Curr Top Med Chem 17:2586–2598 3. Bernetti M, 16. Roberts NA, Martin JA,
Cavalli A, Mollica L (2017)
Kinchington D, Broadhurst AV, Craig JC, Duncan IB và cộng sự
(1990) Thiết kế hợp lý các chất ức chế proteinase HIV
Động học liên kết với protein-ligand (un) như một mô hình dựa trên peptide.
mới để khám phá thuốc ở ngã tư giữa thí nghiệm và mô Khoa học
hình hóa. Med-chemcomm 8:534–550 248:358–361

17. Erickson J, Neidhart DJ, VanDrie J, Kempf DJ, Wang XC,


4. Jaegle M, Wong EL, Tauber C, Nawrotzky E, Arkona C, Norbeck DW và cộng sự (1990)
Rademann J (2017) Các đoạn nối mảnh được tạo khuôn bằng Thiết kế, hoạt động và 2.8 Cấu trúc tinh thể của chất ức
protein-từ nhận dạng phân tử đến khám phá thuốc. Angew chế đối xứng C2 tạo phức với protease HIV-1. Khoa học
Chem Int Ed Engl 56:7358–7378 5. Yin J, Henriksen NM, 249:527–533 18. Dorsey BD, Levin RB, McDaniel
Slochower DR, Shirts MR, Chiu MW,
SL, Vacca JP, Guare JP, Darke PL và cộng sự (1994)
Mobley DL et al (2017)

L-735,524: thiết kế một chất ức chế protease HIV mạnh và


Tổng quan về thách thức máy chủ-khách SAMPL5: chúng ta khả dụng sinh học qua đường uống. J Med Chem 37:3443–3451
có đang làm tốt hơn không? J Comput Aided Mol Des 31:1–
19
19. Vilar S, Sobarzo-Sanchez E, Santana L, Uriarte E (2017)
6. de Azevedo WF Jr (2010) MolDock áp dụng cho sàng lọc ảo Kết nối phân tử và khám phá thuốc trong các thụ thể β-
dựa trên cấu trúc. Mục tiêu thuốc Curr 11:327–334 7. adrenergic.
Chakravarty K, Dalal DC (2018) Curr Med Chem 24:4340–4359 20. Xia X

Mô hình toán học về việc giải phóng thuốc liposome đến khối (2017) Tin sinh học và khám phá thuốc. Curr Top Med Chem
u. Sinh học toán 306:82–96 17:1709–1726 21. Kuntz ID, Blaney JM, Oatley SJ,

Langridge R, Ferrin TE (1982) Một cách tiếp cận hình học đối
8. Qi R, Luo R (2019) Tính mạnh mẽ và hiệu quả của mô hình với các tương tác giữa đại phân tử-phối tử. J Mol Biol
poisson-bolzmann trên các đơn vị xử lý đồ họa. J Chem 161:269–288 22. DesJarlais RL, Dixon JS (1994) Phương
Inf Model 59:409–420 9. He X, Man VH, Ji B, Xie XQ, Wang pháp lắp ghép dựa trên hình dạng và
J (2019)
hóa học cũng như việc sử dụng nó trong thiết kế các chất ức
chế protease HIV-1. J Comput Aided Mol Des 8:231–242 23.
Tính toán ái lực liên kết phối tử protein bằng phương Lunney EA, Hagen SE, Domagala JM, Humblet C, Kosinski J,
pháp năng lượng tương tác tuyến tính mở rộng: ứng dụng Tait BD và cộng sự (1994)
trên bộ Cathepsin S trong D3R Grand Challenge 3. J Comput
Aided Mol Des 33:105–117

Một chất ức chế protease HIV-1 nonpeptide mới: làm sáng


10. Li A, Gilson MK (2018) Entanpy liên kết phối tử protein tỏ chế độ liên kết và ứng dụng của nó trong thiết kế
từ các mô phỏng gần một phần nghìn giây: phân tích các chất tương tự liên quan. J Med Chem 37:2664–2677
nghịch lý tiền tổ chức. J Chem Phys 149:072311

24. Vaillancourt M, Cohen E, Sauve' G (1995)


11. Miao Y, Huang YM, Walker RC, McCammon JA, Chang CA (2018) Đặc điểm của các chất ức chế trạng thái động của protease
Con đường liên kết phối tử và sự chuyển đổi hình dạng HIV-1. Chất ức chế enzym J 9:217–233
của protease HIV. Hóa sinh 57:1533–1541 12. Hoffer L,
Muller C, Roche P, Morelli X (2018) Tối ưu hóa Hit-to-
25. Gehlhaar DK, Verkhivker GM, Rejto PA, Sherman CJ, Fogel
lead dựa trên hóa học được hướng dẫn bởi các phương pháp tiếp DB, Fogel LJ và cộng sự (1995) Nhận biết phân tử chất ức
cận dựa trên cấu trúc. chế AG-1343 bằng protease HIV-1: lắp ghép linh hoạt về
hình dạng bằng chương trình tiến hóa. Chem Biol 2:317–
Mol Thông báo 37:e1800059
324 26. King BL, Vajda S, DeLisi C (1996) Năng lượng tự
13. Yadav BS, Tripathi V (2018) Những tiến bộ gần đây trong do theo kinh nghiệm như một chức
mục tiêu dựa trên sinh học hệ thống năng mục tiêu trong việc lắp ghép và
Machine Translated by Google

Tiềm năng Van der Waals trong phức hợp protein 87

thiết kế: ứng dụng vào chất ức chế protease HIV-1. 38. Lennard-Jones JE (1931) Sự gắn kết. Proc
THÁNG 2 Lett 384:87–91 Vật Lý Sóc 43:461–482

27. Wang S, Milne GW, Yan X, Posey IJ, Nicklaus 39. Cornell WD, Cieplak P, Bayly CI, Gould IR,
MC, Graham L và cộng sự (1996) Khám phá về Merz KM, Ferguson DM và cộng sự (1995) Trường
chất ức chế protease HIV-1 mới, không chứa peptide lực thế hệ thứ hai cho mô phỏng
bằng cách tìm kiếm dược lý. J Med Chem của protein, axit nucleic và các phân tử hữu cơ.
39:2047–2054 J Am Chem Sóc 117:5179–5197

28. Adeniyi AA, Soliman MES (2017) Triển khai QM 40. Hornak V, Abel R, Okur A, Strockbine B,
trong tính toán lắp ghép: nó có phải là một Roitberg A, Simmerling C (2006) So sánh nhiều
lãng phí thời gian tính toán? Thuốc Discov trường lực Amber và phát triển khung protein cải
Hôm nay 22:1216–1223 tiến

29. Crespo A, Rodriguez-Granillo A, Lim VT thông số. Protein 65:712–725

(2017) Phương pháp cơ học lượng tử 41. Huey R, Morris GM, Olson AJ, Goodsell DS
trong khám phá thuốc: ứng dụng của việc lắp ghép (2007) Trường lực tự do bán thực nghiệm
và ghi điểm trong tối ưu hóa khách hàng tiềm năng. Curr hàng đầu với sự phá hủy dựa trên điện tích. Máy tính J
Med Chem 17:2663–2680 Hóa học 28:1145–1152

30. Yilmazer ND, Korth M (2016) Những tiến bộ gần 42. Fahmy A, Wagner G (2002) TreeDock: một công cụ
đây trong việc xử lý tương tác protein-phối tử để gắn protein dựa trên việc giảm thiểu van
bằng các phương pháp cơ học lượng tử. Int J năng lượng der Waals. J Am Chem Sóc
Khoa học Mol 17:742 124:1241–1250

31. Cavasotto CN, Adler NS, Aucar MG (2018) 43. Demerdash ON, Buyan A, Mitchell JC
Phương pháp tiếp cận hóa học lượng tử trong sàng lọc (2010) ReplicaOpter: trình tối ưu hóa sao chép cho
ảo dựa trên cấu trúc và tối ưu hóa khách hàng tiềm năng. lắp ghép linh hoạt. Protein 78:3156–3165
Mặt trận 29(6):188 44. Buckingham A (1938) Phương trình cổ điển
32. Hitzenberger M, Schuster D, Hofer TS trạng thái khí heli, neon và argon.
(2017) Chế độ liên kết của robotnikinin ức chế Proc R Soc London Ser A 168:264–283

lợn bằng âm thanh, một nghiên cứu kết hợp giữa 45. Teik-Cheng L (2007) Hệ số tỷ lệ thay thế giữa
lắp ghép và QM/MM MD. Chem trước Lennard-Jones và hàm thế năng Exponential-6. Mô
5:76
phỏng Mol
33. Salmas RE, Is YS, Durdagi S, Stein M, Yurts-ever 33:1029–1032

M (2018) Một cuộc điều tra về phối tử protein QM 46. Xantheas SS, Werhahn JC (2014) Phổ thông
của thuốc chống loạn thần với mở rộng các hàm năng lượng tiềm năng mô tả các tương
thụ thể dopamin D2 (D2R). J sinh khối tác giữa các phân tử.
Cấu trúc Dyn 36:2668–2677 I. Nền tảng và các hình thức có thể mở rộng của mới

34. Phipps MJ, Fox T, Tautermann CS, Skylaris khái quát hóa Mie, Lennard-Jones, Morse và
CK (2017) Hàm mật độ trực quan Điện thế số mũ-6 của Buckingham. J
phân tích phân hủy năng lượng dựa trên lý thuyết Hóa lý 141:064117
cho các tương tác protein-ligand. Lý thuyết J 47. Bazgier V, Berka K, Otyepka M, Bana'sˇ P
Chem Máy tính 13:1837–1850 (2016) Lực đẩy theo cấp số nhân cải thiện khả
35. Hylsova' M, Carbain B, Fanfrlı'k J, Musilova' L, năng dự đoán cấu trúc của việc lắp ghép phân tử. J
Haldar S, Ko¨pru¨lu¨og˘lu C và cộng sự (2017) Rõ ràng Máy tính Hóa học 37:2485–2494
xử lý nước tại vị trí hoạt động giúp tăng cường 48. Volkart PA, Bitencourt-Ferreira G, nghệ thuật AA, de
tính điểm dung môi cơ học/ngầm lượng tử: Azevedo WF (2019) Kinase phụ thuộc cyclin
Sự ức chế CDK2 bằng pyrazolo mới[1,5-a] 2 trong lão hóa tế bào và ung thư. Đánh giá về cấu
pyrimidine. Eur J Med Chem trúc và chức năng. Mục tiêu ma túy Curr 20(7):716–726.
126:1118–1128
https://doi.org/10.
36. Pecina A, Meier R, Fanfrlı'k J, Lepsˇ`ık M, 2174/1389450120666181204165344
Rˇ eza'cˇ J, Hobza P và cộng sự (2016) 49. de Azevedo WF Jr (2016) Bài viết lấy ý kiến:
Bộ lọc SQM/COSMO: tư thế tự nhiên đáng tin cậy nhắm mục tiêu nhiều kinase phụ thuộc cyclin
nhận dạng dựa trên mô tả cơ học lượng tử của (CDK): Một chiến lược mới cho nghiên cứu lắp
phối tử protein ghép phân tử. Mục tiêu ma túy Curr 17:2
tương tác và hòa tan COSMO tiềm ẩn.
50. Perez PC, Caceres RA, Canduri F, de Azevedo
Cộng Chém (Camb) 52:3312–3315
WF Jr (2009) Mô hình phân tử và
37. Yang Z, Liu Y, Chen Z, Xu Z, Shi J, Chen K mô phỏng động lực của kinase 3 phụ thuộc cyclin
et al (2015) Chức năng chấm điểm liên kết hal- ở người được tạo phức với các chất ức chế. Máy
ogen dựa trên cơ học lượng tử cho các tương tác tính Biol Med 39:130–140
phối tử protein. J Mol Model 21:138

You might also like