Professional Documents
Culture Documents
Đề cương2
Đề cương2
-Văn phạm (Grammar) là một bộ quy tắc định nghĩa cách một ngôn
ngữ được cấu thành từ các thành phần cơ bản của nó. Văn phạm
thường được sử dụng trong ngành khoa học máy tính để định nghĩa
ngữ pháp và cú pháp của một ngôn ngữ lập trình.
-Quy ước:
+Ký hiệu kết thúc được viết bằng chữ thường hoặc các số.
+Ký hiệu chưa kết thúc được viết bằng chữ in.
+Ký hiệu chưa kết thúc nằm bên trái của sản xuất đầu tiên là ký hiệu
bắt đầu.
-Để thuận tiện về mặt kí hiệu, ta dùng định nghĩa chính qui (ĐNCQ)
để đặt tên cho các BTCQ
*Biểu thức chính quy
-Biểu thức chính quy (Regular Expression) là một công cụ được sử
dụng để đặc tả các chuỗi ký tự theo một mẫu nhất định. Biểu thức
chính quy thường được sử dụng để tìm kiếm và so khớp các chuỗi
ký tự trong các ứng dụng văn bản như tìm kiếm và thay thế, phân
tích cú pháp, và kiểm tra tính hợp lệ của định dạng email hoặc số
điện thoại. Biểu thức chính quy cũng được sử dụng để đặc tả ngôn
ngữ thông qua các quy tắc ký tự và cú pháp.
-Một ĐNCQ là một dãy các định nghĩa có dạng
d1 → r1
d2 → r2
.........
d n → rn
-Trong đó di là các tên, ri là các BTCQ trên tập các kí hiệu Σ∪{d1,
d2, ....di-1}
4.Định nghĩa otomat? Các thành phần của otomat? Bài tập về otomat
đoán nhận ngôn ngữ và biểu thức chính quy? Vẽ đồ thị chuyển?
-Automaton (Otomat) là một mô hình toán học đơn giản được sử
dụng để mô hình hóa hệ thống tự động. Otomat được sử dụng trong
nhiều lĩnh vực, ví dụ như trong lý thuyết tính toán, xử lý ngôn ngữ tự
nhiên, xử lý tín hiệu, v.v...
-Các thành phần của Otomat bao gồm:
+Trạng thái (State): Trạng thái là những điểm đánh dấu về trạng thái
của hệ thống tại một thời điểm nào đó.
+Bộ ký tự vào (Input Alphabet): Bộ ký tự vào là tập hợp các ký tự
đầu vào được chấp nhận bởi Otomat.
+Hàm chuyển trạng thái (Transition function): Hàm chuyển trạng
thái biểu diễn các quy tắc chuyển đi từ một trạng thái đến trạng thái
khác dựa trên các ký tự đầu vào.
+Trạng thái ban đầu (Initial state): Trạng thái ban đầu là trạng thái
khởi đầu của Otomat.
+Trạng thái kết thúc (Accepting state): Trạng thái kết thúc là trạng
thái mà Otomat chấp nhận nhận dạng chuỗi đầu vào.
5.Biểu thức chính quy?
-Biểu thức chính quy là một chuỗi ký tự được sử dụng để mô tả một
ngôn ngữ hình thức. Biểu thức chính quy được sử dụng trong lý
thuyết ngôn ngữ hình thức và trong các ứng dụng liên quan đến xử
lý ngôn ngữ như trích xuất thông tin từ văn bản, kiểm tra cú pháp,
tìm kiếm và thay thế. Biểu thức chính quy được sử dụng để miêu tả
các quy tắc cú pháp của một chuỗi ký tự và bao gồm các ký tự, toán
tử và ký hiệu đặc biệt.
-Các ký tự trong biểu thức chính quy thường đại diện cho các ký tự
hoặc chuỗi ký tự cụ thể, ví dụ như "a" để biểu diễn ký tự "a", hoặc
"abc" để biểu diễn chuỗi ký tự "abc". Các toán tử trong biểu thức
chính quy được sử dụng để kết hợp các ký tự hoặc chuỗi ký tự thành
các mẫu phức tạp hơn. Ví dụ, toán tử "|" được sử dụng để chỉ định
một trong các tùy chọn khả dĩ, như trong biểu thức "a|b" để biểu diễn
ký tự "a" hoặc "b". Các ký hiệu đặc biệt trong biểu thức chính quy
được sử dụng để chỉ định các vị trí đặc biệt trong chuỗi, chẳng hạn
như "^" để chỉ định vị trí đầu tiên của chuỗi hoặc "$" để chỉ định vị
trí cuối cùng của chuỗi.
-Ví dụ về một biểu thức chính quy đơn giản là "a(b|c)*", biểu thị một
chuỗi bắt đầu với ký tự "a", theo sau bởi bất kỳ số lượng lặp lại của
một chuỗi bao gồm ký tự "b" hoặc "c". Biểu thức chính quy này có
thể được sử dụng để mô tả một loạt các chuỗi như "ab", "ac", "abb",
"abc", "accccccb" và nhiều hơn nữa.
Bài1:Cho các văn phạm:
Bài 3: Hãy xây dựng các biểu thức chính quy và các otomat hữu hạn
đơn định biểu diễn các ngôn ngữ sau: