Hệ thống phân cấp Chomsky

Trong các lĩnh vực lý thuyết ngôn ngữ hình thức, khoa học máy tính và ngôn ngữ học, hệ thống phân cấp Chomsky là một hệ thống phân cấp các lớp ngữ pháp hình thức hay văn phạm hình thức. Ngữ pháp hình thức mô tả cách tạo chuỗi từ bảng chữ cái của ngôn ngữ có giá trị theo cú pháp của ngôn ngữ đó. Nhà ngôn ngữ học Noam Chomsky đã đưa ra giả thuyết rằng có bốn lớp văn phạm hình thức khác nhau có thể sinh ra các ngôn ngữ ngày càng phức tạp hơn. Mỗi lớp cũng có thể hoàn toàn sinh ra ngôn ngữ của tất cả các lớp thấp hơn, bao gồm cả tập hợp.
Lịch sử
Ý tưởng chung về một hệ thống phân cấp ngữ pháp lần đầu tiên được Noam Chomsky mô tả trong bài viết "Ba mô hình cho việc mô tả ngôn ngữ" trong quá trình chính thức hóa ngữ pháp chuyển đổi – tạo sinh (transformational-generative grammar, TGG).Bản mẫu:Sfn Nhà toán học Marcel-Paul Schützenberger cũng đã đóng vai trò trong sự phát triển của lý thuyết ngôn ngữ hình thức; bài báo "Lý thuyết đại số của ngôn ngữ phi ngữ cảnh"Bản mẫu:Sfn mô tả hệ thống phân cấp hiện đại, bao gồm cả văn phạm phi ngữ cảnh.[1]
Một cách độc lập, bên cạnh các nhà ngôn ngữ học, các nhà toán học cũng đang phát triển các mô hình tính toán (thông qua Automat). Phân tích một câu trong một ngôn ngữ tương tự như tính toán, và các văn phạm do Chomsky mô tả được chứng minh vừa giống vừa tương đương về sức mạnh tính toán với nhiều mô hình máy khác nhau.[2]
Hệ thống phân cấp
| Văn phạm | Ngôn ngữ | Nhận diện automat | Quy tắc sinh
(ràng buộc)Bản mẫu:Efn |
Ví dụ[3][4] |
|---|---|---|---|---|
| Loại 3 | Chính quy | Máy trạng thái hữu hạn | , (chính quy phải)
hoặc , (chính quy trái) |
|
| Loại 2 | Phi ngữ cảnh | Máy tự động đẩy xuống không xác định | ||
| Loại 1 | Cảm ngữ cảnh | Máy Turing không xác định giới hạn tuyến tính | ||
| Loại 0 | Ngữ cấu | Máy Turing | ( không được rỗng) | mô tả một máy Turing kết thúc |
Bản mẫu:NoteslistMỗi ngôn ngữ chính quy đều là ngôn ngữ phi ngữ cảnh, mỗi ngôn ngữ phi ngữ cảnh đều là ngôn ngữ cảm ngữ cảnh, mỗi ngôn ngữ cảm ngữ cảnh đều là ngôn ngữ ngữ cấu (ngôn ngữ tổng quát, ngôn ngữ không hạn chế) và mỗi ngôn ngữ ngữ cấu đều có thể đếm đệ quy. Tất cả đều là các bao hàm chính xác, có nghĩa là tồn tại các ngôn ngữ có thể đếm đệ quy mà không phải ngôn ngữ cảm ngữ cảnh, các ngôn ngữ cảm ngữ cảnh mà không phải là ngôn ngữ phi ngữ cảnh, và các ngôn ngữ phi ngữ cảnh mà không phải là ngôn ngữ chính quy.[5]
Văn phạm chính quy
Bản mẫu:Xem thêmVăn phạm mà các quy tắc sinh của nó có dạng , (hay tuyến tính phải, chính quy phải) hoặc , (hay tuyến tính trái, chính quy trái), trong đó: và thì được gọi là văn phạm chính quy hoặc văn phạm loại 3.
Văn phạm phi ngữ cảnh
Bản mẫu:Xem thêm Văn phạm mà các quy tắc sinh của nó có dạng , trong đó: và thì được gọi là văn phạm phi ngữ cảnh hoặc văn phạm loại 2.
Văn phạm cảm ngữ cảnh
Bản mẫu:Xem thêm Văn phạm mà các quy tắc sinh của nó có dạng , trong đó: ; và thì được gọi là văn phạm ngữ cảnh hoặc văn phạm loại 1.
Văn phạm ngữ cấu
Bản mẫu:Xem thêm Văn phạm mà các quy tắc sinh có dạng , trong đó và thì được gọi là văn phạm ngữ cấu hoặc văn phạm loại 0.