Hệ thống phân cấp Chomsky

Từ testwiki
Bước tới điều hướng Bước tới tìm kiếm
Tập hợp các phân loại được mô tả trong hệ thống phân cấp Chomsky.
Tập hợp các phân loại được mô tả trong hệ thống phân cấp Chomsky.

Trong các lĩnh vực lý thuyết ngôn ngữ hình thức, khoa học máy tínhngôn ngữ học, hệ thống phân cấp Chomsky là một hệ thống phân cấp các lớp ngữ pháp hình thức hay văn phạm hình thức. Ngữ pháp hình thức mô tả cách tạo chuỗi từ bảng chữ cái của ngôn ngữ có giá trị theo cú pháp của ngôn ngữ đó. Nhà ngôn ngữ học Noam Chomsky đã đưa ra giả thuyết rằng có bốn lớp văn phạm hình thức khác nhau có thể sinh ra các ngôn ngữ ngày càng phức tạp hơn. Mỗi lớp cũng có thể hoàn toàn sinh ra ngôn ngữ của tất cả các lớp thấp hơn, bao gồm cả tập hợp.

Lịch sử

Ý tưởng chung về một hệ thống phân cấp ngữ pháp lần đầu tiên được Noam Chomsky mô tả trong bài viết "Ba mô hình cho việc mô tả ngôn ngữ" trong quá trình chính thức hóa ngữ pháp chuyển đổi – tạo sinh (transformational-generative grammar, TGG).Bản mẫu:Sfn Nhà toán học Marcel-Paul Schützenberger cũng đã đóng vai trò trong sự phát triển của lý thuyết ngôn ngữ hình thức; bài báo "Lý thuyết đại số của ngôn ngữ phi ngữ cảnh"Bản mẫu:Sfn mô tả hệ thống phân cấp hiện đại, bao gồm cả văn phạm phi ngữ cảnh.[1]

Một cách độc lập, bên cạnh các nhà ngôn ngữ học, các nhà toán học cũng đang phát triển các mô hình tính toán (thông qua Automat). Phân tích một câu trong một ngôn ngữ tương tự như tính toán, và các văn phạm do Chomsky mô tả được chứng minh vừa giống vừa tương đương về sức mạnh tính toán với nhiều mô hình máy khác nhau.[2]

Hệ thống phân cấp

Văn phạm Ngôn ngữ Nhận diện automat Quy tắc sinh

(ràng buộc)Bản mẫu:Efn

Ví dụ[3][4]
Loại 3 Chính quy Máy trạng thái hữu hạn Aa, AaB (chính quy phải)

hoặc

Aa, ABa (chính quy trái)

L={an|n>0}
Loại 2 Phi ngữ cảnh Máy tự động đẩy xuống không xác định Aα L={anbn|n>0}
Loại 1 Cảm ngữ cảnh Máy Turing không xác định giới hạn tuyến tính αAβαγβ L={anbncn|n>0}
Loại 0 Ngữ cấu Máy Turing γα (γ không được rỗng) L={w|w mô tả một máy Turing kết thúc}

Bản mẫu:NoteslistMỗi ngôn ngữ chính quy đều là ngôn ngữ phi ngữ cảnh, mỗi ngôn ngữ phi ngữ cảnh đều là ngôn ngữ cảm ngữ cảnh, mỗi ngôn ngữ cảm ngữ cảnh đều là ngôn ngữ ngữ cấu (ngôn ngữ tổng quát, ngôn ngữ không hạn chế) và mỗi ngôn ngữ ngữ cấu đều có thể đếm đệ quy. Tất cả đều là các bao hàm chính xác, có nghĩa là tồn tại các ngôn ngữ có thể đếm đệ quy mà không phải ngôn ngữ cảm ngữ cảnh, các ngôn ngữ cảm ngữ cảnh mà không phải là ngôn ngữ phi ngữ cảnh, và các ngôn ngữ phi ngữ cảnh mà không phải là ngôn ngữ chính quy.[5]

Văn phạm chính quy

Bản mẫu:Xem thêmVăn phạm G=Σ,Δ,S,P mà các quy tắc sinh của nó có dạng Aa, AaB (hay tuyến tính phải, chính quy phải) hoặc Aa, ABa (hay tuyến tính trái, chính quy trái), trong đó: A,BΔαΣ thì được gọi là văn phạm chính quy hoặc văn phạm loại 3.

Văn phạm phi ngữ cảnh

Bản mẫu:Xem thêm Văn phạm G=Σ,Δ,S,P mà các quy tắc sinh của nó có dạng Aα, trong đó: AΔα(ΣΔ)* thì được gọi là văn phạm phi ngữ cảnh hoặc văn phạm loại 2.

Văn phạm cảm ngữ cảnh

Bản mẫu:Xem thêm Văn phạm G=Σ,Δ,S,P mà các quy tắc sinh của nó có dạng αAβαγβ, trong đó: AΔ; α,γ,β(ΣΔ)*γϵ thì được gọi là văn phạm ngữ cảnh hoặc văn phạm loại 1.

Văn phạm ngữ cấu

Bản mẫu:Xem thêm Văn phạm G=Σ,Δ,S,P mà các quy tắc sinh có dạng γα, trong đó α,γ(ΣΔ)*γϵ thì được gọi là văn phạm ngữ cấu hoặc văn phạm loại 0.

Chú thích

Tham khảo

Bản mẫu:Tham khảo

Tài liệu

Bản mẫu:Refbegin

Bản mẫu:RefendBản mẫu:Sơ khai