Martingale Doob

Từ testwiki
Phiên bản vào lúc 18:23, ngày 11 tháng 5 năm 2021 của imported>InternetArchiveBot (Đã cứu 1 nguồn và đánh dấu 0 nguồn là hỏng.) #IABot (v2.0.8)
(khác) ← Phiên bản cũ | Phiên bản mới nhất (khác) | Phiên bản mới → (khác)
Bước tới điều hướng Bước tới tìm kiếm

Bản mẫu:Chú thích trong bài

Một martingale Doob (còn gọi là martingale Levy) là một quá trình ngẫu nhiên tính giá trị của một biến ngẫu nhiên và có tính chất martingale theo một bộ lọc cho trước. Nó có thể được xem là giá trị xấp xỉ của một biến ngẫu nhiên dựa vào thông tin tích lũy được cho tới một thời điểm nhất định.

Định nghĩa

Một martingale Doob (đặt theo tên của J. L. Doob)Bản mẫu:Cn là một cách xây dựng martingale nói chung như sau. Ta xét một dãy các biến ngẫu nhiên

X=X1,X2,...,Xn

nhận giá trị trong tập A. Đối tượng quan tâm là một hàm f:An. Định nghĩa:

Bi=EXi+1,Xi+2,...,Xn[f(X)|X1,X2,...Xi]

trong đó giá trị kì vọng trên là một biến ngẫu nhiên do việc tính kì vọng chỉ dựa trên

Xi+1,Xi+2,...,Xn,

X1,X2,...Xi

vẫn được xem là biến ngẫu nhiên. Có thể chứng minh rằng Bi là một martingale cho bất kì dãy Xi nào. Do đó nếu ta có thể chặn trên độ chênh lệch

|Bi+1Bi|,

thì có thể áp dụng bất đẳng thức Azuma và kết luận với xác suất cao rằng f(X) tập trung xung quanh giá trị kì vọng

E[f(X)]=B0.

Bất đẳng thức McDiarmid

Một phương pháp để chặn trên độ chênh lệch và áp dụng bất đẳng thức Azuma cho một martingale Doob là bất đẳng thức McDiarmid.Bản mẫu:Cn Giả sử X1,X2,,Xn là độc lập và giả sử f thỏa mãn

supx1,x2,,xn,x^i|f(x1,x2,,xn)f(x1,x2,,xi1,x^i,xi+1,,xn)|cikhi1in.

(Nói cách khác, việc thay đổi giá trị xi của tọa độ thứ i làm thay đổi giá trị của f bởi một lượng không quá ci.)

Do đó

|Bi+1Bi|ci

và theo bất đẳng thức Azuma, ta có bất đẳng thức McDiarmid cho mọi ε>0:

Pr{f(X1,X2,,Xn)E[f(X1,X2,,Xn)]ε}exp(2ε2i=1nci2)

Pr{E[f(X1,X2,,Xn)]f(X1,X2,,Xn)ε}exp(2ε2i=1nci2)

Pr{|E[f(X1,X2,,Xn)]f(X1,X2,,Xn)|ε}2exp(2ε2i=1nci2).

Xem thêm

Tham khảo

Tham khảo

Bản mẫu:Tham khảo