為何正規表示式 a b a a b n 1 的dfa狀態數至少為2 n

1樓：AirGuanZ

手頭沒有龍書，不知道它怎麼解釋的，我說一下我的理解。

這個正規表示式的意思是所有「倒數第n個字元為a」的由a和b構成的串。由於dfa不知道輸入串什麼時候會結束，因此它必須記住最近看到的n個字元各自是什麼，這樣才能在輸入結束的時候知曉倒數第n個字元是否是a。由於最近看到的n個字元共有2^n種可能的取值，所以dfa至少要有這麼多個狀態。

基於這樣的想法，證明這一命題就很容易了。假設有一台只有2^n-1個狀態的dfa，那麼在串集(a|b)^n之中至少有兩個不同的串會使得該dfa讀完最後乙個字元後處於相同的狀態。記這兩個串分別為A和B，不妨設它們的的前k個字元相同，A的第k+1個字元為a，B的第k+1個字元為b。

我們在兩個串末尾各自再追加一些a，使得第k+1個字元恰好是倒數第n個字元，並記追加後的串分別為A'和B'。那麼，串A'的倒數第n個字元是a，應該被此dfa接受，反過來B'應被拒絕。然而，dfa在讀到A'或B'的第n個字元時處於同乙個狀態，後續字元又都是a，它一定會為A'和B'給出同乙個判定結果，這是不正確的。

為何正規表示式 a b a a b n 1 的dfa狀態數至少為2 n

正規表示式生成

應該怎麼練習使用正規表示式？

正規表示式攻擊 ReDoS 如何預防？

其他用戶還看了：