要求正規表示式匹配漢字，但不匹配「除」「停」這兩個字

1樓：li小八

先用靚湯或正則找到這個節點，再用上面的字元組匹配。

假設這個節點只有一個，用法如下：

import reimport requests as reqfrom bs4 import beautifulsoupurl = '***'html = req.get(url).textbs = beautifulsoup(html)span = bs.

find_all('span', 'pro-title')'''span = re.findall('[^<]+', html)s = span[0]m = re.findall('[\u4e00-\u9fa5]+', s)'''s = str(span)m = re.

findall('[\u4e00-\u9fa5]+', s)print(m)

正規表示式如何匹配漢字？

2樓：匿名使用者

去掉 ^ 和 $ 試試 [\u4e00-\u9fa5]

\u數字，在perl、pcre中要改為：

[\x-\x]

3樓：匿名使用者

按.net的標準，\w本來就是可以匹配：漢字，字母，數字，下劃線。的所以一般\w可以滿足需求了。

如果需要排除字母數字的話，可以這樣：

(?![a-za-z0-9_])\w

>_>這樣寫估計效率不高

所以一般來說還是直接匹配指定的unicode碼\unnnn unicode**中十六進位制**為nnnn的字元漢字(字元) [\u4e00-\u9fa5]中文及全形標點符號(字元) [\u3000-\u301e\ufe10-\ufe19\ufe30-\ufe44\ufe50-\ufe6b\uff01-\uffee]

要求正規表示式匹配漢字，但不匹配「除」「停」這兩個字

正規表示式匹配雙引號裡面的內容，正規表示式匹配引號中間的內容怎麼寫

mysql 正規表示式匹配，MySQL 正規表示式匹配

正規表示式，匹配特定字元後面的內容

要求正規表示式匹配漢字，但不匹配「除」「停」這兩個字

正規表示式匹配雙引號裡面的內容，正規表示式匹配引號中間的內容怎麼寫

mysql 正規表示式 匹配，MySQL 正規表示式 匹配

正規表示式，匹配特定字元後面的內容

相關推薦

mysql 正規表示式匹配，MySQL 正規表示式匹配