Python中怎麼提取字串中的漢字?

時間 2021-06-17 13:21:06

1樓:Datawhale

採用正規表示式的方法對字串進行處理。

str1 = "{我%$是,《速$@.度\發》中 /國、人"

1)提取漢字

漢字的範圍為

」\u4e00

-\u9fa5

「,這個是用Unicode表示的

import

reres1=''

.join(re

.findall('[

\u4e00

-\u9fa5]',

str1

))print

(res1

)輸出為:『我是速度發中中國人』

2)去除所有符號。採用清理資料,僅保留字母、數字、中文的方法res2 = re.sub("[^a-zA-Z0-9\u4e00-\u9fa5]", '', str2)

print(res2)

執行截圖如下:

By Datawhale知乎小組D1

2樓:

這是中文的正則

re.compile(r'[\u4e00-\u9fa5]')

前乙個好說,後面這個不好說,因為有的.留,有的.去掉

3樓:HELLOh

import re

str1 = "{我%$是,《速$@.度\發》中 /國、人"

res = ''.join(re.findall('[\u4e00-\u9fa5]',str1))

print(res)

res2 = ''.join(re.findall('[\u4e00-\u9fa5]',str2))+ str2[-7:]

print(res2)

怎麼用python統計字串中每個字元出現的次數?

酒罈壇兒 str1 hello world 方法一 字典推導式 result print result 方法二 自己寫邏輯 result forx instr1 result x result get x 0 1print result 拯救夢想 實現的這個功能的方法實在太多,python 內建的包...

Excel字元中怎麼提取字母和數字?

fresen 手機打的,可以有點兒繞,只是乙個思路,算是拋磚引玉吧。用substitute把c換成空,len該單元格就可知道該單元格有幾個c,替換最後面的這個c為 或其他唯一的值,再find 在第幾位,然後按這個 所在位數用mid即可分別得出三段字串。 TuskAi 如果是用公式做,可以先用MID將...

Python 中為何沒有數字到字串的自動轉換?

小咩2021 數字加字串,你想要啥結果?舉例 這兩種都說得過去吧 abc def 1 198 200 202 字元陣列自動轉換為ascii碼數字,數字不變,然後進行加法運算,matlab中的定義 abc def 1 abcdef1 數字轉文字,字串不變,然後進行合併運算,你給的定義 abc def ...