1樓:Datawhale
採用正規表示式的方法對字串進行處理。
str1 = "{我%$是,《速$@.度\發》中 /國、人"
1)提取漢字
漢字的範圍為
」\u4e00
-\u9fa5
「,這個是用Unicode表示的
import
reres1=''
.join(re
.findall('[
\u4e00
-\u9fa5]',
str1
(res1
)輸出為:『我是速度發中中國人』
2)去除所有符號。採用清理資料,僅保留字母、數字、中文的方法res2 = re.sub("[^a-zA-Z0-9\u4e00-\u9fa5]", '', str2)
print(res2)
執行截圖如下:
By Datawhale知乎小組D1
2樓:
這是中文的正則
re.compile(r'[\u4e00-\u9fa5]')
前乙個好說,後面這個不好說,因為有的.留,有的.去掉
3樓:HELLOh
import re
str1 = "{我%$是,《速$@.度\發》中 /國、人"
res = ''.join(re.findall('[\u4e00-\u9fa5]',str1))
print(res)
res2 = ''.join(re.findall('[\u4e00-\u9fa5]',str2))+ str2[-7:]
print(res2)
怎麼用python統計字串中每個字元出現的次數?
酒罈壇兒 str1 hello world 方法一 字典推導式 result print result 方法二 自己寫邏輯 result forx instr1 result x result get x 0 1print result 拯救夢想 實現的這個功能的方法實在太多,python 內建的包...
Excel字元中怎麼提取字母和數字?
fresen 手機打的,可以有點兒繞,只是乙個思路,算是拋磚引玉吧。用substitute把c換成空,len該單元格就可知道該單元格有幾個c,替換最後面的這個c為 或其他唯一的值,再find 在第幾位,然後按這個 所在位數用mid即可分別得出三段字串。 TuskAi 如果是用公式做,可以先用MID將...
Python 中為何沒有數字到字串的自動轉換?
小咩2021 數字加字串,你想要啥結果?舉例 這兩種都說得過去吧 abc def 1 198 200 202 字元陣列自動轉換為ascii碼數字,數字不變,然後進行加法運算,matlab中的定義 abc def 1 abcdef1 數字轉文字,字串不變,然後進行合併運算,你給的定義 abc def ...