剛學用python處理excel 如何用python 將 xls檔案批量去重

時間 2021-10-27 10:22:05

1樓:王加加

可以使用pandas的drop_duplicates():

import

pandas

aspd

data=pd

.read_excel

('C:\Temp\data.xlsx'

)data

.drop_duplicates

()也可以指定列來去重:

import

pandas

aspd

data=pd

.read_excel

('C:\Temp\data.xlsx'

)data

.drop_duplicates

(subset=[

"EmpName"

,"Department"

,"JoiningDate"

,"Designation"

],keep

="first"

)注意keep引數表示要保留哪一行,keep="first"保留第一次出現的重複; keep="last"保留最後出現的重複;keep=False表示刪掉所有重複行,保留只出現一次的行。

pandas.DataFrame.drop_duplicates - pandas 1.1.5 documentation

影象處理用 Python 還是 MATLAB?

naturex 如果不呼叫內建函式 方法 matlab的矩陣運算比numpy快許多,尤其是在需要大量隨機索引的時候。用matlab寫個程式驗證演算法,效能還可以接受。numpy完全不能忍。 很多人過於神話了Python,什麼東西都Python,是不是啥時候腳踢彙編拳打CUDA了?插線板就該好好做插線...

學python用windows系統還是用蘋果系統比較好

喳 小銘 我建議選擇 Win。畢竟很多教程都是基於 Windows 的,跟教程走不會困惑。出了什麼問題,方便解決,畢竟很多方案都和 Win 有關。深入後,換換口味也不遲。 linuxboy 蘋果好,圖形強大,而且命令列同樣強大。Linux使用者空間可以做的,蘋果百分之90都可以做。而且你需要商業軟體...

本人剛畢業,想報個培訓班,學 Python 還是 Java 大神們給點建議?

嘎嘎 IT行業必然是現在最火的,目前社會發展 生活 教育都離不開IT的技術支援,所以就業面還是很廣泛的。python是現在第二火的語言,與人工智慧緊密聯絡,如果想一直從事這個行業,建議培訓學習一下,未來發展肯定是離不開人工智慧,前途無量 好程式設計師大王 Python的就業方向如下 1 Python...