1樓:科先生
talk is cheap,show me the code!
import
pandas
aspddf=
pd.DataFrame
([['Jackets'
,'Jackets',1
],['Tops'
,'Knits',1
],['Tops'
,'Knits',1
],['Tops'
,'Blouses',1
],['Tops'
,'Blouses',1
],['Jackets'
,'Outerware',0
],['Bottoms'
,'Pants',1
],['Dresses'
,'Dresses',1
],['Bottoms'
,'Pants',1
],['Bottoms'
,'Jeans',1
],['Bottoms'
,'Pants',0
],['Tops'
,'Blouses',1
]],columns=[
'Department'
,'Type'
,'Recommended'
])df=df
[df['Recommended']==
1]#將Recommended=1的過濾出來
groupby=df
.groupby
(["Recommended"
,"Type"
])#進行groupby聚合
result
=groupby
.count
()#返回DataFrameGroupBy物件計數DataFramedic=
result
.to_dict
()#將dataframe結果轉成字典物件dic=
dic[
'Department'
(dic
)輸出如圖所示
以上使用了pandas庫的DataFrame物件的groupby方法進行分組。
2樓:arachis
在excel中叫資料透檢視(SQL叫行轉列),搜下pandas pivot_table
如果自己實現的話,先統計部門或型別的所有可能取值,然後構造對應的字典
Python 中 「is」 和 「 」 的問題?
Pure White 其實可以看一看python的內建函式 就是雙下劃線 開頭的那些,會對具體的實現和細節有比較好的了解。對於第三個問題,是因為python為了提高效能,所以直接建立了 5到256的整數值的物件,因為這些數值會經常出現。這樣就不用每次出現一次建立一次物件了,可以提高效能並減少記憶體消...
python中如何split問題
我不太確定問的是啥問題,但還是說一下字串的拆分問題。字串的拆分有專用的方法 str.split sep None,maxsplit 1 用sep分拆字串,返回乙個單詞列表。maxsplit指定最大分拆次數 這樣列表就有maxsplit 1個元素 如果maxsplit沒有指定就使用預設值 1,分拆次數...
Python在資料分析中怎麼用?
Python資料分析 Python日期和時間處理及操作時間序列分類 時間戳 timestamp 特定的時刻 固定週期 period 某月或某年 時間間隔 interval 由起始時間戳和結束時間戳表示datetime,time及calendar模組 datetime 以毫秒形式儲存時間和日期date...