1樓:李巨集杰
我覺得不同主要有以下幾點
學習曲線
效能曲線
對新手友好度
2樓:
全宇宙最好的文字標籤解析庫當然是bs了,可一遇到js還是表示很無奈,非要說x系列快點實在沒有必要哈哈哈
3樓:
我怎麼覺得xpath比bs好用多了。 並且也很靈活。特別新版本的lxml更強大
4樓:依雲
beautifulsoup 是 HTML 解析庫,XPath 是 HTML / XML 查詢語言。所以你應該是想說 lxml,使用 XPath
技術查詢和處理 HTML / XML 文件的庫。當然啦,lxml 也支援 CSS 選擇器,只要你安裝 cssselect 庫就可以了。
beautifulsoup 我沒用過,因為
1. 我知道它的時候它是使用正則解析的,比 lxml 使用的 libxml2 C 庫慢
2. 我不想再學一種新的查詢語法(XPath 我早就會一些了,CSS 選擇器更是信手拈來)
3. 安裝 beautifulsoup 和 lxml 對我來說沒什麼差別,因為是 Linux 並且軟體源裡有,一條命令搞定。
5樓:張桃桃
我覺得,我在用的過程是這樣考慮的,xpath 是你需要知道文件結構,而beautifulsoup 是不知道的時候去嘗試找某些標籤。 說的不對的話請輕噴,用的場景不同。
python中enumerate object究竟是一種怎樣的存在形式呢?
l Ass We Can type of l is tuplee enumerate l type of e is enumerate objectforv inenumerate e type of enumerate e is enumerate object print v type of v...
Python中ASCII,Unicode,UTF 8,encode,decode這些有什麼關係?
NoOffense ASCII,UTF 8是常用的字元編碼型別,Unicode是字符集,它們跟具體某一門語言 比如Python 無關,是計算機通行的標準。字元編碼型別規定了位元組 bytes 和字元 character 是如何對應的。例如ASCII中,10進製65代字元 A UTF 8中,16進製制...
python中 from import 的那個點是表示當前包嗎?
譚九鼎 反對所有回答,雖然它們沒全錯。假設該from import x語句存在於proj test.py中,它會匯入同級目錄下的 init py即proj init py中的x物件,如果沒有proj init py或有那個檔案但是檔案中不存在x物件,就匯入proj x init py,如果還沒有,就...