python中的beautifulsoup和xpath有什麼異同點?

時間 2022-01-23 03:20:43

1樓:李巨集杰

我覺得不同主要有以下幾點

學習曲線

效能曲線

對新手友好度

2樓:

全宇宙最好的文字標籤解析庫當然是bs了,可一遇到js還是表示很無奈,非要說x系列快點實在沒有必要哈哈哈

3樓:

我怎麼覺得xpath比bs好用多了。 並且也很靈活。特別新版本的lxml更強大

4樓:依雲

beautifulsoup 是 HTML 解析庫,XPath 是 HTML / XML 查詢語言。所以你應該是想說 lxml,使用 XPath

技術查詢和處理 HTML / XML 文件的庫。當然啦,lxml 也支援 CSS 選擇器,只要你安裝 cssselect 庫就可以了。

beautifulsoup 我沒用過,因為

1. 我知道它的時候它是使用正則解析的,比 lxml 使用的 libxml2 C 庫慢

2. 我不想再學一種新的查詢語法(XPath 我早就會一些了,CSS 選擇器更是信手拈來)

3. 安裝 beautifulsoup 和 lxml 對我來說沒什麼差別,因為是 Linux 並且軟體源裡有,一條命令搞定。

5樓:張桃桃

我覺得,我在用的過程是這樣考慮的,xpath 是你需要知道文件結構,而beautifulsoup 是不知道的時候去嘗試找某些標籤。 說的不對的話請輕噴,用的場景不同。

python中enumerate object究竟是一種怎樣的存在形式呢?

l Ass We Can type of l is tuplee enumerate l type of e is enumerate objectforv inenumerate e type of enumerate e is enumerate object print v type of v...

Python中ASCII,Unicode,UTF 8,encode,decode這些有什麼關係?

NoOffense ASCII,UTF 8是常用的字元編碼型別,Unicode是字符集,它們跟具體某一門語言 比如Python 無關,是計算機通行的標準。字元編碼型別規定了位元組 bytes 和字元 character 是如何對應的。例如ASCII中,10進製65代字元 A UTF 8中,16進製制...

python中 from import 的那個點是表示當前包嗎?

譚九鼎 反對所有回答,雖然它們沒全錯。假設該from import x語句存在於proj test.py中,它會匯入同級目錄下的 init py即proj init py中的x物件,如果沒有proj init py或有那個檔案但是檔案中不存在x物件,就匯入proj x init py,如果還沒有,就...