爬蟲span外面,p裡面的字段怎麼爬取?

時間 2021-05-11 14:56:07

1樓:前嗅大資料

使用我們的ForeSpider資料採集軟體,如果class=lbl是唯一的,可以直接通過DOM.GetTextAll(DOM.FindClass("lbl"))獲取文字資訊

2樓:猿某人

建議首先花半小時學習XML,HTML概念。

然後,了解下解析工具用法,其他答案已經有了,不重複了。

最不濟,用字串替換也能解決吧?

所以你的問題是基礎知識不夠。

~~~~~以上是原答案~~~~~~~~

有個網友非說我這個不具體,看不懂,而且好激動的樣子,我十分不理解到底怎麼回事。

你答你的,我答我的,我是招你了還是惹你了,還是踩你尾巴了?

看懂看不懂是別人的事,跟你有什麼關係?

學好基礎知識,用什麼庫都差不多,實在找不到庫,用查詢替換也能解決問題。

其他人介紹了兩個庫,我再推薦個庫。

from

pyquery

import

PyQuery

aspq

html

="""

比賽專案:

" [半程21.0975、11公里、3.7公里]。"

"""def

GetPText(s

):ifs:

try:

doc=pq(

s)p=

doc(

'p')

.text

()return

pexcept

Exceptionase

:print(e

)return

''def

Test_GetPText

():test_html=[

html,''

,'abc'

,'abc']

fors

intest_html

:print

('Src=',s

)ptext

=GetPText(s

)print

('Result='

,ptext

)def

Run_Test

():Test_GetPText

()def

Run():

ptext

=GetPText

(html

)print

(ptext

)print

('Run Test......'

)Run_Test

()print

('Run Get......'

)Run

()#如果上面太長懶得看,你也可以寫成這樣#print(pq(html)('p').text())

3樓:

直接xpath('//p[@class="item"]/text()')就可以了。text()前面是單/,如果是//的話,就是包含span裡面的東西。

我們處於黑洞裡面還是黑洞外面?

二傻子.首席槓精 有宇宙黑洞假說,該假說最直接的證據宇宙總質量的施瓦西半徑恰好是可觀測宇宙的半徑。黑洞在吸入質量後半徑會擴張,這也解釋了宇宙擴張或者暗能量的原因。如果這種理論成立的話,外面的宇宙我認為會是乙個四維空間的宇宙。 潮汐 問題的補充描述很有哲學思想。於是我們首先定義什麼是黑洞?安裝我們目前...

Java裡面 建立物件放在main方法外面為什麼要用static修飾?

main方法有static修飾,是靜態,訪問不需要例項化該類,通過類名點方法即可。類中無static修飾的成員一般需要例項化才能訪問。 差不多 不太懂你的意思,因為不是static的方法也可以放入main方法中。首先明確乙個概念,static 靜態的,在類載入的時候就會比普通的方法先載入,如果你乙個...

護膝該穿在跑步緊身褲裡面還是外面?

子樂喜歡羽毛球 正常是放到外面的,暫時是沒有發現是穿裡面,穿裡面也不方便調整。並且跑步的時候,除非是很有必要才去戴護膝,不然是不建議戴護膝。膝蓋出現不舒服情況,那麼更多是建議休養,讓身體去修復,並且需要去進行肌肉的核心力量的鍛鍊。肌肉是最好的護膝。要是真的需要的話,那麼是建議在運動的時候戴一下,而不...