如何抓取etymonline的詞根與解釋?

時間 2021-06-15 13:39:42

1樓:深海魚

剛開始學BeautifulSoup,對著API擼的。

print語句裡轉碼成GBK是為了避免CMD輸出時拋ERROR。

#!/usr/bin/env python# -*- coding: utf-8 -*-"""抓取詞根與解釋

("單詞:"

,word

.encode

('gbk'

,errors

='ignore').

decode

('gbk'

))print

("釋義:"

,desc

.encode

('gbk'

,errors

='ignore').

decode

('gbk'

),end="

\n"*2

)if__name__

=='__main__'

:etymas=

iflen

(sys

.argv

)>1:

etymas

.extend

(sys

.argv[1

:len

(sys

.argv

)])else

:etymas=[

"churn"

,"anti"

,"abs"

]print

("沒有輸入單詞,下面演示查詢:"

,"、"

.join

(etymas

),end="

\n"*2

)get_data

(etymas

)把檔案另存為etyma.py,放入PythonScript資料夾,然後把這個目錄加入環境變數。

檔名可以自由更改,只要和下面的命令保持一致即可。用法:

2樓:李星

你的問題是: 把字根(詞源)意義(也就是 "…")裡面的字去比對一般詞典的解釋,然後依意思分類嗎?但是古代的詞義不太可能全部和現代一樣

charles如何抓取https資料報的?

老白兔 原理高票已經解釋了,就是一種中間人攻擊。1 官方說明 SSL Certificates 說明了iOS高版本和Android高版本需要做的一些特殊操作。2 StackOverflow Charles proxy fails on SSL Connect Method 北雁南飛 所有自己感覺明明...

如何利用Python抓取PDF中的某些內容?

現場可程式設計邏輯 pdfminer非常簡單方便,但我在實際用的時候,經常出現轉換文字缺失的情況。個人感覺這個庫是在讀取pdf的時候遇到轉義字元處理的時候有bug,pdf2htmlex比較穩定,轉成html以後再把文字拿出來,目前做了幾百個轉換還沒錯過。 xlzd 你的問題事實上包含幾部分 將 PD...

搜尋引擎如何對抓取的內容進行分組?

夜息 感覺樓主有點概念的混亂 入索引和分類是兩碼事 入索引就是是分詞後的入庫。根據ABCD,啊哦額一等一系列term進行存放。分類是把一大堆東西A,去歸類的另外幾樣東西B上。其實本質就是就求A們和某個B的相關性。然後這個相似性又分成布林模型和潛在語義模型。布林模型很簡單,就是包含 相關 和不包含 不...