如何抓取etymonline的詞根與解釋？

1樓：深海魚

剛開始學BeautifulSoup，對著API擼的。

print語句裡轉碼成GBK是為了避免CMD輸出時拋ERROR。

#!/usr/bin/env python# -*- coding: utf-8 -*-"""抓取詞根與解釋

("單詞："

,word

.encode

('gbk'

,errors

='ignore').

decode

('gbk'

))print

("釋義："

,desc

.encode

('gbk'

,errors

='ignore').

decode

('gbk'

),end="

\n"*2

)if__name__

=='__main__'

:etymas=

iflen

(sys

.argv

)>1:

etymas

.extend

(sys

.argv[1

:len

(sys

.argv

)])else

:etymas=[

"churn"

,"anti"

,"abs"

]print

("沒有輸入單詞，下面演示查詢："

,"、"

.join

(etymas

),end="

\n"*2

)get_data

(etymas

)把檔案另存為etyma.py，放入PythonScript資料夾，然後把這個目錄加入環境變數。

檔名可以自由更改，只要和下面的命令保持一致即可。用法：

2樓：李星

你的問題是: 把字根(詞源)意義(也就是 "…")裡面的字去比對一般詞典的解釋，然後依意思分類嗎？但是古代的詞義不太可能全部和現代一樣

charles如何抓取https資料報的？

老白兔原理高票已經解釋了，就是一種中間人攻擊。1 官方說明 SSL Certificates 說明了iOS高版本和Android高版本需要做的一些特殊操作。2 StackOverflow Charles proxy fails on SSL Connect Method 北雁南飛所有自己感覺明明...

如何利用Python抓取PDF中的某些內容？

現場可程式設計邏輯 pdfminer非常簡單方便，但我在實際用的時候，經常出現轉換文字缺失的情況。個人感覺這個庫是在讀取pdf的時候遇到轉義字元處理的時候有bug，pdf2htmlex比較穩定，轉成html以後再把文字拿出來，目前做了幾百個轉換還沒錯過。 xlzd 你的問題事實上包含幾部分將 PD...

搜尋引擎如何對抓取的內容進行分組？

夜息感覺樓主有點概念的混亂入索引和分類是兩碼事入索引就是是分詞後的入庫。根據ABCD,啊哦額一等一系列term進行存放。分類是把一大堆東西A，去歸類的另外幾樣東西B上。其實本質就是就求A們和某個B的相關性。然後這個相似性又分成布林模型和潛在語義模型。布林模型很簡單，就是包含相關和不包含不...

如何抓取etymonline的詞根與解釋？

charles如何抓取https資料報的？

如何利用Python抓取PDF中的某些內容？

搜尋引擎如何對抓取的內容進行分組？

其他用戶還看了：