關於 Ubuntu 中文論壇有什麼故事?

時間 2021-06-03 02:53:26

1樓:

這論壇09-11年那兩年經常上,那會用ubuntu做桌面系統。現在都不流行技術論壇了,很少人上了。linuxsir、chinaunix當年更早的時候也經常上。

2樓:

論壇各種程式語言高手藏龍臥虎,有Perl的、Lisp的、Haskell的等等;有小正太,也有不少怪大叔,還有很多的二逼青年、文藝青年、裝逼青年,當然了,最多的還是普通青年;從事的工作也是千奇百怪,有小學生(現在變成中學生了)高中生大學生還有搬磚的;熱衷的研究方向各種各樣,有琢磨字型的、琢磨桌面環境的、琢磨WM的、琢磨如何灌水,熱衷於自己建站的;有表情黨、引用黨、改帖黨、地漏黨;最奇怪的是,Ubuntu論壇當中混雜著不少使用其它發行版的人,有喜歡滾動公升級然後旁人坐看悲劇的Arch黨、有喜歡裝Gentoo然後把自己的電腦給燒掉的,當然,也有用Windows的;論壇不定期會有抽風的症狀,並且有時候會被bot給光顧導致大量的廣告,還有時候會有來起其它論壇的人來發表惡意言論。

關於中文bert,請問中文ner使用bert時,語料需要先自己分成單個的字再送入模型嗎?

洋蔥 肯定是需要的,而且BERT的輸入嚴格來說不是按字,而且按照token,這個token是BERT自帶的tokenization的結果,中文漢字會切分為單個的字元,英文或數字串行會按照一定的規則新增 來降低詞表大小。 傅聰 需要有個remap的過程 比如訓練時候從BIO標註轉換成模型輸出label...

關於base64的中文編碼?

basic13 先問是不是,再問為什麼。並非所有的中文的base64編碼都是以5開頭的,比如 耀 以6開頭,還有 以4開頭。不過呢,中文大部分是以5開頭的。要了解為什麼會如此,可以先從base64編碼的原理說起。Base64大致上是在將原始資料按照3位元組的24個bit切分,每6個bit一組,每組前...

Ubuntu 下 C, C , Java, JavaScript, PHP MySQL 最好的開發環境是什麼?Eclipse 是不是可以算乙個?

徐天澤 其實在國內大多數做linux下開發的,都是在windows下進行的。除了有一些公司,在內部就用linux環境,所以在linux環境下開發。vim其實大部分時間都是vi,因為這幫人非常守舊。還有新生代的程式設計師,用的是ubuntu,開發環境自然就是eclipse,外掛程式比較好用。但也容易造...