你是否支援分詞書寫中文,為什麼?

時間 2021-05-06 13:37:27

1樓:

為了可以忽略不計的書面文歧義

徒增巨量篇幅

得不償失

原來300頁的書,現在得500頁

原來一本能說完,現在得上下冊

話說回來,白話文改革加入標點,其實已經足夠了,合理地避免了一些問題,也省下很多之乎者也隱性斷句。

2樓:調皮的耿鬼

可以分,也可以不分。個人認為應該視情況而定。

在日常的使用當中如果一直像我現在這樣分, 閱讀的體驗就會變得比較尷尬。 尤其是對於已經適應了連寫的讀者來說,重新適應這種寫法一定是很不容易的。

然而在一些情況下,當語義的嚴謹程度很必要的時候,例如在合同協議之類的場合,可以在需要排除歧義的地方進行分詞處理。

3樓:歡樂英雄12315

不支援!

分詞的缺點之一 —— 打斷思維!

本來想的好好的,在打字輸出時,還得判斷,哪個是單字,哪個是組詞,分心又費神!

事實上,沒誰說話是乙個詞乙個詞蹦出來的,多數人都是整句說話,除了斷句,詞中間的停頓並不明顯!

即便記錄、輸入時不分詞,而是在之後處理文字時分詞,依然不符合整句閱讀的習慣,降低閱讀效率。

如果擔心相鄰漢字組詞混淆,可以給易混淆的詞,加上引號或分隔號(空格等)。

對所有文字都手動分詞,不必要且低效!

4樓:「已登出」

不支援。

其實邏輯是這樣的:能看懂不分詞中文的自然能看懂分詞中文,能看懂分詞中文的不一定能看懂不分詞中文。

以中文為母語者自然為前者,後者則是以其他語言為母語,後來又學習中文的人。

一種語言自然要盡可能地服務於最初使用他的人,這是語言的本質;服務後天學習者的語言是一種理想狀態,與自然邏輯相違背。(人進行表達時會選擇最適合自己的方式,而無法考慮到適合超遠距離傳播的層次,因為這是違反自然的。解釋起來很可笑,但是也很容易理解)

不分詞的中文對於母語使用者來說是既簡單又靈活的,對於不以中文為母語的使用者來說才存在理解困難,本質上是學習語言的環境不同。

對於母語使用者來說自然是不需要分詞的,但是非母語使用者可以按分詞來寫,反正懂中文的一樣能看懂。

5樓:徐辰

有些人為了拉長中文字串的位元組數已經喪心病狂了。

還是想辦法縮短字母文字的位元組數比較有意義,比如遊說Unicode專家組把單詞做成單個codepoint,還可以順便發明個英文本母輸入法音標輸入法啥的。

這樣英文寫出來就會是這個樣子:

上面這句話只需10(UCS2)或者20(UCS4)個位元組,而原文算上空格需要25個。

6樓:

之前有一部分人回答說應該為了方便外中國人學習中文去改變中文用語習慣,那麼這裡的外國具體是指哪乙個國家呢??具體是去適應哪乙個語種呢?反之我們也可以問某某外語為什麼不來適應中中國人。

奉勸那些覺得要中文迎合外語的人,有這時間不如去創造一門地球語,全地球通用一種語言(╬ ̄皿 ̄)

7樓:南洋

在每個字都已經分隔的漢語裡再插入空格分隔片語,高成本無收益。

查主流中文報章文獻,根據上下文和情景無法消除歧義的句子有多少?0.0001%?

0.00001%??用中文寫作,非要插乙個空格不可,改變表達法或詞語無法消除歧義的句子有多少?

0.00000000001%??還是根本就是0。

通過大量空格避免歧義的所謂收益真的存在嗎?。

8樓:

筆畫可以看成是中文的字母。

所以每個字其實都是八種筆畫(點、橫、豎、撇、折、彎、鉤、捺)在二維平面上排列組合而成偏旁和部首。

部首和偏旁再組合成字。

然後我們看看英文?

26種字母在一維直線上的排列組合成詞綴和詞根。

然後詞綴加詞根組成每個詞。

然後再看看你的題幹?

不分詞相當於每個字都分了開來那麼答案很明顯了,中文中的每個字對應的其實是英文中的每個單詞。

所以不分詞有什麼問題嗎?

9樓:

文字改革是否應該進行的前提是推行的必要性和可行性。在上個世紀大部分中中國人都是文盲的時代推行簡化字是可行的,也是必要的。在現代大部分人都有基本的讀寫能力的情況下人為製造這種麻煩,代價太大,收益甚微。

10樓:我凌

不支援,因為我分不好。

而且對於大部分普通水平的中中國人來說,分詞實在超過了他們的能力範圍,由此導致的「詞不達意」恐怕比不分詞還多。

至於專業檔案中的分詞,由於有專業人士處理,其實已經有類似形式。例如,點校本的古籍往往會對人名、地名和一些特殊需要的詞彙下劃線標註。

11樓:瘋物

不支援作為人類書寫語言,因為會混亂。但支援作為人工智慧學習中文的途徑。

舉例:「海上自來水廠」:建在海上的自來水廠可以算作專有名詞,不做分詞,也可以分為「海上自來水廠」也可以「海上自來水廠」也可以「海上自來水廠」也可以「海上自來水廠」

同理可得「水上交通」該怎麼分,「隨地吐痰者」怎麼分?

中文的詞與短語在某些地方是模糊的,因此如果分詞書寫,制定規範和執行規範需要的時間,可能會很長,而且十分麻煩。

中文分詞書寫最大的意義不在於人類學習中文,而是人工智慧學習中文。中文分詞的模糊,人類學習時可以通過結合上下文和更改行文方式來解決。而人工智慧學習中文,有了分詞書寫,將會使得識別更加便利高效。

12樓:巴拉巴拉

當然不支援啊。

首先格式會很奇怪。中文難在哪?除了各種各樣的字,各種各樣的拼音,還有語法,然後就是斷句了。

這幾個元素都是缺一不可的。短句方式不同,即使是同乙個句子,也會表示出不一樣的的方式。標點符號就已經具備了斷句的功能,為什麼還要額外再加分詞?

13樓:

先搞懂為啥英語要分詞再來,需要分詞的實際上屬於粒度更細的一種結構,結果就是一不小心就拼錯了,不用分割根本無法閱讀,機器語言就是這樣的一種,機器語言靠「定長」來分割,英語呢,實際上你用「/」也可以哦,呵呵!

漢字實際上是一種二維結構影象,所以其自然就是一種分詞。計算機化的漢字只有別字,沒有錯字,要說缺點麼:預組合物件多了點,但英語看者才26個,但是這26個實際上是根本沒有預組合的,至於組合(後的解釋),英語也一樣很煩,反正對非母語任何一種語言都是很煩的,不信,你去看看機器語言。

14樓:

作為乙個中中國人我非常反對

15樓:

不支援漢字詞是在句子和最基本單元漢字之間存在的模糊結構。這就造成了不同於英語的固定方式,漢語中造詞的權利極大地被下放到每個具體的使用者。極端情況下,我們可以直接忽略漢字詞的結構直接使用漢字意思去理解句子。

16樓:尋天淩寒

我反對!(本來寫著支援,但一想力度太弱還是用反對好)別看我平時懶得打標點符號,但是那是承古制(你就胡扯吧分明是自己怎麼念的怎麼打),但是你讓我看分詞的格式,那叫要命!斷句是漢語學習的基本素養之一

現在已經把標點和回車給你加了你還要分詞

能再懶點嗎?

為了防止你語言退化今後無法正常地閱讀古文,強烈建議你放棄這個想法看下面有外中國人支援,!

還嫌所謂的超國民待遇不夠氾濫嗎?到底是友好還是跪?真的很難說中國有句話叫山不就我我去就山,可沒有我不就山山來就我的另外那種所謂的分詞式寫法多來幾次我都要懷疑自己要斷氣還是要哮喘了

17樓:

這簡直是脫褲子放屁,閒得蛋疼。

畢竟句子越長,讀起來還是越費時間。

而且漢語怎麼分詞也是個大問題。

古時候寫文章不加標點符號,容易導致歧義。現在加了標點符號,我理解標點符號已經相當於分詞了。沒有必要再弄出來更精細劃分。

18樓:

我不支援,假設分詞書寫成為官方認定的書寫方式,那麼勢必要制定一套嚴謹的分詞規範,各種各樣的詞彙怎樣拆分覺對是乙個大問題,規範的不好反而會適得其反。

另外,制定出這樣一套複雜的規範後,已經習慣了連寫的普通人能否正確使用?假如使用錯誤算不算語法問題?如果算,那麼考試的扣分項就有變多了……學生的學習成本當然也加大。

19樓:dentisodoys

分不分詞對於語言歧義用處大概不大,而且一些詞有些人覺得該分有些人不該分,而且分詞之後對於語言連貫性有很大影響,看起來很彆扭,而且大部分正常人不會在意在哪裡分。例如此句。-南京市長江大橋

20樓:

小明爸爸問小明和小紅要計算器

小明回答:你算什麼東西。

小紅回答:你要計算什麼東西。

我覺得就算分詞了,小明這頓毒打也是免不掉的,可見歧義與否,與連寫的關係很小,甚至沒有關係,真正導致分歧的點,是你表述意思時的用詞結構方式,小紅為什麼不挨打,心裡沒數麼。

可見分詞並不能很好的減少大部分歧義,反而增加工作量,降低書寫連貫性,完全不適用於現代漢語,屬於典型的,脫了褲子放屁。

21樓:

實際上,我倒是覺得,是否能增加可讀性(閱讀速度)只是一方面原因或者說「表徵」(我認為不能),其中很根本很重要的原因在於,漢語中最基本的「語素」還是「字」。

舉個例子吧,例子就用以下這句話,

【以分詞方式書寫漢語不能增加閱讀速度】

我們按照現代漢語的自然語感大致分一下:

「以分詞方式書寫漢語不能增加閱讀速度」

看起來是不是「挺正確的」?

但是細究起來,問題可就多了。

原句中,大部分沒有被分開的「雙字詞」,其實很多都能被「再次」分開。

「方式、書寫、增加、閱讀」,這幾個詞,都是「並列結構」。

「分詞、漢語、不能、速度」,這幾個詞,都是「偏正結構」。

學過語文的應該都能理解我說的什麼意思,如「閱讀」這個並列結構雙字詞,實際上,閱和讀表達的基本是同乙個意思,這個「同義重複」是語言發展中的現象,用來避免「同音詞」和「發音不清」導致的「含混」。但是實際上,雖然「閱讀」一詞經常連用,但是「閱」跟「讀」二字可並沒有損失「全部的語義」。

舉例:1、領導批示:「已閱,狗屁不通」

2、家長簽字:「家長閱」

3、郵件標記:「已讀」/「未讀」

所以你很難說清楚,基本的「語素」到底是這個字還是乙個雙字詞,我完全可以把上面的那句話改寫成如下:

【以分詞式寫漢語不能增讀速率】

雖然「增」「讀」這種很少單獨用的字看起來怪怪的,但是我相信,基本上中中國人也能明白我這句話的意思。我只是將所有的「並列結構」詞,取詞中乙個字,所有「偏正結構」詞,分成了兩個詞。因為「度」這個字很少單獨用,所以換成了單獨用頻率較高的「率」。

所以,漢字為什麼需要分詞呢?

雖然我們有常用的雙字詞,但是實際上,這些雙字詞種的每乙個「字」,都是有單獨的語義的。

你看到「閱」這個字,不管是在什麼詞裡面,就算整個文章你只看見乙個閱字,你也知道,這個字表達的是「從文字材料種獲得資訊」的含義,甭管是「閱讀」還是「閱覽」還是「已閱」或者是「家長閱」,都沒有區別,所以到底我們為什麼要把「閱讀」這個詞並到一起呢?

實際上,就算是拼音文字,也有各種各樣的詞源等等,比如computer,計算機一詞。就是com-put-er三個部分的組合,每一部分實際上都是有「單獨的語義」的,只不過,受限於拼音文字的多樣性實在是太小,重複也實在太多,不分開確實認不得。

但漢語,本來就是個表意的文字,每個字都有自己的表意成分,你非要某些合併某些拆開,顯得實在是沒什麼必要。

科比退役後你是否還會支援湖人隊?為什麼?

佔曝脊刎都醋 關注是一定就像喬丹當年在公牛的時候,現在不也是很多老球迷都在關注嗎?以後以後退役了,就會有新的聯盟第一人,他的出現會帶動這個球隊的關注程度,就像是原來在麥蒂在魔術的時候是巔峰,其實關注他的人遠遠沒有現在的打不上球的他多,但是來到了火箭,大家關注姚明的同時,看到了他的天賦與能力,所以他受...

你支援早戀嗎?為什麼?

不置可否 我媽 你要是找個成績好的女朋友互相促進一下也挺好的。我爸在旁邊附和,還說他任教的學校有一對cp從年級幾百名到雙雙前十。我 能不能找得到就是另一回事了。沒有早戀過但是有想早戀的物件,她跟我約好考乙個高中,是我們市乙個比較好的重點。當時她成績比我略好,我算是那種 看上去有能力卻不肯好好學的 老...

俄羅斯是否支援印度擁核?為什麼?

歪耳朵的撲稜 我是題主 但是也算是很抱歉吧 這個問題,已經不需要答案了 時過境遷 當時問我這個問題的人 那個我曾經最好的朋友 已經不在了 感謝你們的回答 大草包 青蓑冷雨莫沾身 糖糖重症患者 tian田 劉培強 李大刀 王星筌 李大刀 只要是擁核國家,就會拒絕別人擁有。誰也不想增加直接威脅。俄羅斯不...