英文好麻煩?從資訊理論與亂度解析語言的本質

為什麼英語會有這麼麻煩的 the 或者加 s 等贅語?想不到,筆者於碩士時期主攻 data science 時,意外從「資訊理論」中找到了答案!

麻煩但清楚

影片中提到英語的亂度為 2.6 而我問 AI 得知中文是 9.5 左右。也就是說,英語比較「不亂」,它的各種文法和贅語讓這個語言較為固定可預測。講的難聽一點,英語相較於中文更為「僵化」。



從資訊理論的角度來看,不亂的資訊確定性高,有利於溝通。如同影片中提到的研究,將英語單字挖空大部份的人都能將其還原。而在各種雜訊干擾下,聽英語的人仍然能猜的出意思。

反觀亂度達到英語 4 倍的中文,不確定性高,溝通時容易誤解。話雖如此,這種特性對於創新及發想卻是有益的。

給語言學習者的話

英語相較於其他語言非常地龜毛,歷史上常被笑話是平民用的語言,導致一堆不規則的用法要特別去記。然而,筆者在此要為英語平反一下。

正因為英語的這些麻煩及贅語,降低了英語的亂度,讓溝通更為精準,不易產生誤會。造就了英語得以被全球各種不同文化,不同背景的人們拿來互相溝通。

所以呀,別再嫌麻煩囉~

資訊理論 Deep Dive

給理工專業的你學 Entropy