search
尋找貓咪~QQ 地點 桃園市桃園區 Taoyuan , Taoyuan

如何識別外星文明的語言?

上周我們介紹了南斯拉夫那些宛如外星建築的紀念碑,今天叫主想再聊一聊外星文明的話題。

畢竟,在我們周而復始枯燥艱難的生活之外,還可以對遙遠的世界留有一些幻想。

正如我們的slogan所揭示的,除了生活的真相,叫主也會講講世界的本質。

去年一部熱映的科幻片《降臨》,讓許多人開始關注外星文明語言這個話題。而《三體》中,更是詳實地描繪了人類是如何接聽地外文明的信息的。然而這些科幻作品中的元素,還真的是一門研究。

在真正的科學界,的確有一些科學家一直以來都在進行著相關的研究,比如加利福尼亞州山景城SETI研究所的天體物理學家們。長久以來,這些SETI(Search for Extraterrestrial Intelligence,尋找外星文明)科學家們所關注的一個問題是:

如何才能從紛繁複雜又雜亂無章的宇宙噪音中,真正識別出屬於外星人的信號呢?

換言之,怎樣才能確定一個外太空信號的源頭,來自於一個非生命體自然物,還是一個外星文明呢?

通過對太空信號孜孜不倦地搜尋,SETI學者們試圖尋找一些具有窄帶寬且快速閃爍的光源信號,根據已知的天體物理學,這種信號很可能屬於人為製造的信號。

而那些寬頻無線信號和較慢的光脈衝,一般而言可能來源於自然界,比如星雲的脈衝等等。

然而另外一個問題是,即便我們發現了這些信號,又如何進一步確定它一定屬於智能生命體呢?畢竟,我們並沒有接觸過任何地球以外的生命體,更談何去了解它們的語言呢?

既然不能從地球外去了解,所幸我們還可以了解我們的同類:一些同樣具備交流溝通能力的動物。比如通過舞蹈來傳遞信息的蜜蜂,以及擁有複雜語言能力的座頭鯨。

座頭鯨是一種具有高超溝通能力的動物,它們早在百萬年前就發展出了語言,甚至比智人還要早。

海洋學家們通過觀測和捕捉座頭鯨的聲音,已經對它們的語言有了相當多的了解。

比如,當它們游到溫暖的南太平洋進行求偶交配時,就會發出渾厚的歌聲。而當它們在接近北冰洋地區進行捕獵時,就會發出類似吐氣泡一樣的「啵啵」聲,引誘魚類上鉤。此外,當它們在團隊作戰狩獵時,還會進行互相交流。

通過長期的研究,海洋哺乳動物學家發現了一個更有趣的現象。

正如我們人類在打電話時,如果遇到通話質量不好的情況時,會下意識地選擇放慢語速,並嘗試著重複自己的話來確保對方能夠理解自己的意思。有些時候,這種交流中大量的辭彙是冗餘的,甚至是可以互相替換的。這種交流的目的,是確保即便溝通過程中丟失了一些詞語,也不會影響到對方的理解和判斷。

而座頭鯨也有著同樣的行為。

當它們在充滿船隻的海底進行遠距離溝通時,毫無疑問會遇到這些船隻產生大量噪音的問題。因此,如果它們在這樣的環境下交流,也會情不自禁地選擇放慢語速,並選擇另一種在干擾狀態下交流的語言模式。

在這種抗干擾模式下,它們的交流信息量會損失五分之二。科學家們很快意識到,它們即便進行這種低效的溝通,但仍然能夠保證信息傳播的正確率。

這是為什麼呢?

顯然,這說明座頭鯨(以及很多其他鯨類)具有足夠複雜規則結構的語言,可以利用等效的語言辭彙,來填補那丟失掉的五分之二的信號。

就好比我說:今天的天氣很好,陽光明媚。如果你聽到的是,今天的天很好,明媚,也完全不會妨礙你能get到我的意思。

基於這種觀察,兩位來自加利福尼亞大學戴維斯分校的SETI學者,布倫達·邁科萬(Brenda McCowan)和希恩·漢瑟(Sean F. Hanser),決定研究在社會結構上非常複雜,以及高度依賴語言溝通的三種物種,它們的語言類型可以很容易地被辨別出來。

這三種物種分別是:寬吻海豚(Tursiops truncatus),松鼠猴(Saimiri sciureus)和座頭鯨(Megaptera novaeangliae)。

這項研究的理論基礎,是基於語言學研究中非常經典的齊普法則(Zipf's Law):

所謂齊普法則,是由是由哈佛大學的語言學家喬治·金斯利·齊普(George Kingsley Zipf)於1949年發表的實驗定律。它可以表述為:在自然語言的語料庫里,一個單詞出現的頻率與它在頻率表裡的排名成反比。

所以,頻率最高的單詞出現的頻率大約是出現頻率第二位的單詞的2倍,而出現頻率第二位的單詞則是出現頻率第四位的單詞的2倍。

具體解釋一下就是在英文的文本中,字母E比字母T出現的概率更多,字母T又比字母A出現的概率更多。以此類推,直到出現幾率最低的字母「Q」。那麼,如果以字母出現的概率降序排列出從E到Q的全部字母,將其出現的概率繪製在對數圖上,會形成一條近乎於45度線擬合值,即斜率為-1的線。

同樣的,不僅僅在英文里,在漢語中的文字,也可以得到這樣一個-1的斜率。日語,德語,印地語和數十種其他語言的對話的字母,單詞或音素也是如此。

似乎人類語言唯一的例外是嬰兒的呢喃,它的斜率小於-1。這是因為嬰兒發出的聲音幾乎是隨機是……然而,隨著小baby們開始學習語言之後,斜率就會逐漸向上傾斜,最終在一周歲時達到-1左右。

根據數學家和語言學家的研究顯示,這個-1的斜率表示給定的一系列聲音,或是書寫符號包含了足夠的複雜性,足以構成一種語言。

這是一個必要但不充分的條件,而且是一個從觀察角度得到的結論而非理論角度的結論。

但它卻令人驚訝地滿足信息理論,特別是關於傳遞信息時能量消耗的平衡。具體來講,當一個信息發送方試圖傳遞信號時,它希望消耗最少的能量;而對於信息接收方而言,它希望獲得最多的冗餘信息,以確保能夠接收一個完整的信息。

那麼,在這種雙方的平衡博弈之間,語言就自然而然地形成了一個-1的頻率。

有人曾經舉出反例,例如如果將摩斯電碼的點和杠以概率排列出來的話,會得到一個-0.2的斜率,這看起來和-1差得有點遠。

然而,這種排列並不科學,如果將點和杠的排列組合,比如點點、點杠、杠點、杠杠再按概率排序的話,斜率就會向-1接近。

因此,齊普法則從側面反映了一套語言系統中的字母是如何編碼的。通過它,語言學家就可以對語言原本的意義單位進行逆向破解。

再回到之前的話題,布倫達·邁科萬和希恩·漢瑟發現,寬吻海豚和松鼠猴的語言,也符合齊普定律。而且,雖然當它們的幼體時期和人類嬰兒一樣斜率偏低,但是當它們成年後,斜率就會非常接近於-1。

雖然語言學家還沒有能夠破譯寬吻海豚以及松鼠猴所說的語言,但有一點可以確定的是,它們和人類一樣,擁有一種內部結構足夠複雜的語言系統。

這種複雜性所帶來的好處在於,可以令彼此之間的溝通具有彈性,也就是容錯性,或者抗干擾性。

我們甚至可以推而廣之地認為,任何交換信息的生物都必須能夠做到這一點。

畢竟,環境雜訊,干擾障礙物和都會影響信號的傳播。人類語言的結構就是提供冗餘信息。從某種意義上說,正是這種抗干擾結構決定了給定字母所出現的概率。

正如叫主在前文里所說的那樣,我們只需要聽到一句話中的幾個詞,就可以猜到這句話大概的意思。這也是目前語音識別技術的理論依據之一。

然而,如果一句話中缺少的詞越多,那麼依賴上下文中去補完它們就越困難,它們之間所形成的條件概率也就越低。

對於大多數人類的書面語言,當一句話中連續丟失了九個詞時,那麼彼此之間的條件依賴關係將徹底消失,對於接受者而言將不知所云。

因此,在關於語言的信息理論中,人類的詞熵大約為九階。

正如前面所說,在寬吻海豚和座頭鯨的語言中也有類似的現象。只不過,相對於人類而言,它們的核心辭彙更多,比如寬吻海豚約有50個核心辭彙,而座頭鯨語言的核心辭彙更是高達數百個。但是,我們還需要更多的研究,以確認這倆貨語言的究竟詞熵有多高。

這種對於生命體語言的研究,或許也同樣適用於外星文明。

以目前人類科技的認知,在傳遞信息時,即使是非常先進的地外文明,仍然要遵守信息理論規則。

雖然由於缺乏對於核心信號的認識,我們可能無法破譯所獲得的信息,但同樣可以看出它們通信系統的複雜性,從而推斷出其為智能文明的可能。如果某個信號的條件概率達到很高的比如20階,那麼說明它們的語言複雜程度超過地球上任何一種人類語言。

1967年,天文學家喬瑟林·博奈爾(Jocelyn Burnell)和安東尼·赫維斯(Antony Hewish)發現了一種脈衝恆星,他們將其稱為「小綠人」。

這顆星體所發出的無線信號如此短暫,形成了一種頻繁的脈動,因此一些科學家最初猜測,它們可能來自於非常先進的外星文明。

在澳大利亞國家望遠鏡設施負責人西蒙·約翰遜(Simon Johnston)的幫助下,SETI學者重新分析了這顆Vela Pulsar星的脈衝信號,並獲得了約為-0.3的斜率。

很遺憾的是,這個數值與我們所知道的任何語言都不一致。

此外科學家們還發現,這些脈衝星的信號中,幾乎沒有條件概率結構的存在。因此,它們基本上不可能來自於一個高度發展的外星文明。(目前的研究認為,脈衝星信號是恆星變為超新星之後的自然殘餘物。)

通過信息理論,人類可以相對容易地區分智能生命信號和非生命體信號源。

SETI研究所的科學家們,依然在分析由一個龐大的艾倫望遠鏡陣列所得到的微波信號數據,這個由42台望遠鏡組成的陣列,包括從1到10千兆赫茲的頻段觀測。

或許有一天,我們會真的收到天外來客一億光年之外的訊息。

又或許,我們早就接收到了它們,只不過我們至今仍然懵然無知。

你們喜歡叫主今天這種類型的知識嗎?

不許說看不懂。

=THE END=



熱門推薦

本文由 yidianzixun 提供 原文連結

寵物協尋 相信 終究能找到回家的路
寫了7763篇文章,獲得2次喜歡
留言回覆
回覆
精彩推薦