水生態文明建設的關鍵是恢復并維持自然水體健康,科學合理地評估水體健康狀況無疑是至關重要的。為了評估水體健康狀況,科學家們提出了許多指數。在眾多指數中香農-維納多樣性指數脫穎而出(生物完整性指數后來居上)。在2023年生態環保部發布的《水生態監測技術指南 湖泊和水庫水生生物監測與評價(試行)》(HJ 1296-2023)中提出了香農-維納多樣性指數評價分級參考值(表1)?,F有大量期刊論文中也將香農-維納多樣性指數與水質關聯起來,認為香農-維納多樣性指數越高,水體污染程度越低。
備注:該參考值的H計算公式以2為底
那么香農-維納多樣性指數是如何起源的呢?又是如何能夠應用于水生態并表征水環境質量的呢?
1、香農指數的起源
香農指數又稱香農熵或信息熵。1948年貝爾實驗室通訊技術電子工程師克勞德•香農(Claude Shannon, 1916-2001)在《貝爾系統技術雜志》(Bell System Technology Journal)分兩期發表了信息論開山之作《通訊的數學理論》(A mathematical theory of communications,1948)。在這一重磅文獻中,他引進“信息熵”的概念來衡量通信系統效率。從概念上來講,將信息定義為可能事件或消息的概率分布對數的負值,每個事件的信息量構成一個隨機變量,其期望值或平均值為香農熵。簡單理解就是香農熵用來描述不確定事件的不確定程度,是隨機變量不確定度的度量。隨機變量不確定度越大,熵越大;反之越小。
公式1:
1949年香農和維納在University of Illinois Press出版的《通訊的數學理論》(A mathematical theory of communications,1949)一書中再次系統介紹了信息熵,信息熵的概念在更大范圍內得以推廣?;谶@樣的原因,香農熵也被稱為香農-維納熵。
香農對信息理論的表述在通信工程應用中立即獲得了成功,此后它激發了將信息理論應用于其他各個領域的嘗試,如認知學、生物學、語言學、心理學、經濟學和物理學。
圖1 Claude Shannon
2、香農指數應用于生態學
20世紀初期,如何定量分析生物群落結構是生態學家們關注的重點內容,后來被稱為現代生態學創始人之一的西班牙生態學家和自然學家Ramon Margalef也是其中的一員。
Ramon Margalef于1919年5月16日出生在巴塞羅那,很早就對淡水生物的觀察表現出了濃厚的興趣。1943年后不久,他得到了西班牙研究委員會(CSIC)的資助,并進入了應用生物研究所(Instituto de Biología Aplicada)從事浮游植物研究。1949年,他獲得了自然科學學位。1951年,在馬德里大學提交了他的博士論文后,Ramon Margalef成為該研究所的研究員。
圖2 Ramon Margalef
Ramon Margalef十分擅長用數學方法表達生態學中的現象與規律。1951年,Margalef為了定量分析生物群落結構,在前人的工作基礎上建立了一個新的指數,即“馬格列夫多樣性指數”(Margalef diversity index)。
公式2:
公式3:
公式3相比公式2更常用。公式2和公式3中,S是物種數,N是總物種個體數。馬格列夫多樣性指數也是生態學中常用的指數,但是該公式的缺點也十分明顯:馬格列夫多樣性指數(d)結果完全依賴物種數(S)和總豐度(N),而對缺乏對各個物種豐度的關注,偶見種和常見種對結果的影響是一樣的。如圖3群落A與群落B物種數和總豐度一樣,因此馬格列夫多樣性指數完全一樣,但是兩個群落的物種組成完全不同。盡管該指數在后續工作中被其他生態學家廣泛引用,但是Margalef本身對其并不滿意,并認為物種數與豐度之間的關系需要更多的統計學上的研究。
圖3 馬格列夫多樣性指數案例
1956年Margalef在去北美交流中,他首次談到將信息理論的概念應用于生物體群落的結構和動態研究。這個想法很快吸引了現場聽眾,這也給了Margalef更多的動力把香農的公式介紹給更多的生態學家。1956年,他在分析維哥和卡斯特利翁的海洋浮游植物的數據時,明確地將多樣性表達為信息和熵。但是在這里,他采用了新的公式來計算多樣性指數。
公式4:
在該公式中N為總豐度,S為物種數,Ni為物種i的豐度。該公式終于如Margalef所愿既考慮了物種數也考慮了每個物種的豐度。從結構上來講,該公式與香農熵公式(公式1)已經很接近了,并且在模擬數據(S=5,N=100的所有物種分布組成)上顯示二者的結果具有極顯著的負相關關系(r = -0.94,P<0.001)。
雖然此時Margalef已經注意到了1953年出版的《Information Theory and the Structure of Proteins》一書中已經采用了香農熵公式來計算蛋白中氨基酸的多樣性,并指出信息理論對于從一個科學領域概括到另一個科學領域特別有用。然而此時Margalef并沒有比較香農熵公式與自己的公式之間的異同。
我們采用模擬數據比較兩個公式發現,對比香農熵公式(公式1),Margalef新的公式(公式4)存在著一些不足:(1)其結果與人們直觀感受相反,在香農熵公式當物種數S和N一定時,物種分布越不均勻,香農熵越高,而在Margalef新的公式,物種分布越不均勻,其結果越低;(2)其結果值域分布范圍太窄,在同樣的模擬數據中香農熵的范圍是0.22-1.61,而Margalef新的公式則是3.49-3.59,值域會影響區分不同群落結構的差異(圖4)。
圖4 S=5,N=100模擬所有可能的物種分布(共計38225條數據)。
A,香農熵;B,Margalef新的公式結果
1957年,或許是對自己新創公式的不滿,Margalef用西班牙語發表了“La Teoría de la Información en Ecología”,首次建議將香農熵應用于生物多樣性研究。該文章一經發表便廣受歡迎,以至于第二年又用英文把文章重新發表了一遍(Information theory in ecology),這種一稿多投的現象是十分罕見的,這也從側面說明大家對這篇文章的追捧。此后香農熵正式進入生態學領域成為香農-維納多樣性指數,并在生態學領域大放異彩。
3、香農-維納多樣性指數的生態學意義
香農-維納多樣性指數描述物種的個體出現的紊亂和不確定性的指標。如果一個群落只包含一個物種,不確定性為零,因為我們確信隨機選擇的個體屬于那唯一的一個物種。群落中物種越多,不確定性就越高;在一個多樣化的群落中,我們不太可能猜到隨機選擇的個體屬于哪個物種。然而,如果群落有許多物種,但只有一個(或幾個)占優勢,不確定性就不會那么高,隨機選擇的個體更有可能是數量最多的物種。這就是為什么香農-維納多樣性指數隨著物種數和均勻度的增加而增加,并且物種數對其影響更大。因此香農-維納多樣性指數引入生態學領域用于評估群落生物多樣性是十分合適的。
在三個模擬生物群落中,所有群落物種數和總個體數相同,群落A所有物種完全均勻分布,群落B中物種并未完全均勻分布,但是也沒有出現絕對優勢種,群落C中物種完全不均勻分布,絕對優勢種的豐度占據了群落的大多數。在三個群落中香農-維納多樣性指數隨著物種均勻度的降低而降低(圖5)。
圖5 物種均勻度與香農指數的關系
圖來源于Analysis of community ecology data in R (作者:David Zelený)
4、香農-維納多樣性指數又是如何能夠表征水環境質量的
當用香農-維納多樣性指數表征物種多樣性的時候,通常沒有問題。一般來說香農-維納多樣性指數越高,那么群落中物種豐富度和均勻度越高,對應的物種多樣性越高。然而香農-維納多樣性指數又是如何與水質指標關聯起來的呢?
在生態學領域有一個關于群落穩定性的重要理論,即群落穩定性包括恢復力穩定性和抵抗力穩定性,群落多樣性越高那么抵抗外界干擾能力越強。物種多樣性越高,生態穩定性越高,進而生態系統功能和服務的可持續性更好。當污染發生時,各物種因為敏感性不同,對于污染物的響應也不相同,原有的群落結構必然發生變化。通常來看,某些物種會消亡,而某些耐污種的豐度可能會快速上升,從而導致物種多樣性降低??傮w來看,在自然水體中,香農-維納多樣性指數越低,污染程度越高,反之亦然。
但是,當我們在使用香農-維納多樣性指數表征水環境質量或者水體污染程度時還是需要十分謹慎。具體實踐來看,不同的生物類群、不同的物種鑒定結果、不同的采樣深度以及樣點的具體分布都可能會影響香農-維納多樣性指數。因此香農-維納多樣性指數是否能夠準確反應水體污染程度還需要結合其它指標具體研究。
參考資料
Shannon, C. E. A mathematical theory of communication. The Bell System Technical Journal, 1948,27(3)
Shannon, C.E.; Weaver, W. The Mathematical Theory of Communication; University of Illinois Press: Urbana, IL, USA, 1949.
Sherwin W.B., Prat I Fornells N. The Introduction of Entropy and Information Methods to Ecology by Ramon Margalef. Entropy (Basel). 2019, 21(8):794.
Margalef, R. La Teoría de la Información en Ecología. Mem. Real Acad. Cienc. Artes Barc. 1957, 32, 373–449. (In Spanish)
Margalef, R. Information theory in ecology. Gen. Syst. 1958, 3, 36–71.
David Zelený. Analysis of community ecology data in R. https://www.davidzeleny.net/anadat-r/doku.php/en:div-ind
轉自
水生生物數據分析管理平臺IHB