情境 : 如何評估森林裡樹木的豐富程度?
假設你走路走著撞見了一片森林,想知道森林中樹種多樣化程度,要如何進行量化分析呢?
生態學角度,「多樣」這件事情可分成物種豐富度 (Species richness)、物種均勻度 (Species evenness) :
- 物種豐富度 指的是物種的數量,數量越多豐富度越大。
- 物種均勻度 指的是群集(community)中物種數量的分配情況,物種彼此數量越接近,均勻度越高。
Reference : 科學 Online
從下圖中以森林 1
與 森林 2
進行比較,兩者物種豐富度 相同,都是 16 顆樹,但 森林1
中 4個不同物種數量接近 (均勻),物種均勻度 森林1
> 森林2
:

回到分析,每個組裡面的物種 (菌相) 多樣嗎?
我們把森林1、森林2… 想像成範例檔案中 Female
、Male
兩組,想知道女性與男性組內的菌相多樣性如何? 並量化成數字做成圖,我們可以用 組內多樣性 Alpha diversity 找到答案,「組內」指的是樣本內的意思,觀察樣本內的多樣性情況,QIIME2 提供三種指數進行計算 (嗅到生物統計學的味道了:
- 物種豐富度指數 (Species richness)
- 物種均勻度指數 (Species evenness)
- 物種多樣性指數 (Diversity index)
並提供兩種視覺化呈現方式 :
- 稀疏曲線 (Rarefaction curve)
- 箱形圖 (Box plot)
先把程式跑完,後面慢慢解讀~
繪製多樣性分析 (Alpha and Beta diversity)
先啟動 qiime2-2022.8 環境
conda activate qiime2-2022.8
會使用到 rooted-tree.qza
、table-dada2-240.qza
、sample-metadata.tsv
帶上 [第 15 篇] 的便條紙,這邊要告訴 QIIME2 最大的序列條數是多少:
qiime diversity alpha-rarefaction \
--i-table table-dada2-240.qza \
--i-phylogeny rooted-tree.qza \
--p-max-depth 50131 \
--m-metadata-file sample-metadata.tsv \
--o-visualization alpha-rarefaction.qzv
–p-max-depth : 可視為所有樣本中,最大的序列條數
完成後會顯示:
'
Saved Visualization to: alpha-rarefaction.qzv
'
同一張便條紙,這邊要告訴 QIIME2 統計的取樣深度是多少:
qiime diversity core-metrics-phylogenetic \
--i-phylogeny rooted-tree.qza \
--i-table table-dada2-240.qza \
--p-sampling-depth 19914 \
--m-metadata-file sample-metadata.tsv \
--output-dir core-metrics-results
–p-sampling-depth: 取樣深度
–output-dir: 輸出的資料夾,若原本無此資料夾會自動創一個,
因為此次產出檔案眾多,用一個資料夾裝他們。
完成後會顯示:
'
Saved FeatureTable[Frequency] to: core-metrics-results/rarefied_table.qza
Saved SampleData[AlphaDiversity] to: core-metrics-results/faith_pd_vector.qza
Saved SampleData[AlphaDiversity] to: core-metrics-results/observed_features_vector.qza
Saved SampleData[AlphaDiversity] to: core-metrics-results/shannon_vector.qza
Saved SampleData[AlphaDiversity] to: core-metrics-results/evenness_vector.qza
Saved DistanceMatrix to: core-metrics-results/unweighted_unifrac_distance_matrix.qza
Saved DistanceMatrix to: core-metrics-results/weighted_unifrac_distance_matrix.qza
Saved DistanceMatrix to: core-metrics-results/jaccard_distance_matrix.qza
Saved DistanceMatrix to: core-metrics-results/bray_curtis_distance_matrix.qza
Saved PCoAResults to: core-metrics-results/unweighted_unifrac_pcoa_results.qza
Saved PCoAResults to: core-metrics-results/weighted_unifrac_pcoa_results.qza
Saved PCoAResults to: core-metrics-results/jaccard_pcoa_results.qza
Saved PCoAResults to: core-metrics-results/bray_curtis_pcoa_results.qza
Saved Visualization to: core-metrics-results/unweighted_unifrac_emperor.qzv
Saved Visualization to: core-metrics-results/weighted_unifrac_emperor.qzv
Saved Visualization to: core-metrics-results/jaccard_emperor.qzv
Saved Visualization to: core-metrics-results/bray_curtis_emperor.qzv
'
沒錯,就是這麼多,跑出了滿滿的統計圖,真的是很方便。
本篇使用到的輸入/輸出檔案:Input
: table-dada2-240.qza、rooted-tree.qza、sample-metadata.tsvOutput
: alpha-rarefaction.qzv、core-metrics-results (folder)
下回是多樣性統計解讀時間!