NGS QIIME2 : 分析與繪製組內物種多樣性 (Alpha diversity) (上) -16

瀏覽次數: 503

情境 : 如何評估森林裡樹木的豐富程度?

假設你走路走著撞見了一片森林，想知道森林中樹種多樣化程度，要如何進行量化分析呢?

生態學角度，「多樣」這件事情可分成物種豐富度 (Species richness)、物種均勻度 (Species evenness) :

物種豐富度 指的是物種的數量，數量越多豐富度越大。
物種均勻度 指的是群集(community)中物種數量的分配情況，物種彼此數量越接近，均勻度越高。
Reference : 科學 Online

從下圖中以森林 1 與 森林 2 進行比較，兩者物種豐富度 相同，都是 16 顆樹，但 森林1 中 4個不同物種數量接近 (均勻)，物種均勻度 森林1 > 森林2:

Reference : bioninja

回到分析，每個組裡面的物種 (菌相) 多樣嗎?

我們把森林1、森林2… 想像成範例檔案中 Female、Male 兩組，想知道女性與男性組內的菌相多樣性如何? 並量化成數字做成圖，我們可以用 組內多樣性 Alpha diversity 找到答案，「組內」指的是樣本內的意思，觀察樣本內的多樣性情況，QIIME2 提供三種指數進行計算 (嗅到生物統計學的味道了:

物種豐富度指數 (Species richness)
物種均勻度指數 (Species evenness)
物種多樣性指數 (Diversity index)

並提供兩種視覺化呈現方式 :

稀疏曲線 (Rarefaction curve)
箱形圖 (Box plot)

先把程式跑完，後面慢慢解讀~

繪製多樣性分析 (Alpha and Beta diversity)

先啟動 qiime2-2022.8 環境

conda activate qiime2-2022.8

會使用到 rooted-tree.qza、table-dada2-240.qza、sample-metadata.tsv
帶上 [第 15 篇] 的便條紙，這邊要告訴 QIIME2 最大的序列條數是多少:

qiime diversity alpha-rarefaction \
  --i-table table-dada2-240.qza \
  --i-phylogeny rooted-tree.qza \
  --p-max-depth 50131 \
  --m-metadata-file sample-metadata.tsv \
  --o-visualization alpha-rarefaction.qzv

–p-max-depth : 可視為所有樣本中，最大的序列條數

完成後會顯示:

'
Saved Visualization to: alpha-rarefaction.qzv
'

同一張便條紙，這邊要告訴 QIIME2 統計的取樣深度是多少:

qiime diversity core-metrics-phylogenetic \
  --i-phylogeny rooted-tree.qza \
  --i-table table-dada2-240.qza \
  --p-sampling-depth 19914 \
  --m-metadata-file sample-metadata.tsv \
  --output-dir core-metrics-results

–p-sampling-depth: 取樣深度
–output-dir: 輸出的資料夾，若原本無此資料夾會自動創一個，
因為此次產出檔案眾多，用一個資料夾裝他們。

完成後會顯示:

'
Saved FeatureTable[Frequency] to: core-metrics-results/rarefied_table.qza
Saved SampleData[AlphaDiversity] to: core-metrics-results/faith_pd_vector.qza
Saved SampleData[AlphaDiversity] to: core-metrics-results/observed_features_vector.qza
Saved SampleData[AlphaDiversity] to: core-metrics-results/shannon_vector.qza
Saved SampleData[AlphaDiversity] to: core-metrics-results/evenness_vector.qza
Saved DistanceMatrix to: core-metrics-results/unweighted_unifrac_distance_matrix.qza
Saved DistanceMatrix to: core-metrics-results/weighted_unifrac_distance_matrix.qza
Saved DistanceMatrix to: core-metrics-results/jaccard_distance_matrix.qza
Saved DistanceMatrix to: core-metrics-results/bray_curtis_distance_matrix.qza
Saved PCoAResults to: core-metrics-results/unweighted_unifrac_pcoa_results.qza
Saved PCoAResults to: core-metrics-results/weighted_unifrac_pcoa_results.qza
Saved PCoAResults to: core-metrics-results/jaccard_pcoa_results.qza
Saved PCoAResults to: core-metrics-results/bray_curtis_pcoa_results.qza
Saved Visualization to: core-metrics-results/unweighted_unifrac_emperor.qzv
Saved Visualization to: core-metrics-results/weighted_unifrac_emperor.qzv
Saved Visualization to: core-metrics-results/jaccard_emperor.qzv
Saved Visualization to: core-metrics-results/bray_curtis_emperor.qzv
'

沒錯，就是這麼多，跑出了滿滿的統計圖，真的是很方便。

本篇使用到的輸入/輸出檔案:
Input: table-dada2-240.qza、rooted-tree.qza、sample-metadata.tsv
Output: alpha-rarefaction.qzv、core-metrics-results (folder)

下回是多樣性統計解讀時間！