NGS QIIME2 : 分析與繪製組間物種多樣性 (Beta diversity) -18

維度分析 (Ordination plots)

Beta Diversity 強調的是組與組之間的量化數據,從範例檔案來看,每個樣本有約莫 100 種菌 (確切來說是 OTU/ASV),如果想要繪製一個立體圖來表示每個樣本的位置,每一種菌都有一個對應的豐富度,兩種菌可以在 X-Y 平面圖 (2D) 中放置一個點代表該樣本,三種菌可以在 X-Y-Z 三維圖 (3D) 中放置一個點代表該樣本,四種…五種…一百種該怎麼辦呢?? 難不成要畫一個 100D 圖嗎?

降維(reduction of dimensionality) 就是很常見處理方式,將多維度資料透過投影 (Projection) 與旋轉 (Rotation) 留下主要特徵。

記得高中地理學過將地球 (3D) 投影成平面地圖 (2D) 嗎? 這就是日常最常見的降維處理,而我們也知道不同投影方式會犧牲面積、距離等因素。Reference: UCGIS

生態學菌相中的降維

在生態學角度,要比較組與組之間的差異考量的因素有三:

1. 投影與距離計算方式

必須將兩組或以上的多維度資料中找出差異大的數據,重新繪製於二維或三維座標系上,常見的方式包含 PCA, PCoA, NMDS 等 (可參考 Biotools 文章)。(可在 [第 16 篇] 檔案發現含有 pcoa 的名稱)

2. 權重 (weight)

有無加入權重 (weighted) 也是考量的因素之一,就像是國高中成績單總成績主科會加權個2倍 3倍 QQ,若存在一些菌佔了較高比例(如優勢菌等),可以考慮使用 Weighted (Bray curtis、Weighted unifrac),菌種分布平均或欲觀察整體分布,適合使用 Unweighted (Jaccard、Unweighted unifrac)實務上就是兩者都拿出來看看,哪個符合預期目標。(可在 [第 16 篇]檔案發現含有 unweighted weighted 的名稱)

3. 親緣關係樹 (Phylogenetic tree)

與 [第 17 篇] 中所描述的 faith pd 概念類似,加入了親緣關係的因素。推薦參考 盛夏不等式 文章,(可在 [第 16 篇] 檔案發現含有 bray_curtis jaccard unifrac 的名稱)

Beta diversity 的視覺化

其實在 [第 16 篇] QIIME2 已經分析好了,

檔名方法
bray_curtis_*Beta diversity
evenness_*Alpha diversity
faith_pd_*Alpha diversity
jaccard_*Beta diversity
observed_features_*Alpha diversity
shannon_*Alpha diversity
unweighted_unifrac_*Beta diversity
weighted_unifrac_*Beta diversity

只是需要轉換為 qzv ,並告訴軟體所想要比較的組別 (範例為 Sex): 範例: unweighted_unifrac_distance_matrix.qza

qiime diversity beta-group-significance \
--i-distance-matrix core-metrics-results/unweighted_unifrac_distance_matrix.qza \
--m-metadata-file sample-metadata.tsv \
--m-metadata-column Sex \
--o-visualization core-metrics-results/unweighted_unifrac_Sex_site_betasig.qzv \
--p-pairwise

–i-distance-matrix : 可自行變換表格上所述不同量化方式的Beta diversity .qza
–m-metadata-column : 想要比較的組別 (進階學習)
–p-pairwise : 成對樣本檢定

完成後會顯示:

'
Saved Visualization to: core-metrics-results/unweighted_unifrac_Sex_site_betasig.qzv
'

拖曳到 QIIME2 VIEW,根據檔名不同會有兩種的呈現方式:

1. 箱形圖 (帶有 betasig 名稱的.qzv)

範例: unweighted_unifrac_Sex_site_betasig.qzv

2. 3D Plot (帶有 emperor 名稱的.qzv)

範例: weighted_unifrac_emperor.qzv


本篇使用到的輸入/輸出檔案 :
Input : sample-metadata.tsv、core-metrics-results/unweighted_unifrac_distance_matrix.qza
Output: alpha-rarefaction.qzv、core-metrics-results (folder)

下回是微生物功能預測!


QIIME2 創業 培養 定序 彰師 微生物分析 鐵人賽系列