做 RNA seq 會看到這張像是商品條碼圖~

假設實驗與對照組共 5 個基因表現,名稱為 A~E,兩組各基因表現量不同,把兩組表現量分別相除,得到各基因 Fold Change 也就是倍數。
倍數越大,表實驗比對照組基因表現多出了 N 倍,即上調 (Upregulated gene), 會得到像醬數列:[0.5, 5, 1 , 1.2, 0.4] 大於 1 就是上調 N 倍,小於1就是下調~
再排序數列由大到小: [5, 1.2, 1, 0.5, 0.4],畫成附圖中最下方的 Ranked List Metrix,橫軸序為重新排序基因,縱軸為倍數。
若想觀察實驗組先天免疫 (Innate Immunity) 相關基因是否有變化,全部 5 個基因有 3 個是先天免疫,會在剛剛提到橫軸出現三根垂直線 (像條碼)。
條碼越多,越集中在橫軸左邊,表該途徑上調基因很多且倍數高!
上方像山坡曲線是累加分數,想像從 0 開始每遇到條碼就 +10 分,不相關基因就 -0.2 分。
曲線一開始急遽上升,後面緩緩滑下,就代表先天免疫在實驗組是有顯著差異且上調表現!
實際上 Fold Change 會再用統計處理,使其出現負值/標準化/取對數等。
而山坡曲線中的累加分數稱為 Running enrichment score,其最高點稱為 Enrichment Score (ES) 可以透過往下對統計處理後的 Fold Change,判斷這些相關基因(如先天免疫) 在實驗組中多數為上/下調。
而若某代謝途徑相關基因於實驗組並無顯著上下調,曲線就會呈現上下震盪,呈現如下圖的結果。

Reference:
GitHub: GSEA-MSigDB/gsea-desktopWang
Xianli, et al. (2024). Transcriptome and metabolome analyses reveal the effects of formula and breast milk on the growth and development of human small intestinal organoids. Food Research International, 195, 114999.
本篇同步刊載於 Threads:
PetSci 毛怪實驗紀錄簿 (petsci_note)