🧮 統計工具箱/PCA 主成分分析

🧬 PCA 主成分分析

主成分分析 + Score Plot + Scree Plot

什麼是主成分分析?

主成分分析(Principal Component Analysis, PCA)是一種降維技術,用於將高維度的數據投影到較低維度的空間中,同時盡可能保留原始數據的變異資訊。

想像你有一份包含 20 個生化指標的血液檢測數據。這 20 個變數之間可能存在大量的冗餘(例如多種發炎指標之間高度相關)。PCA 會找出數據中變異量最大的方向——這些方向就是「主成分(Principal Components)」。

數學上,PCA 對數據的共變異數矩陣進行特徵值分解(eigendecomposition)。每個特徵值代表該主成分所解釋的變異量,對應的特徵向量則定義了主成分的方向(也就是原始變數的線性組合權重)。

如何解讀 Scree Plot

Scree Plot 是一張將各主成分的特徵值(或解釋變異百分比)按大小排列的圖表。它是決定「保留幾個主成分」的關鍵工具。

Loadings 的解讀

Loadings 矩陣顯示每個原始變數對各主成分的貢獻權重。絕對值越大,代表該變數對該主成分的影響越大。

PCA 的應用場景

PCA 在生醫研究中有幾個核心應用:

使用 PCA 前的注意事項

此工具永久免費。若它幫你節省了時間,考慮請作者喝杯咖啡。

☕ 請我喝杯咖啡