<aside> 💡 可使用 tensorboard 進行這個可視化。
</aside>
PCA vs t-SNE 應該使用哪個進行可視化
S.NO. | 主成分分析 | t-SNE |
---|---|---|
1. | 它是一種線性降維技術。 | 它是一種非線性降維技術。 |
2. | 它試圖保留數據的全局結構。 | 它試圖保留數據的本地結構(集群)。 |
3. | 與 t-SNE 相比,它效果不佳。 | 它是最好的降維技術之一。 |
4. | 它不涉及超參數。 | 它涉及超參數,例如困惑度、學習率和步數。 |
5. | 它受到異常值的高度影響。 | 它可以處理異常值。 |
6. | PCA 是一種確定性算法。 | 它是一種非確定性或隨機算法。 |
7. | 它通過旋轉向量來保持方差。 | 它通過最小化高斯點之間的距離來工作。 |
8. | 我們可以決定使用特徵值保留多少方差。 | 我們不能保留方差,而是可以使用超參數保留距離。 |
- t-SNE 的隨機性:每次執行跑出來的結果都是不一樣的,不像PCA。
- t-SNE 的解釋性:比較兩堆的大小、距離是沒有意義的。