<aside> 💡 可使用 tensorboard 進行這個可視化。
</aside>
PCA vs t-SNE 應該使用哪個進行可視化
| S.NO. | 主成分分析 | t-SNE |
|---|---|---|
| 1. | 它是一種線性降維技術。 | 它是一種非線性降維技術。 |
| 2. | 它試圖保留數據的全局結構。 | 它試圖保留數據的本地結構(集群)。 |
| 3. | 與 t-SNE 相比,它效果不佳。 | 它是最好的降維技術之一。 |
| 4. | 它不涉及超參數。 | 它涉及超參數,例如困惑度、學習率和步數。 |
| 5. | 它受到異常值的高度影響。 | 它可以處理異常值。 |
| 6. | PCA 是一種確定性算法。 | 它是一種非確定性或隨機算法。 |
| 7. | 它通過旋轉向量來保持方差。 | 它通過最小化高斯點之間的距離來工作。 |
| 8. | 我們可以決定使用特徵值保留多少方差。 | 我們不能保留方差,而是可以使用超參數保留距離。 |
- t-SNE 的隨機性:每次執行跑出來的結果都是不一樣的,不像PCA。
- t-SNE 的解釋性:比較兩堆的大小、距離是沒有意義的。