降維可視化的方法 | Notion

<aside> 💡 可使用 tensorboard 進行這個可視化。

</aside>

PCA vs t-SNE 應該使用哪個進行可視化

S.NO.	主成分分析	t-SNE
1.	它是一種線性降維技術。	它是一種非線性降維技術。
2.	它試圖保留數據的全局結構。	它試圖保留數據的本地結構（集群）。
3.	與 t-SNE 相比，它效果不佳。	它是最好的降維技術之一。
4.	它不涉及超參數。	它涉及超參數，例如困惑度、學習率和步數。
5.	它受到異常值的高度影響。	它可以處理異常值。
6.	PCA 是一種確定性算法。	它是一種非確定性或隨機算法。
7.	它通過旋轉向量來保持方差。	它通過最小化高斯點之間的距離來工作。
8.	我們可以決定使用特徵值保留多少方差。	我們不能保留方差，而是可以使用超參數保留距離。

t-SNE 的隨機性：每次執行跑出來的結果都是不一樣的，不像PCA。

t-SNE 的解釋性：比較兩堆的大小、距離是沒有意義的。

Conclusion

看起來 UMAP 目前最新也最好