相关题目
单选题
对训练数据的预测效果很好,但对验证数据的预测效果不好的现象称为过拟合
单选题
t-SNE(t-Distributed Stochastic Neighbor Embedding)是一种将高维的复杂数据降为二维(或三维)的算法,用于低维空间的可视化
单选题
LLE(Locally Linear Embedding)可以将以弯曲或扭曲的状态埋藏在高维空间中的结构简单地表示在低维空间中
单选题
混合高斯分布对呈椭圆形分布的数据聚类效果较好,而k-means算法对从重心开始呈圆形分布的数据聚类效果较好
单选题
混合高斯分布通过使用多个高斯分布的线性组合来实现聚类
单选题
k-means算法中确定簇的数量这个超参数时,可以使用Elbow方法
单选题
LDA(Latent Dirichlet Allocation)是一种降维算法,适用于文本建模
单选题
LSA(Latent Semantic Analysis)是一种自然语言处理算法,通过矩阵的奇异值分解到达聚类的目的
单选题
PCA(Principal Component Analysis)算法通过计算特征之间的相关性,以少量的特征表示具有较多特征的数据,降低多特征数据分析的复杂度
单选题
KNN(K-Nearest Neighbor)算法由于需要同时存储大量的已知标签数据,故其一般不适合处理大规模的训练数据
