最出名的降维算法是PCA和t-SNE。将这两个算法分别应用到数据「X」上,并得到数据集「X_projected_PCA」,「X_projected_tSNE」。下面哪一项对「X_projected_PCA」和「X_projected_tSNE」的描述是正确的?
A.X_projected_PCA在最近邻空间能得到解释
B.X_projected_tSNE在最近邻空间能得到解释
C.两个都在最近邻空间能得到解释
D.两个都不能在最近邻空间得到解释
第1题:
下面选项中说法正确的有()。
A.JDA特征转化时,降维方法中的数据重构选择PCA来进行
B.通过PCA得到k 维特征表示后,为了减小边缘分布差异,引入最大均值差异MMD,旨在k维嵌入中计算源域数据和目标域数据样本均值之间的距离
C.JDA中,目标域中没有标签数据,不能直接建模,需利用类条件分布来近似,因此可以利用在源域数据上训练得到的基分类器应用到目标域数据,得到目标域数据的伪标签
D.在JDA中,我们的目标是同时最小化域间边缘分布和条件分布的差异
第2题:
下列关于数据降维的说法不正确的是()
A.神经网络算法不能用于数据降维。#B.原始数据可能包含数以百/千/万计的属性,大部分情况下会有很多属性与任务不相关,是冗余的,数据降维可以提高数据质量,提升数据挖掘和机器学习的效率及精度。#C.数据降维的方法包括人工降维和自动降维,其中自动降维又分为维度规约和数据压缩 。#D.维度规约又称又称特征选择, 就是要删除冗余无用的属性;被保留的属性仍保持原有的物理意义。第3题:
以下关于PCA算法的描述正确的有哪些
A.即使输入数据X各个维度上的数值相似度较高,依旧需要对其去均值
B.已知使用PCA算法压缩后的数据Y以及压缩矩阵A,但是无法大致还原压缩前的数据X
C.在使用PCA算法时,有可能陷入局部最小值,所以需要使用不同的初始化数值多次计算以获得更好的结果
D.使用PCA算法时,数据压缩后的维度M可以设置的偏小一点
第4题:
任何的算法都是由数据结构和算法这两个要素组成。
第5题:
2、SVM算法的最小时间复杂度是O(n²),基于此,以下哪种规格的数据集并不适该算法?
A.不受数据集的大小影响
B.中等数据集
C.小数据集
D.大数据集