知乎,中文互联网高质量的问答社区和创作者聚集的原创内容平台,于 2011 年 1 月正式上线,以「让人们更好的分享知识、经验和见解,找到自己的解答」为品牌使命。知乎凭借认真、专业、友善的社区氛围、独特的产品机制以及结构化和易获得的优质内容,聚集了中文互联网科技、商业、 …
知乎是一个中文互联网高质量的问答社区,用户可以在这里发现问题背后的世界,并分享知识、经验和见解。
高维数据的概念其实不难,简单的说就是多维数据的意思。平时我们经常接触的是一维数据或者可以写成表形式的二维数据,高维数据也可以类推,不过维数较高的时候,直观表示很难。
知乎,让每一次点击都充满意义 —— 欢迎来到知乎,发现问题背后的世界。
现在有神经网络输出层的1000维概率向量300条,每类50个数据,层次聚类,kmean结果都与label相去甚远。
具体还要看数据质量,但是可以通过支持向量机的原理理解,支持向量机是通过将低维数据投影到高维空间,在低维空间不可分的数据投影到高维后会更离散,可分性更强。
其实我觉得对于大数据来说,最最最重要的一点是如何在分布式系统上实现这样一个算法而不是专注于提升单机的运算效率,看到有人提出了Pegasos,这的确是一个方向,一旦用到了gradient方法,放到分布式上基本就是走那条parameter server的老路,虽然不清楚对于SVM的稳定性如何,但intuitively是可行的。
高维度数据能否使用kmeans? - 知乎
为啥高维数据,在计算欧式距离时会失效? - 知乎
在之前的文章中介绍了CNN的图解入门,CNN的MATLAB分类实现,CNN的MATLAB回归实现。. 卷积神经网络(Convolutional Neural Networ,简称CNN)是一种广泛应用于图像识别领域的深度学习算法。