吧务
level 11
我现在有一个m行n列的矩阵 并且有个m个的label与之对应 这样矩阵里每一行都对应一个label 现在我想知道到底这个矩阵在多大程度上表达了label信息 我怎么做
2018年04月09日 01点04分
3
吧务
level 11
在mma里我试了两个办法 第一个是用DimensionReduce的tsne降维到二维 矩阵变成m*2的矩阵 然后可视化出来观察 到这只能看没有具体度量 另一个是先用Nearest对于矩阵中任何一行,总有另一行与它距离最近,我看下他们的label是不是一样,最后做一个n*n的混淆矩阵图 不过也只能看没数字指标
2018年04月09日 01点04分
4
吧务
level 11
我注意到python的机器学习库scikit-learn有两个函数
sklearn.metrics.silhouette_score(X, labels)
sklearn.metrics.calinski_harabaz_score(X, labels)
第一个指标输出的值域在[-1,1]之间 越大聚类特性越好
对于不
正确的
clustering (聚类),分数为 -1 , highly dense clustering (高密度聚类)为 +1 。零点附近的分数表示 overlapping clusters (重叠的聚类)。
第二个指标输出的值域为正数 越大聚类特性越好
当 cluster (簇)密集且分离较好时,分数更高,这与一个标准的 cluster(簇)有关。
不过有时候会出现A簇的silhouette_score大于B簇,A簇的calinski_harabaz_score小于B簇的情况发生 怎么办呢
2018年04月09日 02点04分
6