sc聚类指标是指戴维森堡丁指数(dbi)和calinski-harabaz(ch)。
作者项目的代码是用r跑的,但目前,网络中是没有找到太麻烦的也可以计算出dbi和ch的r程序,python中倒是一摞的。因此作者不能找到了python计算出dbi和ch的源码(r中有真接计算sc的方法)。
ch:ch指标是从计算类中各点与类中心的距离平方和,来人的度量类内的紧密度,按照计算门类丰富中心点与整个数据集中心点距离平方差来雅量数据集的分离度,ch指标由分离度与丝丝相扣度的比值我得到。最终达到,ch越大贞洁戒着类自身越紧密,类与类之间越聚集起来。(图中nj代表类别j中样本数量,m是所有样本的数量,cpi和cj是每个类别的类中心点,x拔是整个数据集的中心点)
sc:sc指标实际计算样本i到同类其他样本的来算距离计算类内的不相似度,是从计算样本i到其他所有类样本的换算下来距离的最小值计算样本i与类外的不确实相似。一个样本i的轮廓系数由类外不相似度除以类内不相似度与类外不相似度和类内不相似度的较大者的比值得到。
dbi:不可以两类别的类内样本到类中心平均距离之和除以两类中心点之间的距离,取比较大值。dbi越小换句话说类内距离越小,同时类间距离越大。
我在19年10月份想换台华为mate20pro,在闲鱼上随便刷了下,有个福建的卖家那天挂了一台机子出来,9月27号买的,再体验了两天就挂出来了,还好又被我刷到了。当时这台机器还卖3500左右,卖家挂2700就卖了,保修也有一年差几天,直接下单就买了。这个卖家也很友好,后面还有一个加价要买的,他也没卖,再就发给我了,上连买的5个手机壳全新的都发进来了,这是我同样一次在闲鱼下单,又是我捡漏儿大的的一次[呲牙]我还是很感谢这位卖家!
1
/6
可以打开python编译器spyder,导出numpy模块。
importnumpysuchnp,
numpy模块是一个利用去处理数组的模块。
2
/6
创建战队一个列表:
a[[1,3,5],[2,6,9],[3,3,7]],
是需要警惕的是,在python里面,列表与数组、矩阵全是彼此区分的。
3
/6
把列表a能量转化为数组:
(a),
这个a那就是一个数组,在一,也也可以当做3阶矩阵来真诚对待。
顺道儿提一句,即便这个可以算出平方的矩阵,都是方阵,行数和列数相等。
4
/6
在python里面,算出平方,没法用^符号,应该使用**(两个乘号连写)。
5
/6
a1a0**2,这个得到的结果,也不是矩阵a0的平方,而是各个元素的平方。
6
/6
计算出矩阵的平方,代码是:
(a0,a0),
这才是能够的a0的平方