灰色关联分析基本原理
对于两个系统之间的因素,其随时间或不同对象而变化的关联性大小的度量,称为关联度。而根据因素之间发展趋势的相似或相异程度作为衡量因素间关联程度的方法称为灰色关联分析方法。对于本题衡量客户接受的程度与哪些因素关联度更高,我们可以使用灰色关联分析来衡量购买价格、维护成本、车门数、人员携带能力、行李箱大小、汽车安全性能等调查项和汽车可接受性之间的关联程度。
首先,我们定义数据矩阵的最后一列l为标准要素,其余各列为需要比较的要素,分别用x‘l和x’i表示。
第一步:数据标准化
Xi′=maxXi−minXiXi−minXi=(xi′(1),xi′(2),xi′(3),xi′(4)...)
第二步:求差序列
Δi(k)=∣xl′−xi′∣;i=1,2,3,4...
第三步:求两极差
M=imaxkmaxΔi(k)m=iminkminΔi(k)
第四步:计算关联系数
γli=Δi(k)+ρMm+ρM,i=2,3,4...
第五步:求灰色关联度
γln=N1k=1∑Nγln(k),i=1,2,3,4...
灰色关联分析改进模型
灰色关联分析的核心是计算关联度,但是原始的关联度计算方法对各样本平等看待,即采用平权处理。但是由于各个特征对结果的影响程度是不同的,如果采用平权处理,必然会丧失数据中隐藏的潜在特征,所以本文中我们对各特征进行加权处理。此处我们采用基于距离分析法对灰色关联分析算法进行改进。
改进后的公式为:
γln=k=1∑Nα(k)γln(k),i=1,2,3,4...
其中权重α的计算方法如下:
我们以最优要素和最劣要素为参考要素。计算各个要素与参考要素的距离,离最优要素点近并且离最劣样本远的样本为总体较好的要素。
设数据为m x n矩阵
⎣⎢⎢⎡a11⋮am1⋯⋱⋯a1n⋮amn⎦⎥⎥⎤
第一步:确定最优要素和最劣要素
A+=(a1+,a2+,...,an+)TA−=(a1−,a2−,...,an−)T
其中,
al+=max(a1l,a2l,...,aml)al−=max(a1l,a2l,...,aml),l=1,2,3,...n
第二步:计算各要素点到参考要素点的距离。这里采用欧式距离,
Dk+=l=1∑n(akl−al+)2
第三步:综合正负向距离
Sk=Dk+Dk−,k=1,2,...,m.
通过上式对各要素的距离进行综合评价,即当要素与最优要素点之间的距离越小,与最劣要素点之间的距离越大,那么该要素得到的分数越高。
但是为了防止Sk的分子和分母出现零,我们将Sk的分子和分母同时加上一个偏置β(这里的β一般取1)。得到,
Sk=Dk++βDk−+β,k=1,2,...,m.
第四步:数据归一化
αk=∑k=1mSkSk
则
α=(α1,α2,...,αm)T
即为所有权重向量。