中国核电工程有限公司北京100840
摘要:针对核电设备进度风险的评价问题,采用支持向量机进行了建模并应用交叉验证法对模型的参数进行寻优,利用分类功能实现对进度风险的评价,并将预测结果与实际情况进行了对比,结果证明其可以作为项目管理者评价进度风险有效的辅助工具。
关键词:核电设备;进度风险;支持向量机;交叉验证法
支持向量机(SupportVectorMachine)是Cortes和Vapnik[1]于1995年首先提出的。本文建立了核电设备进度风险支持向量机模型并应用交叉验证法对模型的参数进行寻优,通过少量样本的训练利用分类功能实现对核电设备进度风险的评价,最终将预测结果与实际情况进行对比以验证模型的准确性。
1支持向量机的原理及算法
1.1经验风险最小化与结构风险最小化
机器学习问题可以表示为:输入变量与输出变量存在某种依赖关系,即遵循一个未知的联合概率,机器学习根据个独立同分布观测样本
(1)
在一组函数中寻求一个最优函数使预测期望风险
(2)
最小,其中为预测函数集,为函数的广义参数,为用对进行预测而造成的损失,称之为损失函数。
由于期望风险无法直接计算和最小化,定义
(3)
是训练样本数据经机器学习得到的预测结果与真实结果之间的差值,称为经验风险。
统计学习理论引入了泛化误差界的概念,指真实风险由经验风险和置信风险两部分内容刻画,置信风险代表了机器学习在未知样本上可以信任的程度。真实风险与经验风险和置信风险之间的关系如下:
(4)
其中,为单调递减函数;为样本数;为函数的VC维数(Vapnik-Chervonenkisdimension)。
1.2支持向量机
本文选择径向基函数作为建模的核函数,为径向基核函数的参数。
2核电设备进度风险评价模型
2.1进度风险评价模型建立
我们从“合同签订交货期”、“设计文件平均交换周期”、“设备核安全等级”、“技术方案成熟度”和“供应商成熟度”几个方面对设备进度风险进行评价。
根据支持向量机的分类功能建立支持向量分类(SupportVectorClassification,SVC)机模型,风险因素具体的量化形式见表1。此外,将支持向量分类机模型精度设为0.001。
表1设备进度风险评价因素的量化形式
评价因素量化形式参数说明
合同签订交货周期DD=d合同交货时间为FCD+d个月
d—设备交货周期(月)
设计文件平均交换周期TT=1、2、3、41(T<1周);
2(1周<T<2周);
3(2周<T<3周);
4(T>3周)
设备核安全等级NN=1、2、3、5、7N=1(NC级设备);
N=2(LS级设备);
N=3(核3级设备);
N=5(核2级设备);
N=7(核1级设备)
技术方案成熟度PP=1、2P=1(有成熟参考方案);
P=2(需开发新方案);
供应商成熟度LL=1、2、3L=1(原供方);
L=2(新供方-有核电经验);
L=3(新供方-无核电经验);
注:T取自设备供应商项目执行时的平均数值,其余评价因素合同签订后即可取值。
2.2参数选择
惩罚因子值C和径向基函数的参数,这两个参数对模型的学习能力、预测能力和泛化能力有很大影响。本文应用交叉验证(CV,CrossValidation)法对C和进行寻优,寻优区间均设为2^(-5)到2^(10),寻优步长设为1,支持向量分类机评价函数为训练样本的分类准确率,当支持向量分类机的分类准确率最高时获得最优参数组合(C和)。
3结果与分析
3.1模型训练样本
进度风险模型的评价结果分为4个等级:评价结果0,进度正常;评价结果1,进进度延误,延误周期在30天内;评价结果2,进度延误,延误周期在30-90天内;评价结果3,延误超期超过90天。
选择5个供应商执行情况样本作为训练样本。
训练样本的详细信息如表2所示。
表2训练样本说明
样本编号评价因素样本标签
DTNPL
11321131
23547123
31612210
4822112
52023221
3.2核电设备进度风险的分类预测
利用交叉验证法寻优得到的模型参数C=1,=0.1。利用支持向量分类机建立的进度风险评价模型经过5个训练样本的学习后对9个检验样本的预测结果见表3。
表3检验样本分类结果
样本编号评价因素样本标签预测标签
DTNPL
119231111
227352222
330371233
47111211
519121201
618221200
713112100
825352122
916112300
预测结果表明由5个小样本空间构成的分类超平面,对检验样本的分类准确率达到88.9%,其中仅有5号检验样本的预测结果与实际标签出现偏差。
因此支持向量分类机可以作为一种评价进度风险有效的辅助方法。
4总结
利用支持向量分类机建立的风险评价模型对设备进度风险等级的分类预测有较高的准确率,其可以作为项目管理者评价设备进度风险有效的辅助工具。
参考文献
[1]VAPNIKVN.TheNatureofStatiscalLearningTheory[M].NewYork:Springer-Verlag,1995.
[2]KeerthiK,LinCJ.AsymptoticbehaviorsofsupportvectormachineswithGaussiankernel[J].NeuralComputation,2003,153(3):1667-1689.