基于数据仓库的银行信用评级模型的构建(1)

(整期优先)网络出版时间:2009-09-10
/ 2

[摘 要] 基于数据仓库,利用rbf神经网络,建立了银行信用内部评级系统,提出了企业信用主题数据模型和风险评估模型 的训练过程。实证结果表明,该模型对银行信用评估可取得较好的效果。
[关键词] 数据仓库;神经网络;商业银行;信用评级
一、引言

近年来,商业银行的风险管理成为国际国内金融界关注的焦点。商业银行在运营过程中面临的金融风险主要有信用风险、利率风险、汇率风险、流动性风险和操作风险等,其中信用风险占有特殊的地位。信用风险指的是借款人由于种种原因,不愿或无力偿还银行贷款本息,使银行贷款无法收回,形成呆账损失的可能性。在现代商业银行经营中,信用风险是影响其安全高效运营的主要原因。
风险管理是一种主动的事前行为,而不是事后的补救。应通过分析现有的数据,大量运用数理统计模型识别、衡量和检测风险,利用大量历史数据建立数据仓库,依靠数据挖掘手段了对数据仓库中数据信息进行深度加工和利用,挖掘出数据模型来预测和防范未来的风险,进行风险量化管理。数据挖掘是通过自动或半自动的工具对大量的历史数据进行探索和分析的过程,其目的是发现其中有意义的模式和规律。数据挖掘不是一种现成的产品,而是一门技能。数据挖掘的建模方法分为线形回归、逻辑回归、神经网络、遗传算法和分类树等。
由于我国商业银行目前在处在转轨阶段,一方面由于信息残缺不全,另一方面由于传统的统计方法假定条件的局限性,使我国信用风险评估难以达到满意的效果。
人工神经网络(artificial neural network,简称ann)是20世纪50-60年代产生,80年代以来发展起来的一种处理复杂非线性问题十分有效的手段,目前已在模式识别等领域得到广泛的应用。
现有数十种神经网络方法,实际工作中大都采用bp(back propagation)网络,一些文献将其应用于银行信用风险评估取得了较好的效果。但同时bp网络也存在局限性:由于bp网络用于函数逼近时,权值的调整是用梯度下降法,存在局部极小和收敛速度慢的问题;已学习好的网络的推广(泛化)问题;网络的隐含节点个数的选取尚缺少统一而完整的理论指导等。而rbf(radial basis function)网络在逼近能力、分类能力和学习速度等方面均优于bp网络。利用rbf网络来完成函数逼近任务,并且将结果与bp网络以及采用改进bp算法的前向网络的训练结果作比较,发现rbf网络所用的时间最短。
本文将结合数据仓库与rbf神经网络构建银行信用内部评级系统。

二、数据仓库

数据仓库并非是一个仅仅存储数据的简单信息库,因为这实际上与传统数据库没有两样。数据仓库实际上是一个“以大型数据管理信息系统为基础的,附加在这个数据库系统之上的,存储了从企业所有业务数据库中获取的综合数据,并能利用这些综合数据为用户提供经过处理后的有用信息的应用系统”。如果说传统数据库系统的重点与要求是快速、准确、安全、可靠地将数据存进数据库中的话,那么数据仓库的重点与要求就是能够准确、安全、可靠地从数据库中取出数据,经过加工转换成为有规律的信息之后,再供管理人员进行分析使用。
数据仓库必须随时间变化而不断增加新的内容,进行新的分析和综合。一方面,数据仓库中需要不断捕捉信息系统中变化的数据,将它们追加到数据仓库中;另一方面,数据仓库中包含大量的综合数据,这些综合数据中很多是和时间有关的。需要随时间变化不断进行综合。就信用评级而言,委员会规定商业银行要随时跟踪客户财务状况的变化,至少每年对客户进行一次评级。因此,数据仓库也要随时变化。利用上1年的企业评级数据及专家对评级的调整,建立和调节评级模型,来预测分析客户今年的评级情况。数据模型的训练过程见图1。
16-59-21-625.jpg

三、rbf神经网络

径向基函数网络是单隐层的3层前向网络,输入层节点传递输入信号到隐层,隐层节点的基函数对输入信号在局部产生响应,当输入信号逼近基函数的中央范围时,隐层节点将产生较大的输出。由此可见,rbf网络具有局部逼近能力。其网络结构如图2所示。
作为基函数的形式,有下列几种:
16-59-22-0.jpg
16-59-22-359.jpg

四、数据模型

数据仓库中数据的采集需要从各种业务应用系统和管理信息系统中获取,如交易系统、信贷管理信息系统、客户关系管理信息系统(crm)等系统抽取数据,然后按照统一的数据标准,经过etl(抽取、转换和加载)放入数据仓库的企业信用主题系统中存储、展示。在数据仓库中可以根据需要,建立多个应用主题,其中根据信用评级的需要建立的企业信用主题中的数据模型如下:
在银行信用评估中,多采用指标打分法,影响客户信用评级的指标有很多。在本文中采用反映客户财务状况、经营状况最客观、最主要的6个指标:
资产报酬率=利润总额+财务费用/年平均总资产
资产负债率=总负债/总资产
速动比率=流动资产-存货/流动负债
流动比率=流动资产/流动负债
利息保障倍数=经营活动现金流量净额/利息支出


应收账款周转率=销售收入净额/应收账款平均余额+应收票据平均余额
其中:流动比率和速动比率反映企业的偿债能力,表现放贷企业拥有债权的安全程度及贷款企业到期偿还债务的能力,如果贷款企业到期无法偿还债务,将面临破产的危险;应收账款周转率用于衡量企业在资产管理方面的效果;资产负债率反映企业的总负债在总资产中所占的比例。资产报酬率反映贷款企业经营能力;利息保障倍数反映贷款企业按时还息的能力。