美章網 資料文庫 證據權重方法與信用風險論文范文

    證據權重方法與信用風險論文范文

    本站小編為你精心準備了證據權重方法與信用風險論文參考范文,愿這些范文能點燃您思維的火花,激發您的寫作靈感。歡迎深入閱讀并收藏。

    證據權重方法與信用風險論文

    1經典邏輯回歸

    給出企業的真實數據格式(整理后的財務報表數據),如表1所示,其中違約標志一欄為響應變量Y,0表示正常,1表示違約,xij,i=1,…,n,j=1,…,m表示第i個客戶的第j個指標數值。首先要介紹經典的線性回歸。假設響應變量為向量Yn×1,n為樣本個數;設計矩陣為Xn×(m+1),m+1表示常數列以及m個變量(表1)。將常數列放在X的第一列,經典的線性回歸具有如下表達:該式即為經典的邏輯回歸模型。其中求解關鍵未知參數β的簡單而直接的方法是根據極大似然估計(利用式(2)寫出似然函數繼而利用NewtonRaphson方法求解極大值點[4])。經典邏輯回歸相關理論已經比較成熟并且已經用到實際風險評級模型中,相關的結果可參考文獻[2]。

    2證據權重邏輯回歸

    在實際的風險評級模型中,經典邏輯回歸模型有著諸多缺陷。首先變量個數m過大,例如在下一節做的真實數據中m=147,于是需要在建立邏輯回歸模型之前做變量選擇的工作,而變量選擇一直是統計學中的難題[1];其次,在邏輯回歸模型中,假定中間變量θ與設計矩陣X呈線性關系即θ=Xβ,這一假設在實際中也并不是都滿足的。再次,對于實際的風險評級模型,往往真實數據的采集質量比較差(設計陣不可逆、變量方差過小或者過大等)導致模型偏差較大,甚至無法建立模型,需要新的手段來解決這些問題。在風險評級模型中,我們實際上更關心的是違約樣本分布與正常樣本分布之間的距離,于是利用信息論中相對熵的思想,證據權重方法(weightofevidence)與經典邏輯回歸結合,設計了證據權重邏輯回歸模型,用以估計違約概率。

    21信息價值與證據權重在這一小節中,介紹信息論中熵、相對熵與信息價值的概念,并且借此引出證據權重(weightofevidence)的定義。實際上,證據權重的概念是Good正式提出的[5],用來處理假設檢驗問題。而真正應用到風險評級模型中,則是近年來國際主流評級模型的發展方向[2]。對于連續隨機變量X,密度函數為f(x),熵的定義為對于風險評級模型,基于相對熵判別能力的測量工具是信息價值(informationvalue),用以刻畫違約樣本分布和正常樣本分布的差異[56]。對于某個特定的變量,將對應違約樣本密度函數記為fD;該變量正常樣本密度函數記為f珚D。信息價值定義為違約樣本對應于正常樣本的相對熵與正常樣本對應于違約樣本相對熵之和[2],即從式(5)可知,信息價值的取值范圍為[0,∞)。按照定義,信息價值刻畫的是正常樣本與違約樣本分布之間的差異,對于選定的變量,為了得到具有高的判別能力的風險評級模型,該變量的信息價值應當盡可能的大。信息價值越高,說明該變量對于樣本違約與否的判別能力越強。而信息價值與響應變量(違約與否)的相關關系[5]如表2所示,此外根據信息價值可以變量選擇,將信息價值足夠大(如>03)的變量引入邏輯回歸模型,而舍棄那些信息價值偏小(對于樣本違約與否,幾乎沒有判別能力)的變量。即正常樣本與違約樣本對數似然函數的差。為使信息價值即式(5)達到最大,我們希望WOE值與該選定變量的原始數據呈單調關系,即該變量x數值越大,則對應WOE值單調變化(越大或者越?。?。此外,這種單調關系,同時反映了該變量對于違約與否的判別能力。定義式(6)反映了正常樣本與違約樣本對數似然函數的差,于是該選定變量WOE值的增加意味著違約概率的降低。利用單調的WOE值作為新的設計陣代入經典邏輯回歸,能夠克服本節一開始討論的第二個經典模型的困難,即中間變量θ與原始數據可能并非線性。

    22算法在實際風險評級模型中,考慮第j個變量即設計矩陣X的第j列X•j=[x1j,x2j,…,xnj]T,響應變量yi=0或1,i=1,…,n表示第i個樣本的實際違約情況。證據權重邏輯回歸的算法可以歸納如下,(1)將原始連續數據離散化,尋找第j個變量的最優劃分,并計算信息價值。具體來說,將X•j按照升序排序,記為X(•j)=[X(1,j),…,X(n,j)]T。假設希望將X(•j)分成k個區間(即尋找k-1個分點)且找到的分點必須使得WOE值為單調序列。若不存在這樣的劃分,則舍棄該變量;若存在多個這樣的劃分,則選取使得信息價值最大的劃分方式(即最優化分)。設Gi、Bi分別表示該變量第i個區間的正常、違約樣本個數,G、B表示全部的正常、違約樣本個數,則由式(5)和(6)可得相應的樣本估計形式為。在實際風險評級模型中,區間個數k依賴于經驗,建議取8~10。(2)根據信息價值(IV)的大小選取變量。選取第一步中信息價值較大的變量(如IV>03);舍棄信息價值較小的變量。(3)將選取變量對應的WOE值作為新的設計陣,代入經典邏輯回歸模型。利用經典模型中的方法解決選取變量間可能存在的多重共線性問題[7],計算違約概率并給出相關統計推斷(系數的極大似然估計和置信區間等)。

    3真實數據分析

    這一節將結合某商業銀行真實的近兩年來的制造業數據,給出上述證據權重邏輯回歸算法的應用。通過與經典邏輯回歸模型作比較,來驗證證據權重邏輯回歸模型的功效。數據格式如表1所示,其中違約企業為60個,正常企業240家,涉及的財務指標為147個,即該訓練模型設計陣Xn×(m+1),n=300,m=147。此外,我們選取另外150家企業,30條違約樣本、120條正常樣本作模型功效檢測。在算法第一步中,取區間數為8,計算信息價值與WOE值,選取了10個變量(權益乘數、流動負債率、全部資產現金回收率、現金流量凈值、固定資產成新率、盈利能力、現金比率、資本化資金充足率、(應收票據+應收款)/(應付票據+應付款)、保守速動比率)進入經典邏輯回歸模型。繼而利用經典模型相應結果(參數估計與假設檢驗等),計算違約概率(PD)、正常樣本與違約樣本違約概率的累計分布函數曲線、訓練樣本和檢測樣本的功效曲線(ROC曲線)[1]如圖1~4所示。從違約概率分布來看,證據權重邏輯回歸模型很好的將正常樣本(實線)與違約樣本(虛線)分開,且大多數的正常樣本的違約概率估計值遠小于違約樣本的違約概率估計值。從ROC曲線功效來看,無論是訓練模型還是檢測模型,結合證據權重的邏輯回歸方法的功效(實線)都要明顯的高于經典邏輯回歸方法的功效(虛線)。此外,若取02為分界點(即若樣本違約概率>02,認為該樣本違約,02是正常樣本違約概率分布密度與違約樣本違約概率分布密度交點,如圖1~4。且從圖中可以看出,選取02作為閾值可以對違約客戶有較好的識別,若選另外兩個曲線交點為閾值則對違約客戶誤判升高),該模型對于訓練樣本的辨識度如表3所示。特別地,對于違約客戶的辨識高達88%。而對于檢測樣本,辨識度如表4所示,對于違約客戶的辨識達83%。

    4結束語

    本文將信息論中的證據權重方法與經典的邏輯回歸相結合,應用于國內商業銀行的真實數據并且建立了信用風險評級模型,此外通過比較經典邏輯回歸模型,驗證了證據權重邏輯回歸方法的功效與可行性。且該模型在國內多家商業銀行已經成功上線,使得評級模型對違約概率有了精準的刻畫。

    作者:甘信軍楊維強單位:山東大學數學學院山東大學金融研究院

    精品推薦
    主站蜘蛛池模板: 亚洲毛片不卡av在线播放一区 | 激情综合丝袜美女一区二区| 高清国产AV一区二区三区| 亚洲国产一区二区三区| 国产福利电影一区二区三区久久久久成人精品综合 | 无码精品国产一区二区三区免费| 无码少妇一区二区三区浪潮AV| 亚洲福利一区二区精品秒拍| 一区二区不卡在线| 国产aⅴ精品一区二区三区久久| 日韩精品一区二区三区在线观看 | 中文字幕在线观看一区二区| 中文字幕一区二区三区在线不卡 | 四虎一区二区成人免费影院网址| 精品一区二区三区无码免费直播| 精品成人av一区二区三区| 亚洲av无码一区二区三区不卡| 3d动漫精品啪啪一区二区中 | 日韩内射美女人妻一区二区三区| 农村乱人伦一区二区| 国产在线精品一区二区高清不卡| 精品国产免费一区二区三区香蕉| 久久精品国产第一区二区三区| 成人精品一区二区激情| 精品一区二区三区高清免费观看 | 丰满人妻一区二区三区免费视频| 久久精品岛国av一区二区无码| 一本大道在线无码一区| 亚洲国产成人精品久久久国产成人一区二区三区综 | 一区二区三区91| 亚洲国产激情在线一区| 一区二区在线免费视频| 人妖在线精品一区二区三区| 一区二区三区免费视频播放器| 精品一区二区三区在线观看视频| 日本一区二区三区在线视频| 亚洲国产成人一区二区三区| 日本免费一区二区在线观看| 中文字幕一区在线观看| 春暖花开亚洲性无区一区二区 | 亚洲AV无一区二区三区久久|