前言:我們精心挑選了數(shù)篇優(yōu)質聚類分析論文文章,供您閱讀參考。期待這些文章能為您帶來啟發(fā),助您在寫作的道路上更上一層樓。
對于股票投資來說,一定要關注股票上市公司的基本盈利狀況以及該公司未來的發(fā)展狀況。在投資時,這兩大因素必須進行思考衡量,因為這兩大因素是衡量一個上市公司有沒有投資價值最基本的條件。因此,要在投資前計算出該股票每股的收益、該公司凈資產收益率以及主營收入增長率。
1.盈利能力指標。總資產利潤率=凈利潤/平均資產總額,這體現(xiàn)出公司整體的獲利能力。凈資產利潤率=凈利潤/平均凈資產,這個關系可以直接體現(xiàn)出股東投資的回報。主營業(yè)務收益率=主營業(yè)務利潤/主營業(yè)務收入,主營業(yè)務是上市公司利潤的來源,主營業(yè)務的收益越大,公司在市場中的競爭優(yōu)勢就越明顯。每股收益=凈利潤/期末總股本,每股的收益越高,反應出每股獲利的能力越強。
2.成長能力指標。主營業(yè)務收益增長率=本期主營業(yè)務收入/上期主營業(yè)務收入-1,這體現(xiàn)出上市公司重點項目的成長力。凈資產利潤率=本期凈利潤/上期凈利潤-1,上市公司給員工的薪酬都是根據(jù)凈利潤決定的。
二、聚類分析的投資方法應用實例
聚類分析方法隸屬多元統(tǒng)計分析方法之中,與多元統(tǒng)計分析法和回歸分析法并稱為三大應用方法。聚類分析法一定要建立在某個優(yōu)化意義基礎之上,如果將聚類分析方和常規(guī)的分析法相比較的話,會發(fā)現(xiàn)聚類分析法有很大的優(yōu)勢,第一是使用聚類分析法可以對數(shù)據(jù)中的多個變量進行樣本分析,然后將其分類整理;第二是通過使用聚類分析法所得出的數(shù)據(jù)非常直觀明了,通過觀察聚類譜系圖投資者就能夠清楚地分析出數(shù)據(jù)顯示的結果;第三是如果將聚類統(tǒng)計法所得出來的數(shù)據(jù)結果與普通方法計算出來的結果進行對比,不難發(fā)現(xiàn)聚類分析法的對比結果更加細致、科學、全面,接下來通過兩個應用的實例進行說明。
1.原始數(shù)據(jù)標準化。為了解決原始數(shù)據(jù)量綱和數(shù)量級差異帶來的影響,更好的對聚類分析和判別進行分析,可以采用指標標準化的處理方法。
2.逆指標正向化處理。流通股本是逆指標,對其絕對值取倒數(shù)可以得出。
三、將聚類分析法應用到金融投資上的意義
將聚類分析法應用于金融投資上,不但可以顯示出有效、科學、全面的數(shù)據(jù)更能幫助彌補金融投資投資時所出現(xiàn)的不足。
第一,聚類分析法建立在基礎分析之上,對投資股票從一些基本層面進行量化分析,進而對股票價格影響因素定性進行補充并完善了原有的基礎分析。聚類分析法作為長期的理性投資參考依據(jù),是為了發(fā)掘股票投資的真實價值,避免由于市場過熱導致資產估值不公允。
第二,在建立投資評價模型的時候,可以運用聚類分析法對公司和股票投資價值之間的聯(lián)系進行分析。公司的成長是一個在哥登模型中,在一個變化的趨勢內進行。不變的股息增長率對實際情況并不符合,在采用多階增長模型的時候,想要得到不同階段的股息增長率是很困難的。所以,對股票的成長進行分析得時候,可以選取凈利潤率等客觀的數(shù)據(jù)做參考,這樣可以估算出股票的發(fā)展?jié)摿Α?/p>
第三,通過對聚類分析法和現(xiàn)資組合理論的比較可以得出,聚類分析法比現(xiàn)資組合理論更具有直觀性和實用性,并且在實際生活中的局限小。該方法主要著眼于實際數(shù)據(jù)的相似性和其延生的規(guī)律性,較投資學中一些以預測和假定前提較多的模型而言更具有現(xiàn)實意義,也更加貼近當前市場情況的現(xiàn)實。另外,聚類分析法的操作性強,在實際應用過程中有一定的優(yōu)越性,更加適合投資者使用。
第四,聚類分析法作為長期投資的理念,隨著我國金融行業(yè)的不斷發(fā)展,逐漸被更多的投資人采用。理性的運用聚類分析法這種投資方法,不但可以使投資者的投資風險降到最低,還可以規(guī)范其他投行的投資行為,促使發(fā)行股票的企業(yè)可以本著經營業(yè)績和長期的成長模式進行投資,在一定程度上可以有效規(guī)避道德風險和投機行為,保證金融市場的穩(wěn)定性和規(guī)范性,保護散戶和弱勢群體的經濟利益,進而繁榮整個股票、證劵市場,使我國的經濟更繁榮。
四、結論
近年來,全國大學生數(shù)學建模競賽迅速發(fā)展,為國家培養(yǎng)了大批應用型人才。但由于各地區(qū)教育水平不同、相關部門對競賽的重視程度不同,導致各地區(qū)組織學生參加大學數(shù)學建模競賽的規(guī)模不同,在該項賽事中取得的成績差異比較顯著。2013年全國大學生數(shù)學建模競賽評選出的獎項有:賽區(qū)優(yōu)秀組織工作獎9個,本科組高教社杯獎1個,專科高教社杯獎1個,本科組MATLAB創(chuàng)新獎1個,專科組MATLAB創(chuàng)新獎1個,本科組IBMSPSS創(chuàng)新獎1個,專科組IBMSPSS創(chuàng)新獎1個,本科組一等獎共273名,本科組二等獎共1292名,專科組一等獎共44名,專科組二等獎共211名[1],但成績相對于參賽區(qū)分布不太均勻。分析各地區(qū)在2013年全國大學生數(shù)學建模競賽中取得的成績,明確各地區(qū)數(shù)學建模發(fā)展狀況的差異和特點,將有利于相關部門從宏觀上了解我國大學生數(shù)學建模競賽的整體發(fā)展現(xiàn)狀,分類制定相關政策[2-3],從而充分發(fā)揮數(shù)學建模的重要作用。
1建立綜合評價指標體系
全國大學生數(shù)學建模競賽現(xiàn)狀的一個重要方面就是全國大學生數(shù)學建模競賽獲獎情況。依據(jù)全國大學生數(shù)學建模競賽設置的獎項,遵循可比性原則,參考文獻[4-5],選取x1-x7共七項評價指標,具體如下:x1:本科組高教社杯、MATLAB創(chuàng)新獎和IBMSPSS創(chuàng)新獎獲獎情況;x2:本科組一等獎獲獎數(shù);x3:本科組二等獎獲獎數(shù);x4:專科組高教社杯、MATLAB創(chuàng)新獎和IBMSPSS創(chuàng)新獎獲獎情況;x5:專科組一等獎獲獎數(shù);x6:專科組二等獎獲獎數(shù);x7:年度競賽優(yōu)秀組織工作獎獲得情況。說明:鑒于本科組與專科組的高教社杯、MAT-LAB創(chuàng)新獎和IBMSPSS創(chuàng)新獎三類獎項每年只有一個隊獲獎,且基本不可重復獲得(參見歷年大學生數(shù)學建模競賽獲獎名單)故將其合并作為一類。
2數(shù)據(jù)資料依據(jù)
2013年全國大學生數(shù)學建模競賽獲獎名單,按指標對各個賽區(qū)的獲獎情況統(tǒng)計如表1所示。
3R型聚類分析定性分析
七項指標之間的相關性。編寫MAT-LAB程序如下:>>clc,clear>>symxy;>>x=xlsread(‘shuju.xls’);%將上表中的數(shù)據(jù)保存到MATLAB中WORK文件夾excel文件shu-ju.xls中,并將其賦于x>>y=corr(x)%輸出七項指標間的相關系數(shù)矩陣(如表2所示)>>d=pdist(y,’correlation’);%計算相關系數(shù)導出的距離>>z=linkage(d,’average’);%按類平均法聚類>>h=dendrogram(z);%畫聚類圖(如圖1所示)>>T=cluster(z,’maxclust',5);%把變量劃分為5類>>fori=1:5tm=find(T==i);tm=reshape(tm,1,length(tm));>>fprintf(’第%d類的有%s\n’,i,int2str(tm));>>end程序輸出:第1類的有4;第2類的有56;第3類的有7;第4類的有23;第5類的有1。即:若將指標分為5類,則指標1、4、7各為一類,指標2、3為一類,指標4、5為一類。
4Q型聚類分析
4.1選取5個指標的分類從R型聚類分析分出的5類指標中各選一個,即選取5個指標體系,對33個參賽地區(qū)進行聚類分析。首先對變量數(shù)據(jù)進行標準化處理,采用歐氏距離度量樣本間相似性,選用類平均法計算類間距離。在MATLAB命令窗口輸入下列程序:>>symsxy;>>x=xlsread(’shuju.xls’);%將上表中的數(shù)據(jù)保存到MATLAB中WORK文件夾excel文件shu-ju.xls中,并將其賦于x>>x(:,[3,5])=[];%刪除數(shù)據(jù)矩陣的3,5兩列,即使用變量1,2,4,6,7>>x=zscore(x);%將數(shù)據(jù)標準化>>s=pdist(x);%每一行是一個對象,求對象間的歐式距離>>z=linkage(s,’average’);%按類平均法聚類>>h=dendrogram(z);%畫聚類圖(如圖2所示)>>T=cluster(z,’maxclust’,3);%把樣本點劃分成3類>>fori=1:3;tm=find(T==i);%求i類的對象tm=reshape(tm,1,length(tm));%變成行向量>>fprintf(’第%d類的有%s\n’,i,int2str(tm));%現(xiàn)實分類結果>>end程序輸出:第1類的有11318第2類的有2345678910111216171920212224252627282930313233第3類的有141523即:第一類:北京,福建,湖南;第三類:江西,山東,四川;第二類:其它地區(qū)。
4.2選取7個指標的分類考慮到指標2與指標3,指標5與指標6具有一定的獨立性,若七個指標體系全部取用,將33個地區(qū)分為4類,程序輸入如下:>>symsxy;>>x=xlsread(’shuju.xls’);>>s=pdist(x);>>z=linkage(s,’average’);>>h=dendrogram(z);%畫聚類圖(如圖3所示)>>T=cluster(z,’maxclust’,4);>>fori=1:4tm=find(T==i);tm=reshape(tm,1,length(tm));>>fprintf(’第%d類的有%s\n’,i,int2str(tm));>>end程序輸出:第1類的有116第2類的有6710151927第3類的有23489111213141718202223242528第4類的有521262930313233即:第一類:北京,河南;第二類:遼寧,吉林,江蘇,山東,廣東,陜西;第四類:內蒙古,海南,,青海,寧夏,新疆,香港,澳門。4.3選取本科層次指標的分類只考慮本科層次取得的成績,即選用指標1,2,3,對33個參賽地區(qū)進行聚類分析,從而明確掌握其本科階段的差異,則有:輸入程序:>>symsxy;>>x=xlsread(’shuju.xls’);>>x(:,[4,5,6,7])=[];>>x=zscore(x);>>s=pdist(x);>>z=linkage(s,’average’);>>h=dendrogram(z);%畫聚類圖(如圖4所示)>>T=cluster(z,’maxclust’,3);>>fori=1:3;tm=find(T==i);tm=reshape(tm,1,length(tm));>>fprintf(’第%d類的有%s\n’,i,int2str(tm));>>end程序輸出:第1類的有11318第2類的有101115161719222327第3類的有2345678912142021242526282930313233即:第一類:北京,福建,湖南;第二類:江蘇,浙江,山東,河南,湖北,廣東,重慶,四川,陜西;第三類:其它地區(qū)。4.4選取專科層次指標的分類只考慮專科層次取得的成績,即選用指標4,5,6,對33個參賽地區(qū)進行聚類分析,從而明確掌握其專科階段的差異,則有:輸入程序:>>symsxy;>>x=xlsread(’shuju.xls’);>>x(:,[1:3,7])=[];>>x=zscore(x);>>s=pdist(x);>>z=linkage(s,’average’);%畫聚類圖(如圖5所示)>>h=dendrogram(z);>>T=cluster(z,’maxclust',4);>>fori=1:4;tm=find(T==i);tm=reshape(tm,1,length(tm));>>fprintf(’第%d類的有%s\n’,i,int2str(tm));>>end程序輸出:第1類的有14第2類的有1523第3類的有41927第4類的有1235678910111213161718202122242526282930313233即:第一類:江西;第二類:山東,四川;第三類:山西,廣東,陜西;第四類:其余各地區(qū)。
5結束語
國家統(tǒng)計局在其《中國信息能力報告》中,設計了一套評價我國信息化水平的指標:指標體系共分4級,有25個指標:①信息技術和信息設備應用能力:a.每千人擁有PC數(shù);b.每千人擁有傳真機數(shù);c.每百人擁有電話數(shù);d.每千人擁有電視機數(shù);e.每千人擁有收音機數(shù);f.每萬人接入因特網用戶;g.每百萬人互聯(lián)網上網主機數(shù);h.每平方公里光纜長度;i.每百家企事業(yè)單位上網數(shù);j.基礎信息產業(yè)產值占GDP比重。②信息資源及開發(fā)利用能力:a.每戶打國際電話時間;b.每百人期刊發(fā)行量;c.每日信息量;d.網絡用戶平均上網時間;e.每萬人Web站點數(shù)。③人口素質:a.每萬人平均科學家和工程師數(shù);b.第三產業(yè)從業(yè)人數(shù)占就業(yè)總人口比重;c.大學入學率;d.每十萬人在校學生數(shù);e.計算機專家和工程師數(shù)。④國家對信息產業(yè)發(fā)展的支撐:a.信息產業(yè)產值占GDP比重;b.研究開發(fā)(R&G)支出占GDP比重;c.每主線電信投資;d.人均GNP;e.教育投入。
鑒于遵循數(shù)據(jù)的客觀性和代表性,以及易得性,本文采取以下指標:每千人工業(yè)增加值x1;每千人電信業(yè)務量x2;每千人移動通信交換機容量x3;移動電話普及率x4;電話普及率x5;廣播綜合人口覆蓋率x6;電視綜合人口覆蓋率x7;有線電視普及率x8;每十戶寬帶上網用占有戶數(shù)x9;R&D經費支出占GDP比重x10;每十人從事科技活動人員總數(shù)占有的人數(shù)x11;每十人在校大學生人數(shù)占有的人數(shù)x12;每千人專利授權數(shù)占有數(shù)x13。其中缺省值用平均值代替或者臨近年數(shù)內值代替。由于篇幅有限,指標數(shù)據(jù)省略。
2、因子分析
因子分析法是能夠實現(xiàn)數(shù)據(jù)簡化目的的有效方法之一。其基本思想是根據(jù)相關性大小把變量分組,使得同組內的變量之間相關性較高,使不同組的變量相關性較低,每組變量代表一個基本結構,這個基本結構稱為公共因子。運用因子分析法,借助EXCEL多元統(tǒng)分析,對已得的指標數(shù)據(jù)進行分析處理,在處理過程中選取方差貢獻比率為0.80。
按照方差貢獻比率大于80%,應提取前四個因子,它們所解釋的方差占總方差的84.58%,這四個因子就可以解釋原始數(shù)據(jù)的大部分信息了。
分析結果中可以得到每個城市的四個因子得分情況F1,F(xiàn)2,F(xiàn)3和F4。最后,對28個城市的信息化水平進行綜合評價并排序。以旋轉后四個因子的方差貢獻率為權數(shù)計算綜合得分,計算公式為:F=0.5923F1+0.09957F2+0.0804F3+0.0736F4,最終可以得到所有城市的綜合得分排名。
由于變量指標取值的同向性,得分越高代表信息化水平越高。排名依次為:北京,天津、廣東、浙江、江蘇、湖南、福建等等。
3、聚類分析
聚類分析是統(tǒng)計學中研究“物以類聚”問題的多元統(tǒng)計分析方法,在統(tǒng)計分析的應用領域已經得到了極為廣泛的應用。其思路為:首先每個數(shù)據(jù)對象自成一類,并且計算各個類之間的“距離”或者相似性。然后每次將最相似的兩類合并,合并后重新計算新類與其他各個類之間的距離或相似度。這一“凝聚”的過程一直繼續(xù)直到所有對象都歸為一類為止。利用各城市的因子得分,還可對28個城市進行分類,得分值相近的城市被認為具有較相似的屬性。
4、結果分析
由所得到的聚類圖可以看出,全國信息化水平基本上可以分為五類,北京,山西各成一類,從上面的綜合水平排名可以看出,北京信息化水平處于全國領先地位,這首先歸功于北京的地理位置和政治人文環(huán)境,其次結合因子得分矩陣,北京在因子1上的得分最高,而根據(jù)因子載荷矩陣可以看出,因子1在13個變量指標上的載荷系數(shù)都比較大,證明北京在城市信息化的各個方面都比較出色。山西的信息化綜合水平排名第10,屬于中等偏上的水平,在因子4上的得分較高,因子4在變量指標x1,x2上的載荷量較大,這正好符合山西是個煤礦大省的特征,通信電信比較發(fā)達繁榮。天津、廣東、江蘇、福建、浙江歸為一類,這幾個城市都是發(fā)達城市,信息化水平偏高,在每個指標上得分都比較平均。而河北、黑龍江、河南、江西、遼寧、吉林、湖北、湖南、安徽、山東、四川、海南、重慶可以歸為一類,這幾個城市由于地理環(huán)境、產業(yè)結構、人口眾多等因素使得信息化水平中等偏下。最后一類,信息化水平偏下的一類包括:內蒙古、甘肅、青海、寧夏、廣西、云南、和陜西,信息化水平底下源于經濟發(fā)展水平不高、對于信息化認識薄弱以及對信息產業(yè)的投入不夠。
5、政策建議
雖然我國信息化應用工作已取得了較大的成績,但在發(fā)展的過程中還存在著一些問題和不足使信息化帶動經濟發(fā)展的優(yōu)勢難以更好地發(fā)揮與國外發(fā)達國家相比還有很大差距,就是同亞洲一些發(fā)展中國家(或地區(qū))比較也存在不小的距離。當前,經濟全球化、我國加入世界貿易組織和世界信息產業(yè)的新發(fā)展,都對我國信息化應用發(fā)展提出了新的要求,因此,我們應認真分析中國信息化水平現(xiàn)狀,分析與國外信息化發(fā)展的差距,有效地針對問題和不足進行改進,正確地規(guī)劃未來發(fā)展方向和應采取的對策。
對策和建議主要有:(1)加快有關信息化法律、法規(guī)的制定,確保應用中的可靠性和安全性(2)降低成本,普及大眾。(3)加強信息化知識普及與培訓力度。(4)加大國家對信息化投資力度縮小地區(qū)間差距。(5)加強信息資源建設,提高信息化服務質量與水平。(6)建立信息化數(shù)據(jù)采集系統(tǒng)和評價監(jiān)測體系。
另外,由上文的分析,信息化水平測度的數(shù)據(jù)很不全面,在每個地區(qū)城市的報告中尚未包括有些信息化水平測度指標,比如說信息產業(yè)增加值占地區(qū)生產值的比重。完整的數(shù)據(jù)不僅可以幫助很好的測度信息化水平,同時可以鞭策及時發(fā)現(xiàn)問題,提出相應的解決辦法,這對于提高信息化水平是必要的途徑。
參考文獻:
[1]張海永.基于因子分析和聚類分析的江蘇省13個城市社會發(fā)展水平研究.西南民族大學學報·自然科學版,2007,(2).
[2]陳小磊,鄭建明,萬里鵬.信息化水平測度指標體系理論研究述評.圖書情報知識,2006,(9).
[3]盧紋岱.SPSSforWindows統(tǒng)計分析.電子工業(yè)出版社(第三版),2006.480-483.