美章網 資料文庫 生物統計中統計軟件對比范文

    生物統計中統計軟件對比范文

    本站小編為你精心準備了生物統計中統計軟件對比參考范文,愿這些范文能點燃您思維的火花,激發您的寫作靈感。歡迎深入閱讀并收藏。

    生物統計中統計軟件對比

    生物學研究結果常需生物數理統計處理結合才能夠客觀準確的的分析和解釋生物界各種現象和實驗調查資料[1-2]。在研究兩個或多個變量之間相互制約、相互依存關系時,生物數理統計方法及其軟件亦廣泛應用,目前常用的有Excel、SPSS和SAS。三者當中SAS以其最為強大的統計功能是熟悉統計學并擅長編程的專業人士的首選。而Excel、SPSS則受到非統計學專業人士的青睞;兩者相比,SPSS分析的結果更簡單、直觀,更易于掌握。本文結合相關分析綜述三種軟件的優缺點。

    1常用統計學軟件的特點

    Excel是我們日常工作中最常用的軟件之一。主要用于數據處理、統計分析與計算,簡單的數據庫管理,而且它能繪制圖表,具有檢查與刪除宏病毒的功能,并能與Internet網絡共享資源[3]。此外,還能利用VisualBasicforApplication(VBA)語言開發面向特定應用的程序,但實際應用中很少有人使用。實際工作中我們經常用Excel的兩大服務,一是自動計算功能,進行一些報表處理,這時Excel相對于Word來說不僅制表容易,更重要的是Excel有自動重算功能,一個數據被改動了,相應的結果會自動重算;二是Excel的制圖功能,它能根據輸入表中的數據自動生成曲線圖、柱形圖、餅形圖等,大大減輕了手工制圖的工作量。SPSS(StatisticalPackagefortheSocialScienceorStatisticProductsandServiceSolution)forWindows,與Excel相比,SPSS的統計分析功能、圖表功能和數據庫互接功能更為強大。SPSS軟件處理龐大的受隨機因素影響的數據時具有速度快、無編程、數據接口方便和功能模塊組合靈活等特點。它使用Win-dows的窗口方式展示各種管理和分析數據方法的功能,并使用對話框展示出各種功能選擇項,只要掌握一定的Windows操作技能,只需粗通統計分析原理,就可以使用該軟件為特定的科研工作服務。SPSS集數據整理、分析功能于一身。其基本功能包括數據管理、統計分析、圖表分析、輸出管理等等。SPSS統計分析過程包括描述性統計、均值比較、一般線性模型、相關分析、回歸分析、對數線性模型、聚類分析、數據簡化、生存分析、時間序列分析、多重響應等幾大類,每類中又分多個統計過程,比如回歸分析中又分線性回歸分析、曲線估計、Logistic回歸、Probit回歸、加權估計、兩階段最小二乘法、非線性回歸等多個統計過程,而且每個過程中又允許用戶選擇不同的方法及參數[4-5]。SPSS也有專門的繪圖系統,可以根據數據繪制各種圖形。其分析結果直觀、易學易用,而且可以直接讀取Excel及DBF數據文件。由于其操作簡單,已經在我國的社會科學、自然科學的各個領域發揮了巨大作用。SAS是一套大型集成應用軟件系統,具有完備的數據存取、數據管理、數據分析和數據展現功能。SAS系統中提供的主要分析功能包括統計分析、經濟計量分析、時間序列分析、決策分析、財務分析和全面質量管理工具等等。SAS中各模塊具有相對獨立的功能范圍。常用的模塊有base,graph,stat,insight,assist,analyst模塊等,分別執行基本數據處理、繪圖、統計分析、數據探索、可視化數據處理等功能。編程操作功能的無比強大是SAS系統的長處。盡管高級版本的SAS出現了可視化窗口,然而要想完全發揮SAS系統強大的功能,充分利用其提供的豐富資源,掌握SAS的編程操作是必要的,也只有這樣SAS在各個方面的杰出特長才能得以體現。

    2結合相關分析探討比較Excel、SPSS和SAS優缺點

    2.1變量的相關分析及兩個變量的相關分析

    相關分析用于屬于平行關系的兩個變量的分析。在相關分析中,變量無自變量和依變量之分,而且都具有隨機誤差。相關分析只能研究變量間的相關程度和性質,不能用一個變量的變化去預測另一個變量的變化。事物間的聯系是普遍的。生物學中,作物產量與施肥量、氣溫、土壤濕度等都存在一定的聯系。這種說明客觀事物相互間關系的密切程度并用適當的統計指標表示出來的過程就是相關分析?,F以20種細胞系的細胞膜和細胞質中蛋白質含量的測定結果為例,通過三種軟件的操作來進行兩者之間的相關分析。如本例題命名X為細胞膜中蛋白質含量,Y為細胞質中蛋白質含量,見表1。

    2.1.1Excel操作Excel通過其分析工具庫實現統計分析。數據在工作表中組織后,在“工具”菜單中單擊“數據分析”命令。如果在“工具”菜單中沒有“數據分析”命令,則需要安裝Excel的“分析工具庫”。安裝過程如下:在“工具”菜單中,單擊“加載宏”命令,單擊“瀏覽”按鈕,定位到Office安裝盤所在位置。安裝完成后,再打開“加載宏”對話框,選中“分析工具庫”復選框。選擇“工具”菜單中的“數據分析”命令,此時彈出“數據分析”對話框。在分析工具列表框中選擇“相關系數”。在彈出的對話框中選擇輸入區域,即數據所在區域;分組方式根據輸入數據的方式選擇“逐列”或“逐行”。如果輸入區域的第一行中包含標志項,則選中“標志位于第一行”復選框;如果輸入區域中沒有標志項,則此復選框不選?!拜敵鲞x項”中選擇相應選項,以確定分析結果的顯示位置。選擇完成后,點擊確定即可顯示相關系數的值。Excel中若要顯示統計描述需要在“數據分析”中選擇“統計描述”??娠@示的結果有:平均、標準誤差、中位數、眾數、標準差、方差、峰度、偏度、區域、最小值、最大值、求和、觀測數、最大、最小、置信度(95.0%)等。相關系數結果見表2。本例X與Y的相關系數為0.55461,相關系數檢驗的P值為0.001,按α=0.05水準,拒絕H0,接受H1,相關系數檢驗有統計學意義,膜蛋白和質蛋白之間有55.461%的相關性。這樣的統計分析結果對于我們的后續實驗有一定的指導作用。

    2.1.2SPSS操作SPSS相關分析通過Statistics菜單的Corre-late選項完成。該命令允許同時輸入兩個或兩個以上變量,但系統輸出的是變量間兩兩相關的相關系數。此過程通過對變量進行相關關系的分析,計算有關的統計指標,以判斷變量之間相互關系的密切程度。初始設置:單擊窗口左下角的“變量窗口”(VariableView),在名稱、類型、長度、小數點等處適當設置。完成相關設置后,單擊窗口左下角的“數據窗口”(DataView),返回數據填充區。在SPSS工作表中輸入表1中的實驗數據。輸入數據后,即可進行相關性分析。具體步驟如下:選擇菜單欄中的分析(Analyze)→相關分析(C)→兩個變量相關分析(B),彈出“兩個變量相關”對話框。分別將X,Y變量選入“變量”的方框中,點擊“選項”(Options),彈出“兩個變量相關:選項”面板,選擇“統計”中的“描述”(Descriptive),即可顯示出“平均值和標準差”(M),交叉乘積的標準差和協方差(C)選項,然后點擊“繼續”,重新回到“兩個變量相關”界面,本例分別選中“Pearson”,“雙側”和“標識顯著相關”,然后點擊“確定”,即出現SPSS統計的結果見表3(省略統計描述表格)。從表中可以看出,變量X,Y的相關系數為0.555,交叉乘積的標準差和協方差為267.314,14.069。PearsonCorrelation(相關系數)一列中的星號含義是:顯著性水平為0.001(默認值)的情況下,變量X,Y相關系數存在顯著差異,與“Sig”一列的結果相對應。從給出結果我們可以看到,比起Excel,SPSS的結果內容更詳盡,結果分析更全面。

    2.1.3SAS操作與上述兩種操作不同之處在于,SAS操作在建立數據集時應指定膜蛋白X與質蛋白Y兩個變量。再調用CORR過程求出相關系數。1)設定數據庫環境:LIBNAMEA''''C:\USER'''';2)數據步,建立數據集:DATAA.YTLI7_1;INPUTYX@@;CARDS;12.2115.214.5416.712.2711.912.0414.07.8819.811.1016.210.4317.013.3210.319.595.99.0518.76.4425.19.4916.410.1622.08.3823.18.4923.27.7125.011.3816.810.8211.212.4913.79.2124.4;RUN;3)CORR過程,進行相關分析:PROCCORRDATA=A.YTLI7_1;VARXY;RUN;CORR過程的默認輸出結果主要包括各個變量的簡單統計描述(圖略)和一個相關系數矩陣。結果見表4。SAS這種程序化操作過程簡單,但需熟練掌握相關的編程語言,而且結果內容也沒有SPSS的結果詳盡。

    2.2Excel、SAS、SPSS的評價

    2.2.1數據處理Excel是日常辦公的通用軟件,也是作為計算機文化基礎的一部分而被廣泛學習。作為簡單的數據處理工具,Excel操作簡便,結果直觀。SPSS的數據編輯器很像Excel,可以輸入數據。SPSS的可視窗口界面和下拉列表可以選擇特定命令。但運用SPSS一次只能編輯一個數據文件,在一次涉及多個文件的數據處理中并不強大。SAS在數據處理上可謂功能強大,幾乎可以進行任何可能的處理。SAS中的sql數據庫可以執行sql查詢。只是需要耗費大量時間來學習和理解那些在excel和SPSS中相對容易處理的簡單命令。但是SAS可以同時處理幾個文件相關聯的數據,同時SAS還可以處理多達32768個文件,記錄的數量能限制在磁盤最大容量范圍內,因此它以強大的數據管理和同時處理大批數據文件的功能,得到高級用戶的青睞。

    2.2.2統計分析三種軟件用于統計分析的高級程度從高到低依次是:SAS,SPSS,EXCEL,就像例題中的操作一樣,只要是Ex-cel“數據分析”庫中包括的統計部分,都能通過簡單的操作給出簡單的統計結果。但是Excel只能進行有限的幾種運算(平均、標準誤差、中位數、眾數、標準差、方差、峰度、偏度、區域、最小值、最大值、求和、觀測數、最大、最?。?)、置信度(95.0%)等)。SPSS可以運行眾多統計分析。其長處在于變量分析和多變量分析,可以進行多種特定效應檢測。SPSS的缺點是運算方法不多,只能依照軟件中提供的模式進行運算。SAS可以運行多數常用的統計分析。SAS和SPSS一樣都屬于專業分析統計軟件,而SAS的強勢在于方差分析,混合模式分析和多變量分析,其不足在于依次多項邏輯回歸,運算方法受到SAS語言的限制。

    2.2.3圖表Excel的圖表生成簡單,可視化窗口模式形象直觀,是日常圖表生成的有利工具,而且修飾加工的圖形尤其美觀,單元格數據與數據分析結果具有“聯動”關系,改變其中一個單元格數據,與之相關的Excel公式或圖表就會發生相應的改變,具有“即改即見”的效果。Excel2007使之更加完善,這些功能均為SAS、SPSS所望之不及。SPSS窗口界面可以像Excel一樣輕松的創建圖表。圖片質量較高,因此被很多發表文章的作者采用。SAS包括最強大的圖表工具SAS/Graph,但是SAS/Graph學習起來很有難度。這種圖表大多是通過程序性語言創建的。盡管SAS8以后的版本在創建圖表方面出現可視化界面,但還是沒有SPSS容易操作,一般適用于高級人士。

    3結語

    綜上所述,Excel易學易用,功能有限;但其內置函數數量多且使用方便。公式、圖形等具有即改即可見的特點,此功能在目前的SAS、SPSS等統計軟件尚無法實現。SPSS操作簡易,功能強大,結果詳盡,是生物統計等非計算機專業人士的首選;SAS要求用戶非常熟悉編程語言,這需要漫長的學習過程。但一旦掌握后就可以享受其強大的數據處理功能??傊?,三種統計軟件各有千秋,每個軟件都有其獨到之處,也難免有其軟肋所在。總的來說,SAS,SPSS和Excel是能夠用于多種統計分析的一組工具。通過Stat/Transfer可以在數秒或數分鐘內實現不同數據文件的轉換。因此,可以根據你所處理問題的性質來選擇不同的軟件。如果想通過混合模型來進行分析,可以選擇SAS;但SAS要求用戶非常熟悉編程語言,這需要漫長的學習過程,但一旦掌握后就可以享受其強大的數據處理功能。若是要進行方差分析,最佳的選擇當然是SPSS,它能完成多種特殊效應的檢驗和多變量分析(多元方差分析,因子分析,判別分析等),SPSS11.5版還新增了混合模型分析的功能,但其缺點是沒有穩健方法,無法完成穩健回歸或得到穩健標準誤,缺乏調查數據分析(SPSS12版增加了完成部分過程的模塊)。因此對他們有整體性的功能了解將對我們的實際科研工作具有重要的意義。

    主站蜘蛛池模板: 久久精品成人一区二区三区| 大屁股熟女一区二区三区| 成人区人妻精品一区二区三区 | 国产免费一区二区三区VR| 色欲AV蜜臀一区二区三区| 精品国产亚洲一区二区三区| 日韩精品一区二区午夜成人版| 欧亚精品一区三区免费| 综合无码一区二区三区四区五区| 中文字幕一区二区三区5566| 国产成人精品一区二区三在线观看| 亚洲国产精品一区二区久久| 精品福利一区二区三| 亚洲一区二区三区免费在线观看 | 精品久久国产一区二区三区香蕉| 美女视频一区二区| 国产在线精品一区二区高清不卡| 国产一区二区在线看| 久久久久人妻精品一区| 国产精品日韩一区二区三区| 精品免费AV一区二区三区| 日本道免费精品一区二区| 日韩精品无码中文字幕一区二区 | 中文字幕精品无码一区二区| 国产AV一区二区三区无码野战| 高清一区二区三区日本久| 无码人妻aⅴ一区二区三区| 国产成人精品一区二区三区| 亚洲一区二区久久| 一区二区三区内射美女毛片| 性色A码一区二区三区天美传媒| 无码日韩精品一区二区免费| 国产在线视频一区| 一区二区三区电影网| 久久精品国产第一区二区三区 | 无码人妻精品一区二区三| 亚洲av乱码一区二区三区按摩 | 中文字幕在线精品视频入口一区| 一区二区不卡在线| 日本中文字幕一区二区有码在线| 亚洲天堂一区在线|