美章網(wǎng) 資料文庫(kù) 數(shù)據(jù)挖掘在電子商務(wù)中的應(yīng)用范文

    數(shù)據(jù)挖掘在電子商務(wù)中的應(yīng)用范文

    本站小編為你精心準(zhǔn)備了數(shù)據(jù)挖掘在電子商務(wù)中的應(yīng)用參考范文,愿這些范文能點(diǎn)燃您思維的火花,激發(fā)您的寫作靈感。歡迎深入閱讀并收藏。

    數(shù)據(jù)挖掘在電子商務(wù)中的應(yīng)用

    摘要:

    大數(shù)據(jù)時(shí)代迅速增長(zhǎng)的商業(yè)數(shù)據(jù)和信息之間的內(nèi)在聯(lián)系,備受電子商務(wù)經(jīng)營(yíng)者的普遍關(guān)注。本文基于商業(yè)數(shù)據(jù)和信息之間的關(guān)聯(lián),較深入地探討了Web數(shù)據(jù)挖掘技術(shù)相關(guān)理論及其在電子商務(wù)中的具體應(yīng)用。

    關(guān)鍵詞:

    數(shù)據(jù)抽?。痪垲惙治?;Web數(shù)據(jù)挖掘技術(shù)

    1數(shù)據(jù)挖掘的淵源

    日常生活中時(shí)常會(huì)出現(xiàn)如下情況,商場(chǎng)經(jīng)營(yíng)者總期望銷售量較大的商品放在同一區(qū)域以便于提高銷售額;銀行想了解具有何種特征的客戶需要申請(qǐng)購(gòu)房貸款;保險(xiǎn)公司精算師期望在眾多病歷中尋找到患某種疾病患者的同類特征,進(jìn)而提高設(shè)計(jì)理賠條款的最合理性。針對(duì)上述問(wèn)題,采用傳統(tǒng)數(shù)據(jù)分析工具難以達(dá)到實(shí)際需求。由于傳統(tǒng)信息管理系統(tǒng)采用的數(shù)據(jù)庫(kù)系統(tǒng)還是只有簡(jiǎn)單處理數(shù)據(jù)功能,以實(shí)現(xiàn)對(duì)報(bào)表的查詢統(tǒng)計(jì),而無(wú)法提取數(shù)據(jù)中蘊(yùn)含內(nèi)在的深層關(guān)系。隨著不斷增加的信息量及廣泛應(yīng)用的信息管理系統(tǒng),更期望其具有更豐富的數(shù)據(jù)分析功能,進(jìn)而提供出科學(xué)決策?;谠撔枨?,有利地促進(jìn)了Web數(shù)據(jù)挖掘技術(shù)的迅速發(fā)展。數(shù)據(jù)挖掘主要是指將隱藏在大量數(shù)據(jù)中的有用信息提取出來(lái),在大型數(shù)據(jù)庫(kù)中應(yīng)用機(jī)器學(xué)習(xí)的綜合信息處理技術(shù)。它將各學(xué)科技術(shù)的信息處理方法進(jìn)行綜合,主要有分類、聚類、關(guān)聯(lián)規(guī)則、預(yù)測(cè)及檢測(cè)偏差等功能。

    2數(shù)據(jù)挖掘方法和模型

    數(shù)據(jù)挖掘作為新興技術(shù),在處理數(shù)據(jù)方面具有的特征十分明顯。數(shù)據(jù)挖掘主要用于海量數(shù)據(jù),也是其產(chǎn)生的一個(gè)重要原因。數(shù)據(jù)一般都是不完全的,數(shù)據(jù)結(jié)構(gòu)比較復(fù)雜,也具有較大維數(shù)。數(shù)據(jù)挖掘交叉了很多學(xué)科,采用信息、統(tǒng)計(jì)、數(shù)學(xué)等多個(gè)學(xué)科技術(shù),在實(shí)際中最為常見(jiàn)和廣泛應(yīng)用的有傳統(tǒng)統(tǒng)計(jì)方法、可視化技術(shù)、決策樹、神經(jīng)網(wǎng)絡(luò)、遺傳算法及關(guān)聯(lián)規(guī)則挖掘算法六種算法和模型。

    3國(guó)內(nèi)外Web數(shù)據(jù)挖掘技術(shù)的研究現(xiàn)狀及發(fā)展趨勢(shì)

    隨著知識(shí)發(fā)現(xiàn)的影響日益增大,1995年國(guó)際知識(shí)發(fā)現(xiàn)組委會(huì)將專題討論會(huì)改為國(guó)際會(huì)議,并在加拿大召開(kāi)世界第一屆知識(shí)發(fā)現(xiàn)國(guó)際學(xué)術(shù)會(huì)議,并形成年度國(guó)際會(huì)議。近年來(lái),在知識(shí)發(fā)現(xiàn)方面開(kāi)展了很多卓有成效的研究工作并得到快速發(fā)展,特別是應(yīng)用于商業(yè)和銀行領(lǐng)域尤為迅速。國(guó)外在數(shù)據(jù)挖掘方面比較關(guān)注于貝葉斯方法及Boosting方法的研究,在知識(shí)發(fā)現(xiàn)中應(yīng)用傳統(tǒng)的統(tǒng)計(jì)學(xué)回歸法,并緊密結(jié)合數(shù)據(jù)庫(kù)。研發(fā)完成了很多知識(shí)發(fā)現(xiàn)軟件工具并日益完善,加強(qiáng)用于解決問(wèn)題的整體系統(tǒng)的研發(fā),而過(guò)程并非孤立。國(guó)內(nèi)主要是高校、科研機(jī)構(gòu)等研究人員開(kāi)展Web數(shù)據(jù)挖掘技術(shù)的研究,主要開(kāi)展學(xué)習(xí)算法、數(shù)據(jù)挖掘相關(guān)理論及技術(shù)應(yīng)用等很多方面的研究,國(guó)家也在自然基金、863計(jì)劃等對(duì)相關(guān)研究提供資助經(jīng)費(fèi)。有關(guān)統(tǒng)計(jì)數(shù)據(jù)顯示,知識(shí)發(fā)現(xiàn)及人工智能等技術(shù)是未來(lái)對(duì)工業(yè)具有較重要影響的關(guān)鍵技術(shù)。充分說(shuō)明數(shù)據(jù)挖掘的研究和應(yīng)用備受社會(huì)關(guān)注,并已成為一個(gè)研究熱點(diǎn)。

    4Web數(shù)據(jù)挖掘技術(shù)在電子商務(wù)中的應(yīng)用

    在電子商務(wù)活動(dòng)中主要是將客戶作為Web數(shù)據(jù)挖掘技術(shù)的研究對(duì)象,進(jìn)而發(fā)現(xiàn)客戶具有個(gè)性和共性、必然和偶然、獨(dú)立和關(guān)聯(lián)及現(xiàn)實(shí)和預(yù)測(cè)等方面的知識(shí)。上述知識(shí)都可發(fā)現(xiàn)處于不同概念層次,從微觀分析到宏觀,客觀分析統(tǒng)計(jì)客戶的消費(fèi)行為,為提高電子商務(wù)管理水平提供重要決策,以充分滿足各類客戶實(shí)際需求。

    4.1應(yīng)用于電子商務(wù)的分類與預(yù)測(cè)分類技術(shù)在電子商務(wù)中應(yīng)用最多,也是電子商務(wù)中很重要的一項(xiàng)任務(wù)。主要用于采用統(tǒng)計(jì)、機(jī)器學(xué)習(xí)及神經(jīng)網(wǎng)絡(luò)等方法構(gòu)造分類器,將數(shù)據(jù)庫(kù)中數(shù)據(jù)項(xiàng)向給定某類別中的一個(gè)進(jìn)行映射,以利于預(yù)測(cè)未來(lái)數(shù)據(jù)。

    4.2應(yīng)用于電子商務(wù)中的聚類分析聚類就是根據(jù)相似性原則將一組個(gè)體歸為多個(gè)不同類別,在電子商務(wù)中主要采用客戶聚類實(shí)現(xiàn)對(duì)市場(chǎng)不同消費(fèi)群體的細(xì)分。使同類別個(gè)體之間只有最小距離,而不同類別個(gè)體之間具有較大距離,利于提取聚類客戶特征,電子商務(wù)網(wǎng)站可采用統(tǒng)計(jì)、機(jī)器學(xué)習(xí)及神經(jīng)網(wǎng)絡(luò)等方法為客戶提供個(gè)性化服務(wù)。

    4.3應(yīng)用于電子商務(wù)中的數(shù)據(jù)抽取相對(duì)于傳統(tǒng)商務(wù)活動(dòng),電子商務(wù)具有諸如客戶購(gòu)買動(dòng)機(jī)、心理、欲望及能力等很多虛擬和不確定因素,采用何種方法在無(wú)規(guī)則的零散數(shù)據(jù)中尋找到具有價(jià)值和規(guī)則的數(shù)據(jù)是數(shù)據(jù)挖掘的主要任務(wù)。數(shù)據(jù)抽取就是其中的一個(gè)基本方法,主要是濃縮數(shù)據(jù),采用平均、求和及方差等統(tǒng)計(jì)值或直方、餅狀等圖形方式給出數(shù)據(jù)抽取的緊湊描述,最重要的是基于數(shù)據(jù)泛化對(duì)數(shù)據(jù)總結(jié)進(jìn)行討論。數(shù)據(jù)泛化是將低層次的原始、基本的信息數(shù)據(jù)向高層次進(jìn)行抽象的一個(gè)過(guò)程,在電子商務(wù)活動(dòng)中,數(shù)據(jù)抽取通常采用多維數(shù)據(jù)分析方法,對(duì)客戶數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)進(jìn)行分析,以用于決策支持系統(tǒng)。

    4.4應(yīng)用于電子商務(wù)中的關(guān)聯(lián)規(guī)則事務(wù)型數(shù)據(jù)庫(kù)是用于關(guān)聯(lián)規(guī)則對(duì)主要對(duì)象進(jìn)行發(fā)現(xiàn)。一個(gè)事務(wù)通常由處理時(shí)間、顧客標(biāo)識(shí)及所購(gòu)物品構(gòu)成,因條形碼及Web技術(shù)的日益成熟,管理部門能夠?qū)⒋鎯?chǔ)的客戶資料與售貨數(shù)據(jù)進(jìn)行收集,對(duì)其分析后并發(fā)現(xiàn)關(guān)聯(lián)規(guī)則,根據(jù)網(wǎng)購(gòu)客戶的購(gòu)買行為提供具有價(jià)值的信息??捎糜趯?duì)市場(chǎng)進(jìn)行規(guī)劃,對(duì)商品種類、價(jià)格等進(jìn)行確定。關(guān)聯(lián)規(guī)則一般分為有意義關(guān)聯(lián)規(guī)則和泛化關(guān)聯(lián)規(guī)則,前者主要是指對(duì)最小支持度和可信度提供界限的規(guī)則;后者對(duì)最小可信度提供界限,使最低可靠度在關(guān)聯(lián)規(guī)則上得到反應(yīng)。泛化關(guān)聯(lián)規(guī)則更具有實(shí)用性,由于研究對(duì)象之間具有層次關(guān)系,對(duì)于更多有意義規(guī)則的發(fā)現(xiàn)更具有輔助意義。

    5結(jié)語(yǔ)

    綜上所述,現(xiàn)代信息技術(shù)有力促進(jìn)了電子商務(wù)的發(fā)展,也在商業(yè)運(yùn)作模式中不可或缺?;谌蚪?jīng)濟(jì)一體化,應(yīng)對(duì)網(wǎng)絡(luò)基礎(chǔ)設(shè)施繼續(xù)加強(qiáng)建設(shè),推進(jìn)企業(yè)電子商務(wù)化進(jìn)程,在電子商務(wù)方面健全安全立法并建設(shè)更加完善的物流配送體系,使電子商務(wù)具有良好的發(fā)展環(huán)境。并在文本、多媒體及網(wǎng)絡(luò)等方面深入Web數(shù)據(jù)挖掘技術(shù)研究,使存在于電子商務(wù)中的數(shù)據(jù)安全保密、數(shù)據(jù)質(zhì)量及集成其它商業(yè)軟件等問(wèn)題得到妥善解決。充分利用數(shù)據(jù)挖掘等技術(shù),使企業(yè)優(yōu)勢(shì)得到充分發(fā)揮,加快技術(shù)與管理創(chuàng)新,才能促進(jìn)使企業(yè)在電子商務(wù)中的有序發(fā)展。

    參考文獻(xiàn)

    [1]李業(yè)麗.神經(jīng)網(wǎng)絡(luò)在數(shù)據(jù)挖掘中的應(yīng)用研究[J].計(jì)算機(jī)工程與應(yīng)用,2013(10).

    [2]陳國(guó)萍,李巍,劉仲英.數(shù)據(jù)挖掘中概念樹的標(biāo)準(zhǔn)、生成和實(shí)現(xiàn)[J],計(jì)算機(jī)工程,2012(08).

    作者:邰宇 單位:黑龍江省計(jì)算機(jī)軟件研究中心

    主站蜘蛛池模板: 国精产品一区一区三区有限在线 | 国产福利一区二区三区| 肉色超薄丝袜脚交一区二区| 蜜桃传媒一区二区亚洲AV| 人妻内射一区二区在线视频| 精品一区二区久久久久久久网站| 精品一区二区ww| 日韩一区二区超清视频| 亚洲一区二区三区香蕉| 日本夜爽爽一区二区三区| 国产视频一区二区| 国产一区二区三区小说| 国产经典一区二区三区蜜芽| 无码囯产精品一区二区免费 | 国产成人av一区二区三区在线| 2020天堂中文字幕一区在线观| 中文乱码精品一区二区三区| 精彩视频一区二区| 国产一区二区三区在线免费观看| 国产乱码一区二区三区四| 久久精品亚洲一区二区三区浴池 | 亚洲一区中文字幕在线观看| 中文字幕精品无码一区二区| 精品伦精品一区二区三区视频| 国产伦精品一区二区| 国产福利一区二区| 无码人妻精品一区二区三区9厂 | 亚洲片国产一区一级在线观看| 在线视频国产一区| 日韩视频在线一区| 国产福利在线观看一区二区| 国产一区二区三区手机在线观看| 波多野结衣精品一区二区三区 | 曰韩人妻无码一区二区三区综合部| 91在线看片一区国产| 日本高清一区二区三区| 国偷自产视频一区二区久| 天码av无码一区二区三区四区| 一本色道久久综合一区| 国产波霸爆乳一区二区| 看电影来5566一区.二区|