- 相關推薦
淺議面向電子商務的Web日志挖掘系統(tǒng)
[摘 要]先容了Web挖掘模式在電子商務中的四大應用方向,建立面向電子商務的Web挖掘應用系統(tǒng)模型,并提出一種改進站點設計的算法,實踐證實,通過該方法可以改進網(wǎng)站的設計和布局,方便用戶訪問站點,為用戶提供方便、快捷的服務,實現(xiàn)為客戶的個性化服務。[關鍵詞]Web挖掘 電子商務 個性化服務
電子商務是指個人或企業(yè)通過國際互聯(lián)網(wǎng),采用數(shù)字化方式進行商務數(shù)據(jù)交換和開展商務活動。目前,電子商務正在企業(yè)和商貿(mào)領域占據(jù)著越來越多的市場份額,網(wǎng)絡信息挖掘主要用于對商品的市場定位和消費分析,以輔助制定市場策略,分析購物模式,猜測銷售行情改進站點設計和進步站點效率。向特定的客戶推薦有關的商品。網(wǎng)絡信息挖掘可以提供不同用戶的特定信息,有的放矢地傳播網(wǎng)絡廣告。利用網(wǎng)絡數(shù)據(jù)挖掘技術建立客戶關系治理系統(tǒng),可以極大地提升企業(yè)的競爭上風。
一、Web挖掘模式的應用
(一)發(fā)現(xiàn)潛伏客戶。對一個電子商務網(wǎng)站來說,了解、關注在冊客戶群體非常重要,但從眾多的訪問者中發(fā)現(xiàn)潛伏客戶群體也同樣非常關鍵。假如發(fā)現(xiàn)某些客戶為潛伏客戶群體,就可以對這類客戶實施一定的策略,使他們盡快成為在冊客戶群體。對一個電子商務網(wǎng)站來說,也許就意味著訂單數(shù)的增多、效益的增加。通過利用WEB挖掘的分類技術先對歷史數(shù)據(jù)進行挖掘,可以有效的發(fā)現(xiàn)潛伏客戶。
。ǘ┭娱L客戶的駐留時間。對客戶來說,傳統(tǒng)客戶與銷售商之間的空間間隔在電子商務中已經(jīng)不存在了,Internet上每一個銷售商對于客戶來說都是一樣的,那么如何使客戶在自己的銷售站點上駐留更長的時間,這對銷售商來說將是一個挑戰(zhàn)。為了使客戶在自己的網(wǎng)站上駐留更長的時間,就應該了解客戶的瀏覽行為,知道客戶的愛好及需求所在,動態(tài)地調(diào)整Web頁面,以滿足客戶的需要。通過運用數(shù)據(jù)挖掘中的序列模式發(fā)現(xiàn)技術對客戶訪問信息的挖掘,就能知道客戶的瀏覽行為,從而了解客戶的愛好及需求。
(三)改進站點設計。站點上頁面內(nèi)容的安排就如超級市場中物品在貨架上的擺設一樣,把具有一定支持度和信任度的相關聯(lián)物品擺放在一起有助于銷售,利用關聯(lián)規(guī)則發(fā)現(xiàn)可以針對客戶動態(tài)調(diào)整站點的結(jié)構(gòu),使客戶訪問的有關聯(lián)的文件間的鏈接能夠比較直接,讓客戶更輕易訪問到想訪問的頁面。
。ㄋ模┽槍Σ煌蛻籼峁﹤性化產(chǎn)品。商家可以對客戶登記注冊記錄中和Web日志進行挖掘,從而獲知訪問者的個人愛好,更加充分地了解客戶地需要,根據(jù)各個細分市場,甚至是每一個顧客的獨特需求提供個性化產(chǎn)品,有利于進步客戶的滿足度。
綜上所說,Web挖掘技術推動了個性化推薦,使站點瀏覽者變?yōu)橘徺I者,增加交叉銷售和提升銷售,每一次購買都增加客戶的忠誠度。
二、面向電子商務的Web挖掘應用系統(tǒng)模型
當用戶訪問Web服務器時,Web服務器會自動建立訪問日志信息。隨著WWW技術的快速發(fā)展和時間的積累,Web服務器中Web日志文件將越來越大,基于Web的電子商務服務器將保存大量的Web訪問日志記錄。如何對這些大量的Web日志記錄進行自動分析清理存儲并從中發(fā)現(xiàn)有用的、重要的知識,包括模式、規(guī)則和可視化結(jié)構(gòu)等是目前Web日志挖掘的主要任務。
面向電子商務的Web挖掘系統(tǒng)模型包括數(shù)據(jù)采集、數(shù)據(jù)處理、數(shù)據(jù)存儲、模式發(fā)現(xiàn)、模式分析利用及客戶6個層次,見圖1。
數(shù)據(jù)采集層所采集的數(shù)據(jù)對象為Web服務器日志、客戶登記信息和交易數(shù)據(jù)庫等。Web服務器日志是客戶訪問所產(chǎn)生的服務器日志數(shù)據(jù)?蛻舻怯浶畔⒈仨毢驮L問日志集成,以進步數(shù)據(jù)挖掘的正確度。交易數(shù)據(jù)庫存儲用戶在商務網(wǎng)站上購買商品的信息,其內(nèi)容隨數(shù)據(jù)庫結(jié)構(gòu)的不同而有所不同,一般包括:用戶名、時間、商品ID、采購數(shù)目及價格等。
數(shù)據(jù)處理層實現(xiàn)對數(shù)據(jù)采集層所采集的源數(shù)據(jù)進行處理,包括日志文件的處理和數(shù)據(jù)倉庫的建立。日志文件處理得好壞直接影響挖掘算法產(chǎn)生的結(jié)果,其處理過程是保證Web挖掘質(zhì)量的關鍵。經(jīng)過處理后的數(shù)據(jù)由數(shù)據(jù)存儲層進行保存和治理。
模式發(fā)現(xiàn)層次包括:路徑分析、關聯(lián)規(guī)則挖掘、序列模式挖掘以及聚類和分類分析。
模式分析利用層由兩部分組成:個性化網(wǎng)站及貿(mào)易智能。這也代表了Web挖掘在電子商務中的兩大應用方向。數(shù)據(jù)挖掘的結(jié)果可以幫助他們了解客戶,調(diào)整營銷策略,改進促銷手段,從而達到贏得競爭的目的。
三、改進站點設計的算法
對Web站點的鏈接結(jié)構(gòu)的優(yōu)化可從兩個方面來考慮:一是通過對Web日志的挖掘,發(fā)現(xiàn)用戶訪問頁面的相關性,從而對密切聯(lián)系的頁面之間增加鏈接,方便用戶使用。二是通過對Web日志的挖掘,發(fā)現(xiàn)用戶的期看位置。假如在期看位置的訪問頻率高于實際位置的訪問頻率,可考慮在期看位置和實際位置之間建立導航鏈接,從而實現(xiàn)對Web站點的優(yōu)化。本文對第二點做深進探討。
通過該算法,我們可以找到用戶的返回點,這個位置可能是期看位置,也可能是目標頁面,但可以通過確定時間閾值來解決這個題目。當用戶在返回點停留的時間較長,超過指定的閾值,則以為該頁面是目標頁面,、否則可以以為該頁面是期看位置找不到目標頁面,就會在第二期看位置找,假如還找不到,會在第三期看位置找……。其中我們最關心的是第一期看位置,而且是那些被第一期看且發(fā)生頻率高于系統(tǒng)設計者指定值的所有頁面。因此,尋找第一期看位置便成了我們關注的焦點。
、诎l(fā)現(xiàn)第一期看位置算法。設Ei表示第一期看位置,算法如下:先以用戶的ID為主關鍵字,時間為次關鍵字,對Web日志文件建立索引,掃描Web日志索引文件,對每一個用戶ID,摘取出頁面序列。
For(I=1;I
【淺議面向電子商務的Web日志挖掘系統(tǒng)】相關文章:
Web數(shù)據(jù)挖掘在電子商務中的應用.03-21
Web數(shù)據(jù)挖掘在電子商務中的應用研究03-07
電子商務個性化服務與Web使用挖掘技術12-07
Web結(jié)構(gòu)挖掘在電子商務網(wǎng)站結(jié)構(gòu)優(yōu)化中的應用03-21
Web 2.0技術在電子商務中的應用03-21
淺議電子商務對物流的影響03-21