范例推理下旅游計(jì)劃推薦系統(tǒng)設(shè)計(jì)的關(guān)鍵問題論文
隨著我國旅游業(yè)和互聯(lián)網(wǎng)電子商務(wù)的迅猛發(fā)展,互聯(lián)網(wǎng)上的旅游電子商務(wù)網(wǎng)站成百上千,而這些網(wǎng)站提供的旅游相關(guān)信息堪稱海量。這為普通游客設(shè)計(jì)自己的旅游計(jì)劃提供了豐富的選擇和參考,但同時也大大增加了 信 息 篩 選 和 比 對 的 難 度。例 如,使 用“百 度”搜 索 引 擎 檢 索 關(guān) 鍵 字“九 寨 溝 三 日 游”,檢 索 結(jié) 果 獲 得23 800 000個頁面。為此,建立一個第三方網(wǎng)站,通過“推薦系統(tǒng)”向游客提供旅游計(jì)劃個性化服務(wù)具有很高的實(shí)用價(jià)值和商業(yè)價(jià)值。傳統(tǒng)的“推薦系統(tǒng)”一般基于用戶的歷史記錄(例如網(wǎng)頁瀏覽記錄、產(chǎn)品購買記錄、對產(chǎn)品的評價(jià)或評分等)設(shè)計(jì)推薦算法,但旅游活動不同于一般的產(chǎn)品消費(fèi),即游客一般不會重復(fù)地旅游或者頻繁地旅游。因此,旅游電子商務(wù)網(wǎng)站的“推薦系統(tǒng)”有必要選擇其他 理論和技術(shù)作為基礎(chǔ)。比較普遍的情況是,游客對于自己將進(jìn)行的旅游活動僅有一些初步的想法(例如時間、費(fèi)用、旅游地點(diǎn)等),對于具體行程安排不太了解,所以在制定旅游計(jì)劃的過程中往往喜歡參考別人的旅游計(jì)劃或者經(jīng)驗(yàn),并以此作為自己旅游計(jì)劃的基礎(chǔ)和依據(jù),修改這些例子以形成自己的旅行計(jì)劃。有鑒于此,范例推理(Case-based Reasoning)理論和技術(shù)可運(yùn)用到旅游電子商務(wù)網(wǎng)站的“推薦系統(tǒng)”設(shè)置中。范例推理理論和技術(shù)起源于美國,是人工智能領(lǐng)域中較新穎和成熟的一種問題求解和學(xué)習(xí)方法。它的基本思路是在新問題的解決過程中,通過尋找與之相似的歷史范例,挖掘歷史范例中可資借鑒的信息和知識,進(jìn)而形成新問題的對應(yīng)解決方案。基于范例推理的問題求解過程的可以分為4個階段:范例檢索(Retrieve)、范例重用(Reuse)、范例修正(Revise)和范例保存(Retain)。
1 機(jī)構(gòu)框架
基于范例推理的旅游計(jì)劃推薦系統(tǒng)由三個層次構(gòu)成,即游客應(yīng)用層、Web服務(wù)層和數(shù)據(jù)源層,見圖1.
。1)游客應(yīng)用層。該層為游客訪問推薦系統(tǒng)提供一個的良好的交互操作界面,游客可輸入文字、數(shù)字等信息,瀏覽、修改和保存旅游計(jì)劃推薦系統(tǒng)的輸出結(jié)果。(2)Web服務(wù)層。該層負(fù)責(zé)從數(shù)據(jù)源中檢索、更新數(shù)據(jù)。旅游計(jì)劃推薦系統(tǒng)運(yùn)行在該層。該層主要模塊包括管理模塊(負(fù)責(zé)和“游客應(yīng)用層”相互作用,管理其他模塊、維護(hù)“數(shù)據(jù)源層”、檢索模塊(負(fù)責(zé)CBR技術(shù)中的檢索、匹配功能)。(3)數(shù)據(jù)源層。該層包括旅游計(jì)劃收集庫、旅游計(jì)劃范例庫和游客資料庫等。其中,旅游計(jì)劃收集庫包含大量采集自各網(wǎng)站的、未經(jīng)整理的旅游信息資料;旅游計(jì)劃范例庫包含大量的標(biāo)準(zhǔn)化的旅游計(jì)劃范例;游客資料數(shù)據(jù)庫包含著登陸游客的相關(guān)歷史記錄。
2 關(guān)鍵技術(shù)與方法
基于范例推理理論和技術(shù),本文將范例推理系統(tǒng)作為旅游計(jì)劃推薦系統(tǒng)的'核心組成部分。為了保證旅游計(jì)劃推薦系統(tǒng)正常運(yùn)作,該范例推理系統(tǒng)必須解決3個關(guān)鍵問題,即旅游計(jì)劃采集系統(tǒng)、旅游計(jì)劃范例庫和旅游計(jì)劃范例檢索設(shè)計(jì)。
。1)旅游計(jì)劃采集系統(tǒng)。旅游計(jì)劃范例的搜集工作主要依賴旅游計(jì)劃自動采集系統(tǒng)進(jìn)行。該系統(tǒng)通過“URL模板匹配庫”過濾出可以解析的網(wǎng)頁,然后將可解析的HTML文檔進(jìn)行網(wǎng)頁結(jié)構(gòu)化處理,生成XML文檔。最后結(jié)合DOM4J和XPath語言建立頁面解析模板,從XML文檔中抽取指定節(jié)點(diǎn)信息,并將其存儲進(jìn)入旅游計(jì)劃收集庫。旅游計(jì)劃采集系統(tǒng)工作流程參見圖二。需要說明的是,筆者將XML語言應(yīng)用在網(wǎng)頁信息自動抽取過程中。XML是一種元標(biāo)記語言,它將結(jié)構(gòu)、內(nèi)容和表現(xiàn)分離,提供描述結(jié)構(gòu)化資料的格式,有著較好的數(shù)據(jù)存儲格式,可擴(kuò)展性,高度結(jié)構(gòu)化,語義性強(qiáng)、能夠解決HTML網(wǎng)頁的數(shù)據(jù)的異構(gòu)性和半結(jié)構(gòu)化問題。URL模板匹配庫是一個包含了旅游電子商務(wù)網(wǎng)站URL特征的XML文件,與待抽取網(wǎng)頁的URL進(jìn)行模板匹配,判斷頁面是否可以被解析并確定其網(wǎng)頁解析模板。XPath(XML Path Language)是一種在XML文檔中查找信息的語言,可用來在XML文檔中對元素和屬性進(jìn)行遍歷。用DOM4J解析器可以從指定的XML文檔中自動抽取出所需信息。
。2)旅游計(jì)劃范例庫。各旅游商務(wù)網(wǎng)站提供的旅游計(jì)劃包含大量信息,內(nèi)容側(cè)重點(diǎn)和格式等大相徑庭,因此必須將這些旅游計(jì)劃進(jìn)行標(biāo)準(zhǔn)化處理,即將一個個旅游計(jì)劃依據(jù)需要事先確立旅游計(jì)劃范例模板轉(zhuǎn)化為旅游計(jì)劃。該范例模版既能夠最大限度地反應(yīng)普通游客對旅游計(jì)劃的諸多關(guān)注要點(diǎn),而且信息應(yīng)該言簡意賅,一目了然。為了更好的了解普通游客對旅行計(jì)劃的關(guān)注要點(diǎn),筆者與Phuket ABC Tour合 作 進(jìn) 行 了 旅 游 計(jì) 劃 網(wǎng)絡(luò)問卷調(diào)查,歷時30天,獲得“旅游計(jì)劃問卷調(diào)查表”100份(該問卷調(diào)查表調(diào)研對象為普通游客,調(diào)研主要內(nèi)容為對旅游計(jì)劃的關(guān)注要點(diǎn)進(jìn)行排序和打分)“旅游計(jì) 劃問卷調(diào)查表”統(tǒng)計(jì)結(jié)果顯示,普通游客對旅游計(jì)劃的關(guān)注要點(diǎn)由強(qiáng)到弱排序?yàn)榫包c(diǎn)、時間、費(fèi)用、住宿、餐飲、交通。為此,筆者設(shè)計(jì)了一個旅游計(jì)劃范例模版(以成都國旅的九寨溝三日游為例),見表1.旅游計(jì)劃范例庫存儲有大量旅游計(jì)劃范例,并且能夠不斷補(bǔ)充的新的旅游計(jì)劃范例。
。3)旅游計(jì)劃范例檢索。與旅游計(jì)劃范例模板相匹配,筆者設(shè)計(jì)了新旅游計(jì)劃模版,游客可根據(jù)自身需要選填各項(xiàng)。新旅游計(jì)劃模版見表2.表2中,“關(guān)注程度排序”可理解為游客賦予各“關(guān)注要點(diǎn)”的權(quán)重;“時間”和“費(fèi)用”兩項(xiàng)為數(shù)值,“地點(diǎn)”、“住宿”、“餐 飲”、“景 點(diǎn)”、“交通”和“旅游對象”項(xiàng)為字符。假設(shè)新旅游計(jì)劃與旅游計(jì)劃范例分別表示為t和s,fti和fsi分別表示新 旅 游 計(jì) 劃 和 旅 游 計(jì) 劃 范 例 的 第i個“關(guān)注要點(diǎn)”的數(shù)值或字符。
對于旅游活動的“時間”和“費(fèi)用”而言,如果新旅游計(jì)劃設(shè)定的數(shù)值與旅游計(jì)劃范例的數(shù)值之間差距過大,則游客 一般 難 以 接 受,例 如5 000元與50 000元之間的差距,5天與10天之間的差距。故根據(jù)生活常識設(shè)定兩者差距介于0.5和1.5倍之間為有效相似度,否則為無效相似度。
地點(diǎn)“、”住宿“、”餐飲“、”景點(diǎn)“、”交通“和”旅游對象“等字符項(xiàng)目相似性計(jì)算公式為
將單個關(guān)注要點(diǎn)的相似度與其權(quán)重相乘(w{1,2,3…7}),其結(jié)果再相加得到新旅游計(jì)劃與旅游計(jì)劃范例的總體相似度。總體相似度越大,說明新旅游計(jì)劃與旅游計(jì)劃范例越相似。旅游計(jì)劃范例按照總體相似度降序輸出。
3 結(jié)語
為了幫助游客從海量網(wǎng)絡(luò)旅游信息中解脫出來,快速、有效地制定個性化的旅游計(jì)劃,筆者嘗試提出了基于范例推理的旅游計(jì)劃推薦系統(tǒng)的系統(tǒng)框架。該系統(tǒng)在實(shí)際運(yùn)用過程中還存在一些難題,需要大量關(guān)鍵技術(shù)與方法的支撐,筆者僅進(jìn)行了簡要的探討,未來還有待于進(jìn)一步研究。
參考文獻(xiàn):
[1] 張曌,夏國平,李雪峰。基于案例推理的電子商務(wù)個性化推薦系統(tǒng)[J].計(jì)算機(jī)工程,2007(20):187-189.
[2] 楊健,趙秦怡。基于案例的推理技術(shù)研究進(jìn)展及應(yīng)用[J].計(jì)算機(jī)工程與設(shè)計(jì),2008(3):710-712.
[3] 胡少榮,孟嗣儀,劉云,等。網(wǎng)頁信息自動抽取技術(shù)的研究[J].鐵路計(jì)算機(jī)應(yīng)用,2010(9):37-40.
[4] 李施施,葉柏龍;诎咐评淼碾娮由虅(wù)推薦系統(tǒng)研究[J].計(jì)算機(jī)光盤軟件與應(yīng)用,2013(3):14-15.
【范例推理下旅游計(jì)劃推薦系統(tǒng)設(shè)計(jì)的關(guān)鍵問題論文】相關(guān)文章:
1.談旅游景區(qū)導(dǎo)向標(biāo)識系統(tǒng)的優(yōu)化設(shè)計(jì)論文
2.旅游網(wǎng)站系統(tǒng)設(shè)計(jì)論文參考文獻(xiàn)
3.旅游文化下的公園規(guī)劃設(shè)計(jì)分析論文
4.旅游管理系統(tǒng)功能架構(gòu)的設(shè)計(jì)