- 相關推薦
面向專利的電子信息產品TBT預警研究論文
摘 要:本文面向專利進行文本挖掘,通過主題詞抽取確定技術熱點及其技術發(fā)展趨勢,通過技術發(fā)展趨勢進行TBT預警,通過實例驗證說明是一種有效地TBT預警方法,也是文本挖掘技術在TBT預警領域的補充和擴展。
關鍵詞:專利 文本挖掘 TBT預警
根據世界知識產權組織(WIPO)的統(tǒng)計,90%~95%的研發(fā)成果包含在專利文獻中,專利文獻公開的技術有80%以上未出現(xiàn)在其他技術文獻中,全世界90%以上的發(fā)明創(chuàng)造信息都是首先通過專利文獻反映出來。專利作為技術信息最有效的載體,囊括了全球90%以上的最新技術情報,相比一般技術刊物所提供的信息早5年~6年,而且內容翔實準確。技術標準化存在的一個現(xiàn)象是,技術標準越來越與專利技術聯(lián)系在一起,專利被不斷包容進技術標準中,這無論是在作為正式標準的法定標準還是事實標準都是如此。專利文本挖掘就是利用文本挖掘技術從特定領域的專利中發(fā)現(xiàn)潛在的、合理的、對決策有價值的知識。
一、專利文本挖掘在TBT預警中的應用
文本挖掘是利用一系列的數(shù)據挖掘技術,從大量的無結構的文本數(shù)據中發(fā)現(xiàn)潛在的、可能的數(shù)據模式及內在聯(lián)系,獲得對用戶有價值的知識。文本挖掘在生物醫(yī)學、郵件過濾、專利分析,輿情監(jiān)測等領域有廣泛的應用研究。本文利用文本挖掘技術對進口國專利進行分析,及時發(fā)現(xiàn)進口國技術的動向,是TBT預警中的有效方法。
二、專利文本挖掘TBT預警過程
面向專利的文本挖掘即利用文本挖掘技術的對大量的專利進行分析,從而獲得潛在的、可能的數(shù)據模式及內在聯(lián)系,獲得對用戶有價值的知識。本文運用Text Mining for Clementine對收集到的大量專利文獻進行文本挖掘,基本步驟如下:
1.專利數(shù)據收集、篩選:專利數(shù)據收集是根據具體的需求從原始專利數(shù)據庫中抽取并匯總成與文本挖掘任務有關的源文本數(shù)據的過程。根據本文的實際需要,確定專利檢索地區(qū)、申請區(qū)間。選定進口國比較有權威性的專利庫作為數(shù)據收集的來源。
2.主題詞抽。河肨ext Mining for Clementine中的Text Extraction node抽取專利文獻的主題詞,以含有該主題詞的專利數(shù)量排序,這樣可以清晰顯示哪些主題詞在專利文檔中占的比例最高。
3.技術熱點確定:主題詞在專利文檔中所占的百分比作為技術熱度,技術熱度越高,則設置技術性貿易壁壘的可能性越大。
4.技術趨勢分析:將各個時間點的技術熱度放在時間軸上分析其變化趨勢,依此來預測將來的關注度變化,如果持續(xù)走高,則可認為必然會成為新的技術性貿易壁壘,做出預警。
三、以美國專利文獻數(shù)據庫為例進行專利文本挖掘
1.專利信息收集
選定具有權威性的USPTO Patent Databases(美國專利商標局USPTO網上專利文獻數(shù)據庫)作為數(shù)據源,收集2007年1月至12月的關于電子信息產品的所有專利,本文通過對2007年各個月份的專利文獻進行文本挖掘,確定電子信息產品領域技術熱點,得出技術趨勢圖,根據技術發(fā)展趨勢的走向判斷實施TBT可能性,以2007年1月的專利文獻為例進行挖掘。
2.主題詞抽取
利用Text Mining for Clementine中的Text Extraction node對2007年1月的關于電子信息產品專利進行主題詞抽取,結果如圖1所示,在2007年1月,關于計算機類產品、電子設備類產品、通訊類產品的專利分別約占總數(shù)的55.36%、39.88%、10.12%,關于能量問題、噪聲問題的專利分別約占總數(shù)的13.10%、13.10%,說明在未來時期,設置技術性貿易壁壘的可能性比較大,應該通知相關企業(yè)密切關注。
3.技術熱點確定
通過以上分析,根據主題詞在文檔中所占的百分比即為技術熱度,可確定2007年1月技術熱點涉及計算機類產品、電子設備類產品、通訊類產品、能量問題和噪聲問題。
4.技術變化趨勢分析
按照以上步驟對2007年后11個月的數(shù)據進行分析,發(fā)現(xiàn)computer 、energy和noise為共有的主題詞,將這12個月的技術熱點進行統(tǒng)計分析。
5.TBT警情分析
將各個時間點的熱點技術關注度放在時間軸上分析其變化趨勢,依此來預測將來的關注度變化,如果持續(xù)走高,則可認為必然會成為新的技術性貿易壁壘。
從計算機類產品、energy和noise的技術趨勢圖可以看出,在2007年12個月中,關于計算機類產品、energy和noise的技術一直在增長,相關的專利技術比較多,持續(xù)的時間長,可預見在未來相當長的時間內,計算機類產品、energy和noise的相關技術備受關注,認為其可能會成為新的技術性貿易壁壘標準。根據以上分析,向計算機產品企業(yè)發(fā)送預警信息。認為電子信息產品能耗方面和噪聲方面會成為新的技術性貿易壁壘標準,對電子信息產品能效標準提出新的要求。
參考文獻:
[1]劉玉琴 汪雪鋒:基于文本挖掘技術的專利質量評價與實證研究[J].2007
[2]翟東升 王明吉:專利地圖在技術性貿易壁壘預警中的應用.圖書與情報,2006(1)
[3]馮曉青:企業(yè)技術標準與專利戰(zhàn)略研究[J]. 科學管理研究,2007(4)
[4]Yuen-Hsien Tseng Chi-Jen Lin Yu-i Lin:Text mining techniques for patent analysis[J].Information Processing and Management,2007
【面向專利的電子信息產品TBT預警研究論文】相關文章:
面向產品的供給鏈本錢核算體系構建研究10-21
面向產品創(chuàng)新的供給鏈性能評價體系研究06-24
電子信息安全交換研究論文05-27
旅行社產品的不可專利性及其對策研究07-08
新型電子信息標志系統(tǒng)的開發(fā)研究論文06-23
電子信息加密保存與運行維護研究論文09-29
電子產品硬件測試研究論文05-31
創(chuàng)新設計電子信息產品智能制造創(chuàng)論文09-15
企業(yè)如何申請產品專利08-31