【畢業(yè)學(xué)位論文】基于 SOM 的專利可視化方法研究_第1頁
【畢業(yè)學(xué)位論文】基于 SOM 的專利可視化方法研究_第2頁
【畢業(yè)學(xué)位論文】基于 SOM 的專利可視化方法研究_第3頁
【畢業(yè)學(xué)位論文】基于 SOM 的專利可視化方法研究_第4頁
【畢業(yè)學(xué)位論文】基于 SOM 的專利可視化方法研究_第5頁
已閱讀5頁,還剩68頁未讀, 繼續(xù)免費(fèi)閱讀

【畢業(yè)學(xué)位論文】基于 SOM 的專利可視化方法研究.pdf 免費(fèi)下載

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

北京理工大學(xué)碩士學(xué)位論文 I 摘要 專利情報作為重要的信息資源,如果加以合理利用就可以提供相關(guān)的技術(shù)、經(jīng)濟(jì)、市場和法律等方面信息,從而為企業(yè)決策提供依據(jù)。近年來,新技術(shù)的不斷涌現(xiàn)、技術(shù)更新?lián)Q代頻率的加劇,以及對于知識產(chǎn)權(quán)問題的日益重視,都促使專利信息以前所未有的速度迅猛增長。然而與信息的快速增長所不和諧的是專利分析方法的發(fā)展并不盡人意。 本論文以法為基礎(chǔ)開展信息可視化的相關(guān)技術(shù)研究,嘗試使用信息可視化、數(shù)據(jù)挖掘等技術(shù)手段進(jìn)行專利信息的挖掘,從而提高專利分析水平,進(jìn)一步發(fā)覺潛在信息。 本文根據(jù)專利信息本身的特點(diǎn),提出了基于時結(jié)合專利信息本身特點(diǎn)對其可以更好地挖掘隱含信息,然后通過中國專利信息的集成電路封裝技術(shù)領(lǐng)域數(shù)據(jù)進(jìn)行驗(yàn)證;接著本文根據(jù)作者提出的可視化圖形生成原則,設(shè)計了可視化圖形生成算法,并采用等高線圖譜將挖掘的信息展現(xiàn)出來。最后本文對集成電路封裝技術(shù)領(lǐng)域開展實(shí)證研究,在實(shí)證中對本文提出的模型和可視化算法全部進(jìn)行了驗(yàn)證和分析。 關(guān)鍵詞 專利情報,視化數(shù)據(jù)挖掘、可視化模型 北京理工大學(xué)碩士學(xué)位論文 as an if it be it be as a of at a in of up of on to s of is is OM to a on We as to of to of we a OM of we by C on of a a At a C in be of 北京理工大學(xué)碩士學(xué)位論文 錄 摘要. . 1 . 1 究意義. 3 . 4 究方法. 4 究難點(diǎn). 4 文結(jié)構(gòu)及安排. 5 2 相關(guān)理論研究. 7 . 7 利情報分析的意義. 7 利分析流程. 8 于. 9 利情報可視化方法綜述. 11 息可視化. 11 利信息可視化可行性研究. 13 . 15 3基于. 18 . 18 . 20 章小結(jié). 23 4可視化模型研究. 24 據(jù)處理方法研究. 24 據(jù)準(zhǔn)備. 24 據(jù)預(yù)處理. 27 視化訓(xùn)練集的生成. 28 視化結(jié)果實(shí)現(xiàn). 28 . 29 視化圖譜二維坐標(biāo)計算. 30 視化圖譜設(shè)計原則. 31 . 32 章小結(jié). 37 5 實(shí)證分析:集成電路封裝技術(shù)可視化挖掘. 38 證分析背景介紹. 38 成電路封裝技術(shù)介紹. 38 取集成電路封裝技術(shù)的意義. 38 據(jù)獲取. 39 北京理工大學(xué)碩士學(xué)位論文 數(shù)據(jù)源選擇. 39 利信息獲取與存儲. 39 據(jù)預(yù)處理. 40 據(jù)清洗. 40 性轉(zhuǎn)換. 41 據(jù)庫整合. 41 練集生成. 42 家層面. 43 業(yè)層面. 44 據(jù)歸一化. 44 . 47 家層面分析. 47 業(yè)層面分析. 53 . 58 章小結(jié). 61 6 總結(jié)與展望. 62 文的研究意義. 62 文的創(chuàng)新點(diǎn). 62 一步工作. 62 致謝. 63 攻讀碩士期間發(fā)表的學(xué)術(shù)論文. 64 參考文獻(xiàn):. 65 北京理工大學(xué)碩士學(xué)位論文 V 圖目錄 圖1- 1 2維10*10節(jié)點(diǎn)的專利主題局部地形視圖.1- 2基于.1- 3 論文框架.2- 1專利分析流程.2- 2可視化挖掘流程.3- 1 .3- 2基于.3- 3可視化流程設(shè)計.4- 1 數(shù)據(jù)監(jiān)測、集成流程.4- 2 中國專利信息網(wǎng)絡(luò)數(shù)據(jù).4- 3法律狀態(tài)信息網(wǎng)絡(luò)數(shù)據(jù).4- 4基于.4- 5六邊形.4- 6 .4- 7可視化效果圖.5- 1數(shù)據(jù)整合.5- 2未處理指標(biāo)單位帶來的影響.5- 3前十高產(chǎn)國家/地區(qū)專利申請年份分布.5- 4專利國家分布圖.5- 5高產(chǎn)國家維持年份分析圖.5- 6 .5- 7國家層面的四象限圖.5- 8 封裝技術(shù)中國專利申請人.5- 9 .5- 10公司間聚類分析.5- 11 層次聚類冰柱圖.5- 12 國家層面聚類分析樹形圖.5- 13 企業(yè)層面聚類分析樹形圖.京理工大學(xué)碩士學(xué)位論文 目錄 表格5- 1中國專利數(shù)據(jù)庫設(shè)計.格5- 2 擴(kuò)展的屬性.格5- 3國家領(lǐng)域訓(xùn)練集生成原則.格5- 4 前十高產(chǎn)國家/地區(qū)專利申請數(shù)量分布表.格5- 5 前十家高產(chǎn)機(jī)構(gòu)申請專利分布表.格5- 6公司.格5- 7國家層次聚類的結(jié)果分析.格5- 8國家層次聚類的結(jié)果分析.京理工大學(xué)碩士學(xué)位論文 1 1)專利信息作為情報資源日益重要。 隨著經(jīng)濟(jì)的全球化發(fā)展,我國企業(yè)將面臨著來自國內(nèi)外的競爭壓力。知己知彼,百戰(zhàn)不殆,企業(yè)只有明確自身的地位和作用才能獲得競爭的主動權(quán)。在此情況下,許多大公司、企業(yè)都在不斷調(diào)整自己的技術(shù)路線1,重點(diǎn)關(guān)注高新技術(shù)的專利信息作用。 專利情報作為重要的信息資源,如果加以合理利用就可以提供相關(guān)的技術(shù)信息、經(jīng)濟(jì)信息、市場信息和法律信息,作為企業(yè)決策的依據(jù)。 (2)專利信息增長迅速,分析方法體系并不完善。 隨著新技術(shù)的不斷涌現(xiàn)、技術(shù)更新?lián)Q代頻率的加劇,以及對于知識產(chǎn)權(quán)問題的日益重視,專利的申請數(shù)量每年都在遞增。僅2006年申請專利數(shù)就為357899件,2007年則申請為50223件。如何利用好這些龐大的資源,挖掘出企業(yè)所需的信息一直備受關(guān)注。 然后目前專利數(shù)據(jù)庫豐富的同時,分析手段和決策支持的功能表現(xiàn)不足,對現(xiàn)有信息的利用不足,不能很好的發(fā)掘出數(shù)據(jù)的內(nèi)在聯(lián)系。以往的方法主要是建立在統(tǒng)計分析基礎(chǔ)上。在專利數(shù)據(jù)到信息,情報和知識轉(zhuǎn)化不足;沒有動態(tài)更新的技術(shù)識別能力;關(guān)鍵技術(shù),競爭技術(shù),輔助技術(shù)等技術(shù)識別方法欠缺。 (3)目前專利分析中所面臨的主要問題 在日益激烈的競爭中,為了獲取競爭的主動權(quán),企業(yè)必須明確自身在競爭環(huán)境中所處的地位與狀態(tài)。反映在專利信息領(lǐng)域,人們的期望就不僅僅不停留在對專利表面信息的挖掘上。為了制定更加合理的專利戰(zhàn)略上,企業(yè)需要對其在某領(lǐng)域的專利地位,以及競爭對手的狀況有詳細(xì)的認(rèn)識。但是目前的專利分析方法對專利品質(zhì)分類方面的挖掘并不完善,并不能滿足企業(yè)對其的需求。 因此本文旨在結(jié)合實(shí)驗(yàn)室目前的專利數(shù)據(jù)庫現(xiàn)狀,從可視化的特點(diǎn)出發(fā),對專利信息進(jìn)行挖掘、揭示和說明,彌補(bǔ)傳統(tǒng)分析方面的缺陷。 (4)信息可視化技術(shù)的研究現(xiàn)狀 可視化技術(shù)(利用計算機(jī)圖形學(xué)和圖像處理技術(shù),將數(shù)據(jù)轉(zhuǎn)換成圖形或圖像在屏幕上顯示出來,并進(jìn)行交互處理的理論、方法和技術(shù)10。人們獲取北京理工大學(xué)碩士學(xué)位論文 2 和處理信息的效果與信息的展現(xiàn)方式密切相關(guān)。有人做過試驗(yàn),如果把大量的數(shù)據(jù)排列成易于辨認(rèn)的圖案,人們可以在瞬間理解數(shù)億比特的信息,大大提高了人們的認(rèn)知率。這也說明信息只有通過有效的展現(xiàn)才能發(fā)揮他的本來意義9。 國內(nèi)外的學(xué)者在可視化技術(shù)應(yīng)用于科技信息知識發(fā)現(xiàn)方面做了大量的研究,陳超美1999年在“A 中提出一種語義為中心的信息可視化方法,通過對個人文獻(xiàn)集合以語義為中心的方法集中揭示信息空間的內(nèi)在聯(lián)系。在“中提出一種基于虛擬現(xiàn)實(shí)表達(dá)語義結(jié)構(gòu)的知識管理系統(tǒng)。 2001年“a s 出并實(shí)現(xiàn)了通過科技文獻(xiàn)抽取模式進(jìn)行作者引文分析,利用計算機(jī)圖形技術(shù)將分析結(jié)果繪制為3與印第安納大學(xué)的文中對包括降維技術(shù)、聚類分析與空間配置等在內(nèi)的可視化關(guān)鍵技術(shù)做了系統(tǒng)的闡述。俄克拉何馬州立大學(xué)電子與計算機(jī)工程系a 中提出一種據(jù)庫信息可視化與分析系統(tǒng),針對科技預(yù)測對文獻(xiàn)和專利信息進(jìn)行二維的可視化,該系統(tǒng)的過程模型是:獲取文獻(xiàn)、繪制文獻(xiàn)圖、聚類分析、關(guān)系挖掘和生成總結(jié)與趨勢表達(dá)。美國亞里桑那大學(xué)的黃贊等2003年在“中運(yùn)用內(nèi)容圖譜分析和引文網(wǎng)絡(luò)分析等技術(shù)對納米領(lǐng)域的專利進(jìn)行分析并進(jìn)行可視化表達(dá)。法國of a of 文中著重闡述了神經(jīng)網(wǎng)絡(luò)方法在科學(xué)技術(shù)信息圖譜中的應(yīng)用,并將基于神經(jīng)網(wǎng)絡(luò)的復(fù)合自組織工具應(yīng)用于信息分析和復(fù)合圖形表達(dá)。如圖1朱東華與of 中指出科技信息管理的關(guān)鍵在于獲取大量數(shù)據(jù)、快速處理和有效的結(jié)果表達(dá),并在“中對信息可視化在技術(shù)機(jī)會分析和技術(shù)預(yù)測中的應(yīng)用做了深入的研究。 北京理工大學(xué)碩士學(xué)位論文 3 圖1- 1 2維10*10節(jié)點(diǎn)的專利主題局部地形視圖 究意義 目前對專利的分析主要是集中在數(shù)理統(tǒng)計分析基礎(chǔ)之上,結(jié)合專利分析方法的調(diào)研結(jié)合以往專利分析工作的經(jīng)驗(yàn),發(fā)現(xiàn)在現(xiàn)在的專利分析方法中,主要采用的方法有: 傳統(tǒng)的統(tǒng)計方法 計量分析方法 技術(shù)生命周期分析法 技術(shù)矩陣分析法 引證分析法 關(guān)聯(lián)分析法 這些方法對專利信息進(jìn)行的挖掘。但是這些方法卻有著固有的缺陷:在專利數(shù)據(jù)到信息,情報和知識轉(zhuǎn)化不足;沒有動態(tài)更新的技術(shù)識別能力;關(guān)鍵技術(shù),競爭技術(shù),輔助技術(shù)等技術(shù)識別方法欠缺等。 特別是在對技術(shù)組群的識別中,在對競爭技術(shù)的分析過程中缺乏有效的判定方式。在技術(shù)組群識別中,我們常采用關(guān)聯(lián)和引用網(wǎng)絡(luò)分析,但是這些方法本身是有其不可避免的缺陷的。關(guān)聯(lián)分析法受分詞準(zhǔn)確與否的影響較大,但是目前存在的分詞算法對于某些科技術(shù)語的抽取還是比較薄弱;引用分析受制于其引用專利的給出,在目前我們所得的專利數(shù)據(jù)庫中只有美國專利對引用給出了比較詳細(xì)的描述,這就限制了其對其他專利數(shù)據(jù)的利用,再次基于引用構(gòu)造的技術(shù)組群更多的反應(yīng)了技術(shù)的一個演變形式,對于相似技術(shù)的一個競爭合作關(guān)系并沒有描述。 因此,在這種前提要,就需要我們來找尋另一種有效方式來填充其分析的空白。而通過對以提高專利分析的效率和正確性,北京理工大學(xué)碩士學(xué)位論文 4 提高知識的準(zhǔn)確性和可理解性;可以幫助企業(yè)理解和分析專利技術(shù)的之間的相互關(guān)系,以獲得本行業(yè)或本企業(yè)的技術(shù)策略、技術(shù)熱點(diǎn)領(lǐng)域、技術(shù)競爭態(tài)勢、競爭企業(yè)情況等情報內(nèi)容,為自身的決策提供十分重要的輔助參考,具有重大的研究和實(shí)用意義。 論文的主要內(nèi)容是,通過利用到大量專利情報背后隱藏的重要規(guī)律,獲得企業(yè)或行業(yè)中專利技術(shù)策略、技術(shù)實(shí)力和技術(shù)特點(diǎn)等專利情報信息,以起到輔助決策的作用,如圖1圖1- 2基于體研究內(nèi)容有:對特定數(shù)據(jù)源專利數(shù)據(jù)的獲取及預(yù)處理;視化模型的設(shè)計和實(shí)現(xiàn);以及某一領(lǐng)域的專利實(shí)證分析。 究方法 本論文主要從科學(xué)技術(shù)角度,結(jié)合定性和定量分析方法,利用宏觀和微觀層面對專利信息進(jìn)行獲取、分析、可視化和評價。在已有模型基礎(chǔ)上對結(jié)果進(jìn)行分析,得出無法從大量專利數(shù)據(jù)中直觀得到的信息。 在實(shí)證方面,以集成電路的封裝技術(shù)領(lǐng)域?yàn)槔Y(jié)合北京理工大學(xué)知識發(fā)現(xiàn)與數(shù)據(jù)分析實(shí)驗(yàn)室專利分析平臺的前期研究成果,集成獲取該領(lǐng)域中專利信息,利用專利信息進(jìn)行深層次的挖掘。 究難點(diǎn) 北京理工大學(xué)碩士學(xué)位論文 5 專利數(shù)據(jù)的格式化和標(biāo)準(zhǔn)化?;谟谥苯邮褂茫员仨氝M(jìn)行格式化和標(biāo)準(zhǔn)化統(tǒng)一,并集成到專利數(shù)據(jù)庫中,最后形成合理規(guī)范的業(yè)務(wù)數(shù)據(jù)集;同時,由于學(xué)習(xí)網(wǎng)絡(luò)30,輸入層的選擇可以說對結(jié)果的產(chǎn)生具有非常重要的影響。因此,輸入層變量的選擇問題將是本次研究中的要點(diǎn)難點(diǎn)。 專業(yè)知識的淡化,規(guī)律的凸現(xiàn)。因?yàn)楸狙芯恐荚跒槠髽I(yè)、機(jī)構(gòu),或相關(guān)政府部門提供輔助決策的信息,然而專利的基礎(chǔ)知識比較復(fù)雜和繁多,因此挖掘后的結(jié)果展示和分析應(yīng)該盡量通俗易懂,簡潔明了,所以必須考慮到對專利專業(yè)知識的淡化處理,而著重凸出規(guī)律性的結(jié)論。 由于本課題綜合了目前先進(jìn)的信息技術(shù)和專利技術(shù)進(jìn)行探索性研究工作,所以在研究不斷深入的過程必然會出現(xiàn)更多的潛在問題,對這些問題的有效解決也將成為本課題的重要研究內(nèi)容。 文結(jié)構(gòu)及安排 圖1- 3 論文框架 本論文主要從理論層面、方法層面和應(yīng)用層面進(jìn)行了劃分。前兩個部分主要來探北京理工大學(xué)碩士學(xué)位論文 6 討基于術(shù)及以模型的探討研究,最后一部分通過實(shí)證應(yīng)用來驗(yàn)證方法的可行性。 第一部分,理論層面的研究,也即論文緒論的介紹。主要介紹了論文的選擇依據(jù)以及研究意義;著眼于信息可視化技術(shù)以及專利情報分析領(lǐng)域的發(fā)展情況,提出論文的研究方法以及研究過程中的難點(diǎn)與重點(diǎn)。最后對論文研究提出簡要框架。 第二部分,方法層面的研究,這也是整個論文的核心。通過對以往的專利分析工作的優(yōu)缺點(diǎn)的比較,以及針對以往工作的不足,為了更好地利用專利情報挖掘隱含信息,本文提出了“基于然后在整體模型的基礎(chǔ)上,對成了論文的整個方法體系。 最后,實(shí)證分析,將已有模型應(yīng)用到集成電路封裝技術(shù)領(lǐng)域,對得到的結(jié)果進(jìn)行分析,來驗(yàn)證本模型的正確性以及合理性。北京理工大學(xué)碩士學(xué)位論文 7 2 相關(guān)理論研究 發(fā)明、實(shí)用新型或外觀設(shè)計向果務(wù)院專利行政部門提出專利申請,經(jīng)依法審查合格后,向?qū)@暾埲耸谟璧脑谝?guī)定的時間內(nèi)對該項(xiàng)發(fā)明創(chuàng)造享有的專有權(quán)3。 然而企業(yè)在專利申請上并不是一味的盲目7,會從市場、競爭前景、技術(shù)等方面進(jìn)行考慮。也及在市場方面:它必須具有市場價值,也即企業(yè)需要通過從中來獲得經(jīng)濟(jì)效益;競爭因素:如果與同類技術(shù)相比并不具有優(yōu)勢,形成不了足夠強(qiáng)大的市場,那么也沒有必要申請專利;技術(shù)因素:主要考慮該項(xiàng)技術(shù)創(chuàng)造仿制程度的難易。綜上可知,專利情報是一種重要的信息,通過它可以獲得相關(guān)技術(shù)、經(jīng)濟(jì)、市場方面的信息。本論文的可視化技術(shù)也是建立在專利的基礎(chǔ)上的。 利情報分析的意義 今天的社會是信息激增的社會。僅近三十年來的科學(xué)技術(shù)成果就超過以往人類歷史兩千年成果的總和。國外有的學(xué)者把信息同能源和材料并稱為今日社會進(jìn)步的三大技術(shù)支柱,把當(dāng)今的社會稱之為“情報社會”。以情報信息為對象,對其內(nèi)容進(jìn)行識別、整理、分析、綜合、選擇、推薦或加工出新的信息來服務(wù)于社會創(chuàng)造活動,這便是廣義情報研究的任務(wù)3。情報研究是以當(dāng)代科學(xué)技術(shù)的新成就為主要對象。判斷這些成就的價值,發(fā)現(xiàn)問題啟發(fā)思路,預(yù)告未來,提出建議。 文獻(xiàn)情報研究是情報學(xué)的重要內(nèi)容,屬于情報服務(wù)中的高層次活動。它既包括文獻(xiàn)研究,又在一定程度上涉及可行性分析和科學(xué)預(yù)測等領(lǐng)域6。文獻(xiàn)情報研究作為一個以大量收集各種有關(guān)文獻(xiàn)情報信息,經(jīng)過加工、分析而提出有針對性的研究報告這樣一種研究工作,與生產(chǎn)、科研、經(jīng)濟(jì)、政治等活動也有著非常密切的聯(lián)系。毫無疑間,隨著我國政治、經(jīng)濟(jì)、文化的發(fā)展,文獻(xiàn)情報分析研究必將受到社會各界愈來愈大的重視,它的發(fā)展前景是十分廣泛闊的。 北京理工大學(xué)碩士學(xué)位論文 8 利分析流程 考慮到研究領(lǐng)域的不同、分析的目、要求不同,因此在研究過程中信息收集的范圍,所采用的方法,以及最后結(jié)果的呈現(xiàn)方式都大相徑庭。但是所有研究工作的分析流程都是大同小異的,具體圖2圖2- 1專利分析流程 (1) 針對分析工作的目的,首先確定監(jiān)測需求,初步選取監(jiān)測對象。利用下

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論