基于數(shù)據(jù)挖掘的社交網(wǎng)絡(luò)分析與研究論文_第1頁(yè)
基于數(shù)據(jù)挖掘的社交網(wǎng)絡(luò)分析與研究論文_第2頁(yè)
基于數(shù)據(jù)挖掘的社交網(wǎng)絡(luò)分析與研究論文_第3頁(yè)
基于數(shù)據(jù)挖掘的社交網(wǎng)絡(luò)分析與研究論文_第4頁(yè)
基于數(shù)據(jù)挖掘的社交網(wǎng)絡(luò)分析與研究論文_第5頁(yè)
已閱讀5頁(yè),還剩1頁(yè)未讀 繼續(xù)免費(fèi)閱讀

付費(fèi)下載

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第頁(yè)共頁(yè)基于數(shù)據(jù)挖掘的社交網(wǎng)絡(luò)分析^p與研究論文基于數(shù)據(jù)挖掘的社交網(wǎng)絡(luò)分析^p與研究論文【摘要】:^p:在計(jì)算機(jī)網(wǎng)絡(luò)越來(lái)越普及的社會(huì)中造就信息傳播的便利性進(jìn)步,也讓社交網(wǎng)絡(luò)漸漸開(kāi)展成為虛擬社群形態(tài),從早期的電子布告欄〔BBS〕到如今的社交網(wǎng)站〔SocialNetworkSites〕,都可以讓人們親密討論與互動(dòng)。本文將主要討論基于數(shù)據(jù)挖掘模型的社交網(wǎng)絡(luò)關(guān)聯(lián)預(yù)測(cè)分析^p,并對(duì)相關(guān)技術(shù)進(jìn)展闡述?!娟P(guān)鍵詞】:^p:數(shù)據(jù)挖掘;社交網(wǎng)絡(luò);關(guān)聯(lián)預(yù)測(cè)在社交網(wǎng)絡(luò)上,根據(jù)先前國(guó)外學(xué)者Viswanath,Mislove,ChaandGummadi和NguyenandTran都是針對(duì)theNewOrleans地區(qū)社群使用者發(fā)布數(shù)據(jù)來(lái)研究使用者發(fā)布的關(guān)系,而____地區(qū)針對(duì)使用者社群發(fā)布的分析^p多以問(wèn)卷方法居多,故本研究欲使用直接抓取頁(yè)面數(shù)據(jù)與卷標(biāo)的方法,觀察使用者社群網(wǎng)站上發(fā)布行為,利用先前用學(xué)者所提數(shù)據(jù)呈現(xiàn)方式,結(jié)合【關(guān)鍵詞】:^p標(biāo)記方式來(lái)理解使用者在社群網(wǎng)絡(luò)上的發(fā)布關(guān)系。而其中社群人數(shù)拓展最快速就是____,利用了社交網(wǎng)絡(luò)的特性讓使用者能更有效率的在網(wǎng)絡(luò)上找到有關(guān)系的親朋好友,將這世界的每個(gè)人、每個(gè)群體透過(guò)各種關(guān)系快速的串連起來(lái)[1]。1數(shù)據(jù)挖掘模型的概述當(dāng)要對(duì)HDFS讀寫(xiě)數(shù)據(jù)時(shí),檔案將被切割成小的64MBBlock,NameNode將告知每個(gè)DataNode,切割后的block是存放在哪,DataNode將負(fù)責(zé)做本地端檔案的block數(shù)據(jù)對(duì)應(yīng),并且同時(shí)DataNode將對(duì)其他DataNode進(jìn)展數(shù)據(jù)復(fù)制備份的動(dòng)作。Hadoop系統(tǒng)的容錯(cuò)率和可擴(kuò)大性來(lái)自于DataNode,當(dāng)DataNode出錯(cuò)意外關(guān)機(jī),其它節(jié)點(diǎn)上的數(shù)據(jù)將仍然存在,且當(dāng)需動(dòng)態(tài)增刪系統(tǒng)的運(yùn)算量,只需增加DataNode節(jié)點(diǎn)或停頓DataNode運(yùn)作。在進(jìn)展社群資料搜集與前處理之前,要先理解一下信息擷取與信息過(guò)濾的不同之處。在社群網(wǎng)站上隨機(jī)尋找開(kāi)放目錄上的使用者,而后進(jìn)展下載該使用者發(fā)布數(shù)據(jù)的動(dòng)作是謂信息擷?。欢鴮⑹褂谜咄盔f墻上大筆數(shù)據(jù)寫(xiě)進(jìn)本地端的HDFS系統(tǒng)后,并通過(guò)預(yù)先設(shè)定的一些挑選條件式和過(guò)濾方法,剔除雜亂的數(shù)據(jù),變成對(duì)本研究有用的信息,以利后續(xù)卷標(biāo)計(jì)算與【關(guān)鍵詞】:^p計(jì)算,這個(gè)過(guò)程就叫信息過(guò)濾[2]。2基于數(shù)據(jù)挖掘模型的社交網(wǎng)絡(luò)關(guān)聯(lián)預(yù)測(cè)分析^p【關(guān)鍵詞】:^p分析^p部份那么是針對(duì)個(gè)人涂鴉墻頁(yè)面和使用者自訂信息頁(yè)面進(jìn)展【關(guān)鍵詞】:^p標(biāo)記,其【關(guān)鍵詞】:^p來(lái)是使用者自訂信息頁(yè)面上含的運(yùn)動(dòng)、音樂(lè)、書(shū)籍、電影、電視、游戲、宗教、政治八組【關(guān)鍵詞】:^p。相關(guān)度計(jì)算是利用本研究所提相關(guān)度公式來(lái)進(jìn)展個(gè)人涂鴉墻頁(yè)面、使用者自訂信息頁(yè)面和模擬頁(yè)面間的關(guān)聯(lián)運(yùn)算,利用頁(yè)面間所含的【關(guān)鍵詞】:^p,計(jì)算出仿真頁(yè)面與使用頁(yè)面間的相關(guān)度。并在相關(guān)度計(jì)算階段把社群發(fā)布分析^p與【關(guān)鍵詞】:^p分析^p的結(jié)果做個(gè)穿插分析^p。之后對(duì)此分析^p結(jié)果進(jìn)展研究評(píng)估。使用者自訂信息頁(yè)面有讓使用者自己標(biāo)記自己興趣的分類工程,分為大四大類自訂選項(xiàng),其自訂選項(xiàng)下,包含子工程讓使用者自訂標(biāo)記自己的興趣,而該表的使用者自訂分類工程就是本研究挑選【關(guān)鍵詞】:^p的根據(jù),本研究挑選運(yùn)動(dòng)、音樂(lè)、書(shū)籍、電影、電視、游戲、宗教、政治這八個(gè)字作為【關(guān)鍵詞】:^p標(biāo)記投擲的工程,在此就不考慮同義不同字、字面背后意涵等問(wèn)題,只考慮第一層的字義[3]。3社交網(wǎng)絡(luò)關(guān)聯(lián)預(yù)測(cè)的.相關(guān)技術(shù)與應(yīng)用社交網(wǎng)絡(luò)分析^p一直以來(lái)都是個(gè)熱門(mén)的話題,所有團(tuán)體成員彼此之間社交關(guān)系的集合就是這個(gè)團(tuán)體的社交網(wǎng)絡(luò),而透過(guò)社交網(wǎng)絡(luò)分析^p可以理解團(tuán)體成員之間的互動(dòng),這分析^p可應(yīng)用在各種與人有關(guān)的領(lǐng)域上。在學(xué)校里,學(xué)生之間小團(tuán)體的組成及班級(jí)中____物與被孤立者的存在,一直都是教育者相當(dāng)關(guān)心的部份。在團(tuán)體精神治療中,成員之間的交流情況是分析^p治療成果的指標(biāo)之一。在網(wǎng)絡(luò)社群中,理解使用者群體之間的互動(dòng)可以幫助廠商開(kāi)發(fā)更人性化的網(wǎng)絡(luò)產(chǎn)品。人格特質(zhì)分析^p也是個(gè)熱門(mén)的話題,每個(gè)人的行為都有一套固定的行為形式,而分析^p這行為形式就是所謂的人格特質(zhì)分析^p,這分析^p也可應(yīng)用在各種與人有關(guān)的領(lǐng)域上。在學(xué)校里,不同類型的學(xué)生需要不同方式的教育。在公司面試上,公司透過(guò)分析^p應(yīng)征者的人格形式來(lái)錄取所需要的人才[4]。然而,一般心理學(xué)使用的社交網(wǎng)絡(luò)分析^p與人格特質(zhì)分析^p都是透過(guò)紙筆測(cè)驗(yàn),使用大量的人力去獲得人際互動(dòng)的信息,考慮團(tuán)體成員間友好的互動(dòng)關(guān)系,并使用方向性的連結(jié)來(lái)表達(dá)人們之間的互動(dòng)關(guān)系。目前使用計(jì)算機(jī)視覺(jué)技術(shù)的社交網(wǎng)絡(luò)分析^p系統(tǒng),僅考慮人們同時(shí)出現(xiàn)頻率當(dāng)作親密程度的指針,而且使用無(wú)方向性的連結(jié)來(lái)表示人們之間的互動(dòng)關(guān)系。因此,我們使用擁有計(jì)算機(jī)視覺(jué)技術(shù)的多攝影機(jī)系統(tǒng),透過(guò)分析^p人們之間的互動(dòng)行為,互動(dòng)行為包含互動(dòng)的對(duì)象、所表達(dá)的肢體語(yǔ)言與情緒信息,根據(jù)分析^p所有的互動(dòng)得到團(tuán)體內(nèi)所有成員之間的社交態(tài)度,而這就是這團(tuán)體的社交網(wǎng)絡(luò)。除了友好的互動(dòng)關(guān)系之外,我們還考慮了厭惡的互動(dòng)關(guān)系,并且使用方向性的連結(jié)來(lái)表達(dá)人們之間的互動(dòng),這讓我們的社交網(wǎng)絡(luò)分析^p能更貼切現(xiàn)實(shí)的互動(dòng)情況。通過(guò)分析^p一個(gè)人所有的社交互動(dòng)行為,可以得知此人的行為擁有何種傾向,而這行為形式就是這個(gè)人的人格特質(zhì)??傊?,我們可以根據(jù)觀察分析^p人們的互動(dòng)行為,得到與人們觀察得到的結(jié)果大同小異的社交網(wǎng)絡(luò)分析^p,證明我們能透過(guò)計(jì)算機(jī)視覺(jué)技術(shù)獲得貼近現(xiàn)實(shí)的社交網(wǎng)絡(luò)分析^p,并且比起一般心理學(xué)的社交網(wǎng)絡(luò)分析^p省下許多不必要的人力?!緟⒖嘉墨I(xiàn)】:^p:[1]王云馳,鄧倩妮.關(guān)聯(lián)信息在社交網(wǎng)絡(luò)中傳播的競(jìng)爭(zhēng)模型[J].微型電腦應(yīng)用,2023,(3):22-24.[2]魏爽,高華玲.利用數(shù)據(jù)挖掘方法進(jìn)展社交網(wǎng)絡(luò)關(guān)聯(lián)預(yù)測(cè)[J].電腦知識(shí)與技術(shù),2

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論