版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
摘要:伴隨互聯(lián)網(wǎng)技術(shù)普及與短視頻行業(yè)發(fā)展,不斷有用戶涌入各類(lèi)網(wǎng)絡(luò)視頻創(chuàng)作平臺(tái),既為網(wǎng)絡(luò)信息爆炸式增長(zhǎng)貢獻(xiàn)力量又試圖從中獲取所需信息。本文通過(guò)網(wǎng)絡(luò)爬蟲(chóng)技術(shù)獲取某關(guān)鍵詞下推送內(nèi)容評(píng)論區(qū)內(nèi)容相關(guān)數(shù)據(jù),利用數(shù)據(jù)處理與可視化技術(shù)開(kāi)展主要關(guān)注點(diǎn)、情感分析等工作,探究大眾對(duì)有關(guān)內(nèi)容的態(tài)度,實(shí)現(xiàn)大數(shù)據(jù)有關(guān)技術(shù)在體育行業(yè)應(yīng)用新方向。關(guān)鍵詞:中長(zhǎng)跑;數(shù)據(jù);分析;可視化;技術(shù);引論研究背景中考體育作為一項(xiàng)貼合我國(guó)國(guó)情實(shí)際需要,由我國(guó)提出的深化體教融合的社會(huì)工程,對(duì)推動(dòng)我國(guó)青少年學(xué)子文化學(xué)習(xí)與體育鍛煉協(xié)調(diào)發(fā)展具有重要指導(dǎo)意義。新課程改革背景下的體育與健康課程以發(fā)展學(xué)生核心素養(yǎng)和增進(jìn)學(xué)生身心健康為主要目的,要求學(xué)生學(xué)會(huì)相應(yīng)必備的健康與安全的知識(shí)與技能,積極參與體育鍛煉,掌握與應(yīng)用體能和運(yùn)動(dòng)技能;與之對(duì)應(yīng)的是在體育中考中要體現(xiàn)對(duì)學(xué)生運(yùn)動(dòng)能力、健康行為、體育品德等方面的考核,然而在實(shí)際政策推行過(guò)程中難免存在橫向評(píng)價(jià)維度片面問(wèn)題,單一考核標(biāo)準(zhǔn)難以界定學(xué)生參與體育活動(dòng)深度;鑒于場(chǎng)地限制與偏重“身體素質(zhì)”的考核評(píng)價(jià),學(xué)校體育課程大部分精力耗費(fèi)在枯燥的身體素質(zhì)訓(xùn)練上而忽視運(yùn)動(dòng)技能及技巧的訓(xùn)練。伴隨現(xiàn)代社會(huì)互聯(lián)網(wǎng)普及,越來(lái)越多人選擇通過(guò)互聯(lián)網(wǎng)及衍生流媒體平臺(tái)獲取信息[1]。如此龐大的群體涌入互聯(lián)網(wǎng)平臺(tái)對(duì)應(yīng)的產(chǎn)生供需市場(chǎng),面對(duì)群眾獲取各類(lèi)信息的需求,越來(lái)越多博主活躍于各大視頻創(chuàng)作社區(qū)或流媒體平臺(tái)自行創(chuàng)作分享內(nèi)容。以嗶哩嗶哩這一PUGC社區(qū)為例,截至2023年第三季度數(shù)據(jù)顯示,該網(wǎng)站日均活躍用戶為1.03億人。對(duì)于體育中考項(xiàng)目訓(xùn)練安排,學(xué)生及家長(zhǎng)往往更傾向于選擇練習(xí)時(shí)間較短、成效更為顯著的方式。學(xué)者從科學(xué)角度論述各項(xiàng)目體現(xiàn)的運(yùn)動(dòng)能力需要及科學(xué)的訓(xùn)練安排通常是從提升學(xué)生長(zhǎng)久身體素質(zhì)與運(yùn)動(dòng)能力角度出發(fā),需要長(zhǎng)期堅(jiān)持才可看見(jiàn)效果,也不似一般博主創(chuàng)作能夠說(shuō)明某次訓(xùn)練是為解決何種問(wèn)題。此外得益于互聯(lián)網(wǎng)與有關(guān)可視化、信息化等技術(shù)發(fā)展,受眾還可及時(shí)與博主分享或接受線上指導(dǎo)。綜上大眾從互聯(lián)網(wǎng)平臺(tái)瀏覽博主分享視頻獲取有關(guān)信息的方式還有待開(kāi)發(fā),且極具應(yīng)用前景。研究意義從前文可知,本次論文研究主要以某個(gè)具體視頻為例展開(kāi)相關(guān)程序試運(yùn)行,尋求是否某種可廣泛推廣的模式。通過(guò)爬取某關(guān)鍵詞下平臺(tái)自動(dòng)推送的熱點(diǎn)視頻評(píng)論區(qū)觀眾留言,利用Python進(jìn)行分析,尋找視頻受眾主要關(guān)注點(diǎn)、情感態(tài)度等信息。觀眾關(guān)注的內(nèi)容可以反映出在實(shí)踐活動(dòng)中觀眾普遍、迫切需要解決的“痛點(diǎn)”問(wèn)題,幫助有類(lèi)似需求的觀望者快速獲取解決辦法;也可作為視頻創(chuàng)作者的“風(fēng)向標(biāo)”,幫助創(chuàng)作者明確市場(chǎng)需求,生產(chǎn)符合大眾實(shí)際需要的高質(zhì)量?jī)?nèi)容。由于短視頻博主創(chuàng)作水平良莠不齊,平臺(tái)審核工作繁瑣難以面面俱到等眾多原因難以保證每條視頻都能解決學(xué)生的實(shí)際需要。除此以外,各平臺(tái)上有關(guān)視頻數(shù)量眾多,觀眾反饋褒貶不一等因素?zé)o疑也為有需求者挑選方案帶來(lái)更多干擾選項(xiàng)。借助數(shù)據(jù)挖掘處理等技術(shù)篩選出評(píng)論區(qū)觀眾積極情感態(tài)度詞占多數(shù)的視頻將有利于為潛在受眾個(gè)性化推薦接受度較高的訓(xùn)練方法。該項(xiàng)研究能為大數(shù)據(jù)有關(guān)技術(shù)跨界服務(wù)大眾提供實(shí)踐檢驗(yàn),相關(guān)模式也可進(jìn)行跨界推廣。相關(guān)技術(shù)理論基礎(chǔ)本次論文主要在Python環(huán)境下完成,使用到的有關(guān)模塊為pandas、request、snownlp、matplotlib、jiebe等[2],其優(yōu)勢(shì)在于(1)具“偽代碼”特性,可使使用者僅關(guān)心完成什么樣的工作任務(wù),而不必糾結(jié)于語(yǔ)法;(2)其是開(kāi)源的,與最受歡迎的開(kāi)源大數(shù)據(jù)平臺(tái)具有很好的兼容性,還擁有相當(dāng)多的第三方拓展庫(kù),可廣泛應(yīng)用于數(shù)據(jù)分析、網(wǎng)絡(luò)爬蟲(chóng)等多個(gè)領(lǐng)域。數(shù)據(jù)有關(guān)技術(shù)本文數(shù)據(jù)主要來(lái)源于網(wǎng)絡(luò)爬蟲(chóng),這是一種按照既定規(guī)則在網(wǎng)絡(luò)上自動(dòng)爬取信息的程序腳本。其工作流程大致可分為四步:=1\*GB3①確定初始URL作為入口;=2\*GB3②發(fā)送請(qǐng)求下載對(duì)應(yīng)網(wǎng)頁(yè);=3\*GB3③分析網(wǎng)頁(yè)內(nèi)容,提取所需要的信息;=4\*GB3④提取頁(yè)面中的鏈接作為新的URL,然后循環(huán)執(zhí)行上述流程直到滿足條件。本次論文數(shù)據(jù)爬取過(guò)程中主要調(diào)用Request庫(kù),它是一個(gè)較為實(shí)用的PythonHTTP客戶端庫(kù),編寫(xiě)爬蟲(chóng)和測(cè)試服務(wù)器響應(yīng)數(shù)據(jù)時(shí)經(jīng)常會(huì)用到。可用于發(fā)送HTTP請(qǐng)求和處理相應(yīng),提供簡(jiǎn)潔且簡(jiǎn)單易用的API,使得HTTP請(qǐng)求變得更加便捷。相比urllib庫(kù),它的語(yǔ)法模塊會(huì)更加簡(jiǎn)單,而且它是有中文官方文檔可作參考的。在數(shù)據(jù)處理階段主要應(yīng)用到Pandas庫(kù),其基于數(shù)組形式提供了極其豐富的數(shù)據(jù)操作,本文主要應(yīng)用其讀取數(shù)據(jù)采集文件并進(jìn)行數(shù)據(jù)清洗和預(yù)處理,包括去除重復(fù)值、正則清洗和分詞。作為Python的核心數(shù)據(jù)分析支持庫(kù),能夠簡(jiǎn)單直觀地處理關(guān)系型、標(biāo)記型數(shù)據(jù),主要數(shù)據(jù)結(jié)構(gòu)為一維數(shù)據(jù)和二維數(shù)據(jù),可處理金融、統(tǒng)計(jì)、工程等領(lǐng)域內(nèi)的大多數(shù)典型用例,該庫(kù)可參與數(shù)據(jù)分析的整理與清洗、分析與建模、可視化與制表等階段。可視化技術(shù)數(shù)據(jù)可視化是為了數(shù)據(jù)更高效的反映情況,便于讀者高效閱讀。利用該項(xiàng)技術(shù)能夠以圖形圖片的形式直觀展現(xiàn)出關(guān)鍵特征與某種規(guī)律,還可根據(jù)需要從不同維度觀察進(jìn)行深入研究。本文主要使用Python中的一個(gè)2D繪圖庫(kù)——Matplotlib,以多種硬拷貝格式和跨平臺(tái)的交互式環(huán)境生成出版物質(zhì)量的圖形,例如線性圖、散點(diǎn)圖等。文本分析技術(shù)本次論文對(duì)有關(guān)文本內(nèi)容的分析主要借助LDA模型。其是一種用于主題建模的概率生成模型,是一種無(wú)監(jiān)督學(xué)習(xí)算法,用于從文本集合中發(fā)現(xiàn)隱藏的主題結(jié)構(gòu)。LDA假設(shè)每個(gè)文檔是由多個(gè)主題組成的,而每個(gè)主題又由多個(gè)單詞組成。通過(guò)對(duì)文檔和單詞的統(tǒng)計(jì)分析,LDA可以推斷出每個(gè)文檔中各個(gè)主題的概率分布以及每個(gè)主題中各個(gè)單詞的概率分布。該項(xiàng)算法可用于=1\*GB3①主題識(shí)別:確定評(píng)論中討論的主題或話題,從而了解用戶關(guān)心的具體問(wèn)題或感興趣的內(nèi)容。=2\*GB3②情感分析:識(shí)別不同主題下用戶的情感傾向,包括正面評(píng)價(jià)、負(fù)面評(píng)價(jià)或中性態(tài)度,以便更好地理解用戶對(duì)特定話題的看法。=3\*GB3③關(guān)鍵詞分布:發(fā)現(xiàn)主題相關(guān)的關(guān)鍵詞及其在不同主題中的分布情況,有助于理解用戶對(duì)某一話題的關(guān)注點(diǎn)和重點(diǎn)內(nèi)容。=4\*GB3④用戶興趣挖掘:根據(jù)不同主題下的評(píng)論內(nèi)容,分析用戶對(duì)產(chǎn)品、服務(wù)或話題的興趣和偏好,可用于個(gè)性化推薦或定制營(yíng)銷(xiāo)。=5\*GB3⑤趨勢(shì)分析:根據(jù)主題的變化和演化,了解用戶關(guān)注的話題隨時(shí)間的變化趨勢(shì),有助于制定相應(yīng)的業(yè)務(wù)策略。文本處理技術(shù)Jieba分詞作為Python中的分詞庫(kù),在使用時(shí)通過(guò)importjieba導(dǎo)入。主要利用中文詞庫(kù)確定漢字之間的關(guān)聯(lián)概率,將使用者提供的一段中文文本切分為獨(dú)立詞語(yǔ);除分詞外用戶還可自定義添加詞組。Jieba分詞主要有三種模式:=1\*GB3①精確模式:可對(duì)文本內(nèi)容進(jìn)行精確劃分,使得所得結(jié)果內(nèi)不存在冗雜詞匯;=2\*GB3②全模式:該模式下可將文本中所有可能構(gòu)成的詞語(yǔ)掃描出來(lái),速度非常快,該模式下無(wú)法解決歧義;=3\*GB3③搜索引擎模式:是在精確模式的基礎(chǔ)上對(duì)長(zhǎng)詞再次切分,能夠提高召回率,主要適用于搜索引擎分詞。TF-IDF是一種用于信息檢索與數(shù)據(jù)挖掘的常用加權(quán)技術(shù),常用于挖掘文章中的關(guān)鍵詞,而且算法簡(jiǎn)單高效,常被工業(yè)用于最開(kāi)始的文本數(shù)據(jù)清洗。TF-IDF技術(shù)相較其他而言簡(jiǎn)單快速,有關(guān)技術(shù)原理容易理解。但在實(shí)際使用過(guò)程中用詞頻來(lái)衡量文章中的一個(gè)詞是否重要稍顯片面不夠有理有據(jù);某些時(shí)候重要的詞出現(xiàn)的可能不夠多。除此以外這種計(jì)算無(wú)法體現(xiàn)位置信息,無(wú)法體現(xiàn)某一詞在文章結(jié)構(gòu)中的重要性。Gensim是一款開(kāi)源的第三方Python工具包,用于從原始的非結(jié)構(gòu)化的文本中,無(wú)監(jiān)督地學(xué)習(xí)到文本隱層的主題向量表達(dá)。主要優(yōu)勢(shì)在于可高速處理大規(guī)模文本數(shù)據(jù),它支持包括TF-IDF,LSA,LDA和word2vec在內(nèi)的多種主題模型算法。語(yǔ)料庫(kù)制作主要包含兩個(gè)過(guò)程:=1\*GB3①獲取詞袋:本文主要來(lái)自于jieba分詞結(jié)果;=2\*GB3②向量轉(zhuǎn)換:對(duì)獲取的詞袋進(jìn)行向量轉(zhuǎn)換。前期調(diào)研為獲得相對(duì)客觀的體育中考實(shí)施情況,探求在體育中考這一政策中廣泛采用的項(xiàng)目設(shè)置,筆者實(shí)地探訪海南白沙金波實(shí)驗(yàn)學(xué)校,并委托在海南省各地實(shí)習(xí)的同學(xué)與當(dāng)?shù)伢w育教師交流,收集學(xué)生實(shí)際參考體育項(xiàng)目情況。結(jié)合論文研究需要,通過(guò)訪問(wèn)中國(guó)知網(wǎng)、各省市教育局官方網(wǎng)站、各地政務(wù)服務(wù)平臺(tái)等途徑檢索了有關(guān)體育中考項(xiàng)目設(shè)置的有效政策、文件及相關(guān)論文等文獻(xiàn)資料,對(duì)收集到的資料進(jìn)行匯總歸納整理。利用Excel軟件對(duì)收集到的數(shù)據(jù)進(jìn)行簡(jiǎn)單預(yù)處理后對(duì)相關(guān)數(shù)據(jù)進(jìn)行整理歸類(lèi)匯總,利用統(tǒng)計(jì)軟件SPSSAU分析得出我國(guó)部分城市體育中考項(xiàng)目設(shè)置[4]。本次總共收集來(lái)自我國(guó)31個(gè)行政區(qū)(除澳門(mén)香港特別行政、臺(tái)灣省外,部分省份僅采用省會(huì)城市體考方案或2023年體育考核方案)體育中考項(xiàng)目設(shè)置信息。本次統(tǒng)計(jì)篩選出入選頻次較高的身體素質(zhì)類(lèi)項(xiàng)目與運(yùn)動(dòng)技能,具體如下圖。圖3-1各省體育中考項(xiàng)目設(shè)置據(jù)此發(fā)現(xiàn)中長(zhǎng)跑(男子1000m,女子800m)在多地出臺(tái)的考核標(biāo)準(zhǔn)中均作為必考項(xiàng)目,多地學(xué)生也反饋該項(xiàng)目在體育中考項(xiàng)目中分?jǐn)?shù)占比較大,難度較大,在項(xiàng)目上的練習(xí)時(shí)間較長(zhǎng)。以某視頻為例的分析數(shù)據(jù)處理導(dǎo)出爬蟲(chóng)獲取的數(shù)據(jù)后首要是進(jìn)行數(shù)據(jù)清洗工作,主要包括去重和正則清洗兩個(gè)步驟:首先,通過(guò)使用drop_duplicates函數(shù)對(duì)原始數(shù)據(jù)進(jìn)行去重操作。在代碼中,根據(jù)評(píng)論內(nèi)容這一列進(jìn)行去重,并將去重后的結(jié)果重新賦值給新的DataFrame。這樣可以確保每條評(píng)論內(nèi)容的唯一性,避免出現(xiàn)重復(fù)的數(shù)據(jù)。接下來(lái),進(jìn)行正則清洗的步驟。正則清洗主要是針對(duì)評(píng)論內(nèi)容這一列的內(nèi)容,去除除了中英文字符和數(shù)字以外的其他字符。具體實(shí)現(xiàn)通過(guò)使用正則表達(dá)式的方式,調(diào)用re.sub函數(shù)進(jìn)行替換。在代碼中,使用正則表達(dá)式[^\u4e00-\u9fa5^a-z^A-Z^0-9^,.,。?。篯|,將評(píng)論內(nèi)容中除了中英文字符、數(shù)字和部分標(biāo)點(diǎn)符號(hào)(逗號(hào)、句號(hào)、感嘆號(hào)、冒號(hào))以外的字符都替換為空格,從而實(shí)現(xiàn)清洗效果。清洗后的結(jié)果保存為新的DataFrame,并將其寫(xiě)入Excel文件。通過(guò)這樣的數(shù)據(jù)清洗過(guò)程,可以確保數(shù)據(jù)的準(zhǔn)確性和一致性,使得后續(xù)的數(shù)據(jù)分析和處理更加可靠和有效。主要關(guān)注點(diǎn)分析在該環(huán)節(jié)需要使用到前文所訴TF-IDF技術(shù)。TF計(jì)算公式如下:tfTF其中是ni,j該詞在文件dj中出現(xiàn)的次數(shù),分母則是文件djIDF其中D表示文件總數(shù),Di實(shí)現(xiàn)評(píng)論內(nèi)容主要關(guān)注點(diǎn)的詞頻分析可以按照以下步驟進(jìn)行:首先讀取經(jīng)過(guò)數(shù)據(jù)清洗的評(píng)論內(nèi)容數(shù)據(jù)。使用jieba庫(kù)對(duì)每條評(píng)論內(nèi)容進(jìn)行分詞處理,得到分詞后的結(jié)果。創(chuàng)建一個(gè)空的列表或字典用于存儲(chǔ)詞頻統(tǒng)計(jì)結(jié)果(本次文章數(shù)據(jù)主要利用groupby函數(shù)進(jìn)行統(tǒng)計(jì))。遍歷分詞結(jié)果列表,對(duì)每個(gè)詞語(yǔ)進(jìn)行詞頻統(tǒng)計(jì),將詞語(yǔ)及其出現(xiàn)次數(shù)添加到詞頻統(tǒng)計(jì)結(jié)果中。對(duì)詞頻統(tǒng)計(jì)結(jié)果進(jìn)行排序,可以按照詞頻降序排列。本次論文共爬取到有關(guān)數(shù)據(jù)六千加,為減少不必要工作量,設(shè)定閾值,過(guò)濾掉低頻詞語(yǔ),只保留出現(xiàn)頻率較高的詞語(yǔ);此外采取手動(dòng)錄入與實(shí)際應(yīng)用無(wú)關(guān)的“停用詞”保證分析范圍的有效性。最后將詞頻統(tǒng)計(jì)結(jié)果進(jìn)行可視化展示如下。圖4-1主要關(guān)注點(diǎn)詞云圖從圖中可以看出在該自動(dòng)推送視頻評(píng)論區(qū)下觀眾多在描述表達(dá)自己有關(guān)情感感受、關(guān)注該項(xiàng)目體育考試成績(jī)及尋求某具體問(wèn)題解決方案。LDA主題分析LDA主題分析的實(shí)現(xiàn)過(guò)程如下:首要準(zhǔn)備好經(jīng)過(guò)數(shù)據(jù)清洗和預(yù)處理的文本數(shù)據(jù)。使用gensim庫(kù)構(gòu)建語(yǔ)料庫(kù)和詞袋模型,將文本數(shù)據(jù)轉(zhuǎn)換為可用于LDA模型的格式。設(shè)置LDA模型的參數(shù),包括主題數(shù)量、迭代次數(shù)、詞頻閾值等。使用LDA模型訓(xùn)練語(yǔ)料庫(kù),并得到主題-詞語(yǔ)分布和文檔-主題分布。根據(jù)需求,選擇合適的方法獲取每個(gè)主題的關(guān)鍵詞,可以是按照權(quán)重排序或者設(shè)定閾值篩選??梢允褂胮yLDAvis庫(kù)對(duì)LDA模型進(jìn)行可視化,生成交互式的主題模型可視化圖表,并保存為HTML文件。分析LDA主題分析結(jié)果,根據(jù)關(guān)鍵詞和文檔-主題分布了解每個(gè)主題的含義和特點(diǎn),理解文本數(shù)據(jù)中不同主題的分布情況??梢赃M(jìn)一步對(duì)文本數(shù)據(jù)進(jìn)行主題分析,根據(jù)文檔-主題分布確定每個(gè)文檔最可能的主題,并將主題信息添加到原始數(shù)據(jù)中。本次論文有關(guān)分析基于余弦相似度進(jìn)行,主要是通過(guò)計(jì)算兩個(gè)夾角的余弦值來(lái)評(píng)估它們之間的相似度,與歐氏距離相比,更加注重兩個(gè)向量在方向上的差異。該算法將向量根據(jù)坐標(biāo)值繪制到向量空間中,計(jì)算兩向量的夾角θ,通過(guò)θ的大小去判斷兩向量的相似程度。夾角越小說(shuō)明越相似,反之則不相似。假設(shè)存在兩個(gè)n維向量A和B,A=[A1,A2...,An],B=[B1,B2...,Bn],則A與B的夾角的余弦由確定。余弦值總是在[1,1]之間,余弦值越趨近于1,代表兩向量方向越接近;越趨近于1,代表兩向量方向越相反;接近于0,代表兩個(gè)向量近乎正交。一般情況下,需要將相似度歸一化到[0,1]區(qū)間內(nèi),由確定。通過(guò)計(jì)算,篩選后數(shù)據(jù)最佳主題數(shù)為3圖4-2評(píng)論LDA主題數(shù)尋優(yōu)情感分析本文適用snownlp庫(kù)進(jìn)行情感分析,對(duì)所獲取的六千加評(píng)論內(nèi)容列進(jìn)行情感分計(jì)算,將大于0.7分定為積極,介于0.3-0.7定為中性,小于0.3定為消極。本文采用的情感評(píng)分算法公式為:情感評(píng)分=(積極詞個(gè)數(shù)×積極詞的權(quán)重)-(消極詞個(gè)數(shù)×消極詞的權(quán)重)+(中性詞個(gè)數(shù)×中性詞的權(quán)重),完成計(jì)算后統(tǒng)計(jì)輸出結(jié)果。圖4-3評(píng)論情感分析占比評(píng)論區(qū)消極詞匯多為觀眾在表達(dá)自己對(duì)該項(xiàng)體育項(xiàng)目測(cè)試的悲觀態(tài)度,表明考生在日常參與訓(xùn)練時(shí)往往對(duì)該項(xiàng)目存在抵觸甚至于厭惡心理,無(wú)法排解自身對(duì)該項(xiàng)目的恐慌情緒。從側(cè)面說(shuō)明除必要的身體素質(zhì)訓(xùn)練外相關(guān)從業(yè)者需要關(guān)注受試者的心理素質(zhì)狀況,適當(dāng)安排趣味化訓(xùn)練以激發(fā)學(xué)生學(xué)習(xí)熱情,克服負(fù)面情緒情感。積極詞匯多為觀眾感謝視頻創(chuàng)作者的內(nèi)容分享及互相鼓勵(lì),說(shuō)明該視頻實(shí)現(xiàn)了較為良好的雙向交流平臺(tái)建立。從側(cè)面反映該條視頻內(nèi)容質(zhì)優(yōu)且適合尋求認(rèn)同感或需要情緒價(jià)值提供的小伙伴??偨Y(jié)與展望總結(jié)與反思筆者作為非大數(shù)據(jù)專(zhuān)業(yè)學(xué)生對(duì)Python語(yǔ)言及各項(xiàng)大數(shù)據(jù)有關(guān)技術(shù)的認(rèn)識(shí)和實(shí)際應(yīng)用難免會(huì)有所缺失,在分析環(huán)節(jié)會(huì)由于缺乏完整的技術(shù)理論體系支撐而使所做研究略顯片面單薄。在當(dāng)前各種世界發(fā)展趨勢(shì)下,大數(shù)據(jù)技術(shù)仍可跨界應(yīng)用于多領(lǐng)域的數(shù)據(jù)分析,本文旨在通過(guò)一個(gè)實(shí)例研究探求有關(guān)技術(shù)與體育短視頻創(chuàng)作行業(yè)的跨界融合的可能性,并完成一些力所能及的前期準(zhǔn)備。展望由于本科階段知識(shí)儲(chǔ)備能力有所限制,筆者僅能對(duì)單一視頻進(jìn)行分析與探究,且途中所采用的各類(lèi)算法還有待優(yōu)化。目前單一短視頻推薦容易存在推薦模式固化,無(wú)法結(jié)合學(xué)生個(gè)性化需求和偏好來(lái)提供符合個(gè)體差異的個(gè)性化方案。
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026年電子工程師電子技術(shù)與設(shè)備維護(hù)實(shí)踐考試題
- 客運(yùn)企業(yè)交通安全
- 天保護(hù)林員培訓(xùn)課件
- 2026年河南輕工職業(yè)學(xué)院?jiǎn)握芯C合素質(zhì)考試模擬試題含詳細(xì)答案解析
- 2026年天津商務(wù)職業(yè)學(xué)院?jiǎn)握芯C合素質(zhì)筆試備考題庫(kù)含詳細(xì)答案解析
- 2026年江西藝術(shù)職業(yè)學(xué)院?jiǎn)握芯C合素質(zhì)考試參考題庫(kù)含詳細(xì)答案解析
- 2026年汕尾職業(yè)技術(shù)學(xué)院?jiǎn)握芯C合素質(zhì)考試參考題庫(kù)含詳細(xì)答案解析
- 2026年貴州經(jīng)貿(mào)職業(yè)技術(shù)學(xué)院高職單招職業(yè)適應(yīng)性測(cè)試模擬試題及答案詳細(xì)解析
- 2026年深圳信息職業(yè)技術(shù)學(xué)院?jiǎn)握芯C合素質(zhì)筆試備考題庫(kù)含詳細(xì)答案解析
- 2026年陜西交通職業(yè)技術(shù)學(xué)院?jiǎn)握芯C合素質(zhì)筆試備考題庫(kù)含詳細(xì)答案解析
- 主播合作協(xié)議解除協(xié)議書(shū)
- 臨床檢驗(yàn)初級(jí)師歷年試題及答案2025版
- 文第19課《井岡翠竹》教學(xué)設(shè)計(jì)+2024-2025學(xué)年統(tǒng)編版語(yǔ)文七年級(jí)下冊(cè)
- 干部教育培訓(xùn)行業(yè)跨境出海戰(zhàn)略研究報(bào)告
- 車(chē)庫(kù)使用協(xié)議合同
- 組件設(shè)計(jì)文檔-MBOM構(gòu)型管理
- 《不在網(wǎng)絡(luò)中迷失》課件
- 山東省泰安市2024-2025學(xué)年高一物理下學(xué)期期末考試試題含解析
- 竹子產(chǎn)業(yè)發(fā)展策略
- 【可行性報(bào)告】2023年硫精砂項(xiàng)目可行性研究分析報(bào)告
- 2024-2025年上海中考英語(yǔ)真題及答案解析
評(píng)論
0/150
提交評(píng)論