版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
reduceByKey算子
引言reduceByKey算子應(yīng)用分析與示例/01引言
引言轉(zhuǎn)換算子行動(dòng)算子算子reduceByKey算子/02reduceByKey算子應(yīng)用分析與示例reduceByKey算子應(yīng)用分析與示例reduceByKey屬于Transformation算子
在一個(gè)(K,V)對(duì)的數(shù)據(jù)集上使用,返回一個(gè)(K,V)對(duì)的數(shù)據(jù)集,key相同的值,都被使用指定的reduce函數(shù)聚合到一起。
和groupbykey類似,任務(wù)的個(gè)數(shù)是可以通過第二個(gè)可選參數(shù)來配置的。scala>valrdd0=sc.parallelize(Array((1,1),(1,2),(1,3),(2,1),(2,2),(2,3)),3)scala>valrdd6=rdd0.reduceByKey((x,y)=>x+y)rdd6:org.apache.spark.rdd.RDD[(Int,Int)]=ShuffledRDD[3]atreduceByKeyat:25scala>rdd6.collectres9:Array[(Int,Int)]=Array((1,6),(2,6))例子一按key求和
valrdd=sc.parallelize(List((“a”,2),(“b”,3),(“a”,3)))合并key計(jì)算
valr1=rdd.reduceByKey((x,y)=>x+y)輸出結(jié)果如下
reduceByKey算子應(yīng)用分析與示例
若有一些spark書和Hadoop的書,要求兩本書各自銷量的平均值數(shù)據(jù)如下先創(chuàng)建一個(gè)rdd分析下數(shù)據(jù),要想求平均值,必須算出總的價(jià)格,要對(duì)不同書進(jìn)行分組,求每組書的數(shù)量reduceByKey算子應(yīng)用分析與示例
)因?yàn)閙apValues是對(duì)值的操作,不操作key,打印結(jié)果如下接著需要按key進(jìn)行reduce,讓key合并reduceByKey算子應(yīng)用分析與示例
變量說明:
當(dāng)將spark進(jìn)行reduce后
這里的(x,y)表示的是(10,1)(20,1)
x._1表示10,x._2表示1
y._1表示20,y._2表示1
這樣通過計(jì)算得到的就是如下結(jié)果reduceByKey算子應(yīng)用分析與示例
接著要對(duì)value進(jìn)行操作,用mapValues()就可以打印結(jié)果如下reduceByKey算子應(yīng)用分析與示例
Hive數(shù)據(jù)庫介紹
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 水土保持治理工安全教育強(qiáng)化考核試卷含答案
- 電商咨詢師風(fēng)險(xiǎn)評(píng)估與管理評(píng)優(yōu)考核試卷含答案
- 注水泵工操作能力強(qiáng)化考核試卷含答案
- 多膛爐焙燒工操作競(jìng)賽考核試卷含答案
- 起重裝卸機(jī)械智能控制員安全風(fēng)險(xiǎn)測(cè)試考核試卷含答案
- 老年癲癇手術(shù)麻醉的腦電監(jiān)測(cè)應(yīng)用
- 2026山東省青島市城陽區(qū)教育系統(tǒng)招聘高層次緊缺急需人才180人備考題庫附答案詳解
- 2026四川長(zhǎng)虹物業(yè)服務(wù)有限責(zé)任公司綿陽分公司招聘環(huán)境專員兼行政助理崗位1人備考題庫及答案詳解(新)
- 虛擬現(xiàn)實(shí)技術(shù)的未來展望
- 2025河北張家口市康保縣二人臺(tái)藝術(shù)團(tuán)第二次招聘專業(yè)演職人員5人備考題庫含答案詳解
- 《認(rèn)識(shí)時(shí)鐘》大班數(shù)學(xué)教案
- 新疆維吾爾自治區(qū)伊犁哈薩克自治州2023-2024學(xué)年八年級(jí)下學(xué)期期中數(shù)學(xué)試題
- 人工智能在專業(yè)通信領(lǐng)域的應(yīng)用
- T-CI 178-2023 高大邊坡穩(wěn)定安全智能監(jiān)測(cè)預(yù)警技術(shù)規(guī)范
- THHPA 001-2024 盆底康復(fù)管理質(zhì)量評(píng)價(jià)指標(biāo)體系
- 傷口的美容縫合減少瘢痕的形成
- MSOP(測(cè)量標(biāo)準(zhǔn)作業(yè)規(guī)范)測(cè)量SOP
- 顱鼻眶溝通惡性腫瘤的治療及護(hù)理
- 人教版四年級(jí)《上冊(cè)語文》期末試卷(附答案)
- 四川山體滑坡地質(zhì)勘察報(bào)告
- 青島啤酒微觀運(yùn)營(yíng)
評(píng)論
0/150
提交評(píng)論