版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
FiveProgrammingLanguagesforBigData
Unit
7TextAContents
NewWords
Abbreviations
Phrases參考譯文NewWordsNewWordsPhrasesAbbreviationsListeningtoTextA用于大數(shù)據(jù)的五種編程語(yǔ)言大數(shù)據(jù)專業(yè)人員必須做出的最重要的決定之一,尤其是對(duì)于那些剛進(jìn)圈子或剛剛起步的人來(lái)說(shuō),就是為大數(shù)據(jù)操作和分析選擇最佳的編程語(yǔ)言。如今,僅了解大數(shù)據(jù)問(wèn)題并構(gòu)筑架構(gòu)以解決該問(wèn)題還遠(yuǎn)遠(yuǎn)不夠,也要完美執(zhí)行,而且選擇正確的語(yǔ)言任重而道遠(yuǎn)。以下是大數(shù)據(jù)最常用的五種編程語(yǔ)言。1.Python根據(jù)最近舉行的StackOverflow開(kāi)發(fā)人員調(diào)查,Python已被宣布為2018年增長(zhǎng)最快的編程語(yǔ)言之一。它的通用性意味著它可以廣泛使用于各種用例中,大數(shù)據(jù)編程是應(yīng)用程序的一個(gè)主要領(lǐng)域。大數(shù)據(jù)框架中越來(lái)越多地使用許多用于數(shù)據(jù)分析和處理的庫(kù)來(lái)清洗和處理大塊數(shù)據(jù),例如pandas、NumPy、SciPy都是基于Python的。不僅如此,大多數(shù)流行的機(jī)器學(xué)習(xí)和深度學(xué)習(xí)框架(例如scikit-learn、Tensorflow等)也都使用Python編寫,并且正在大數(shù)據(jù)生態(tài)系統(tǒng)中得到越來(lái)越多的應(yīng)用。使用Python的一個(gè)缺點(diǎn)是它運(yùn)行緩慢,這也是為什么它在大數(shù)據(jù)編程方面還不是一流選手的原因。盡管非常易于使用,但大數(shù)據(jù)專業(yè)人員發(fā)現(xiàn)使用Java或Scala等語(yǔ)言構(gòu)建的系統(tǒng)比使用Python構(gòu)建的系統(tǒng)更快速、更強(qiáng)大。參考譯文但是,Python用其他質(zhì)量彌補(bǔ)了這一限制。由于Python主要是一種腳本語(yǔ)言,因此交互式編碼和大數(shù)據(jù)分析解決方案的開(kāi)發(fā)變得非常容易。Python可以輕松地與現(xiàn)有的大數(shù)據(jù)框架(例如ApacheHadoop和ApacheSpark)集成,從而使你能夠大規(guī)模執(zhí)行預(yù)測(cè)分析。為什么我們將Python用于大數(shù)據(jù)??它是通用的。?擁有豐富的數(shù)據(jù)分析和機(jī)器學(xué)習(xí)庫(kù)。?它容易使用。?它支持迭代開(kāi)發(fā)。?它集成了豐富的大數(shù)據(jù)工具。?通過(guò)Jupyter筆記本進(jìn)行交互式計(jì)算。參考譯文參考譯文2.R喜歡統(tǒng)計(jì)的人就喜歡R,很多人對(duì)此并不會(huì)感到驚訝。R被普遍稱為“統(tǒng)計(jì)語(yǔ)言”,用于建立有效而準(zhǔn)確的數(shù)據(jù)分析的數(shù)據(jù)模型。在大型R包存儲(chǔ)庫(kù)(CRAN,也稱為綜合R存檔網(wǎng)絡(luò))的支持下,使用R,你幾乎擁有完成大數(shù)據(jù)處理中的任何任務(wù)的所有類型的工具——從分析到數(shù)據(jù)可視化。R可以與ApacheHadoop和ApacheSpark以及其他流行框架無(wú)縫集成,用于大數(shù)據(jù)處理和分析。使用R作為大數(shù)據(jù)編程語(yǔ)言的一個(gè)問(wèn)題是它不是很通用。這意味著用R編寫的代碼不可用于產(chǎn)品部署,并且通常必須轉(zhuǎn)換為某些其他編程語(yǔ)言,例如Python或Java。也就是說(shuō),如果你的目標(biāo)只是為大數(shù)據(jù)分析構(gòu)建統(tǒng)計(jì)模型,那么你絕對(duì)應(yīng)該考慮使用R。為什么我們將R用于大數(shù)據(jù)??它是為數(shù)據(jù)科學(xué)而構(gòu)建的。?它支持Hadoop和Spark。?它具有強(qiáng)大的統(tǒng)計(jì)建模和可視化功能。?它支持Jupyter筆記本。3.Java老伙計(jì)Java總是很棒。一些傳統(tǒng)的大數(shù)據(jù)框架(例如ApacheHadoop)及其生態(tài)系統(tǒng)中的所有工具都是基于Java的,如今它們?nèi)栽谠S多企業(yè)中使用。更不用說(shuō)Java是迄今為止我們討論過(guò)的所有語(yǔ)言中最穩(wěn)定和最現(xiàn)成的語(yǔ)言!使用Java開(kāi)發(fā)大數(shù)據(jù)應(yīng)用程序使你能夠使用大型的工具和庫(kù)生態(tài)系統(tǒng)來(lái)實(shí)現(xiàn)互操作性、監(jiān)控以及更多功能,其中大多數(shù)已經(jīng)過(guò)嘗試和測(cè)試。Java的主要缺點(diǎn)之一是冗長(zhǎng)。你必須用Java編寫數(shù)百行代碼來(lái)完成一項(xiàng)任務(wù),而該任務(wù)用Python或Scala幾乎只編寫15-20行代碼就行了,這一事實(shí)可能會(huì)使許多新手程序員望而卻步。但是,在Java8中引入lambda函數(shù)確實(shí)使生活變得更加輕松。與Python等較新的語(yǔ)言不同,Java不支持迭代開(kāi)發(fā),這是將來(lái)的Java版本關(guān)注的領(lǐng)域。盡管Java存在缺陷,但在大數(shù)據(jù)編程的首選語(yǔ)言方面它仍然是強(qiáng)大的競(jìng)爭(zhēng)者。為什么我們將Java用于大數(shù)據(jù)??傳統(tǒng)的大數(shù)據(jù)工具和框架是用Java編寫的。?穩(wěn)定且現(xiàn)成。?它是一個(gè)由久經(jīng)考驗(yàn)的工具和庫(kù)組成的大型生態(tài)系統(tǒng)。
參考譯文4.GoGo是最近發(fā)展最快的編程語(yǔ)言之一。由一群對(duì)C++感到沮喪的谷歌工程師設(shè)計(jì),我們認(rèn)為Go在此列表中是一個(gè)不錯(cuò)的選擇,這僅僅是因?yàn)樗С执髷?shù)據(jù)基礎(chǔ)架構(gòu)中使用的許多工具,包括Kubernetes、Docker等。Go快速、易學(xué)且易用。更重要的是,隨著企業(yè)希望構(gòu)建可大規(guī)模運(yùn)行的數(shù)據(jù)分析系統(tǒng),基于Go的系統(tǒng)已用于集成機(jī)器學(xué)習(xí)和數(shù)據(jù)的并行處理。還可以相對(duì)輕松地將其他語(yǔ)言與基于Go的系統(tǒng)進(jìn)行接口。為什么我們將Go用于大數(shù)據(jù)??快速且易于使用。?大數(shù)據(jù)基礎(chǔ)架構(gòu)中使用的許多工具都是基于Go的。?具有高效的分布式計(jì)算。參考譯文參考譯文5.Scala最后但并非最不重要的是Scala。Scala是面向?qū)ο蠛秃瘮?shù)式編程范式的完美結(jié)合,它既快速又健壯,是許多大數(shù)據(jù)專業(yè)人士常用的語(yǔ)言選擇。事實(shí)上,在ApacheSpark和ApacheKafka中兩個(gè)最受歡迎的大數(shù)據(jù)處理框架構(gòu)建在Scala之上,這可告訴你有關(guān)Scala功能的所有信息。Scala在JVM上運(yùn)行,這意味著用Scala編寫的代碼可以在基于Java的大數(shù)據(jù)生態(tài)系統(tǒng)中輕松使用。不過(guò),使Scala與Java不同的一個(gè)重要因素是,相比之下,Scala要簡(jiǎn)潔得多。你可以在Scala中用不到15行來(lái)編寫數(shù)百行看上去令人困惑的Java代碼。但是,與Go和Python之類的語(yǔ)言相比,Scala的不利方面是其陡峭的學(xué)習(xí)曲線,這可能會(huì)使初學(xué)者不愿使用它。為什么我們將Scala用于大數(shù)據(jù)??它快速而強(qiáng)大。?它適合與ApacheSpark等大數(shù)據(jù)工具一起用于分布式大數(shù)據(jù)處理。?它適用于JVM,可以在基于Java的生態(tài)系統(tǒng)中使用。你可能還需要考慮其他幾種語(yǔ)言——Julia、SAS和MATLAB是一些主要的語(yǔ)言,它們本身就很有用。但是,與我們上面討論的語(yǔ)言相比,我們認(rèn)為它們?cè)谀承┓矫嬗兴啡薄獰o(wú)論在速度、效率、易用性、文檔還是社區(qū)支持等方面?,F(xiàn)在出現(xiàn)的問(wèn)題是:你應(yīng)該選擇哪種語(yǔ)言?這完全取決于你要做什么。如果你的重點(diǎn)是涉及大量統(tǒng)計(jì)計(jì)算的核心數(shù)據(jù)分析,那么R將是你的首選語(yǔ)言。另一方面,如果你想為大數(shù)據(jù)開(kāi)發(fā)流應(yīng)用程序,Scala可能是一個(gè)更好的選擇。如果你希望使用機(jī)器學(xué)習(xí)并構(gòu)建預(yù)測(cè)模型,那么Python將助你一臂之力。最后,如果你打算僅使用傳統(tǒng)上可用的工具來(lái)構(gòu)建大數(shù)據(jù)解決方案,那么Java是適合你的語(yǔ)言。你還可以選擇結(jié)合兩種
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 嗆奶的課件教學(xué)課件
- 遼寧省2025秋九年級(jí)英語(yǔ)全冊(cè)Unit10You'resupposedtoshakehands課時(shí)5SectionB(2a-2e)課件新版人教新目標(biāo)版
- 2025年塑料家具項(xiàng)目發(fā)展計(jì)劃
- 黃疸的飲食調(diào)整與護(hù)理
- VSD護(hù)理技巧分享
- 疝氣護(hù)理中的疼痛評(píng)估與處理
- 耳鳴的藥物治療與非藥物治療
- 護(hù)理人文素養(yǎng)與手術(shù)室護(hù)理
- 員工培訓(xùn)課件app
- 護(hù)理差錯(cuò)防范:培訓(xùn)與教育策略
- 《建筑業(yè)10項(xiàng)新技術(shù)(2025)》全文
- GB/T 34107-2017軌道交通車輛制動(dòng)系統(tǒng)用精密不銹鋼無(wú)縫鋼管
- GB/T 31402-2015塑料塑料表面抗菌性能試驗(yàn)方法
- GB/T 20969.3-2007特殊環(huán)境條件高原機(jī)械第3部分:高原型工程機(jī)械選型、驗(yàn)收規(guī)范
- 最新-脂肪性肝病課件
- 眼科OCT異常圖譜解讀
- DB11- 996-2013-城鄉(xiāng)規(guī)劃用地分類標(biāo)準(zhǔn)-(高清有效)
- 風(fēng)光互補(bǔ)系統(tǒng)實(shí)驗(yàn)(圣威科技)王鑫
- 1-院前急救風(fēng)險(xiǎn)管理
- 古典園林分析之郭莊講解課件
- 核電工程質(zhì)量保證知識(shí)培訓(xùn)教材PPT課件
評(píng)論
0/150
提交評(píng)論