大數(shù)據(jù)專業(yè)英語教程 課件 Unit 1 A Big Data Basics_第1頁(yè)
大數(shù)據(jù)專業(yè)英語教程 課件 Unit 1 A Big Data Basics_第2頁(yè)
大數(shù)據(jù)專業(yè)英語教程 課件 Unit 1 A Big Data Basics_第3頁(yè)
大數(shù)據(jù)專業(yè)英語教程 課件 Unit 1 A Big Data Basics_第4頁(yè)
大數(shù)據(jù)專業(yè)英語教程 課件 Unit 1 A Big Data Basics_第5頁(yè)
已閱讀5頁(yè),還剩15頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

BigDataBasics

Unit

1TextAContents

NewWords

Abbreviations

Phrases參考譯文NewWordsNewWordsNewWordsNewWordsPhrasesPhrasesAbbreviationsListeningtoTextA大數(shù)據(jù)基礎(chǔ)1.什么是大數(shù)據(jù)?根據(jù)Gartner的說法,大數(shù)據(jù)是大容量、快速和多樣的信息資產(chǎn),它們需要經(jīng)濟(jì)高效的創(chuàng)新的信息處理形式,以增強(qiáng)洞察力和決策能力。這個(gè)定義清楚地回答了“什么是大數(shù)據(jù)?”這一問題。大數(shù)據(jù)是指必須處理和分析的復(fù)雜和巨大的數(shù)據(jù)集,以發(fā)現(xiàn)可以使企業(yè)和組織受益的有價(jià)值的信息。但是,大數(shù)據(jù)有一些基本原則,這使得回答什么是大數(shù)據(jù)變得更加簡(jiǎn)單:?它是指大量數(shù)據(jù),其隨著時(shí)間呈指數(shù)增長(zhǎng)。?它是如此龐大,以至于無法使用常規(guī)數(shù)據(jù)處理技術(shù)進(jìn)行處理或分析。?它包括數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)挖掘、數(shù)據(jù)分析、數(shù)據(jù)共享和數(shù)據(jù)可視化。?該術(shù)語是一個(gè)全面的術(shù)語,包括數(shù)據(jù)、數(shù)據(jù)框架以及用于處理和分析數(shù)據(jù)的工具和技術(shù)。參考譯文1.大數(shù)據(jù)的特征2.1數(shù)據(jù)量大大數(shù)據(jù)意味著海量數(shù)據(jù)。它曾經(jīng)是員工創(chuàng)建的數(shù)據(jù)?,F(xiàn)在,因?yàn)閿?shù)據(jù)是由機(jī)器、網(wǎng)絡(luò)和諸如社交媒體之類的系統(tǒng)上的人員交互生成的,因此要分析的數(shù)據(jù)量很大。2.2多樣性多樣性指結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)有許多來源和類型。我們?cè)?jīng)存儲(chǔ)來自電子表格和數(shù)據(jù)庫(kù)等來源的數(shù)據(jù)?,F(xiàn)在,數(shù)據(jù)以電子郵件、照片、視頻、音頻、監(jiān)視設(shè)備、PDF等形式出現(xiàn)。各種各樣的非結(jié)構(gòu)化數(shù)據(jù)給存儲(chǔ)、挖掘和分析數(shù)據(jù)帶來了麻煩。2.3高速性大數(shù)據(jù)速度處理數(shù)據(jù)從業(yè)務(wù)流程、機(jī)器、網(wǎng)絡(luò)以及人類與社交媒體站點(diǎn)交互、移動(dòng)設(shè)備等流入的速度。數(shù)據(jù)流很大而且是連續(xù)的。這些實(shí)時(shí)數(shù)據(jù)可以幫助研究人員和企業(yè)做出有價(jià)值的決策,如果您能夠掌握數(shù)據(jù)流入的速度,則可以提供戰(zhàn)略競(jìng)爭(zhēng)優(yōu)勢(shì)和投資回報(bào)率。參考譯文參考譯文2.4真實(shí)性大數(shù)據(jù)真實(shí)性是指數(shù)據(jù)中的偏差、噪聲和異常。存儲(chǔ)和挖掘的數(shù)據(jù)是否對(duì)正在分析的問題有意義?在制定大數(shù)據(jù)策略時(shí),你需要團(tuán)隊(duì)和合作伙伴共同努力,以保持?jǐn)?shù)據(jù)干凈并防止“臟數(shù)據(jù)”在系統(tǒng)中累積。2.5有效性就像大數(shù)據(jù)的真實(shí)性一樣,有效性的問題也意味著數(shù)據(jù)對(duì)于預(yù)期用途而言是正確且準(zhǔn)確的。明確有效的數(shù)據(jù)是做出正確決策的關(guān)鍵。2.6易變性大數(shù)據(jù)易變性是指數(shù)據(jù)有效期為多長(zhǎng)時(shí)間以及數(shù)據(jù)應(yīng)存儲(chǔ)多長(zhǎng)時(shí)間。在實(shí)時(shí)數(shù)據(jù)的世界中,需要確定數(shù)據(jù)在什么時(shí)候不再與當(dāng)前分析相關(guān)。大數(shù)據(jù)顯然涉及的問題不僅限于數(shù)量、多樣和速度,還涉及其他問題,如真實(shí)性、有效性和易變性。3.大數(shù)據(jù)如何工作?大數(shù)據(jù)背后的主要思想是:對(duì)某一事情了解得越多就越能獲得洞察力,更能做出決定或找到解決方案。在大多數(shù)情況下,此過程是完全自動(dòng)化的。但要在分析工具、機(jī)器學(xué)習(xí)甚至人工智能的幫助下實(shí)現(xiàn)這一目標(biāo),需要了解大數(shù)據(jù)的工作原理并正確設(shè)置一切。處理大量數(shù)據(jù)需要一個(gè)真正穩(wěn)定且結(jié)構(gòu)良好的基礎(chǔ)架構(gòu)。它將快速處理海量和不同類型的數(shù)據(jù),這可能會(huì)使單個(gè)服務(wù)器或群集過載。這就是為什么需要在大數(shù)據(jù)背后擁有一個(gè)經(jīng)過深思熟慮的系統(tǒng)。應(yīng)該根據(jù)系統(tǒng)容量考慮所有過程。對(duì)于大型公司來說,這可能需要成百上千的服務(wù)器。你可以想象,這可能要花費(fèi)大量的資金。當(dāng)你添加所需的所有工具時(shí),費(fèi)用就多了。因此,你需要了解大數(shù)據(jù)三個(gè)主要操作,以便可以事先計(jì)劃預(yù)算,并構(gòu)建最佳的系統(tǒng)。

參考譯文3.1整合大數(shù)據(jù)總是從許多來源收集的,因此需要找到處理巨量信息的新策略和技術(shù)。在某些情況下,我們正在談?wù)摿魅肽阆到y(tǒng)的PB級(jí)信息,因此將如此大量的信息集成到你的系統(tǒng)中將是一個(gè)挑戰(zhàn)。你必須按照業(yè)務(wù)需要和客戶可以理解的正確格式來接收、處理和格式化數(shù)據(jù)。3.2管理如此大量的信息,還需要什么?需要一個(gè)存放它的地方??梢源鎯?chǔ)在云中、本地或同時(shí)在兩者中。還可以選擇以什么形式存儲(chǔ)數(shù)據(jù),以便可以按需實(shí)時(shí)提供數(shù)據(jù)。這就是越來越多的人選擇云存儲(chǔ)解決方案的原因,因?yàn)樗С之?dāng)前的計(jì)算要求。3.3分析好的,你已經(jīng)接收并存儲(chǔ)了數(shù)據(jù),但是需要對(duì)其進(jìn)行分析以便使用。探索你的數(shù)據(jù)并使用它來做出任何重要的決定,例如了解客戶主要研究了哪些功能,或使用它來共享研究。使用它來做你想做的和需要的一切。參考譯文4.大數(shù)據(jù)的優(yōu)勢(shì)4.1改善業(yè)務(wù)流程大數(shù)據(jù)的最大優(yōu)勢(shì)可能是它可以幫助企業(yè)獲得巨大的競(jìng)爭(zhēng)優(yōu)勢(shì)。除了能夠更好地了解和定位目標(biāo)客戶之外,分析大數(shù)據(jù)還可以改善和優(yōu)化業(yè)務(wù)運(yùn)營(yíng)的某些方面,例如通過挖掘大數(shù)據(jù),零售商不僅可以探索消費(fèi)和生產(chǎn)方式,還可以促進(jìn)庫(kù)存管理、改善供應(yīng)鏈、優(yōu)化分銷渠道等。4.2檢測(cè)欺詐使用大數(shù)據(jù)的這個(gè)優(yōu)勢(shì)來自實(shí)施機(jī)器學(xué)習(xí)技術(shù)。它可以幫助銀行和其他金融機(jī)構(gòu)經(jīng)常在持卡人都不知道的情況下,檢測(cè)出像用信用卡欺詐購(gòu)買等欺詐行為。4.3改善客戶服務(wù)大數(shù)據(jù)分析程序中最常見的目標(biāo)之一就是改善客戶服務(wù)。當(dāng)今的企業(yè)從不同的來源(例如客戶關(guān)系管理(CRM)系統(tǒng)、社交媒體以及其他客戶聯(lián)系點(diǎn))捕獲大量信息。通過分析大量信息,他們可以了解用戶的口味和喜好。在大數(shù)據(jù)技術(shù)的幫助下,他們能夠創(chuàng)造比以往任何時(shí)候都更加響應(yīng)靈敏、個(gè)性化和準(zhǔn)確的客戶體驗(yàn)。參考譯文參考譯文5.大數(shù)據(jù)的缺點(diǎn)盡管大數(shù)據(jù)有很多優(yōu)勢(shì),但它仍然面臨一些嚴(yán)峻的挑戰(zhàn),這些挑戰(zhàn)使其實(shí)施變得困難或冒險(xiǎn)。5.1隱私和安全問題大數(shù)據(jù)的最大缺點(diǎn)可能是它會(huì)使企業(yè)成為網(wǎng)絡(luò)攻擊者的軟目標(biāo)。甚至大型企業(yè)也經(jīng)歷過大規(guī)模數(shù)據(jù)泄露的事件。但是,隨著GDPR的實(shí)施,企業(yè)越來越多地嘗試在流程、協(xié)議和基礎(chǔ)架構(gòu)上進(jìn)行投資,以能夠維護(hù)大數(shù)據(jù)。5.2對(duì)技術(shù)專業(yè)知識(shí)的需求處理大數(shù)據(jù)需要大量的技術(shù)能力,這是大數(shù)據(jù)專家和數(shù)據(jù)科學(xué)家成為IT領(lǐng)域收入豐厚且令人垂涎的團(tuán)隊(duì)的主要原因之一。培訓(xùn)員工或雇用專家來處理大數(shù)據(jù)可能會(huì)輕易地顯著增加企業(yè)成本。6.大數(shù)據(jù)未來的發(fā)展方向在哪?大數(shù)據(jù)已經(jīng)在許多領(lǐng)域改變了游戲規(guī)則,而且無疑將繼續(xù)增長(zhǎng)。一旦我們周圍的一切都開始使用互聯(lián)網(wǎng)(物聯(lián)網(wǎng)),那么使用大數(shù)據(jù)的可能性將是巨大的。我們可得到的數(shù)據(jù)量只會(huì)增加,而分析

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論