版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第6章應用層與Internet服務6.1Internet應用層6.2域名系統(tǒng)DNS6.3萬維網6.4電子郵件6.5文件傳輸協(xié)議6.6Telnet與DHCP協(xié)議簡介6.7流媒體技術與應用6.8CDN返回6.1Internet應用層應用層是TCP/IP模型的最高層,其通過使用傳輸層所提供的服務,直接向用戶提供服務,是TCP/IP網絡與用戶之間的界面或接口。該層由若干面向用戶提供服務的應用協(xié)議和支持這些應用的支撐協(xié)議組成,基于這些協(xié)議,應用層向用戶提供了眾多的網絡應用。TCP/IP應用層上的典型應用根據(jù)用途性質可分為三類,提供網絡系統(tǒng)服務與維護,構建和完善網絡系統(tǒng)的應用主要有DNS域名系統(tǒng)、DHCP動態(tài)主機配置、TELNET遠程登錄、SNMP網絡管理;面向大眾提供通用服務的應用包括WWW服務、電子郵件、FTP文件傳輸?shù)?;新興應用服務主要有流媒體服務、內容分發(fā)服務、P2P應用等。在應用層開發(fā)了與這些應用相關的協(xié)議包括超文本傳輸協(xié)議,下面分類作以簡述。下一頁返回6.1Internet應用層支持因特網上廣泛使用的傳統(tǒng)通用服務的協(xié)議有:(1)HTTP:用來在瀏覽器和WWW服務器之間傳送超文本的協(xié)議;(2)SMTP:用于實現(xiàn)電子郵件傳輸?shù)膽脜f(xié)議;(3)FTP:用于實現(xiàn)文件傳輸服務的協(xié)議,通過FTP用戶可以方便地連接到遠程服務器上,可以進行查看、刪除、移動、復制、更名遠程服務器上的文件內容的操作,并能進行上傳文件和下載文件等操作。為了使用戶更加可靠、高效地訪問網絡應用服務,TCP/IP模型的應用層還提供了一些網絡系統(tǒng)服務支撐協(xié)議,主要有:(1)DNS:用于實現(xiàn)域名和IP地址之間的相互轉換;上一頁下一頁返回6.1Internet應用層(2)DHCP:動態(tài)主機IP地址分配,為用戶接入網絡時自動獲得IP提供支撐;(3)TELNET:實現(xiàn)虛擬或仿真終端的服務,允許用戶把自己的計算機當作遠程主機上的一個終端連接到遠程計算機,并使用基于文本界面的命令控制和管理遠程主機上的文件及其他資源;(4)SNMP:由于因特網結構復雜,擁有眾多的操作者,因此需要好的工具進行網絡管理,以確保網絡運行的可靠性和可管理性。而SNMP提供了一種監(jiān)控和管理計算機網絡的有效方法,它已成為計算機網絡管理的事實標準。隨著大規(guī)模寬帶通信的實現(xiàn),以流媒體為代表的多媒體應用進入蓬勃發(fā)展期,引領了因特網的發(fā)展。另外,以移動互連為基礎的即時通信、電子商務等也成為因特網應用的新亮點。上一頁下一頁返回6.1Internet應用層圖6-1給出了上述的應用層協(xié)議與傳輸層TCP、UDP協(xié)議及其端口之間的關系。應用層協(xié)議根據(jù)所使用的傳輸層服務的不同可以分為三類:一類是基于面向連接的TCP協(xié)議,如HTTP、FTP、SMTP和TELNET等;另一類是基于無連接的UDP協(xié)議,如SNMP、TFTP和DHCP等;還有一類既可基于TCP協(xié)議,也可基于UDP協(xié)議,如DNS。應用層的許多協(xié)議都是基于客戶服務器方式。即使是對等通信方式,實質上也是一種特殊的客戶服務器方式。這里再明確一下,客戶(client)和服務器(server)都是指通信中所涉及的兩個應用進程??蛻舴掌鞣绞剿枋龅氖沁M程之間服務和被服務的關系。這里最主要的特征就是:客戶是服務請求方,服務器是服務提供方。上一頁返回6.2域名系統(tǒng)DNS6.2.1域名系統(tǒng)的應用背景與價值作用IP地址的使用讓我們可在因特網上定位到一臺主機并與之通信。從根本上講,要訪問因特網上的主機,必須知道其IP地址,用IP地址來實現(xiàn)主機的邏輯尋址。但是32位二進制的IP地址非常難以記憶,即使采用點分十進制表示,也很難記住。就像為了打電話狂背電話號碼一樣,讓人覺得無聊又無奈。為此產生了電話號碼本,把人名與電話號碼對應起來,傳統(tǒng)紙件的電話本需要我們用人名人工檢索,得到電話號碼后再撥打,現(xiàn)在的手機通信錄已經在手機中電子存儲并實現(xiàn)了自動轉換,當我們按人名撥打時,實際上撥出的是其電話號碼。下一頁返回6.2域名系統(tǒng)DNS人們將這一經驗搬移到因特網上,來解決應用中IP地址難記的問題。日常生活中人們已經養(yǎng)成了記住名字的習慣,現(xiàn)在我們也給因特網上的主機起一個個性化的字符名字,然后我們通過記住主機名來記住主機,尤其是知名主機。應用中我們通過主機名來訪問主機,當然,因特網上只能根據(jù)IP地址定位主機,所以,應用中也需要先根據(jù)主機名檢索到其IP地址,這需要有一個專用的“地址本”和檢索機構,以實現(xiàn)自動檢索。圖6-2給出了使用主機名訪問因特網主機的一般過程。上一頁下一頁返回6.2域名系統(tǒng)DNS圖6-2中,當網絡用戶在客戶機IE瀏覽器輸入域名www.163.com訪問網站時,該客戶機要向本地DNS服務器發(fā)出一個域名解析請求??蛻魴C用待解析的域名構造一個DNS請求報文,發(fā)給本地域名服務器。本地域名服務器查找數(shù)據(jù)庫,得到對應的IP地址中,把IP地址通過DNS應答報文發(fā)給客戶機??蛻魴C上的應用進程獲得目的主機的IP地址,再用IP地址去訪問163服務器。當然,正常情況下163服務器會返回用戶所需的數(shù)據(jù),客戶機通過IE瀏覽器把網頁還原顯示———我們打開了網站主頁。上一頁下一頁返回6.2域名系統(tǒng)DNS鑒于因特網的龐大和主機數(shù)量的眾多,為了有序地管理主機,我們把主機歸屬到各個域里,一個域中還可以包含子域。如“www.sina.com.cn”就表示主機名字為“www”,“.sina.com.cn”指出了主機“www”的隸屬關系,即它屬于cn域里com域的sina子域。從理論上講,整個因特網可以只使用一個域名服務器,使它裝入因特網上所有的主機名,并回答所有對IP地址的查詢。然而這種做法并不可取。因為因特網規(guī)模很大,這樣的域名服務器肯定會因過負荷而無法正常工作,而且一旦域名服務器出現(xiàn)故障,整個因特網就會癱瘓。因此,從思想上講,實現(xiàn)域名服務的不應該是一臺服務器,而應該是一群服務器且分布到世界各地,它們應該有組織地構成一個完整的系統(tǒng),完成任何可能的查詢服務。上一頁下一頁返回6.2域名系統(tǒng)DNS因特網的域名系統(tǒng)DNS被設計成一個聯(lián)機分布式數(shù)據(jù)庫系統(tǒng),并采用客戶服務器方式。DNS使大多數(shù)名字都在本地進行解析(resolve),僅少量解析需要在因特網上通信,因此DNS系統(tǒng)的效率很高。由于DNS是分布式系統(tǒng),即使單個計算機出了故障,也不會妨礙整個DNS系統(tǒng)的正常運行。為了支持域名解析系統(tǒng),我們對因特網上的所有域組成一個樹形結構。早在1983年因特網就開始采用層次樹狀結構的命名方法,配套使用分布式的域名系統(tǒng)DNS。域名到IP地址的解析是由分布在因特網上的許多域名服務器程序(可簡稱為域名服務器)共同完成的。域名服務器程序在專設的結點上運行,人們常把運行域名服務器程序的機器稱為域名服務器。上一頁下一頁返回6.2域名系統(tǒng)DNS6.2.2因特網域名結構主機的字符標識名格式及組織方式很重要,因為它影響到從名字到IP地址的解析。早期的網絡(如ARPANET),其互連的主機數(shù)目較少,使用主機名的方法來標識連網的主機。該方法用平面命名機制為每臺連網的主機取一個唯一的字符名字,平面名字與IP地址對應地登記在網絡中的一個共享文件(如hosts)中,并進行集中管理。只要用戶輸入主機名字,計算機就可以從中查詢到對應的IP地址。上一頁下一頁返回6.2域名系統(tǒng)DNS以平面命名機制命名的字符名字的主要優(yōu)點是名字短小,實現(xiàn)起來比較簡單,在主機數(shù)量較少的網絡環(huán)境下,這是一個很實用的方法。但對于后期因特網上大量的主機,這種方式在管理和解析上的缺點是明顯的。首先,由于名字取自單一標識符集,當有大量主機時,為了使名字獨一無二,需要花費很大的心思才行;其次,平面方式的組織形式下,隨著主機數(shù)目的大量增加,名字管理工作量會大大增加,檢索效率降低;第三,一臺地址解析服務器完成解析服務很難避免瓶頸效應,可靠性沒有保證;第四,名字到地址的關聯(lián)經常會改變,要保持名字到IP地址的映射更新困難。上一頁下一頁返回6.2域名系統(tǒng)DNS因此人們引入域名(domainname)這一概念。任何一個連接在因特網上的主機或路由器,都有一個唯一的層次結構的名字,即域名?!坝颉保ǎ洌铮恚幔椋睿┦敲挚臻g中一個可被管理的劃分。域還可以劃分為子域,而子域還可繼續(xù)劃分子域,這樣就形成了頂級域、二級域、三級域等等。因特網上,所有的域名組成一種樹形結構。在域名樹中,葉子用來標識主機,除葉子以外的結點,用來標識域。如圖6-3所示。每一個域名都是由標號序列組成,而各標號之間用點隔開。例如,圖6-3中,北京大學Web網站的域名是www.pku.edu.cn。其中標號cn是頂級域名,標號edu是二級域名,標號pku是三級域名,www是主機名,通常用www作Web服務器名字。域名的這種分層、分級的命名和管理機制其實和人們通常的行政地址命名和管理方法類似,如生活中通常用國家、省、市、街道、門牌等標識一個通信地址。上一頁下一頁返回6.2域名系統(tǒng)DNS域名由英文字母和數(shù)字組成,每一個域名不超過63個字符,不區(qū)分大小寫。除連字符(下劃線)外不能使用其他的標點符號。級別最高的頂級域名則寫在最右邊。由多個域名組成的完整域名總共不超過255個字符。DNS既不規(guī)定一個域名需要包含多少個下級域名,也不規(guī)定每一級的域名代表什么意思。各級域名由其上一級的域名管理機構管理,而最高的頂級域名則由ICANN進行管理。用這種方法可使每一個域名在整個因特網范圍內是唯一的,并且也容易設計出一種查找域名的機制。域名的這種表示形式與組織結構為DNS解析提供了基礎。上一頁下一頁返回6.2域名系統(tǒng)DNS頂級域名分為國家頂級域名、通用頂級域名、基礎結構域名三大類。如中國的國家頂級域名是cn。最常見的通用頂級域名有7個,即:com(公司企業(yè)),net(網絡服務機構),org(非營利性的組織),int(國際組織),edu(美國專用的教育機構),gov(美國的政府部門),mil表示(美國的軍事部門)。反向域arpa,用于反向域名解析,將IP地址解析成域名。在國家頂級域名下注冊的二級域名均由該國家自行確定。我國把二級域名劃分為“類別域名”和“行政區(qū)域名”兩大類。如edu為教育機構,bj為北京市,sd為山東省。上一頁下一頁返回6.2域名系統(tǒng)DNS6.2.3域名服務器域名的樹形體系是抽象的。在樹結構中,除葉子以外的結點域中,設立相應的域名管理機構,來實現(xiàn)域的登記注冊管理;同時設立一個域名服務器用來實現(xiàn)域的登記與解析。每一個域名服務器都只對域名體系中的一部分進行管轄。因特網上的DNS域名服務器也是按照層次安排的。根據(jù)域名服務器所起的作用,可以把域名服務器劃分為以下四種不同的類型。(1)根域名服務器(rootnameserver):根域名服務器是最高層次的域名服務器,也是最重要的域名服務器。所有的根域名服務器都知道所有頂級域名服務器的域名和IP地址。也就是說,頂級域名需要在根域名服務器中登記。上一頁下一頁返回6.2域名系統(tǒng)DNS(2)頂級域名服務器(即TLD服務器):這些域名服務器負責管理在該頂級域名服務器注冊的所有二級域名。當收到DNS查詢請求時,就給出相應的回答。(3)權威域名服務器(authoritativenameserver):每個主機都要被登記在一個權威域名服務器上。如果一個域名服務器總是存在著將主機名稱解析為IP地址的DNS記錄,那么該域名服務器對于主機來說就是權威服務器。很多域名服務器都是同時作為本地服務器和權威服務器使用的。上一頁下一頁返回6.2域名系統(tǒng)DNS(4)本地域名服務器(localnameserver):當一個主機發(fā)出DNS查詢請求時,這個查詢請求報文就發(fā)送給本地域名服務器。由此可看出本地域名服務器的重要性。每一個因特網服務提供者ISP,或一個大學,甚至一個大學里的系,都可以擁有一個本地域名服務器,這種域名服務器有時也稱為默認域名服務器。當PC機使用WindowsXP操作系統(tǒng)時,打開“控制面板”,選擇“網絡連接”,再用鼠標右鍵點擊任何一種網絡連接,選擇“屬性”—“網絡”,然后選擇“Internet協(xié)議(TCP/IP)”,再選擇“屬性”,就可看見有關DNS地址的選項。這里的DNS服務器指的就是本地域名服務器。本地域名服務器離用戶較近,一般不超過幾個路由器的距離。當所要查詢的主機也屬于同一個本地ISP時,該本地域名服務器立即就能將所查詢的主機名轉換為它的IP地址,而不需要再去詢問其他的域名服務器。上一頁下一頁返回6.2域名系統(tǒng)DNS6.2.4域名解析過程客戶端應用程序向域名服務器遞交域名,服務器端返回域名對應的IP地址,這個服務過程稱為域名解析服務。DNS服務器除了具備前述的對本級域及其子域進行域名管理的功能外,還具備通過DNS協(xié)議接受客戶端應用程序的域名解析請求,返回域名解析結果的域名解析服務功能。DNS使用客戶/服務器(C/S)機制實現(xiàn)域名解析。上一頁下一頁返回6.2域名系統(tǒng)DNS假定域名為aa.gov.cn的主機要訪問www.163.com,由于不知道其IP,故向本地域名服務器查詢主機www.163.com的IP。由于本地域名服務器不是目的主機的權威域名服務器,所以它也沒有相關記錄,但它有根域名服務器的地址,會繼續(xù)向根域名服務器請求解析;根域名服務器中記錄了目的主機的頂級域名服務器dns.com的信息,并向其查詢;頂級域名服務器知道它隸屬于dns.163.com,并向其發(fā)出解析請求;dns.163.com是目的主機的權威域名服務器,通過查找其數(shù)據(jù)庫可得到目的IP,然后將結果逐級返回。圖6-4中①~⑧展示了DNS查詢過程。上一頁下一頁返回6.2域名系統(tǒng)DNS下面簡單討論一下域名的解析過程。這里要注意兩點。第一,主機向本地域名服務器的查詢一般都是采用遞歸查詢(recursivequery)。所謂遞歸查詢就是:如果主機所詢問的本地域名服務器不知道被查詢域名的IP地址,那么本地域名服務器就以DNS客戶的身份,向其他根域名服務器繼續(xù)發(fā)出查詢請求報文(即替該主機繼續(xù)查詢),而不是讓該主機自己進行下一步的查詢。因此,遞歸查詢返回的查詢結果或者是所要查詢的IP地址,或者是報錯,表示無法查詢到所需的IP地址。上一頁下一頁返回6.2域名系統(tǒng)DNS第二,本地域名服務器向根域名服務器的查詢通常是采用迭代查詢(iterativequery)。迭代查詢的特點是這樣的:當根域名服務器收到本地域名服務器發(fā)出的迭代查詢請求報文時,要么給出所要查詢的IP地址,要么告訴本地域名服務器:“你下一步應當向哪一個域名服務器進行查詢”。然后讓本地域名服務器進行后續(xù)的查詢(而不是替本地域名服務器進行后續(xù)的查詢)。根域名服務器通常是把自己知道的頂級域名服務器的IP地址告訴本地域名服務器,讓本地域名服務器再向頂級域名服務器查詢。頂級域名服務器在收到本地域名服務器的查詢請求后,要么給出所要查詢的IP地址,要么告訴本地域名服務器下一步應當向哪一個權威域名服務器進行查詢。本地域名服務器就這樣進行迭代查詢。最后,知道了所要解析的域名的IP地址,然后把這個結果返回給發(fā)起查詢的主機。上一頁下一頁返回6.2域名系統(tǒng)DNS當然,本地域名服務器也可以采用遞歸查詢。這取決于最初的查詢請求報文的設置是要求使用哪一種查詢方式。圖6-5用例子說明了迭代查詢的過程。從上述過程可以看到,在樹形域結構上運用世界各地分散布署的DNS服務器能夠解析出所有的域名。如果目的域名在本地域名服務器上不能得到解析,可能會運用外網上的DNS服務,產生遠程流量、需要更大的時延。因此,為了提高DNS查詢效率,并減輕根域名服務器的負荷和減少因特網上的DNS查詢報文數(shù)量,在域名服務器中廣泛地使用了高速緩存(有時也稱為高速緩存域名服務器)。高速緩存用來存放最近查詢過的域名以及從何處獲得域名映射信息的記錄。上一頁下一頁返回6.2域名系統(tǒng)DNS最后關于DNS再說明幾點。第一,因特網上的主機和路由器必須有唯一的IP地址,但不必都有域名。第二,域名和IP地址的對應關系不只是一對一的,可以是多對多的。多個域名可以對應一個IP地址,如多個Web網站共用一個服務器;一個域名可以對應多個IP,并且可以通過DNS重定向實現(xiàn)負載均衡,參見6.7節(jié)。上一頁返回6.3萬維網萬維網WWW(WorldWideWeb),當今社會中最廣泛的網絡應用,可以說我們天天在用,現(xiàn)在孩子時期已經開始使用萬維網。但到目前為止,你有沒有困惑過:萬維網是什么?是不是Internet?與Internet有什么區(qū)別?我們用網,但卻很難認知網絡。畢竟因特網太大了,萬維網也太大了,大得讓我們只見樹木,不見森林,很難整體認知和把握它。從前面的學習我們已經能認識Internet。它是網絡互連的結果,是互聯(lián)網,它跨網、跨國、跨時空構建起了一個通信平臺。萬維網不是Internet,萬維網是依托Internet有過超鏈接而構建起來的信息系統(tǒng),是Internet應用之一,是依托Internet運行的一項服務。下一頁返回6.3萬維網6.3.1萬維網信息系統(tǒng)及組成萬維網WWW(WorldWideWeb)并非某種特殊的計算機網絡。萬維網是一個大規(guī)模的、聯(lián)機式的信息存儲所,英文簡稱為Web,是運行在因特網上的一個分布式信息系統(tǒng),給人們提供分布式應用,萬維網用鏈接的方法能讓用戶從任何一個主頁開始,非常方便地從因特網上的一個站點訪問另一個站點(也就是所謂的“鏈接到另一個站點”),主動地按需獲取信息。萬維網提供豐富的信息資源。圖6-6說明了萬維網提供分布式服務的特點。圖6-6是由眾多萬維網網站組成萬維網的示意圖。萬維網由眾多網站構成,網站是網頁的集成,每個網頁是一個超媒體的萬維網文檔,通過網頁中的超鏈接,萬維網中的各個網頁、網站聯(lián)成一體,構成一個分布式、多入口的信息系統(tǒng)。上一頁下一頁返回6.3萬維網各網站可以相隔數(shù)千公里,但都必須連接在因特網上。每一個萬維網站點都存放了許多文檔。在這些文檔中有一些地方的文字是用特殊方式顯示的,而當我們將鼠標移動到這些地方時,鼠標的箭頭就變成了一只手的形狀。這就表明這些地方有一個鏈接,如果我們在這些地方點擊鼠標,就可以從這個文檔鏈接到可能相隔很遠的另一個文檔。經過一定的時延,在我們的IE瀏覽器中就能將遠方傳送過來的網頁文檔顯示出來。萬維網是一個把網頁由超鏈接關聯(lián)起來的信息系統(tǒng),基本元素是Web頁面。超鏈接是邏輯鏈接,超鏈接實質上是指向另一個Web頁面的地址指針。萬維網系統(tǒng)中,Web頁面的地址用統(tǒng)一資源定位符URL表示。上一頁下一頁返回6.3萬維網要追蹤超鏈接,把異地網站的網頁打開,需要超文本傳輸協(xié)議HTTP的工作。HTTP能根據(jù)URL的標識,通過一定的步驟把超鏈接所指向的網頁數(shù)據(jù)通過因特網網絡鏈接傳輸?shù)奖镜?。因此,網絡鏈接是實現(xiàn)超鏈接的物理基石,互聯(lián)網是實現(xiàn)萬維網的物理基礎,也就是說,萬維網要部署在互聯(lián)網上,需要在互聯(lián)網的支撐下才能得以運行、實現(xiàn)。萬維網是以萬維網文檔為元素的信息系統(tǒng),萬維網文檔間的聯(lián)系由超鏈接表達;HTTP在萬維網中充當采購員的角色,它把URL指向的信息數(shù)據(jù)采購回來。而跨網互連互通的In?ternet為采購員的采購提供了高速公路級的支撐。網站是同屬于一個資源單位、共享同一個服務器程序服務的相關萬維網文檔的集合;Web服務器是網站的家,網站要部署在服務器上,是網站的硬件支撐,也是邏輯的萬維網和物理的互聯(lián)網關聯(lián)起來的結合點。上一頁下一頁返回6.3萬維網服務器程序提供了服務器端萬維網信息的管理、檢索、響應提交;IE瀏覽器在客戶端與服務器程序實現(xiàn)對等交互,把HTTP采購到的數(shù)據(jù)還原,以網頁的形式顯示給用戶。IE瀏覽器能還原和識別網頁是因為萬維網文檔中使用了HTML標記。超文本標記語言實現(xiàn)了萬維網文檔的書寫、記錄,為網頁的制作和在客戶端的還原奠定了基礎,提供了技術支撐。動態(tài)信息技術的使用使萬維網突破了單純靜態(tài)信息顯示的束縛,JAVA程序語言及數(shù)據(jù)庫與萬維網文檔的融合實現(xiàn)了萬維網上的動態(tài)應用服務。把解決具體問題的網絡應用系統(tǒng)納入萬維網的框架下實現(xiàn),賦予萬維網以新的使命,使其生機盎然。手機、PAD智能終端的加入,擴展了萬維網的空間,提供了更多的靈活和方便。在智能移動萬維網應用中,云計算、云服務得以彰顯,為寡資源、低處理能力的移動終端提供了計算和存儲支持。上一頁下一頁返回6.3萬維網萬維網文檔是萬維網的基本元素和載體;HTTP實現(xiàn)了萬維網文檔傳輸;萬維網的形態(tài)和應用也在隨著新技術的應用演變和深化。本節(jié)從以上三個方面對萬維網展開剖析。可見,萬維網是一個由多種構件組成、通過構件關聯(lián)而建構起來的信息系統(tǒng)。這個系統(tǒng)是龐大且復雜的,現(xiàn)在我們進一步從多個方面認識萬維網。1.超媒體Web頁面是萬維網文檔,它使用了超媒體,超媒體是包含超鏈接的媒體,超鏈接實質是指向另一網頁的指針,它用URL來標識。上一頁下一頁返回6.3萬維網萬維網是一個分布式的超媒體(hypermedia)系統(tǒng),它是超文本(hypertext)系統(tǒng)的擴充。超文本是把一些信息根據(jù)需要連接起來的信息管理技術,是包含指向其他文檔的鏈接的文本。也就是說,一個超文本由多個信息源鏈接成,而這些信息源的數(shù)目實際上是不受限制的。人們可以通過一個文本的鏈接指針打開另一個相關的文本。利用一個鏈接可以找到另一個文檔,而這又可鏈接到其他的文檔。這些文檔可以位于世界上任何一個接在因特網上的超文本系統(tǒng)中。超文本提供了萬維網上信息的鏈接,是萬維網的組建基礎。超媒體與超文本的區(qū)別是文檔內容不同。超文本文檔僅包含文本信息,而超媒體文檔還包含其他表示方式的信息,如圖形、圖像、聲音、動畫,甚至活動視頻圖像。上一頁下一頁返回6.3萬維網2.超級鏈接超鏈接是WWW上的一種鏈接技巧,它是內嵌在文本或圖像中的。通過已定義好的關鍵字和圖形,只要單擊某個圖標或某段文字,就可以自動連上相對應的其他文件。每個鏈接都有一個起點和終點。鏈接的起點可以是一個字或幾個字,或是一幅圖。文本超鏈接在瀏覽器中通常帶下劃線,而圖像超鏈接是看不到的,但如果用戶的鼠標碰到它,鼠標的指標通常會變成手指狀(文本超鏈接也是如此)。鏈接的終點可以是其他網站上的頁面。網頁的出色之處在于能夠把超鏈接嵌入網頁中,使用戶能夠從一個網頁站點方便地轉移到另一個相關的網頁站點。超鏈接實質是一個指向其網頁的指針。為了標識萬維網系統(tǒng)中的系統(tǒng)資源,引入了統(tǒng)一資源定位符URL。上一頁下一頁返回6.3萬維網3.統(tǒng)一資源定位符URL統(tǒng)一資源定位符(UniformResourceLocator,URL)也被稱為網頁地址,是標準的萬維網上資源的地址。基本URL包括以下成分:服務協(xié)議、服務器域名或地址、服務器端口號、文檔的路徑和文檔名稱,其中有些項可以省略。在萬維網文檔中可以通過對象的URL引用其他頁面中的對象。例如,某門戶網站Web頁面的URL是:http://news.sina.com.cn/c/2015-06-17/113531960702.html其中,http表示訪問資源需要使用HTTP協(xié)議;news.sina.com.cn是域名,指出了資源所在的主機;/c/2015-06-17指出了資源在主機中的路徑;113531960702.html是文件名。上一頁下一頁返回6.3萬維網URL也可以標識網頁中的一個資源對象,下面是一個圖片的URL:http://i1.sinaimg.cn/dy/cr/2015/0617/4139874997.jpg4.網頁、網站、服務器(1)網頁是網站的基本信息單位,是WWW的基本文檔。它由文字、圖片、動畫、聲音等多種媒體信息以及鏈接組成,是用HTML編寫的,通過鏈接實現(xiàn)與其他網頁或網站的關聯(lián)和跳轉。網頁文件是由HTTP來傳輸,并能被瀏覽器識別、還原顯示的文本文件。其擴展名是.htm或.html。上一頁下一頁返回6.3萬維網(2)網站由眾多不同內容的網頁構成,網頁的內容可體現(xiàn)網站的全部功能。通常把進入網站首先看到的網頁稱為首頁或主頁(homepage),例如,新浪、網易、搜狐都是國內比較知名的大型門戶網站。(3)服務器。網站是一個相對獨立的信息系統(tǒng),是軟件。從硬件角度講,服務器是網站部署的硬件平臺。萬維網系統(tǒng)正是通過服務器與互聯(lián)網關聯(lián)的。從軟件視角講,服務器上有一組服務控制程序,是提供Web信息服務的服務器軟件,主要功能包括管理和存儲各種Web對象,每個對象由URL尋址;接收來自用戶瀏覽器的服務請求,通過相應的處理來制作并返回Web頁面。Web服務器實現(xiàn)了HTTP的服務器端,流行的Web服務器程序有Apache和MicrosoftInternetInformationServer。上一頁下一頁返回6.3萬維網5.瀏覽器瀏覽器(Webbrowser),是具有標準接口的Web客戶機軟件,實現(xiàn)了HTTP的客戶機端。作為客戶端,瀏覽器一方面與服務器軟件進行通信,要實現(xiàn)與HTTP接口;另一方面,瀏覽器將HTTP傳送的數(shù)據(jù)還原成Web頁面,顯示給用戶,要實現(xiàn)與HTML標識的兼容。瀏覽器是萬維網訪問的起點和終點。當我們訪問萬維網上一個網頁或者其他網絡資源的時候,首先要在瀏覽器上鍵入目的網頁的URL,或者通過超鏈接。瀏覽器分析URL,對域名部分調用DNS系統(tǒng)進行解析得到目的主機的IP。接下來瀏覽器調用HTTP協(xié)議,向目的服務器請求指定路徑下的資源。在通常情況下,HTML文本、圖片和構成該網頁的一切其他文件很快會被逐一請求并發(fā)送回用戶。上一頁下一頁返回6.3萬維網網絡瀏覽器接下來的工作是把HTML、CSS和其他接收到的文件所描述的內容,加上圖像、鏈接和其他必需的資源,顯示給用戶,讓我們看到“網頁”。圖6-7是一個典型瀏覽器的功能組成示意圖。一個瀏覽器包括一組客戶機程序、一組解釋程序,以及管理這些客戶程序和解釋程序的控制程序??刂瞥绦蛑饕忉屖髽说膯螕艉玩I盤的輸入,并調用有關的組件來執(zhí)行用戶指定的操作。HTML解釋程序是必不可少的,而其他的解釋程序(如Java)則是可選的。HTML解釋程序的輸入就是符合HTML語法的文檔。解釋程序把HTML標記轉換成相應的命令來控制版面格式。上一頁下一頁返回6.3萬維網6.萬維網文檔萬維網文檔是萬維網的基本組成元素,它是一種超媒體文檔,是用超文本標記語言HTML編制的文件。(1)萬維網文檔與超文本標記語言HTML。超文本標記語言HTML(HyperTextMarkupLanguage)就是一種制作萬維網頁面的標準語言,它消除了不同計算機之間信息交流的障礙。HTML是一種規(guī)范,一種標準,它通過標記符號來標記要顯示的網頁中的各個部分。網頁文件本身是一種文本文件,通過在文本文件中添加標記符,可以告訴瀏覽器如何顯示其中的內容(如:文字如何處理,畫面如何安排,圖片如何顯示等)。上一頁下一頁返回6.3萬維網HTML定義了許多用于排版的命令,即“標簽”(tag)。例如,<I>表示后面開始用斜體字排版,而</I>則表示斜體字排版到此結束。HTML就把各種標簽嵌入萬維網的頁面中,這樣就構成了所謂的HTML文檔。比如,用記事本將以下內容編輯到一個文件中,保存成.html的文件。然后用瀏覽器打開該文件,可看到圖6-8所示的Web頁面。對比語法和效果可以看出,<html>與</html>之間的文本描述了網頁,<body>與</body>之間的文本是可見的頁面內容,<hl>與</hl>之間的文本“靜夜思”按1級標題顯示,align=center指出了居中顯示,<H3>與</H3>之間的文本“賞析”按3級標題顯示,<i>與</i>控制其為斜體字,<p>與</p>之間的文本被顯示為段落內容,而<hr/>標簽在頁面中創(chuàng)建水平線。上一頁下一頁返回6.3萬維網使用網頁制作軟件可以讓我們能夠像使用Word文字處理器那樣很方便地制作各種Web頁面。其中MicrosoftFrontPage是一款輕量級靜態(tài)網頁制作軟件,Dreamweaver是一個專業(yè)級網頁制作軟件,是初學者或專業(yè)級網站開發(fā)人員的常用工具。(2)萬維網文檔的類型。靜態(tài)文檔(staticdocument)是指在文檔創(chuàng)作完畢后就存放在萬維網服務器中,在被用戶瀏覽的過程中,內容不會改變。由于這種文檔的內容不會改變,因此用戶對靜態(tài)文檔的每次讀取所得到的返回結果都是相同的。靜態(tài)文檔的最大優(yōu)點是簡單,但不適合表達動態(tài)變化的內容,因此有一定的局限性。上一頁下一頁返回6.3萬維網動態(tài)文檔(dynamicdocument)是指文檔的內容是在瀏覽器訪問萬維網服務器時才由應用程序動態(tài)創(chuàng)建。當瀏覽器請求到達時,萬維網服務器要運行另一個應用程序,并把控制轉移到此應用程序。該應用程序根據(jù)瀏覽器發(fā)來的請求,結合數(shù)據(jù)庫中的最新數(shù)據(jù)生成Web文檔,作為對瀏覽器請求的響應。由于對瀏覽器每次請求的響應都是臨時生成的,因此用戶不同時間、不同條件的訪問看到的內容是不同的。動態(tài)文檔具有表現(xiàn)當前最新信息的能力,例如股市行情、天氣預報或民航售票情況等內容。開發(fā)動態(tài)文檔需要編寫用于生成文檔的應用程序,而不是編寫靜態(tài)頁面。動態(tài)文檔和靜態(tài)文檔的主要差別僅體現(xiàn)在服務器上,其文檔內容都遵循HTML所規(guī)定的格式,因此瀏覽器無法判定服務器送來的是哪一種文檔。上一頁下一頁返回6.3萬維網動態(tài)文檔的生成是動態(tài)的,一旦生成在瀏覽器端的顯示是不變的,動態(tài)文檔一旦建立,它所包含的信息內容也就固定下來而無法及時刷新屏幕。另外,像動畫之類的顯示效果,動態(tài)文檔也無法提供?;顒游臋n(activedocument)是將服務器的部分處理工作轉移給瀏覽器的一種技術。每當瀏覽器請求一個活動文檔時,服務器就返回一段程序,讓它在瀏覽器中運行,可與用戶直接交互,連續(xù)地改變屏幕的顯示。所有的處理工作都由瀏覽器自己在本地完成。顯然,這種技術對網絡帶寬的要求較低,能夠為服務器分攤部分處理任務。例如,Web服務器運行JavaScript編寫的程序,就能將部分功能轉移到瀏覽器上運行,這種技術也被稱作富客戶端技術。需要注意的是,活動文檔本身并不包括其運行所需的軟件,相關軟件是事先存放到瀏覽器中的。上一頁下一頁返回6.3萬維網6.3.2超文本傳送協(xié)議HTTPHTTP是HypertextTransferProtocol的縮寫,即超文本傳輸協(xié)議。顧名思義,HTTP提供了訪問超文本信息的功能,是WWW瀏覽器和WWW服務器之間的應用層通信協(xié)議。HTTP協(xié)議是用于分布式協(xié)作超文本信息系統(tǒng)的、通用的、面向對象的協(xié)議。WWW使用HTTP協(xié)議傳輸各種超文本頁面和數(shù)據(jù)。上一頁下一頁返回6.3萬維網1.HTTP協(xié)議的原理與過程在構建萬維網信息系統(tǒng)的環(huán)節(jié)中,HTTP協(xié)議扮演著“采購員”的角色,它把超鏈接指定的資源通過互聯(lián)網的網絡鏈接給“采購”回來。它由瀏覽器調用,向瀏覽器交付數(shù)據(jù)。當用戶在瀏覽器地址欄輸入網頁地址或點擊頁面上的超鏈接時,瀏覽器獲得了目標資源的URL。瀏覽器對目標URL進行分析,提取域名并調用DNS解析獲得目的主機的IP;分析出資源文件名及在目的主機的路徑;然后把目的資源的IP與路徑交給URL中指定的協(xié)議即HTTP協(xié)議,由HTTP協(xié)議負責,發(fā)起網絡通信,將目標資源獲取回來,交付瀏覽器;瀏覽器分析還原Web數(shù)據(jù)并顯示出來。在瀏覽器的處理過程中,HTTP的任務和過程如圖6-9所示。上一頁下一頁返回6.3萬維網HTTP協(xié)議完成任務的過程包括4步。(1)建立連接:HTTP使用TCP協(xié)議向服務端發(fā)出建立連接的請求,服務端給出響應并建立連接。(2)發(fā)送請求:HTTP將請求報文通過TCP連接傳輸給服務器端,請求目標資源。(3)給出響應:服務端按照客戶端的要求給出應答,把結果(HTML文件)返回給客戶端。(4)關閉連接:客戶端HTTP接到應答后通知TCP關閉連接,并將數(shù)據(jù)交付瀏覽器。上一頁下一頁返回6.3萬維網在這里要理清瀏覽器、HTTP、TCP間的關系。瀏覽器在需要時啟用HTTP協(xié)議;HTTP協(xié)議根據(jù)任務要求,指導TCP協(xié)議為其傳輸,至于傳輸什么內容、服務器端的HTTP如何響應及異常處理等對瀏覽器和TCP都是透明的;TCP只負責把HTTP交付的報文可靠地傳送到目的端。綜上可見,瀏覽器和服務器之間的請求/響應的交互,必須按照一定的次序和數(shù)據(jù)格式進行,要解決傳輸什么、怎么傳的問題。這些格式和規(guī)則就是超文本傳輸協(xié)議HTTP規(guī)范。也就是說,HTTP協(xié)議實現(xiàn)了瀏覽器和服務器間的數(shù)據(jù)傳輸,規(guī)定了傳輸數(shù)據(jù)的方式、傳輸次序、數(shù)據(jù)格式。上一頁下一頁返回6.3萬維網HTTP使用了面向連接的TCP作為傳輸層協(xié)議,保證了數(shù)據(jù)的可靠傳輸。HTTP不必考慮數(shù)據(jù)在傳輸過程中被丟棄后又怎樣被重傳,雖然HTTP使用了面向連接的TCP,但是,HTTP協(xié)議本身是無連接的。也就是說HTTP是一個無狀態(tài)的協(xié)議,即HTTP不要求服務器保留客戶的任何狀態(tài)信息。這意味著當同一客戶第二次、第三次訪問服務器時,服務器并不認得、不記得他,沒有老客戶的概念。HTTP的無狀態(tài)特性簡化了服務器的設計,使服務器更容易支持大量HTTP并發(fā)請求。2.持續(xù)連接不難發(fā)現(xiàn),在上述HTTP的機制下,從瀏覽器請求一個萬維網文檔所需的時間是該文檔的傳輸時間加上兩倍往返時間RTT。如圖6-10所示。圖中TCP建立連接中第三次握手的TCP段捎帶了HTTP請求報文。上一頁下一頁返回6.3萬維網其實一個Web頁面并不像以上講的那樣簡單。如前所述,一個Web頁面就是一個文本文檔。我們在瀏覽器中看到的頁面往往包含大量的圖片、文本框、動畫、視頻、聲音等,我們稱之為組成網頁的對象。多數(shù)萬維網頁面包含一個基本的HTML文件和多個引用對象,在用HTML編制網頁的時候,這些網頁對象并不包含在網頁文檔里,它是用鏈接的形式鏈接到萬維網文檔中特定位置的。也就是說,網頁對象是作為一個文件獨立于基本的HTML文件單獨存儲在文件夾中的。還記得嗎,當我們?yōu)g覽到一個網頁,單擊“文件”—“網頁另存為…”,在保存類型中選擇“網頁,全部”時,我們會發(fā)現(xiàn),保存在磁盤上的網頁有一個.html文檔,還有一個同名的文件夾。打開這個文件夾看看吧,里面有很多圖像、圖標、音視頻文件,這些正是鏈接在網頁中的對象。上一頁下一頁返回6.3萬維網這樣,當我們在瀏覽器里打開一個多對象的網頁時,HTTP首先把服務器端的基本的HTML文件傳送過來,然后再對其分析,看它引用了哪些對象,再把各個對象文件分別用單獨的TCP連接傳輸給客戶端。顯然,頻繁地建立和釋放TCP連接增加了時延,是低效的。為此,對最初的HTTP協(xié)議進行了改進、升級,升級后的1.1版本里采用一個持續(xù)連接來傳輸所有的網頁對象。如圖6-11(a)所示。上一頁下一頁返回6.3萬維網HTTP/1.0的主要缺點,就是每請求一個文檔就要有兩倍RTT的開銷。HTTP/1.1協(xié)議較好地解決了這個問題,它使用了持續(xù)連接(persistentconnection)。所謂持續(xù)連接就是萬維網服務器在發(fā)送響應后仍然在一段時間內保持這條TCP連接,使同一個客戶(瀏覽器)和該服務器可以繼續(xù)在這條連接上傳送后續(xù)的HTTP請求報文和響應報文。這并不局限于傳送同一個頁面上鏈接的文檔,而是只要這些文檔都在同一個服務器上就行。而對于非持續(xù)連接方式,每個TCP連接在服務器發(fā)送一個對象后關閉,即該連接并不為其他的對象而持續(xù)下來。很顯然,圖6-11(a)和(b)中都使用了持續(xù)連接,但(b)圖所示的方式傳輸效率更高,我們稱之為流水線方式(withpipelining)。相對應地,圖(a)所示的方式為非流水線方式(withoutpipelining)。上一頁下一頁返回6.3萬維網非流水線方式的特點,是客戶在收到前一個響應后才能發(fā)出下一個請求。流水線方式的特點,是客戶在收到HTTP的響應報文之前就能夠接著發(fā)送新的請求報文。于是一個接一個的請求報文到達服務器后,服務器就可連續(xù)發(fā)回響應報文。因此,使用流水線方式時,客戶訪問所有的對象只需花費一個RTT時間。流水線工作方式使TCP連接中的空閑時間減少,提高了下載文檔效率。在了解了HTTP的工作方式后,我們再分析一下HTTP的報文結構,從而認清HTTP的請求命令和響應報文,透徹地理解HTTP實現(xiàn)萬維網文檔傳輸?shù)脑砗瓦^程。上一頁下一頁返回6.3萬維網3.HTTP的報文結構HTTP的報文有請求報文和響應報文兩種。HTTP的請求報文是從客戶機向服務器發(fā)出的請求,響應報文是服務器到客戶機的應答,它們的結構相似,如圖6-12所示。兩種報文的格式大體上可分為三個部分:請求行(RequestLine)或狀態(tài)行(StatusLine)、首部行(HeaderLine)和實體主體(EntityBody)。其中,HTTP請求報文的首行為請求行,在方法、URL、版本三個字段之間用空格分隔。HTTP響應報文的首行為狀態(tài)行,版本、狀態(tài)碼、短語三個字段間也需要由空格分開。上一頁下一頁返回6.3萬維網從實例中可以看出報文的一些特點。首先,HTTP報文是用ASCII文本書寫的,便于閱讀調試;各個字段的長度都是不確定的,這可以較好地適應不同情況。第二,報文由6行組成,最后一行為空行。第三,請求行有三個字段,分別是方法、URL和版本。方法可以取不同的值,有多種方法。所謂“方法”就是對所請求的對象進行的操作,這些方法實際上也就是一些命令。因此,請求報文的類型是由它所采用的方法決定的。表6-1給出了請求報文中常用的幾種方法。上一頁下一頁返回6.3萬維網每一個請求報文發(fā)出后,都能收到一個響應報文,其格式如圖6-12(b)所示。響應報文的第一行就是狀態(tài)行。狀態(tài)行包括三個字段:HTTP版本、狀態(tài)碼以及解釋狀態(tài)碼的簡單短語。狀態(tài)碼(Status-Code)都是三位數(shù)字的,分為5大類共33種。例如:lxx表示通知信息,如請求收到了或正在進行處理;2xx表示成功,如接受或知道了;3xx表示重定向,如要完成請求還必須采取進一步的行動;4xx表示客戶的差錯,如請求中有錯誤的語法或不能完成;5xx表示服務器的差錯,如服務器失效無法完成請求。下面三種狀態(tài)行在響應報文中是經常見到的。上一頁下一頁返回6.3萬維網HTTP/1.1202Accepted//接受HTTP/1.1400BadRequest//錯誤的請求HTTP/1.1404NotFound//找不到若請求的網頁從http://xxgk.lyu.edu.cn/st/ec/info69.html轉移到了一個新的地址,則響應報文的狀態(tài)行和一個首部行就是下面的形式:HTTP/1.1301MovedPermanently//永久性地轉移了Location:http://xxgk.lyu.edu.cn/xx/info69.html//新的URL上一頁下一頁返回6.3萬維網4.Cookie與用戶跟蹤如前所述,HTTP是無狀態(tài)的。這樣做簡化了服務器的設計,但在實際工作中,一些情況下,萬維網站點卻常常希望能夠識別用戶。例如,在網上購物時,一個顧客要購買多種物品。當他把選好的一件物品放入“購物車”后,他還要繼續(xù)瀏覽和選購其他物品。因此,服務器需要記住用戶的身份,使他再接著選購的一些物品能夠放入同一個“購物車”中,這樣就便于集中結賬。有時某些萬維網站點也可能想限制某些用戶的訪問,或記住用戶的訪問習慣,以便智能地為用戶推薦產品。要做到這點,可以在HTTP中使用Cookie。最新的Cookie規(guī)范是RFC6265,這使得萬維網站點可以使用Cookie來跟蹤用戶。上一頁下一頁返回6.3萬維網現(xiàn)在Cookie已經在很多網站被廣泛使用。Cookie最典型的應用是判定注冊用戶是否已經登錄網站,用戶可能會得到提示,是否在下一次進入此網站時保留用戶信息以便簡化登錄手續(xù),這些功能都要用Cookie來實現(xiàn)。Cookie的標識記錄是由服務器端生成的,但其功能的實現(xiàn)需要瀏覽器配合,可以分為三個主要環(huán)節(jié)。(1)服務器端生成用戶Cookie標識碼,并通告給瀏覽器,在以后的訪問中共同維護、使用這一標識碼。上一頁下一頁返回6.3萬維網(2)瀏覽器記錄Cookie標識碼,并在以后的訪問中攜帶使用此標識碼。當用戶A的瀏覽器收到HTTP響應報文時,它會讀取Set-cookie的首部行中的用戶標識碼,并記錄在一個本地特定的Cookie文件中,在文件中添加一行記錄,登記服務器的主機名和cookie標識碼。以后用戶A再瀏覽這個網站時,瀏覽器發(fā)出的每一個HTTP請求報文都會在請求報文的Cookie首部行中攜帶這個標識碼。(3)服務器端跟蹤用戶。服務器端根據(jù)瀏覽器首部行中的Cookie標識碼確定用戶身份,并記錄用戶的訪問,跟蹤用戶666888在該網站的活動。當然也就能實現(xiàn)特定用戶的購物車功能。上一頁下一頁返回6.3萬維網5.Web緩存由于大量用戶會對Web上同一個信息感興趣,因此如果此時將某用戶訪問遠程Web服務器得到的信息保留在本地,本地的其他用戶就可以就近獲取該信息了。實現(xiàn)這種功能的技術稱為Web緩存(Webcaching)技術。實現(xiàn)這種功能的設備稱為Web緩存器(Webcache),也叫代理服務器(proxyserver),它是能夠代表初始Web服務器來滿足HTTP請求的網絡實體。代理服務器把最近的一些請求和響應暫存在本地磁盤中。當新請求到達時,若代理服務器發(fā)現(xiàn)這個請求與暫時存放的請求相同,就返回暫存的響應,而不需要按URL的地址再次去因特網訪問該資源。代理服務器可在客戶端或服務器端工作,也可在中間系統(tǒng)上工作。上一頁下一頁返回6.3萬維網該Web緩存器有自己的磁盤存儲空間,并可在該存儲空間中保存最近請求過對象的副本。顯然,Web緩存可以帶來兩方面的好處:一是能夠大大減少客戶機請求Web頁面的響應時間,特別是當客戶機與初始服務器之間的帶寬遠低于客戶機與Web緩存器之間的帶寬時更是如此;二是能夠大大減少一個機構的接入鏈路到因特網的通信量,從而降低了網絡通信費用,也能從整體上大大減少因特網上的Web流量,從而改善了所有應用的性能。使用Web緩存器后,在減小用戶時延時又會產生一個新問題,即存放在緩存器中的對象副本是當初Web服務器中的,不是最新的。為了解決這個問題,HTTP增加條件GET(conditionalGET)方法,讓Web緩存器能夠核對和更新緩存副本,保證其有效性。上一頁下一頁返回6.3萬維網6.3.3萬維網應用與演化1.萬維網信息搜索當前萬維網的發(fā)展已經從構建全球最大的信息源走向基于信息源的信息檢索服務。萬維網的優(yōu)點是包羅了無限主題的無限信息。萬維網的缺點是信息太多,用戶苦于無限信息的查找。構建基于無限信息源的主題信息查找就是萬維網發(fā)展的必然。也就是說,在萬維網發(fā)展的高級階段,不再是直接提供信息,更重要的是提供信息檢索。這就要用到搜索引擎。上一頁下一頁返回6.3萬維網(1)信息搜索。萬維網搜索引擎是萬維網中的特殊站點,專門用來幫助人們查找存儲在其他站點上的信息。搜索引擎有能力告訴用戶,文件或文檔存儲在何處。盡管各種搜索引擎的工作方式有所不同,但影響信息檢索質量、實現(xiàn)信息檢索的關鍵有兩個:一個是關鍵字,另一個是搜索引擎。搜索網站提供的是基于關鍵字的互聯(lián)網搜索。為此,搜索網站要生成一份索引,保存所搜尋的詞語以及相應地址,允許用戶在索引中查找詞語或詞語組合。早期搜索引擎的索引僅包括數(shù)十萬個網頁或文檔,每天受理的查詢可能只有一兩千次。如今,頂級搜索引擎的索引列表涵蓋數(shù)億個網頁,每天響應數(shù)千萬次查詢。上一頁下一頁返回6.3萬維網在萬維網中用來進行搜索的工具叫作搜索引擎(searchengine)。搜索引擎是影響搜索結果的重要因素,它影響到信息檢索的效率、準確度等主要指標。搜索引擎的種類很多,但大體上可劃分為兩大類,即全文檢索搜索引擎和分類目錄搜索引擎?,F(xiàn)在最出名的全文檢索搜索引擎就是Google(www.google.com)和百度(www.baidu.com)。在分類目錄搜索引擎中最著名的大型門戶網站是雅虎(www.yahoo.com)、新浪(www.sina.com)、搜狐(www.sohu.com)和網易(www.163.com)等。(2)搜索引擎的工作原理。搜索引擎在提供搜索服務前,要做好三步工作:從互聯(lián)網上抓取網頁,建立索引數(shù)據(jù)庫,在索引數(shù)據(jù)庫中搜索排序。上一頁下一頁返回6.3萬維網①從互聯(lián)網上抓取網頁。利用能夠從互聯(lián)網上自動收集網頁的Spider系統(tǒng)程序,自動訪問互聯(lián)網,并沿著任何網頁中的所有URL爬到其他網頁,重復這一過程,并把爬過的所有網頁收集回來。②建立索引數(shù)據(jù)庫。由分析索引系統(tǒng)程序對收集回來的網頁進行分析,提取相關網頁信息(包括網頁所在URL、編碼類型、頁面內容包含的關鍵詞、關鍵詞位置、生成時間、大小、與其他網頁的鏈接關系等),根據(jù)一定的相關度算法進行大量復雜計算后,得到每一個網頁針對頁面內容中及超鏈中每一個關鍵詞的相關度(或重要性),然后用這些相關信息建立網頁索引數(shù)據(jù)庫。上一頁下一頁返回6.3萬維網③在索引數(shù)據(jù)庫中搜索排序。當用戶輸入關鍵詞搜索后,由搜索系統(tǒng)程序從網頁索引數(shù)據(jù)庫中找到符合該關鍵詞的所有相關網頁。因為所有相關網頁針對該關鍵詞的相關度早已算好,所以只需按照現(xiàn)成的相關度數(shù)值排序,相關度越高,排名越靠前。④由頁面生成系統(tǒng)將搜索結果的鏈接地址和頁面內容摘要等內容組織起來返回給用戶。搜索引擎的Spider一般要定期重新訪問所有網頁(各搜索引擎的周期不同,可能是幾天、幾周或幾月,也可能對不同重要性的網頁有不同的更新頻率),更新網頁索引數(shù)據(jù)庫,以反映出網頁內容的更新情況,增加新的網頁信息,去除死鏈接,并根據(jù)網頁內容和鏈接關系的變化重新排序。這樣,網頁的具體內容和變化情況就會反映到用戶查詢的結果中。上一頁下一頁返回6.3萬維網(3)信息搜索的發(fā)展趨勢。①自然搜索。人們的日常交流是使用自然語言而非關鍵(字)詞,因為關鍵(字)詞表達的意思和意圖不完整、不準確,反映在搜索結果上的缺陷是返回信息過多。基于自然語言搜索,符合人們的語言習慣,像人與人之間的交流一樣輕松、直接、方便,這無疑給用戶提供了巨大的便利。②智能搜索。基于關鍵詞搜索是符號匹配,并不能處理關鍵詞本身的語義,這就是基于關鍵詞搜索存在一系列缺陷的原因。從這個層面上講,搜索引擎的發(fā)展趨勢是把“語言”計算技術和人工智能融合,讓計算機返回的結果富有針對性,將準確信息顯示在前兩三項的搜索結果之中。讓計算機具有人的智能和邏輯分析能力,能夠理解自然語言表達的語義,使搜索結果與用戶需求實現(xiàn)更精準的匹配,以解決問題的形式把結果返回給用戶。上一頁下一頁返回6.3萬維網2.萬維網電子商務平臺萬維網不僅是信息庫、信息的提供和傳輸系統(tǒng),現(xiàn)在已經演變成一個支持生產、經營、辦公的應用系統(tǒng),廣泛地應用在生活、管理、營銷等各社會領域,構建行業(yè)應用平臺。萬維網基礎上的電子商務平臺是萬維網眾多行業(yè)應用中的典型代表。網上商店、網上交易就是萬維網在營銷、流通領域的應用,數(shù)字商鋪、電子交易、網絡支付都是基于萬維網實現(xiàn)的,萬維網的這類應用打造了電子商務成功實施的信息平臺,是電子商務的基礎。上一頁下一頁返回6.3萬維網電子商務是以信息網絡技術為手段,以商品交換為中心的商務活動,也可理解為在互聯(lián)網(Internet)、企業(yè)內部網(Intranet)和增值網(ValueAddedNetwork,VAN)上以電子交易方式進行交易活動和相關服務的活動,是傳統(tǒng)商業(yè)活動各環(huán)節(jié)的電子化、網絡化、信息化。萬維網是實現(xiàn)這些活動的網絡平臺,并為這些活動提供信息系統(tǒng)支持。電子商務是在因特網開放的網絡環(huán)境下,基于瀏覽器/服務器的應用方式,它通常是指在全球各地廣泛的商業(yè)貿易活動中,買賣雙方不謀面地進行各種商貿活動,實現(xiàn)消費者的網上購物、商戶之間的網上交易和在線電子支付以及各種商務活動、交易活動、金融活動和相關的綜合服務活動的一種新型的商業(yè)運營模式。上一頁下一頁返回6.3萬維網電子商務的形成與交易離不開以下四方面的支持。(1)交易平臺。第三方電子商務平臺(以下簡稱第三方交易平臺)是指在電子商務活動中為交易雙方或多方提供交易撮合及相關服務的信息網絡系統(tǒng)的總和。(2)平臺經營者。第三方交易平臺經營者(以下簡稱平臺經營者)是指在工商行政管理部門登記注冊并領取營業(yè)執(zhí)照,從事第三方交易平臺運營并為交易雙方提供服務的自然人、法人和其他組織。(3)站內經營者。第三方交易平臺站內經營者(以下簡稱站內經營者)是指在電子商務交易平臺上從事交易及有關服務活動的自然人、法人和其他組織。上一頁下一頁返回6.3萬維網(4)支付系統(tǒng)。支付系統(tǒng)(PaymentSystem)是由提供支付清算服務的中介機構和實現(xiàn)支付指令傳送及資金清算的專業(yè)技術手段共同組成,用以實現(xiàn)債權債務清償及資金轉移的一種金融安排,有時也稱為清算系統(tǒng)(ClearSystem)。綜上可見,在構成電子商務的各個環(huán)節(jié)無處不現(xiàn)萬維網的蹤影。移動Web技術的成熟與應用促成了移動電商發(fā)展,使電子商務無處不在、無時不在。移動電子商務是指可以利用手機、PDA及掌上電腦等無線終端進行的B2B、B2C或C2C的電子商務。它將萬維網、移動通信技術、短距離通信技術及其他信息處理技術完美地結合,使人們可以在任何時間、任何地點進行各種商貿活動,實現(xiàn)隨時隨地、線上線下的購物與交易、在線電子支付以及各種交易活動、商務活動、金融活動和相關的綜合服務活動等。上一頁下一頁返回6.3萬維網3.移動Web與云計算隨著無線網絡技術的發(fā)展,人們越來越多地使用手持移動設備,如移動電話或PDA(PersonalDigitalAssistant)訪問萬維網。這種在移動中訪問網絡的方式給人們的工作和生活帶來了極大的便利。但是由于這些手持移動設備的存儲和計算能力及帶寬等方面的局限,使移動設備訪問萬維網的方式面臨許多技術問題,因為絕大多數(shù)的Web網站的內容是為具有寬帶連接并有強大顯示能力的桌面計算機而設計的。為此促生了移動Web技術,這些技術還正在快速發(fā)展和演進之中。上一頁下一頁返回6.3萬維網相比普通臺式計算機和筆記本電腦,用移動手機、PAD來瀏覽Web網頁存在幾個方面的困難,如:顯示屏幕小、輸入能力有限、無線接入帶寬有限且費用高、網絡的連通性不夠穩(wěn)定、電池壽命、散熱及成本等諸多因素導致移動終端計算、存儲能力有限。顯然把移動終端與面向普通計算機的Web頁面應用對接存在困難與挑戰(zhàn)。移動Web的早期方法采用了無線設備專用的無線應用協(xié)議(WirelessApplicationProtocol,WAP)。隨著3G網絡的大量部署,以及高性能移動手機的出現(xiàn),網絡帶寬和設備計算能力得到了巨大的提高。突然間,在移動電話上運行簡單的Web瀏覽器變成了完全有可能的事情。當前使用了與PC相同TCP/IP協(xié)議棧的移動Web從以下三個方面來提升性能。上一頁下一頁返回6.3萬維網(1)開發(fā)移動版本的網頁,構建移動Web網站。當用戶使用移動設備上網瀏覽Web網站時,Web服務器負責為用戶提供移動版本的網頁。在前面HTTP的報文結構的例子中,我們會發(fā)現(xiàn)在HTTP請求報文的首部行中有一個UserAgent首部,它標識了請求方所使用的瀏覽器軟件版本。通過查看這個首部信息,Web服務器能夠檢測出應該返回桌面版本的網頁還是移動版本的網頁。因此,當Web服務器接收到一個請求時,它可能首先查看請求報文的首部,然后給移動電話返回圖像小、文字少和簡單的導航頁面,而給桌面計算機用戶返回一個全功能的網頁。上一頁下一頁返回6.3萬維網(2)使用內容轉換技術。內容轉換(contenttransformation)或轉碼(transcoding)技術是將一臺計算機(轉碼服務器)設置在移動電話和Web服務器之間,它從移動電話獲得請求,然后從Web服務器預取頁面內容,最后把請求的內容轉換成移動友好的內容。一種非常簡單的轉換方法是減小大幅圖片的尺寸,將它重新格式化成一個較低分辨率的圖片。當然還可以使用其他許多針對不同媒體簡單而有用的轉換方法。上一頁下一頁返回6.3萬維網(3)開發(fā)移動瀏覽器。移動瀏覽器是專用于手持移動設備如移動電話或PDA的Web瀏覽器。移動瀏覽器為手持設備的小型屏幕顯示網頁做了各種優(yōu)化。移動瀏覽器軟件必須很小并且高效以適應無線手持設備的低內存與低帶寬。移動瀏覽器通常與轉碼器技術配合使用,以減少產生的流量。目前移動瀏覽器市場競爭非常激烈,在全球最著名的移動瀏覽器是Opera,而國內用戶使用得較多的是UC瀏覽器。除此之外,云計算、云服務的理念也深入移動Web應用,鑒于移動終端的處理計算能力的局限,在移動Web應用中,移動終端主要承擔請求提交、結果回顯的功能,更多的計算、數(shù)據(jù)存儲都由網絡服務器承擔。移動Web的快速發(fā)展,也為在PC網絡時代不景氣的云計算、云服務開拓了廣闊的發(fā)展空間,使之在眾多領域中獲得了大規(guī)模應用。上一頁下一頁返回6.3萬維網4.博客博客應用是萬維網單一信息源模式的突破。博客改變了傳統(tǒng)上網民僅僅是因特網上內容的消費者的現(xiàn)狀,成為因特網上信息的生產者,體現(xiàn)了共享與貢獻的完美結合。從歷史上看,Weblog這個新詞是JomBarger于1997年創(chuàng)造的。簡寫的blog(這是今天最常用的術語)則是PeterMerholz于1999年創(chuàng)造的。上一頁下一頁返回6.3萬維網博客,僅音譯,英文名為Blog,有人把blog既當作名詞,也當作動詞,表示編輯博客或寫博客。不久,新名詞blogger也出現(xiàn)了,它表示博客的擁有者、撰寫者或博客用戶。博客的正式名稱為網絡日志,是一種通常由個人管理、不定期張貼新的文章的網站。博客上的文章通常根據(jù)張貼時間,以倒序方式由新到舊排列。許多博客專注在特定的課題上提供評論或新聞,其他則被作為比較私密的日記。一個典型的博客結合了文字、圖像、其他博客或網站的鏈接及其他與主題相關的媒體,能夠讓讀者以互動的方式留下意見是許多博客的要素。大部分的博客內容以文字為主,仍有一些博客專注在藝術、攝影、視頻、音樂、播客等各種主題。博客是社會媒體網絡的一部分,比較著名的有新浪、網易等博客。上一頁下一頁返回6.3萬維網5.微博微博,微型博客(MicroBlog)的簡稱,是一種通過關注機制分享簡短實時信息的廣播式的社交網絡平臺。但微博不同于一般的博客。微博只記錄片段、碎語,三言兩語,現(xiàn)場記錄,發(fā)發(fā)感慨,曬曬心情,永遠只針對一個問題進行回答。微博只是記錄自己瑣碎的生活,呈現(xiàn)給人看,而且必須很真實。微博中不必有太多的邏輯思維,很隨便,很自由,有點像電影中的一個鏡頭。寫微博比寫其他東西簡單得多,不需要標題,不需要段落,更不需要漂亮的詞匯。微博是一個基于用戶關系信息分享、傳播以及獲取的平臺。用戶可以通過Web、WAP等各種客戶端組建個人社區(qū),以140字的文字更新信息,并實現(xiàn)即時分享。微博的關注機制分為可單向、可雙向兩種。上一頁下一頁返回6.3萬維網微博作為一種分享和交流平臺,其更注重時效性和隨意性。微博更能表達出每時每刻的思想和最新動態(tài),而博客則更偏重于梳理自己在一段時間內的所見、所聞、所感。因微博而誕生出微小說這種小說體裁。微博作為一種互動及傳播性極快的工具,實時性、現(xiàn)場感及快捷性往往超過所有媒體。同時微博的現(xiàn)實性、真實性使得其內容與社會緊密相關,而其即時性、隨意性又讓其正確性得不到保障。因此,作為社會交流、言論工具的微博常處于社會輿論的風口浪尖,引發(fā)爭議和不可預期的社會效應。因此,其管理和使用正處在不斷地規(guī)范過程中。上一頁下一頁返回6.3萬維網6.微信在通信模式上,微信是即時通信與萬維網Web服務的融合。在應用上,微信集交友、即時通信、電子商務、營銷等諸多應用于一體,是一種新興的信息應用平臺。微信(WeChat)是騰訊公司于2011年推出的一個為智能終端提供即時通信服務的免費應用程序,微信支持跨通信運營商、跨操作系統(tǒng)平臺通過網絡快速發(fā)送免費語音短信、視頻、圖片和文字;同時,也可以使用通過共享流媒體內容的資料和基于位置的社交插件如“搖一搖”“漂流瓶”“朋友圈”“公眾平臺”和“語音記事本”等服務插件。上一頁下一頁返回6.3萬維網微信與移動互連、移動Web發(fā)展相得益彰。截止到2015年第一季度,微信已經覆蓋中國90%以上的智能手機,月活躍用戶達到5.49億,用戶覆蓋200多個國家、超過20種語言。此外,各品牌的微信公眾賬號總數(shù)已經超過800萬個,移動應用對接數(shù)量超過85000個,微信支付用戶則達到了4億左右。微信提供公眾平臺、朋友圈、消息推送等功能,用戶可以通過“搖一搖”“搜索號碼”“附近的人”及掃二維碼方式添加好友和關注公眾平臺,同時微信將內容分享給好友以及將用戶看到的精彩內容分享到微信朋友圈。上一頁下一頁返回6.3萬維網微信作為時下最熱門的社交信息平臺,也是移動端的一大入口,正在演變成為一大商業(yè)交易平臺,它對營銷行業(yè)帶來的顛覆性變化開始顯現(xiàn)。微信商城的開發(fā)也隨之興起。微信商城是基于微信而研發(fā)的一款社會化電子商務系統(tǒng),消費者只要通過微信平臺,就可以實現(xiàn)商品查詢、選購、體驗、互動、訂購與支付的線上線下一體化服務模式。微信支付是集成在微信客戶端的支付功能,用戶可以通過手機完成快速的支付流程。微信支付向用戶提供安全、快捷、高效的支付服務,以綁定銀行卡的快捷支付為基礎。微信開啟智慧生活。2014年8月28日,微信支付正式公布“微信智慧生活”全行業(yè)解決方案。具體體現(xiàn)在以微信公眾號+微信支付為基礎,幫助傳統(tǒng)行業(yè)將原有商業(yè)模式“移植”到微信平臺。上一頁下一頁返回6.3萬維網微信提供的閉環(huán)式移動互聯(lián)網商業(yè)解決方案中,涉及的服務能力包括:移動電商入口、用戶識別、數(shù)據(jù)分析、支付結算、客戶關系維護、售后服務和維權、社交推廣等。這也預示著微信再次加大商業(yè)化開放步伐,為合作伙伴提供連接能力,助推企業(yè)用戶商業(yè)模式的移動互聯(lián)網化轉型。通過為合作伙伴提供“連接一切”的能力,微信正在形成一個全新的“智慧型”生活方式。其已經滲透到以下傳統(tǒng)行業(yè),如微信打車、微信交電費、微信購物、微信醫(yī)療、微信酒店等,為醫(yī)療、酒店、零售、百貨、餐飲、票務、快遞、高校、電商、民生等數(shù)十個行業(yè)提供標準解決方案。微信彌漫著時代氣息,強力推動著萬維網拓展創(chuàng)新應用。上一頁下一頁返回6.3萬維網7.萬維網技術模式總結萬維網在各行業(yè)中得以廣泛地應用與發(fā)展,得益于其B/S(Browser/Server)架構下的通用應用程序客戶端技術。Browser/Server結構主要是利用了不斷成熟的Web瀏覽器技術,結合瀏覽器的多種腳本語言和ActiveX技術,用通用瀏覽器實現(xiàn)原來需要復雜專用軟件才能實現(xiàn)的強大功能,同時節(jié)約了開發(fā)成本。用戶通過顯示在通用瀏覽器中的動態(tài)頁面執(zhí)行各種操作,使用標準的HTTP協(xié)議訪問服務器上的數(shù)據(jù)。B/S最大的優(yōu)點就是可以在任何地方進行操作而不用安裝任何專門的軟件,只要有一臺能上網的電腦就能使用,客戶端零安裝、零維護,系統(tǒng)的擴展非常容易。上一頁返回6.4電子郵件電子郵件(e-mail)是因特網上使用最多的和最受用戶歡迎的一種應用。在互聯(lián)網發(fā)展的早期,電子郵件是人們交流信息、傳送文件的重要方式;現(xiàn)在,隨著因特網上即時通信、文件傳輸方式的增多,電子郵件的功能在許多場合雖有了替代方案,但仍然是因特網的重要應用之一。1982年,RFC821、RFC822標準分別對簡單郵件傳送協(xié)議SMTP(SimpleMailTransferProtocol)和因特網文本報文格式作了規(guī)定,標志著電子郵件正式成為因特網的一個服務。1993年又提出了通用因特網郵件擴充MIME(MultipurposeInternetMailExtensions)讓電子郵件突破只能進行ASCII碼傳輸?shù)木窒扌?,實現(xiàn)郵件的多媒體數(shù)據(jù)傳輸。經過多次修訂,現(xiàn)在使用的電子郵件由RFC2821和RFC2822標準定義。
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- (完整版)生理學試題及答案400題
- 郵政招聘考試真題及答案
- vivo秋招試題及答案
- 單體電壓技師考試題庫及答案
- 車子駕駛證考試題庫及答案
- 中共臺州市路橋區(qū)委全面深化改革委員會辦公室關于公開選聘工作人員1人參考題庫必考題
- 中國金融出版社有限公司2026校園招聘4人考試備考題庫附答案
- 公主嶺市公安局2025年招聘警務輔助人員(150人)考試備考題庫必考題
- 南充市司法局2025年下半年公開遴選公務員(參公人員)公 告(2人)備考題庫必考題
- 吉水縣園區(qū)開發(fā)建設有限公司及下屬子公司2026年第一批面向社會公開招聘備考題庫附答案
- 2026年浙江高考語文真題試卷+答案
- 2025 年大學人工智能(AI 應用)期中測試卷
- 《市場營銷(第四版)》中職完整全套教學課件
- (正式版)DB61∕T 2121-2025 《風力發(fā)電場集電線路設計規(guī)范》
- 疑難病例討論制度落實常見問題與改進建議
- 創(chuàng)傷性脾破裂的護理
- 蓬深102井鉆井工程(重新報批)項目環(huán)境影響報告表
- 大模型金融領域可信應用參考框架
- (新教材)2025年人教版七年級上冊歷史期末復習常考知識點梳理復習提綱(教師版)
- 中國全色盲診療專家共識2026
- 中國地質大學武漢本科畢業(yè)論文格式
評論
0/150
提交評論