版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
直接成分分析法在計(jì)算機(jī)結(jié)構(gòu)與樹(shù)形圖上的運(yùn)用
0叉樹(shù)形態(tài)的復(fù)雜性樹(shù)型圖在數(shù)學(xué)研究、計(jì)算機(jī)編程和語(yǔ)言學(xué)研究中發(fā)揮著重要作用。在語(yǔ)言學(xué)研究領(lǐng)域,分叉樹(shù)形圖經(jīng)常用于視覺(jué)化體現(xiàn)某一語(yǔ)言(英語(yǔ))結(jié)構(gòu):句子結(jié)構(gòu)、音節(jié)結(jié)構(gòu)和音位幾何特征。目前常見(jiàn)的利用分叉樹(shù)形圖分析相關(guān)句子(詞組)結(jié)構(gòu)的理論主要有:Chomsky在轉(zhuǎn)化生成語(yǔ)法中提出的X-、SP理論、表層深層結(jié)構(gòu)轉(zhuǎn)化規(guī)則1-177,Halliday在系統(tǒng)功能語(yǔ)法中提出的最小括號(hào)法486-521;人們根據(jù)Bloomfield提出的直接成分分析法168-169在分析實(shí)際問(wèn)題時(shí),所采用的二叉樹(shù)分析圖等。然而,即便是二叉樹(shù)也有不同的形態(tài),為研究方便,本文采用的是如圖1所示的二叉樹(shù)形態(tài)。語(yǔ)言學(xué)直接成分分析法(以下簡(jiǎn)稱IC分析法)中的二叉樹(shù)和程序設(shè)計(jì)中的數(shù)據(jù)存儲(chǔ)結(jié)構(gòu)二叉樹(shù)(以下簡(jiǎn)稱二叉樹(shù))有著某些相似的特征。例如:二者都由結(jié)點(diǎn)和分叉構(gòu)成;一個(gè)結(jié)點(diǎn)都可以引申出兩個(gè)子結(jié)點(diǎn)。因而,語(yǔ)言學(xué)二叉樹(shù)可以看作一種特殊的信息數(shù)據(jù)存儲(chǔ)結(jié)構(gòu)二叉樹(shù)。另外,筆者試作如此猜想:數(shù)據(jù)存儲(chǔ)結(jié)構(gòu)二叉樹(shù)的內(nèi)在關(guān)系以及與之相關(guān)的數(shù)學(xué)公式是否可以用于揭示直接成分分析法中二叉樹(shù)的內(nèi)在關(guān)系呢?如果可以,鑒于后者的特殊性,原先的數(shù)學(xué)關(guān)系又將作如何調(diào)整?其實(shí)這一假設(shè)可以分解為以下幾個(gè)子問(wèn)題:IC分析法二叉樹(shù)可以分為哪幾類?在語(yǔ)言學(xué)二叉樹(shù)中,各個(gè)語(yǔ)言單位(可以看作二叉樹(shù)的結(jié)點(diǎn)),語(yǔ)言層次(可以看作二叉樹(shù)的層次或深度),以及整個(gè)樹(shù)形圖之間存在何種數(shù)學(xué)關(guān)系?這些關(guān)系成立的前提條件是什么以及如何應(yīng)用到實(shí)例中?IC分析法有無(wú)多元化分的可能性?若可分,多元化分中的內(nèi)在關(guān)系將是怎樣的?在《語(yǔ)言論》一書(shū)中,Bloomfiled提出了兩個(gè)著名的語(yǔ)言分析方法:語(yǔ)言學(xué)刺激反應(yīng)公式23和直接成分分析法169。從研究角度上講,國(guó)內(nèi)已有學(xué)者從數(shù)理角度對(duì)前者進(jìn)行了拓展性研究,但是鮮有學(xué)者從數(shù)理角度繼續(xù)深入研究后者。通過(guò)類比數(shù)據(jù)結(jié)構(gòu)二叉樹(shù)的分類和性質(zhì),本文重點(diǎn)研究了理想化條件下IC二叉樹(shù)的分類和內(nèi)部數(shù)學(xué)關(guān)系,探討了多元?jiǎng)澐值目赡苄?以期為自然語(yǔ)言(英語(yǔ))的計(jì)算機(jī)處理提供新思路,從而深入拓展IC分析法。1研究背景1.1相關(guān)文獻(xiàn)記載Bloomfield于1933年在《語(yǔ)言論》一書(shū)中首次明確地提出了IC分析法168-169,大多數(shù)語(yǔ)言學(xué)家對(duì)IC分析的合理性并未提出太多的質(zhì)疑,而且似乎是“順理成章”地接受了其理論與方法55。但是他并沒(méi)有直接定義這一概念,而是通過(guò)例子來(lái)闡釋:……AnyEnglishspeakingpersonwhoconcernshimselfwiththismatterissuretotellusthattheimmediateconstituentsofPoorJohnranawayarethetwoformsPoorJohnandranaway;thateachoftheseis,inturn,acomplexform;thattheimmediateconstituentsofranawayareran,morpheme,andaway,acomplexform,whoseconstituentsarethemorphemesa-andway;andthattheconstituentsofPoorJohnarePoorandJohn.Onlyinthiswaywillaproperanalysisleadtotheultimatelyconstituentmorphemes……168-169由以上論述可知:IC分析法是一種語(yǔ)法分析體系,它把較大的語(yǔ)言單位(句子或詞組)分成連續(xù)不斷的層次或成分,這種分析直到最后一層,即每一成分僅含一個(gè)詞或其有意義的部分。它的的核心特征可以歸納為:兩分法(二元化分)適用于各個(gè)層次;兩分法直至遇到不可再分的成分(通常到詞)才停止。IC分析法是對(duì)語(yǔ)言形式上的劃分,需要指出的是:雖然Bloomfield認(rèn)為語(yǔ)言分析應(yīng)該從形式出發(fā),但并不否認(rèn)意義因素在語(yǔ)言分析中的作用53。他認(rèn)為IC分析中的最終不可分成分一般為詞素,而詞素就是語(yǔ)言中最小的有意義的單位,這點(diǎn)可以證明他對(duì)意義的重視。為了便于二叉樹(shù)與實(shí)際所代表的語(yǔ)言(單位)對(duì)應(yīng),本文所提及的IC分析法只研究到詞的層面。語(yǔ)言學(xué)家們?cè)酶鞣N圖形闡釋IC分析法:包括集合交并法、括號(hào)法、凹凸表法以及二叉樹(shù)等。鑒于二叉樹(shù)形態(tài)的多樣性,為闡釋方便,本文只研究如圖1所示的二叉樹(shù)形態(tài)。1.2叉樹(shù)的基本性質(zhì)數(shù)據(jù)結(jié)構(gòu)二叉樹(shù)具有如下性質(zhì):①在二叉樹(shù)的第k層,最多有2k-1(k≥1)個(gè)結(jié)點(diǎn);②深度為m的二叉樹(shù)最多有2m-1個(gè)結(jié)點(diǎn);③在任意一棵二叉樹(shù)中,深度為0的結(jié)點(diǎn)總是比度為2的結(jié)點(diǎn)多1個(gè);④具有n個(gè)結(jié)點(diǎn)的二叉樹(shù),其深度(最大層次數(shù))至少為[log2n]+1,其中[log2n]表示只取log2n的整數(shù)部分;⑤具有n個(gè)結(jié)點(diǎn)的完全二叉樹(shù)的深度為[log2n]+1,其中表示只取整數(shù)34-36。當(dāng)然,二叉樹(shù)還有許多其它性質(zhì),鑒于篇幅限制,本文將根據(jù)以上幾個(gè)結(jié)論來(lái)探究語(yǔ)言學(xué)IC二叉樹(shù)中較為簡(jiǎn)單的基本性質(zhì)。數(shù)據(jù)結(jié)構(gòu)二叉樹(shù)有兩個(gè)特殊的類型:滿二叉樹(shù)和完全二叉樹(shù)。在前者中:除最后一層外,每一層上的所有結(jié)點(diǎn)都有兩個(gè)子結(jié)點(diǎn);在后者中,除最后一層外,每一層上的結(jié)點(diǎn)數(shù)均達(dá)到最大值;兩者在最后一層上只缺少右邊的若干結(jié)點(diǎn)34-36。語(yǔ)言學(xué)二叉樹(shù)自身的特性決定了它不是簡(jiǎn)單的二叉樹(shù),其性質(zhì)和分類不能簡(jiǎn)單地與信息結(jié)構(gòu)二叉樹(shù)相類比。2ic分析中相交樹(shù)的分類2.1深度的分析在IC分析法框架內(nèi),IC二叉樹(shù)的樹(shù)形結(jié)構(gòu)可與自然語(yǔ)言的結(jié)構(gòu)相對(duì)應(yīng)。結(jié)點(diǎn)表示語(yǔ)言單位或成分。如圖1中,A作為根結(jié)點(diǎn)代表著一個(gè)較大的語(yǔ)言單位(句子或詞組);子結(jié)點(diǎn)B和C代表構(gòu)成A的兩個(gè)直接成分(詞組或詞);結(jié)點(diǎn)D和E表示構(gòu)成上一結(jié)點(diǎn)B的兩個(gè)直接成分;同理以此類推,最終得出兩個(gè)不可再分的結(jié)點(diǎn)H和I(不可再分的語(yǔ)言成分)。另外,樹(shù)形層次代表語(yǔ)言層次。比如,A所處的層次代表著將要進(jìn)行IC分析的較高的語(yǔ)言層(句子層或詞組層);B,C表示經(jīng)過(guò)IC分析法處理后,所得出的較低的語(yǔ)言層;其他結(jié)點(diǎn)以此類推,屬于更低的層次。而且,并不是所有出于同一層次的結(jié)點(diǎn)都可以進(jìn)行IC劃分。在第3層上,有的結(jié)點(diǎn)(如:D,F,G)已經(jīng)是詞,或者經(jīng)過(guò)若干次IC劃分已經(jīng)處于詞的層面,一般不能再進(jìn)行劃分;而有的結(jié)點(diǎn)(E),由于還未劃分到詞,因而可以再分,并且在第4層次得出H和I兩個(gè)葉子結(jié)點(diǎn)(E的直接不可分成分,即詞)。筆者稱這種現(xiàn)象為“直接不可分成分”出現(xiàn)的不同步性。另外“直接不可分成分”用Bloomfield的術(shù)語(yǔ)來(lái)表示就是“最終成分”168-169。本文IC二叉樹(shù)研究的重要前提“最終成分(二叉樹(shù)中用葉子結(jié)點(diǎn)或終結(jié)點(diǎn)表示)”或“直接不可分成分”就是指詞。在這個(gè)前提下,D,H,I,F,G(葉子結(jié)點(diǎn))代表著構(gòu)成我們通常所見(jiàn)的(將要進(jìn)行直接成分劃分的)句子(根結(jié)點(diǎn)A)的詞。值得注意的是:IC分析法核心特性決定了IC二叉樹(shù)的某一結(jié)點(diǎn)(在可分的情況下)必須同時(shí)分成兩個(gè)子結(jié)點(diǎn)。這點(diǎn)與信息結(jié)構(gòu)二叉樹(shù)不同,后者的結(jié)點(diǎn)的分化不必同時(shí),而是按照信息訪問(wèn)(查詢,又稱遍歷)或存儲(chǔ)的次序進(jìn)行排列的。另外,直接成分分析法體現(xiàn)出的語(yǔ)言的設(shè)計(jì)特征“創(chuàng)造性”34-36,20-21及“遞歸性”,使語(yǔ)言單位具有無(wú)限次二元?jiǎng)澐值目赡苄?這是本文IC二叉樹(shù)研究的另一個(gè)重要前提。2.2滿ic二叉樹(shù)形態(tài)筆者認(rèn)為IC二叉樹(shù)可以分為3類:空IC二叉樹(shù)、滿IC二叉樹(shù)、非滿IC二叉樹(shù)。從圖形角度來(lái)講,空樹(shù)是只有一個(gè)結(jié)點(diǎn)(根結(jié)點(diǎn))或沒(méi)有結(jié)點(diǎn)的IC二叉樹(shù)。從語(yǔ)言學(xué)角度來(lái)看,它表示的是這樣1個(gè)語(yǔ)言單位:只含有1個(gè)詞,或者含有非詞成分,抑或非語(yǔ)言形式(無(wú)語(yǔ)、手勢(shì)語(yǔ)等)。如圖2所示,前者的樹(shù)形圖可記作“·”;后兩者的樹(shù)形圖可記作“Φ”??諛?shù)可描述為:“在某些語(yǔ)境中,以某種句子類型出現(xiàn)詞或非詞成分。177”它們可以履行句子的職能,表達(dá)一個(gè)完整的意思。比如:(1)a:Whatdoyouknowaboutthecriminal?b:……(Silence)(2)c:Whatistheprefixintheword‘pretext’?d:Pre-.(3)e:Whendoyougohome?f:Tomorrow.滿IC二叉樹(shù)形態(tài)(如圖3所示)類似于數(shù)據(jù)結(jié)構(gòu)二叉樹(shù)中的滿二叉樹(shù)形態(tài)。從圖形角度來(lái)講,所有葉子結(jié)點(diǎn)或終結(jié)點(diǎn)都分布在同一層次,即最底層。從語(yǔ)言角度來(lái)看,在IC分析作用下,語(yǔ)言單位(或其成分)的所有直接不可分成分均出現(xiàn)在同一語(yǔ)言層(最底層)。這一點(diǎn)可歸結(jié)為:“直接不可分成分”出現(xiàn)的同步性。要想呈現(xiàn)出滿樹(shù)分布特征,從較高層次分化出來(lái)的直接成分應(yīng)該具有類似的劃分結(jié)構(gòu),即都可以同時(shí)劃分出相同數(shù)量的語(yǔ)言成分(結(jié)構(gòu)),或經(jīng)過(guò)若干次IC分析后得出的語(yǔ)言成分同時(shí)在同一語(yǔ)言層上具有不可再分性(通常到詞)。此外,這也反映了在IC分析法作用下,語(yǔ)言成分(單位)分布的對(duì)稱性。例如,英文句子“Thegirlwalkedhome”的IC分析圖具有上述特征。非滿IC二叉樹(shù)(如圖4)與滿樹(shù)相對(duì)。從圖形角度來(lái)講,葉子結(jié)點(diǎn)或終結(jié)點(diǎn)不都分布在同一層次(最底層)。從語(yǔ)言角度來(lái)看,它體現(xiàn)了語(yǔ)言“直接不可分成分”出現(xiàn)的不同步性。對(duì)于呈現(xiàn)出非IC滿樹(shù)分布特征的語(yǔ)言單位,從較高層次分化出來(lái)的直接成分不具有類似的劃分結(jié)構(gòu),即不能同時(shí)劃分出相同數(shù)量的語(yǔ)言成分(結(jié)構(gòu))。這反映了在IC分析法作用下,語(yǔ)言成分(單位)分布的不對(duì)稱性。如詞組“thebeautifulgirl”的IC二叉樹(shù)就是非滿樹(shù)。但是,在樹(shù)形上,非滿IC二叉樹(shù)不同于作為數(shù)據(jù)結(jié)構(gòu)的完全二叉樹(shù),原因在于:后者除最后一層外每一層上的結(jié)點(diǎn)數(shù)均達(dá)到最大值,在最后一層上只缺少右邊的若干結(jié)點(diǎn);而前者,依據(jù)其定義,最后一層外每一層上的結(jié)點(diǎn)數(shù)可以不達(dá)到最大值,在最后一層上(依據(jù)語(yǔ)言環(huán)境)可以缺失任意位置的結(jié)點(diǎn)。據(jù)此,在二元?jiǎng)澐智疤嵯?從形態(tài)上看,非滿IC二叉樹(shù)不完全等同于作為數(shù)據(jù)結(jié)構(gòu)的完全二叉樹(shù)。此外,在IC分析法作用下,我們還可得出空IC二叉樹(shù)的語(yǔ)言單位或成分(結(jié)點(diǎn))總數(shù)恒為1或0,滿IC二叉樹(shù)和非滿二叉樹(shù)的語(yǔ)言單位或成分(結(jié)點(diǎn))總數(shù)為奇數(shù)。3語(yǔ)言學(xué)與二叉樹(shù)之間的內(nèi)部數(shù)學(xué)關(guān)系3.1滿語(yǔ)2號(hào)的節(jié)點(diǎn)數(shù)和語(yǔ)言學(xué)意義3.1.1確定嚴(yán)格控制參數(shù)的公式在滿IC二叉樹(shù)中,一個(gè)根結(jié)點(diǎn)分化成第2樹(shù)層的兩個(gè)次結(jié)點(diǎn);在第3層,上一層兩個(gè)次結(jié)點(diǎn)又依次分別分化成相應(yīng)的兩個(gè)結(jié)點(diǎn),共計(jì)4個(gè)結(jié)點(diǎn);以此類推:后一層上的結(jié)點(diǎn)數(shù)是前一層次結(jié)點(diǎn)數(shù)的兩倍。以上特點(diǎn)說(shuō)明了:滿IC二叉樹(shù)的各層的結(jié)點(diǎn)數(shù)形成了以1(根結(jié)點(diǎn)數(shù))為首項(xiàng),2為公比的等比數(shù)列。設(shè)某一樹(shù)層為第m層,此層的結(jié)點(diǎn)數(shù)為am,根據(jù)等比數(shù)列公式,可得am=2(m-1)(m≥1,m∈N+),此公式表示的圖形意義為:當(dāng)IC滿樹(shù)的某一樹(shù)層m確定時(shí),第m層的結(jié)點(diǎn)數(shù)為2(m-1)。am和m的關(guān)系可以用一個(gè)更普遍的函數(shù)y=2(x-1)來(lái)表示。am=2(m-1)等價(jià)變形可得m=log2am+1,當(dāng)am為已知時(shí)(設(shè)am=t),則原方程變形為m=log2t+1(t≥1,t∈N+)。此公式表示的圖形意義為:某層次的結(jié)點(diǎn)數(shù)t確定時(shí),則這一層次必是log2t+1層。另外,以上結(jié)論也可從滿二叉樹(shù)(數(shù)據(jù)結(jié)構(gòu))的性質(zhì)④得出34-36。根據(jù)IC二叉樹(shù)結(jié)點(diǎn)與自然語(yǔ)言(英語(yǔ))語(yǔ)言單位和語(yǔ)言層次的對(duì)應(yīng)關(guān)系,以上結(jié)論可歸為:在IC分析法作用下,當(dāng)所涉及的語(yǔ)言單位呈現(xiàn)出滿二叉樹(shù)分布狀態(tài)時(shí),位于某語(yǔ)言層m的(被劃分出的)語(yǔ)言成分(單位)數(shù)為:2(m-1);特定語(yǔ)言層的語(yǔ)言成分?jǐn)?shù)t確定時(shí),則其必分布在第log2t+1層上。3.1.2滿二叉樹(shù)數(shù)據(jù)結(jié)構(gòu)滿二叉樹(shù)的各層的結(jié)點(diǎn)數(shù)構(gòu)成了等比數(shù)列。因而求滿二叉樹(shù)的總的結(jié)點(diǎn)就等于求等比數(shù)列的和。設(shè)此等比數(shù)列有m(m≥1)項(xiàng),即二叉樹(shù)有m個(gè)樹(shù)層。當(dāng)m趨近+∞時(shí),則前m項(xiàng)和為:Sm=∑m=1∞am=∑m=1∞2(m?1)=a1+a2+a3+?+am.Sm=∑m=1∞am=∑m=1∞2(m-1)=a1+a2+a3+?+am.根據(jù)等比數(shù)列前n項(xiàng)和公式Sn=a1(1-qn)/(1-q),可得Sm=1(1-2m)/(1-2)=2m-1(m≥1,m∈N+)。此公式的圖形意義為:當(dāng)IC滿樹(shù)的前m層結(jié)點(diǎn)總數(shù)為2m-1。另外Sm和m的數(shù)學(xué)關(guān)系可用一個(gè)更普遍的函數(shù)y=2x-1來(lái)表示。當(dāng)IC滿樹(shù)的結(jié)點(diǎn)總數(shù)確定時(shí)(設(shè)Sm=p),也可求出有多少樹(shù)層m,其關(guān)系式為:m=log2(p+1)。這個(gè)結(jié)論的證明如下:由Sm=2m-1得:log2Sm=log2(2m-1),即m=log2(Sm+1),把p=Sm代入此式得:m=log2(p+1)。另外,以上結(jié)論也可從滿二叉樹(shù)(數(shù)據(jù)結(jié)構(gòu))的性質(zhì)得出34-36。從語(yǔ)言學(xué)角度看,以上結(jié)論可歸納為:在IC分析法作用下,呈現(xiàn)出滿樹(shù)分布狀態(tài)的較大語(yǔ)言單位及其劃分出的成分總數(shù)為2m-1(m為語(yǔ)言單位在IC分析法作用下呈現(xiàn)出的語(yǔ)言層次)。3.2ic-2叉樹(shù)的節(jié)點(diǎn)、樹(shù)層的最佳值和學(xué)術(shù)意義3.2.1在滿樹(shù)各層深度結(jié)構(gòu)設(shè)計(jì)時(shí),求各層點(diǎn)對(duì)點(diǎn)及分值的有效性通過(guò)觀察3類IC二叉樹(shù)形態(tài),可得出在同等條件下,即當(dāng)樹(shù)層數(shù)(m≥1)確定時(shí),滿IC二叉樹(shù)的結(jié)點(diǎn)總數(shù)最多。其推理如下:當(dāng)m=1時(shí),空IC二叉樹(shù)結(jié)點(diǎn)數(shù)為1,滿IC二叉樹(shù)結(jié)點(diǎn)數(shù)為1,非滿IC二叉樹(shù)結(jié)點(diǎn)數(shù)為1;當(dāng)m>1時(shí)(空IC二叉樹(shù)不符合條件),由于滿樹(shù)各層結(jié)點(diǎn)(除最后一層)都能分出兩個(gè)子結(jié)點(diǎn),而非滿樹(shù)的各層的結(jié)點(diǎn)(除最后一層)不能充分進(jìn)行分化,因此樹(shù)層數(shù)相同時(shí),滿樹(shù)的結(jié)點(diǎn)數(shù)大于非滿樹(shù)的結(jié)點(diǎn)數(shù)。綜上所述,當(dāng)樹(shù)層數(shù)m確定時(shí),求此IC二叉樹(shù)的結(jié)點(diǎn)數(shù)的最大值就等價(jià)于求滿IC二叉樹(shù)的結(jié)點(diǎn)總數(shù):Sm=2m-1(m≥1,m∈N+)。另外,關(guān)于結(jié)點(diǎn)最大值的結(jié)論也可以從數(shù)據(jù)結(jié)構(gòu)二叉樹(shù)的性質(zhì)①得出。另外,當(dāng)樹(shù)層數(shù)(m≥1)確定時(shí),要想使結(jié)點(diǎn)分布的總數(shù)最少,則除最后一層外,每層只有一個(gè)結(jié)點(diǎn)可以分化出兩個(gè)次結(jié)點(diǎn)。此時(shí)結(jié)點(diǎn)總數(shù)為Sm=2(m-1)+1=2m-1(m≥1,m∈N+)。從語(yǔ)言學(xué)角度看,以上結(jié)論可歸為:在IC分析法作用下,當(dāng)可被二元?jiǎng)澐值妮^大語(yǔ)言單位呈現(xiàn)出的層次為m(m≥1)時(shí),此語(yǔ)言單位及其劃分出的成分最少為2m-1;此語(yǔ)言單位及其劃分出來(lái)的成分最多為2m-1。3.2.2提出結(jié)論及結(jié)果通過(guò)觀察3類IC二叉樹(shù)形態(tài),我們還可以發(fā)現(xiàn):當(dāng)結(jié)點(diǎn)數(shù)p=0時(shí),此樹(shù)為空數(shù),樹(shù)層不存在;結(jié)點(diǎn)數(shù)p=1時(shí),這3類二叉樹(shù)樹(shù)層各為1;當(dāng)結(jié)點(diǎn)數(shù)p>1時(shí),要想使結(jié)點(diǎn)分布的層次最少,必須使各個(gè)層次都排滿結(jié)點(diǎn),即每個(gè)結(jié)點(diǎn)(除最后一層)都可IC劃分(如圖3所示)。而在3類IC二叉樹(shù)中,最能充分實(shí)現(xiàn)結(jié)點(diǎn)IC劃分的只有滿IC二叉樹(shù)。綜上所述,當(dāng)結(jié)點(diǎn)數(shù)p≥1時(shí),求IC二叉樹(shù)樹(shù)層的最小值就等價(jià)于求滿IC二叉樹(shù)的數(shù)層數(shù)m,m=log2(p+1)。反之,在IC分析法作用下,結(jié)點(diǎn)總數(shù)確定時(shí),要想使結(jié)點(diǎn)分布的層次最多,則除最后一層外。每層只有一個(gè)結(jié)點(diǎn)可以分化出兩個(gè)次結(jié)點(diǎn)(如圖5所示)。設(shè)結(jié)點(diǎn)數(shù)為p(p≥1),樹(shù)層數(shù)為m,根據(jù)以上的推理和IC二叉樹(shù)特點(diǎn)可得:p=2(m-1)+1,即m=(p+1)/2。綜上所述,當(dāng)結(jié)點(diǎn)數(shù)p≥1時(shí),所形成IC二叉樹(shù)樹(shù)層數(shù)的最大值為(p+1)/2。事實(shí)上,當(dāng)m≥3時(shí),此類樹(shù)前一層結(jié)點(diǎn)分劃的可能性(c1221)會(huì)影響下一層結(jié)點(diǎn)劃分,根據(jù)相應(yīng)的排列組合公式,可得此樹(shù)的形態(tài)共有2(m-2)種。從語(yǔ)言學(xué)角度看,以上結(jié)論可歸納為:在IC分析法作用下,當(dāng)可被二元?jiǎng)澐值妮^大語(yǔ)言單位(包括其被二元?jiǎng)澐值乃谐煞?有p(p≥1)個(gè)時(shí),它(們)所形成的語(yǔ)言層次最少為:log2(p+1);所形成的語(yǔ)言層次最多為:(p+1)/2。4建立數(shù)據(jù)庫(kù)語(yǔ)料庫(kù)以數(shù)據(jù)結(jié)構(gòu)二叉樹(shù)的性質(zhì)和直接成分分析法為研究基礎(chǔ),本文所揭示的語(yǔ)言內(nèi)部的數(shù)學(xué)關(guān)系有著一定的理論價(jià)值和應(yīng)用價(jià)值。IC分析法的優(yōu)點(diǎn)在于可以層次鮮明地揭示出語(yǔ)言內(nèi)部的結(jié)構(gòu)層次,有助于語(yǔ)言描寫(xiě)的客觀精確;可以分析歧義句;發(fā)現(xiàn)新語(yǔ)法規(guī)律。國(guó)內(nèi)已有學(xué)者提倡在外國(guó)文學(xué)教學(xué)中發(fā)揮學(xué)生數(shù)學(xué)邏輯智能的重要性。鑒于此,拓展后的IC分析法,特別是其中的數(shù)學(xué)關(guān)系和公式以及形態(tài)圖,也可以應(yīng)用在語(yǔ)言學(xué)和文學(xué)的教學(xué)中。它有助于教師和學(xué)生從數(shù)學(xué)角度(借助相關(guān)的計(jì)算軟件和多媒體設(shè)備)來(lái)分析語(yǔ)言的層次結(jié)構(gòu),改變以往的純語(yǔ)言分析,這也符合多元智能(MI)理論11-12中培養(yǎng)數(shù)學(xué)邏輯智能和空間智能的要求。目前,計(jì)算機(jī)處理句法(結(jié)構(gòu))歧義的方法主要是概率上下文無(wú)關(guān)語(yǔ)法、概率詞匯下文無(wú)關(guān)語(yǔ)法和概率CYK算法。這些方法主要是依據(jù)概率計(jì)算和與之相關(guān)的語(yǔ)料庫(kù)來(lái)判斷某種句法結(jié)構(gòu)出現(xiàn)的可能性。筆者嘗試用拓展后的IC分析法來(lái)處理句法歧義。原因在于:不同的句法結(jié)構(gòu)所表示的意義不同,
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 耐輻射奇球菌研究
- 次貸危機(jī)與保險(xiǎn)解析
- 《GBT 29265.304-2016 信息技術(shù) 信息設(shè)備資源共享協(xié)同服務(wù) 第 304 部分:數(shù)字媒體內(nèi)容保護(hù)》專題研究報(bào)告
- 《GBT 31817-2015 風(fēng)力發(fā)電設(shè)施防護(hù)涂裝技術(shù)規(guī)范》專題研究報(bào)告
- 《GBT 31783-2015 商用木材與木制品標(biāo)識(shí)》專題研究報(bào)告
- 《AQ 6113-2025呼吸防護(hù) 氧氣呼吸器安全使用維護(hù)技術(shù)規(guī)范》專題研究報(bào)告
- 《Python語(yǔ)言程序設(shè)計(jì)》課件-2.1 掌握程序的格式框架
- 商業(yè)用房按揭貸款擔(dān)保合同
- 中成藥提取工崗位招聘考試試卷及答案
- 竹編技師(初級(jí))考試試卷及答案
- 招標(biāo)代理機(jī)構(gòu)遴選投標(biāo)方案(技術(shù)標(biāo))
- Unit 1 People of Achievement Vocabulary 單詞講解課件高二英語(yǔ)人教版(2019)選擇性必修第一冊(cè)
- 廣東事業(yè)單位工作人員聘用體檢表
- NB-T+10488-2021水電工程砂石加工系統(tǒng)設(shè)計(jì)規(guī)范
- 建設(shè)法規(guī) 課件全套 項(xiàng)目1-8 建設(shè)工程法規(guī)基礎(chǔ)- 建設(shè)工程其他相關(guān)法律制度
- 2024年RM機(jī)器人大賽規(guī)則測(cè)評(píng)筆試歷年真題薈萃含答案
- 頭頸腫瘤知識(shí)講座
- 小學(xué)二年級(jí)體育教案全冊(cè)表格式
- 儲(chǔ)能收益統(tǒng)計(jì)表
- 手術(shù)室經(jīng)腹腔鏡膽囊切除術(shù)護(hù)理查房
- GB/T 17451-1998技術(shù)制圖圖樣畫(huà)法視圖
評(píng)論
0/150
提交評(píng)論