應(yīng)用人工智能及統(tǒng)計于大數(shù)據(jù)會話自動分析_第1頁
應(yīng)用人工智能及統(tǒng)計于大數(shù)據(jù)會話自動分析_第2頁
應(yīng)用人工智能及統(tǒng)計于大數(shù)據(jù)會話自動分析_第3頁
應(yīng)用人工智能及統(tǒng)計于大數(shù)據(jù)會話自動分析_第4頁
應(yīng)用人工智能及統(tǒng)計于大數(shù)據(jù)會話自動分析_第5頁
已閱讀5頁,還剩48頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

應(yīng)用人工智能及統(tǒng)計于大數(shù)據(jù):會話自動分析

ApplyingArtificialIntelligence&StatisticstoBigData:

AutomaticAnalysisofConversations很多人做決定都是根據(jù)傳統(tǒng)/信念Toomanydecisionsbasedontradition/beliefs而非數(shù)據(jù)和結(jié)果Ratherthandata&consequences令我沮喪Makesmefrustrated傳統(tǒng)vs.數(shù)據(jù)Traditionvs.Data在餐廳工作時Restaurantjob:

我將9包面以3乘3的方式入箱 Ipacked9noodlesinabox,3by3但被上司斥責(zé),要我以2乘4的方式入8包面Butmybossscoldedmetopack8,2by4

因為「我們一向都這樣做?!?because“wealwaysdoitthatway.”傳統(tǒng)vs.數(shù)據(jù)Traditionvs.Data很高興和大家一同用資料做決策Delightedtoworktogethertomakedecisionsw/data運用人工智能+統(tǒng)計UseArtificialintelligence+Statistics

傳統(tǒng)vs.數(shù)據(jù)Traditionvs.Data對話情景示例Examplechatscenario研究問題示例Exampleresearchquestions自動化分析成份Automaticanalysiscomponents統(tǒng)計語篇分析StatisticalDiscourseAnalysis數(shù)據(jù)、理論、分析、結(jié)果及討論示例

ExampleData,Theory,Analysis,Results&Discussion如何改進說話/對話分析

HowtoImproveYourAnalysesofTalk/Chats識別問題IdentifyProblem設(shè)計一堂測試西方星座(占星術(shù))假設(shè)的在線科學(xué)課

DesignanonlinesciencelessonabouttestinghypothesesbasedontheWesternzodiac(astrology)挑選具有以下知識的組員……

SelectTeamMemberswithknowledgeof…教學(xué)

Teaching科學(xué)

Science西方星座Westernzodiac科技

Technology小組能解決難以獨自處理的問題

GroupsSolveProblemsthatAreHardtoDoAlone研究問題

ResearchQuestions哪些思考和社交過程幫助

vs.窒礙成功獲得結(jié)果?Whichthinkingandsocialprocessesaidvs.hindersuccessfuloutcomes?組員的行動如何影響我的行動?

Howdoteammates’actionsinfluencemyactions????自動轉(zhuǎn)錄

AutomatedTranscription

自動分類/注釋/編碼

AutomatedCategorization/Annotation/Coding自動統(tǒng)計分析

AutomatedStatisticalAnalysis

自動分析AutomatedAnalysis自動轉(zhuǎn)錄AutomatedTranscription識別客觀的談話和行為

Identifyobjectivetalk&behaviors聲音和行為因應(yīng)不同的人和情況而有所分別

Voices&behaviorsdifferacrosspeople&contexts同一聲音/行為可能代表不同意思/功用

Samesound/behavior,differentmeanings/functions

替代數(shù)據(jù)Alternativedata在線討論毋須轉(zhuǎn)錄為文字

Onlinediscussionsdonotneedtranscription

但經(jīng)常包含非正式的拼寫或單詞

butoftenhavenon-formalspellings/words

自動轉(zhuǎn)錄AutomatedTranscription

簡單的理論解釋復(fù)雜的現(xiàn)象

Simpletheoryexplainingcomplexphenomena

合適的概念/分類

Suitableconcepts/categories分類有多個面向

Multipledimensionsofcategories

例如:三種選擇,每種有四個面向

e.g.,4dimensionsof3choiceseach

=34=81種現(xiàn)象 =34=81phenomena自動分類AutomatedCategorization每個面向有其精確的決策樹

Precisedecisiontreeforeachdimension問題的序列引導(dǎo)分類

Sequenceofquestionsguidecategorization計算機語言學(xué)

程序為資料編碼

Computational

linguisticsprogramcodesdata

建立數(shù)據(jù)庫作自動統(tǒng)計分析

Createsdatabaseforautomatedstatisticalanalysis??自動分類AutomatedCategorization分類指令vs.問題vs.句子Categorizecommandsvs.questionsvs.statements這輪談話有否禁止一種行動?沒有主語的謂詞

Doesthisturnoftalkproscribeanaction?

Predicatewithoutsubject是,編碼為指令(祈使)

Yes,codeascommand否,觀眾是否這輪談話的主語?

No,istheaudiencethesubjectoftheturn?否,這輪談話是否以問題形式展示?主謂倒裝No,istheturnintheformofaquestion?

Subject-predicatereversal否,編碼為句子(陳述)No,codeasstatement是,編碼為問題(疑問)Yes,codeasquestion??決策樹示例ExampleDecisionTree這輪談話有否禁止一種行動?沒有主語的謂詞

Doesthisturnoftalkproscribeanaction?

Predicatewithoutsubject是,編碼為指令(祈使)Yes,codeasacommand(imperative)否,觀眾是否這輪談話的主語?No,istheaudiencethesubjectoftheturn?

否,這輪談話是否以問題形式展示?主謂倒裝

No,istheturnintheformofaquestion?

Subject-predicatereversal

否,編碼為句子(陳述)No,codeasastatement(declarative)

是,編碼為問題(疑問)Yes,codeasaquestion

(interrogative)

是,動詞是否情態(tài)動詞(應(yīng)該、必須…)?

Yes,isverbamodal

(should,must,…)?

否,是否未完成以上行動?這行動有否在下一輪發(fā)生?No,wastheaboveactionnotdone?

Isactiondoneinnextturn?是,編碼為指令

Yes,codeasacommand否,編碼為問題

No,codeasaquestion是,是否「何-問題」問題(何人、何事、何地、為何、何時、如何)?

Yes,IsitaWh-question(who,what,where,why,when,how)?是,編碼為問題

Yes,codeasaquestion否,這行動是否可行?下一位講者(不)同意?

No,istheactionfeasible?Nextspeaker(dis)agrees??是,編碼為指令

Yes,codeasacommand?否,編碼為問題

No,codeasaquestion

Labov,2001;Tsui,1992

??決策樹示例ExampleDecisionTree替代數(shù)據(jù)Alternativedata由參加者建立的分類

Participant-createdcategories由參加者分類的資料

Participant-categorizeddata但需要對分類有共同的理解

Butneedsharedunderstandingofcategories分類Categorization筆記分類的效度

ValidityofCategorizingNotes內(nèi)部參加者效度

(emic)InternalParticipantValidity(emic)學(xué)生制作提示

Studentcreatecues學(xué)生使用提示(自我編碼)

Studentsusecues(self-coding)→通知外部觀察者效度

(etic)

informsExternalObserverValidity(etic) →編寫計算機程序把筆記分類

Writecomputerprogramtocategorizenotes結(jié)合計算機科學(xué)和統(tǒng)計

CombineComputerScienceandStatistics人工智能專業(yè)系統(tǒng)

ArtificialIntelligenceExpertSystem統(tǒng)計語篇分析

StatisticalDiscourseAnalysis自動統(tǒng)計分析

AutomatedStatisticalAnalysis

人工智能專業(yè)系統(tǒng)

ArtificialIntelligenceExpertSystem「統(tǒng)計員」(Statistician)

程序

Statisticianprogram翻譯理論模型

統(tǒng)計模型

Translatetheoreticalmodel→statisticalmodel利用可用資料測試統(tǒng)計模型

Teststatisticalmodelwithavailabledata解釋結(jié)果 Interpretresults人工智能專業(yè)系統(tǒng)

ArtificialIntelligenceExpertSystem「統(tǒng)計員」(Statistician)程序

Statisticianprogram如有需要,

Ifneeded,

修改統(tǒng)計模型Revisestatisticalmodel

(人工智能專業(yè)系統(tǒng)重寫) (AIexpertsystemrewritesitself)

回到步驟二(測試統(tǒng)計模型) Gotostep#2(teststatisticalmodel)輸出主要結(jié)果的表格/數(shù)位

Outputtable/figureofmainresults人工智能專業(yè)系統(tǒng)

ArtificialIntelligenceExpertSystem統(tǒng)計語篇分析

StatisticalDiscourseAnalysis

以例子說明 Illustratewithexample自動統(tǒng)計分析

AutomatedStatisticalAnalysis

數(shù)據(jù)

Data共同作者Studyco-author:NobukoFUJITA加拿大某大學(xué)課程

1universitycourseinCanada17名學(xué)生

17students13周

13weeks數(shù)據(jù)

Data教育科技課堂的在線討論區(qū)

OnlineforumofEducationalTechnologyclass

教師每星期發(fā)出一道新問題

Teacherposes1novelproblemperweek每名學(xué)生每周必需發(fā)一篇筆記

(訊息)

Eachstudentmustpost1noteperweek不記分

Notgraded321,867

321,867words1,330篇不同的筆記

1,330asynchronousnotes每周有102篇筆記102notes/week每名學(xué)生每周平均發(fā)6篇筆記

Eachstudentaverages6notes/week寫筆記的提示CuestoStartNotes教師提供可用的在線提示,引導(dǎo)學(xué)生寫筆記

Teacheroffersoptionalonlinecuestostartnotes四種提示:新意念、闡述、解釋、總結(jié)

4cues:Newidea,Elaborate,Explain,Summarize學(xué)生可跟隨這些提示寫筆記

Studentscanclickoncuestowritetheirnotes例如:「我的新意念是……」、「我的解釋是……」

e.g.,“Mynewideais…”“Myexplanationis…”學(xué)生自行制作五個提示

Studentscreate5owncues意見、不同意、例子、要求應(yīng)用、要求解釋

Opinion,Disagree,Example,Askaboutuse, Askforexplanation之前的筆記

現(xiàn)在的筆記Previousnote(s)

Current

note認知Cognition解釋Explain

意見Opinion

例子Example

闡述Elaboration

社會元認知Socialmetacognition

組員的行動

我的行動?TeammateAction

MyAction?元認知Metacognition

我監(jiān)察和控制我的知識和行動

I

monitorandcontrolmyemotions,knowledge,andactions

Flavell,1971;Hacker,1998大多數(shù)人的元認知很差。Mostindividualshavepoormetacognition.Hacker&Bol,2004社會元認知SocialMetacognition組員監(jiān)控和控制各組員的知識和行動

Wemonitorandcontrolouremotions,knowledge,andactions Chiu,inpress(社會)元認知(Social)Metacognition之前的筆記

現(xiàn)在的筆記Previousnote(s)

Current

note認知Cognition解釋Explain

意見Opinion

例子Example

闡述Elaboration

社會元認知Socialmetacognition

要求應(yīng)用Askaboutuse 尋求解釋Askforexplanation

不同意Disagree 組員的行動

我的行動?

TeammateAction

MyAction?序列關(guān)系到目標流程?

SequenceLinkedtoTargetProcess?(A→B→C)→D?個案研究Casestudies數(shù)算例子Countinstances計算和比較百分比及概率Compute&Compare%’sandprobabilities序列分析Sequentialanalysis適合于有很多假設(shè)而非常簡單的模型(即A之后是Suitableforverysimplemodelsthathavemanyassumptions(AisfollowedbyB)統(tǒng)計測試復(fù)雜的解釋模型?Statisticallytestcomplexexplanatorymodels?障礙Obstacle

早期談話影響后期談話

Earlytalkaffectlatertalk解決方法Overcomewith…統(tǒng)計語篇分析

StatisticalDiscourseAnalysis橫跨數(shù)篇筆記的影響

EffectsacrossseveralnotesBen:2乘以4是6。

2times4is6.Ana:不!你錯了。

No!You’rewrong.Ben:噢,對,2乘以4是8,

因為是4加4

Oh,right,2times4

is8

becauseit’s4plus4 前2篇筆記2notesago=(–2)前1篇筆記Previousnote=(–1)

障礙Obstacle

早期談話影響后期談話

Earlytalkaffectlatertalk同時間談話/筆記

Paralleltalk

/

notes解決方法Overcomewith…矢量自回歸模型VectorAuto-Regression(m5→m7)統(tǒng)計語篇分析

StatisticalDiscourseAnalysis有同時間筆記的主題討論樹

TopicDiscussionTreewithParallelNotes12T910351118462713障礙Obstacle

早期談話影響后期談話

Earlytalkaffectlatertalk同時間談話/筆記

Paralleltalk

/

notes解決方法Overcomewith…矢量自回歸模型VectorAuto-Regression(m5→m7)識別及儲存之前的談話

Identify&storepriortalk統(tǒng)計語篇分析

StatisticalDiscourseAnalysis簡單序列Simplesequence筆記編號Note#人物Person筆記Note編碼Code前篇筆記PreviousNote前一個編碼Code(-1)1Ana計算3乘以4。Dothreetimesfour.*--識別及儲存之前的談話

IdentifyandStorePriorTalk簡單序列Simplesequence筆記編號Note#人物Person筆記Note編碼Code前篇筆記PreviousNote前一個編碼Code(-1)1Ana計算3乘以4。Dothreetimesfour.*--2Ben3乘以4等于7Threetimesfourisseven+1*識別及儲存之前的談話

IdentifyandStorePriorTalk簡單序列Simplesequence筆記編號Note#人物Person筆記Note編碼Code前篇筆記PreviousNote前一個編碼Code(-1)1Ana計算3乘以4。Dothreetimesfour.*--2Ben3乘以4等于7Threetimesfourisseven+1*3Eva錯了,是等于12No,it’stwelve-

2+識別及儲存之前的談話

IdentifyandStorePriorTalk簡單序列Simplesequence筆記編號Note#人物Person筆記Note編碼Code前篇筆記PreviousNote前一個編碼Code(-1)1Ana計算3乘以4。Dothreetimesfour.*--2Ben3乘以4等于7Threetimesfourisseven+1*3Eva錯了,是等于12No,it’stwelve-

2+同時間Parallel筆記編號Note#人物Person筆記Note編碼Code前篇筆記PreviousNote前一個編碼Code(-1)1Ana計算3乘以4。Dothreetimesfour.*--2Ben3乘以4等于7Threetimesfourisseven+1*識別及儲存之前的談話

IdentifyandStorePriorTalk

簡單序列Simplesequence筆記編號Note#人物Person筆記Note編碼Code前篇筆記PreviousNote前一個編碼Code(-1)1Ana計算3乘以4。Dothreetimesfour.*--2Ben3乘以4等于7Threetimesfourisseven+1*3Eva錯了,是等于12No,it’stwelve-

2+同時間Parallel筆記編號Note#人物Person筆記Note編碼Code前篇筆記PreviousNote前一個編碼Code(-1)1Ana計算3乘以4。Dothreetimesfour.*--2Ben3乘以4等于7Threetimesfourisseven+1*3Eva是等于12Twelve.+1*識別及儲存之前的談話

IdentifyandStorePriorTalk

障礙Obstacle

早期談話影響后期談話

Earlytalkaffectlatertalk同時間談話/筆記

Paralleltalk

/

notes討論不同Discussionsdiffer(D1

D3)時段不同Timeperiodsdiffer(T2

T4)解決方法Overcomewith…矢量自回歸模型VectorAuto-Regression(m5→m7)識別及儲存之前的談話

Identify&storepriortalk多層次分析(階層線性模式)Multilevelanalysis(HLM)統(tǒng)計語篇分析

StatisticalDiscourseAnalysis鑒定斷點

IdentifyBreakpoint(s)斷點Breakpoint決定性的事件徹底地改變社交互動Criticaleventradicallychangesthesocialinteraction以統(tǒng)計鑒定斷點比依賴人類的主觀性較好

Ratherthanrelyonhumansubjectivity,statisticallyidentifybreakpoints鑒定斷點

IdentifyBreakpoint(s)以計算機程序建立統(tǒng)計模型去測試每個可能的斷點Computerprogramcreatesstatisticalmodeltotesteachpossiblebreakpoint用兩個或以上的斷點去測試模型

Testmodelswith2ormorebreakpoints以最少的貝氏信息準則(BIC)去找出模型

Findmodelw/smallestBayesianInfoCriterion(BIC)

最少的斷點能解釋最多方差Fewestbreakpointsexplainingthemostvariance一個組別內(nèi)的斷點

Breakpointsin1group%Micro-creativity0%20%40%60%80%100%050100150訊息量

Message#百分比解釋%Explain障礙Obstacle

早期談話影響后期談話

Earlytalkaffectlatertalk同時間談話/筆記

Paralleltalk

/

notes討論不同Discussionsdiffer(D1

D3)時段不同Timeperiodsdiffer(T2

T4)附近的談話相似Similarnearbyturns(t8→t9)解決方法Overcomewith…矢量自回歸模型VectorAuto-Regression(m5→m7)識別及儲存之前的談話

Identify&storepriortalk多層次分析(階層線性模式)Multilevelanalysis(HLM)斷點及多層次分析

Breakpoint&MultilevelanalysisQ-統(tǒng)計量Q-statistics統(tǒng)計語篇分析

StatisticalDiscourseAnalysis統(tǒng)計語篇分析

StatisticalDiscourseAnalysis障礙Obstacle離散結(jié)果Discreteoutcomes(Yes/No)多重結(jié)果

Multipleoutcomes(Y1,Y2)不常見的結(jié)果

Infrequentoutcomes(<25%)中介效果

Mediationeffects(X→M→Y)假陽性Falsepositives(+++ns-)解決方法Overcomewith…邏輯模型/常態(tài)機率模型

Logit/Probit多變數(shù)結(jié)果模型

Multivariateoutcomemodels估計并除去Logit偏差Estimate&RemoveLogitbias多層次中介檢定

Multilevelmediationtests兩階段線性逐步增加法

2-stagelinearstep-upprocedure

障礙Obstacle缺失數(shù)據(jù)Missingdata(0010??011000)穩(wěn)健性Robustness解決方法Overcomewith…估計缺失資料:馬可夫鏈蒙地卡羅多重插補

Estimatemissingdata:MarkovChainMonteCarlomultipleimputation分拆結(jié)果模型Separateoutcomemodels測試資料子集和原始資料

Testdatasubsets&originaldata統(tǒng)計語篇分析

StatisticalDiscourseAnalysis組別過程

組別結(jié)果?

GroupProcessesGroupOutcomes?組別結(jié)果作為因變量Groupoutcomeasdependentvariable哪種過程得出較佳結(jié)果?

Whichprocessesyieldbetteroutcomes?例子:較佳的課堂設(shè)計(組別層面)

e.g.,betterLessondesign(group-level)組別過程作為解釋變量

Groupprocessesasexplanatoryvariables

例子:百分比解釋 e.g.,%Explanations課堂設(shè)計=

0+1

(百分比解釋)+…+Lessondesign=

0+1(%Explanations)+…+百分比解釋

%Explanations課堂設(shè)計的素質(zhì)

LessonDesignquality0.26對于較小的樣本,

Forasmallsample,使用組別過程作為因變量

UseGroupprocessasdependentvariable

成功組別是否較常用此方法?Aresuccessfulgroupsmorelikelytousethisprocess?結(jié)果作為解釋變量

Outcomeasexplanatoryvariable解釋=

0+1課堂設(shè)計+…+Explain

=

0+1

Lessondesign

+…+課堂設(shè)計的素質(zhì)

LessonDesignquality解釋

Explain0.31***組別過程

組別結(jié)果?

GroupProcessesGroupOutcomes?組別Group前3篇筆記

3notesago前2篇筆記

2notesago前1篇筆記Previousnote現(xiàn)在的筆記Currentnote+1.59*1.68**+2.89*+2.33**+1.74*+3.16*+1.23***+2.09*+1.43*+1.62*解釋Explain尋求解釋AsktoExplain(-3)例子Example(-3)

+1.68**設(shè)計成績Designscore要求應(yīng)用AskforUse(-2)尋求解釋AsktoExplain(-1)闡述Elaborate(-1)意見Opinion(-2)不同意Disagree(-2)結(jié)果Results結(jié)果Results組別結(jié)果及最近的筆記

→解釋

Groupoutcome&Recentnotes→Explain組別結(jié)果在解釋上的跨層面影響

Cross-leveleffectofGroupoutcomeonExpla

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論