版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
應(yīng)用人工智能及統(tǒng)計于大數(shù)據(jù):會話自動分析
ApplyingArtificialIntelligence&StatisticstoBigData:
AutomaticAnalysisofConversations很多人做決定都是根據(jù)傳統(tǒng)/信念Toomanydecisionsbasedontradition/beliefs而非數(shù)據(jù)和結(jié)果Ratherthandata&consequences令我沮喪Makesmefrustrated傳統(tǒng)vs.數(shù)據(jù)Traditionvs.Data在餐廳工作時Restaurantjob:
我將9包面以3乘3的方式入箱 Ipacked9noodlesinabox,3by3但被上司斥責(zé),要我以2乘4的方式入8包面Butmybossscoldedmetopack8,2by4
因為「我們一向都這樣做?!?because“wealwaysdoitthatway.”傳統(tǒng)vs.數(shù)據(jù)Traditionvs.Data很高興和大家一同用資料做決策Delightedtoworktogethertomakedecisionsw/data運用人工智能+統(tǒng)計UseArtificialintelligence+Statistics
傳統(tǒng)vs.數(shù)據(jù)Traditionvs.Data對話情景示例Examplechatscenario研究問題示例Exampleresearchquestions自動化分析成份Automaticanalysiscomponents統(tǒng)計語篇分析StatisticalDiscourseAnalysis數(shù)據(jù)、理論、分析、結(jié)果及討論示例
ExampleData,Theory,Analysis,Results&Discussion如何改進說話/對話分析
HowtoImproveYourAnalysesofTalk/Chats識別問題IdentifyProblem設(shè)計一堂測試西方星座(占星術(shù))假設(shè)的在線科學(xué)課
DesignanonlinesciencelessonabouttestinghypothesesbasedontheWesternzodiac(astrology)挑選具有以下知識的組員……
SelectTeamMemberswithknowledgeof…教學(xué)
Teaching科學(xué)
Science西方星座Westernzodiac科技
Technology小組能解決難以獨自處理的問題
GroupsSolveProblemsthatAreHardtoDoAlone研究問題
ResearchQuestions哪些思考和社交過程幫助
vs.窒礙成功獲得結(jié)果?Whichthinkingandsocialprocessesaidvs.hindersuccessfuloutcomes?組員的行動如何影響我的行動?
Howdoteammates’actionsinfluencemyactions????自動轉(zhuǎn)錄
AutomatedTranscription
自動分類/注釋/編碼
AutomatedCategorization/Annotation/Coding自動統(tǒng)計分析
AutomatedStatisticalAnalysis
自動分析AutomatedAnalysis自動轉(zhuǎn)錄AutomatedTranscription識別客觀的談話和行為
Identifyobjectivetalk&behaviors聲音和行為因應(yīng)不同的人和情況而有所分別
Voices&behaviorsdifferacrosspeople&contexts同一聲音/行為可能代表不同意思/功用
Samesound/behavior,differentmeanings/functions
替代數(shù)據(jù)Alternativedata在線討論毋須轉(zhuǎn)錄為文字
Onlinediscussionsdonotneedtranscription
但經(jīng)常包含非正式的拼寫或單詞
butoftenhavenon-formalspellings/words
自動轉(zhuǎn)錄AutomatedTranscription
簡單的理論解釋復(fù)雜的現(xiàn)象
Simpletheoryexplainingcomplexphenomena
合適的概念/分類
Suitableconcepts/categories分類有多個面向
Multipledimensionsofcategories
例如:三種選擇,每種有四個面向
e.g.,4dimensionsof3choiceseach
=34=81種現(xiàn)象 =34=81phenomena自動分類AutomatedCategorization每個面向有其精確的決策樹
Precisedecisiontreeforeachdimension問題的序列引導(dǎo)分類
Sequenceofquestionsguidecategorization計算機語言學(xué)
程序為資料編碼
Computational
linguisticsprogramcodesdata
建立數(shù)據(jù)庫作自動統(tǒng)計分析
Createsdatabaseforautomatedstatisticalanalysis??自動分類AutomatedCategorization分類指令vs.問題vs.句子Categorizecommandsvs.questionsvs.statements這輪談話有否禁止一種行動?沒有主語的謂詞
Doesthisturnoftalkproscribeanaction?
Predicatewithoutsubject是,編碼為指令(祈使)
Yes,codeascommand否,觀眾是否這輪談話的主語?
No,istheaudiencethesubjectoftheturn?否,這輪談話是否以問題形式展示?主謂倒裝No,istheturnintheformofaquestion?
Subject-predicatereversal否,編碼為句子(陳述)No,codeasstatement是,編碼為問題(疑問)Yes,codeasquestion??決策樹示例ExampleDecisionTree這輪談話有否禁止一種行動?沒有主語的謂詞
Doesthisturnoftalkproscribeanaction?
Predicatewithoutsubject是,編碼為指令(祈使)Yes,codeasacommand(imperative)否,觀眾是否這輪談話的主語?No,istheaudiencethesubjectoftheturn?
否,這輪談話是否以問題形式展示?主謂倒裝
No,istheturnintheformofaquestion?
Subject-predicatereversal
否,編碼為句子(陳述)No,codeasastatement(declarative)
是,編碼為問題(疑問)Yes,codeasaquestion
(interrogative)
是,動詞是否情態(tài)動詞(應(yīng)該、必須…)?
Yes,isverbamodal
(should,must,…)?
否,是否未完成以上行動?這行動有否在下一輪發(fā)生?No,wastheaboveactionnotdone?
Isactiondoneinnextturn?是,編碼為指令
Yes,codeasacommand否,編碼為問題
No,codeasaquestion是,是否「何-問題」問題(何人、何事、何地、為何、何時、如何)?
Yes,IsitaWh-question(who,what,where,why,when,how)?是,編碼為問題
Yes,codeasaquestion否,這行動是否可行?下一位講者(不)同意?
No,istheactionfeasible?Nextspeaker(dis)agrees??是,編碼為指令
Yes,codeasacommand?否,編碼為問題
No,codeasaquestion
Labov,2001;Tsui,1992
??決策樹示例ExampleDecisionTree替代數(shù)據(jù)Alternativedata由參加者建立的分類
Participant-createdcategories由參加者分類的資料
Participant-categorizeddata但需要對分類有共同的理解
Butneedsharedunderstandingofcategories分類Categorization筆記分類的效度
ValidityofCategorizingNotes內(nèi)部參加者效度
(emic)InternalParticipantValidity(emic)學(xué)生制作提示
Studentcreatecues學(xué)生使用提示(自我編碼)
Studentsusecues(self-coding)→通知外部觀察者效度
(etic)
informsExternalObserverValidity(etic) →編寫計算機程序把筆記分類
Writecomputerprogramtocategorizenotes結(jié)合計算機科學(xué)和統(tǒng)計
CombineComputerScienceandStatistics人工智能專業(yè)系統(tǒng)
ArtificialIntelligenceExpertSystem統(tǒng)計語篇分析
StatisticalDiscourseAnalysis自動統(tǒng)計分析
AutomatedStatisticalAnalysis
人工智能專業(yè)系統(tǒng)
ArtificialIntelligenceExpertSystem「統(tǒng)計員」(Statistician)
程序
Statisticianprogram翻譯理論模型
統(tǒng)計模型
Translatetheoreticalmodel→statisticalmodel利用可用資料測試統(tǒng)計模型
Teststatisticalmodelwithavailabledata解釋結(jié)果 Interpretresults人工智能專業(yè)系統(tǒng)
ArtificialIntelligenceExpertSystem「統(tǒng)計員」(Statistician)程序
Statisticianprogram如有需要,
Ifneeded,
修改統(tǒng)計模型Revisestatisticalmodel
(人工智能專業(yè)系統(tǒng)重寫) (AIexpertsystemrewritesitself)
回到步驟二(測試統(tǒng)計模型) Gotostep#2(teststatisticalmodel)輸出主要結(jié)果的表格/數(shù)位
Outputtable/figureofmainresults人工智能專業(yè)系統(tǒng)
ArtificialIntelligenceExpertSystem統(tǒng)計語篇分析
StatisticalDiscourseAnalysis
以例子說明 Illustratewithexample自動統(tǒng)計分析
AutomatedStatisticalAnalysis
數(shù)據(jù)
Data共同作者Studyco-author:NobukoFUJITA加拿大某大學(xué)課程
1universitycourseinCanada17名學(xué)生
17students13周
13weeks數(shù)據(jù)
Data教育科技課堂的在線討論區(qū)
OnlineforumofEducationalTechnologyclass
教師每星期發(fā)出一道新問題
Teacherposes1novelproblemperweek每名學(xué)生每周必需發(fā)一篇筆記
(訊息)
Eachstudentmustpost1noteperweek不記分
Notgraded321,867
字
321,867words1,330篇不同的筆記
1,330asynchronousnotes每周有102篇筆記102notes/week每名學(xué)生每周平均發(fā)6篇筆記
Eachstudentaverages6notes/week寫筆記的提示CuestoStartNotes教師提供可用的在線提示,引導(dǎo)學(xué)生寫筆記
Teacheroffersoptionalonlinecuestostartnotes四種提示:新意念、闡述、解釋、總結(jié)
4cues:Newidea,Elaborate,Explain,Summarize學(xué)生可跟隨這些提示寫筆記
Studentscanclickoncuestowritetheirnotes例如:「我的新意念是……」、「我的解釋是……」
e.g.,“Mynewideais…”“Myexplanationis…”學(xué)生自行制作五個提示
Studentscreate5owncues意見、不同意、例子、要求應(yīng)用、要求解釋
Opinion,Disagree,Example,Askaboutuse, Askforexplanation之前的筆記
現(xiàn)在的筆記Previousnote(s)
Current
note認知Cognition解釋Explain
意見Opinion
例子Example
闡述Elaboration
社會元認知Socialmetacognition
組員的行動
我的行動?TeammateAction
MyAction?元認知Metacognition
我監(jiān)察和控制我的知識和行動
I
monitorandcontrolmyemotions,knowledge,andactions
Flavell,1971;Hacker,1998大多數(shù)人的元認知很差。Mostindividualshavepoormetacognition.Hacker&Bol,2004社會元認知SocialMetacognition組員監(jiān)控和控制各組員的知識和行動
Wemonitorandcontrolouremotions,knowledge,andactions Chiu,inpress(社會)元認知(Social)Metacognition之前的筆記
現(xiàn)在的筆記Previousnote(s)
Current
note認知Cognition解釋Explain
意見Opinion
例子Example
闡述Elaboration
社會元認知Socialmetacognition
要求應(yīng)用Askaboutuse 尋求解釋Askforexplanation
不同意Disagree 組員的行動
我的行動?
TeammateAction
MyAction?序列關(guān)系到目標流程?
SequenceLinkedtoTargetProcess?(A→B→C)→D?個案研究Casestudies數(shù)算例子Countinstances計算和比較百分比及概率Compute&Compare%’sandprobabilities序列分析Sequentialanalysis適合于有很多假設(shè)而非常簡單的模型(即A之后是Suitableforverysimplemodelsthathavemanyassumptions(AisfollowedbyB)統(tǒng)計測試復(fù)雜的解釋模型?Statisticallytestcomplexexplanatorymodels?障礙Obstacle
早期談話影響后期談話
Earlytalkaffectlatertalk解決方法Overcomewith…統(tǒng)計語篇分析
StatisticalDiscourseAnalysis橫跨數(shù)篇筆記的影響
EffectsacrossseveralnotesBen:2乘以4是6。
2times4is6.Ana:不!你錯了。
No!You’rewrong.Ben:噢,對,2乘以4是8,
因為是4加4
Oh,right,2times4
is8
becauseit’s4plus4 前2篇筆記2notesago=(–2)前1篇筆記Previousnote=(–1)
障礙Obstacle
早期談話影響后期談話
Earlytalkaffectlatertalk同時間談話/筆記
Paralleltalk
/
notes解決方法Overcomewith…矢量自回歸模型VectorAuto-Regression(m5→m7)統(tǒng)計語篇分析
StatisticalDiscourseAnalysis有同時間筆記的主題討論樹
TopicDiscussionTreewithParallelNotes12T910351118462713障礙Obstacle
早期談話影響后期談話
Earlytalkaffectlatertalk同時間談話/筆記
Paralleltalk
/
notes解決方法Overcomewith…矢量自回歸模型VectorAuto-Regression(m5→m7)識別及儲存之前的談話
Identify&storepriortalk統(tǒng)計語篇分析
StatisticalDiscourseAnalysis簡單序列Simplesequence筆記編號Note#人物Person筆記Note編碼Code前篇筆記PreviousNote前一個編碼Code(-1)1Ana計算3乘以4。Dothreetimesfour.*--識別及儲存之前的談話
IdentifyandStorePriorTalk簡單序列Simplesequence筆記編號Note#人物Person筆記Note編碼Code前篇筆記PreviousNote前一個編碼Code(-1)1Ana計算3乘以4。Dothreetimesfour.*--2Ben3乘以4等于7Threetimesfourisseven+1*識別及儲存之前的談話
IdentifyandStorePriorTalk簡單序列Simplesequence筆記編號Note#人物Person筆記Note編碼Code前篇筆記PreviousNote前一個編碼Code(-1)1Ana計算3乘以4。Dothreetimesfour.*--2Ben3乘以4等于7Threetimesfourisseven+1*3Eva錯了,是等于12No,it’stwelve-
2+識別及儲存之前的談話
IdentifyandStorePriorTalk簡單序列Simplesequence筆記編號Note#人物Person筆記Note編碼Code前篇筆記PreviousNote前一個編碼Code(-1)1Ana計算3乘以4。Dothreetimesfour.*--2Ben3乘以4等于7Threetimesfourisseven+1*3Eva錯了,是等于12No,it’stwelve-
2+同時間Parallel筆記編號Note#人物Person筆記Note編碼Code前篇筆記PreviousNote前一個編碼Code(-1)1Ana計算3乘以4。Dothreetimesfour.*--2Ben3乘以4等于7Threetimesfourisseven+1*識別及儲存之前的談話
IdentifyandStorePriorTalk
簡單序列Simplesequence筆記編號Note#人物Person筆記Note編碼Code前篇筆記PreviousNote前一個編碼Code(-1)1Ana計算3乘以4。Dothreetimesfour.*--2Ben3乘以4等于7Threetimesfourisseven+1*3Eva錯了,是等于12No,it’stwelve-
2+同時間Parallel筆記編號Note#人物Person筆記Note編碼Code前篇筆記PreviousNote前一個編碼Code(-1)1Ana計算3乘以4。Dothreetimesfour.*--2Ben3乘以4等于7Threetimesfourisseven+1*3Eva是等于12Twelve.+1*識別及儲存之前的談話
IdentifyandStorePriorTalk
障礙Obstacle
早期談話影響后期談話
Earlytalkaffectlatertalk同時間談話/筆記
Paralleltalk
/
notes討論不同Discussionsdiffer(D1
D3)時段不同Timeperiodsdiffer(T2
T4)解決方法Overcomewith…矢量自回歸模型VectorAuto-Regression(m5→m7)識別及儲存之前的談話
Identify&storepriortalk多層次分析(階層線性模式)Multilevelanalysis(HLM)統(tǒng)計語篇分析
StatisticalDiscourseAnalysis鑒定斷點
IdentifyBreakpoint(s)斷點Breakpoint決定性的事件徹底地改變社交互動Criticaleventradicallychangesthesocialinteraction以統(tǒng)計鑒定斷點比依賴人類的主觀性較好
Ratherthanrelyonhumansubjectivity,statisticallyidentifybreakpoints鑒定斷點
IdentifyBreakpoint(s)以計算機程序建立統(tǒng)計模型去測試每個可能的斷點Computerprogramcreatesstatisticalmodeltotesteachpossiblebreakpoint用兩個或以上的斷點去測試模型
Testmodelswith2ormorebreakpoints以最少的貝氏信息準則(BIC)去找出模型
Findmodelw/smallestBayesianInfoCriterion(BIC)
最少的斷點能解釋最多方差Fewestbreakpointsexplainingthemostvariance一個組別內(nèi)的斷點
Breakpointsin1group%Micro-creativity0%20%40%60%80%100%050100150訊息量
Message#百分比解釋%Explain障礙Obstacle
早期談話影響后期談話
Earlytalkaffectlatertalk同時間談話/筆記
Paralleltalk
/
notes討論不同Discussionsdiffer(D1
D3)時段不同Timeperiodsdiffer(T2
T4)附近的談話相似Similarnearbyturns(t8→t9)解決方法Overcomewith…矢量自回歸模型VectorAuto-Regression(m5→m7)識別及儲存之前的談話
Identify&storepriortalk多層次分析(階層線性模式)Multilevelanalysis(HLM)斷點及多層次分析
Breakpoint&MultilevelanalysisQ-統(tǒng)計量Q-statistics統(tǒng)計語篇分析
StatisticalDiscourseAnalysis統(tǒng)計語篇分析
StatisticalDiscourseAnalysis障礙Obstacle離散結(jié)果Discreteoutcomes(Yes/No)多重結(jié)果
Multipleoutcomes(Y1,Y2)不常見的結(jié)果
Infrequentoutcomes(<25%)中介效果
Mediationeffects(X→M→Y)假陽性Falsepositives(+++ns-)解決方法Overcomewith…邏輯模型/常態(tài)機率模型
Logit/Probit多變數(shù)結(jié)果模型
Multivariateoutcomemodels估計并除去Logit偏差Estimate&RemoveLogitbias多層次中介檢定
Multilevelmediationtests兩階段線性逐步增加法
2-stagelinearstep-upprocedure
障礙Obstacle缺失數(shù)據(jù)Missingdata(0010??011000)穩(wěn)健性Robustness解決方法Overcomewith…估計缺失資料:馬可夫鏈蒙地卡羅多重插補
Estimatemissingdata:MarkovChainMonteCarlomultipleimputation分拆結(jié)果模型Separateoutcomemodels測試資料子集和原始資料
Testdatasubsets&originaldata統(tǒng)計語篇分析
StatisticalDiscourseAnalysis組別過程
組別結(jié)果?
GroupProcessesGroupOutcomes?組別結(jié)果作為因變量Groupoutcomeasdependentvariable哪種過程得出較佳結(jié)果?
Whichprocessesyieldbetteroutcomes?例子:較佳的課堂設(shè)計(組別層面)
e.g.,betterLessondesign(group-level)組別過程作為解釋變量
Groupprocessesasexplanatoryvariables
例子:百分比解釋 e.g.,%Explanations課堂設(shè)計=
0+1
(百分比解釋)+…+Lessondesign=
0+1(%Explanations)+…+百分比解釋
%Explanations課堂設(shè)計的素質(zhì)
LessonDesignquality0.26對于較小的樣本,
Forasmallsample,使用組別過程作為因變量
UseGroupprocessasdependentvariable
成功組別是否較常用此方法?Aresuccessfulgroupsmorelikelytousethisprocess?結(jié)果作為解釋變量
Outcomeasexplanatoryvariable解釋=
0+1課堂設(shè)計+…+Explain
=
0+1
Lessondesign
+…+課堂設(shè)計的素質(zhì)
LessonDesignquality解釋
Explain0.31***組別過程
組別結(jié)果?
GroupProcessesGroupOutcomes?組別Group前3篇筆記
3notesago前2篇筆記
2notesago前1篇筆記Previousnote現(xiàn)在的筆記Currentnote+1.59*1.68**+2.89*+2.33**+1.74*+3.16*+1.23***+2.09*+1.43*+1.62*解釋Explain尋求解釋AsktoExplain(-3)例子Example(-3)
+1.68**設(shè)計成績Designscore要求應(yīng)用AskforUse(-2)尋求解釋AsktoExplain(-1)闡述Elaborate(-1)意見Opinion(-2)不同意Disagree(-2)結(jié)果Results結(jié)果Results組別結(jié)果及最近的筆記
→解釋
Groupoutcome&Recentnotes→Explain組別結(jié)果在解釋上的跨層面影響
Cross-leveleffectofGroupoutcomeonExpla
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026年農(nóng)業(yè)文化遺產(chǎn)活化利用指南
- 煙草制品經(jīng)營風(fēng)險防控管理手冊
- 2026青龍湖(河北)產(chǎn)業(yè)發(fā)展集團有限公司招聘15人備考題庫及一套參考答案詳解
- 2026年原型設(shè)計工具高階應(yīng)用培訓(xùn)
- 計算機行業(yè)年度策略:AI應(yīng)用加快全球格局重塑中
- 職業(yè)健康風(fēng)險評估與員工職業(yè)發(fā)展動態(tài)調(diào)整機制
- 職業(yè)健康促進與職業(yè)健康效益優(yōu)化
- 職業(yè)健康與心理健康的整合干預(yù)策略-2
- 陽江2025年廣東陽江陽西縣新墟鎮(zhèn)招聘合同制禁毒工作人員筆試歷年參考題庫附帶答案詳解
- 邢臺2025年河北邢臺市襄都區(qū)招聘中小學(xué)幼兒園教師75人筆試歷年參考題庫附帶答案詳解
- 云南省玉溪市2025-2026學(xué)年八年級上學(xué)期1月期末物理試題(原卷版+解析版)
- 2026年哈爾濱通河縣第一批公益性崗位招聘62人考試參考試題及答案解析
- 六年級寒假家長會課件
- 就業(yè)協(xié)議書解約函模板
- 物流鐵路專用線工程節(jié)能評估報告
- 2026天津市南開區(qū)衛(wèi)生健康系統(tǒng)招聘事業(yè)單位60人(含高層次人才)備考核心試題附答案解析
- 重瞼手術(shù)知情同意書
- 研發(fā)部門員工加班管理細則
- 46566-2025溫室氣體管理體系管理手冊及全套程序文件
- 九師聯(lián)盟2026屆高三上學(xué)期12月聯(lián)考英語(第4次質(zhì)量檢測)(含答案)
- 第21章 反比例函數(shù)(單元測試·綜合卷)(含答案)-滬科版(2024)九上
評論
0/150
提交評論