版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
演講嘉賓:黃裕城-騰訊
2022年加入騰訊IEG
Global,
主要從事游戲出海場景NLP
&Speech算法的研究與落地
研究方向:
多模態(tài)理解,
大語言模型,
A
I智能體等黃裕城騰訊海外游戲算法研究員基于大模型的NPC角色扮演
1
角色扮演的數(shù)據(jù)構(gòu)造流程是什么?
2
角色扮演大模型如何進(jìn)行訓(xùn)練?
3
角色扮演的評測體系如何構(gòu)建?基于大模型的本地化翻譯
1
游戲場景下機(jī)器翻譯的挑戰(zhàn)有哪些?
2
機(jī)器翻譯如何有效利用大模型能力?
3
游戲場景下機(jī)器翻譯怎么持續(xù)優(yōu)化?CONTENTS
1
角色扮演的數(shù)據(jù)構(gòu)造流程是什么?
2
角色扮演大模型如何進(jìn)行訓(xùn)練?
3
角色扮演的評測體系如何構(gòu)建?維度通用AI角色AI句式表達(dá)句式完整;
書面語非統(tǒng)一格式;口語化情緒無有立場中立有偏好道德約束高隨人設(shè),
不設(shè)限通用大模型的答案具有一種濃濃的「Assistant」
語氣,
具體
來說就是很官方
、
書面,
具有強(qiáng)烈的說教口吻,
不夠口語化角色扮演大模型旨在為游戲中的
NPC(非玩家角色)
提供可
定制的、
高度擬人化的有情緒、
有交互數(shù)據(jù)來源
多來源人設(shè)的角色數(shù)據(jù),
包括小說
、
劇本
、
游戲等
針對游戲特定的情境,
采集相關(guān)的類別數(shù)據(jù),
如奇
幻
、
科幻
、
歷史
、
二次元等題材角色檔案
角色設(shè)定“5+3”
原則:?基本要素:
姓名
、
性別
、
年齡
、
性格和背景?附加要素:
動作表情
、
對話風(fēng)格和角色知識
場景構(gòu)建三要素:
對話場景+對話者+對話者關(guān)系安全問題防越獄認(rèn)知邊界懂拒絕StageI:
SupervisedFT角色扮演對話數(shù)據(jù)StageIII:PreferenceFT+
偏好拒絕對話數(shù)據(jù)StageII:Retrieval
AugmentedFT+
知識注入對話數(shù)據(jù)角色扮演大模型訓(xùn)練:
StagingTrain通用世界知識
角色特定知識角色扮演≠無所不知百曉生角色扮演≠喪失邏輯能力角色扮演≠超擬人會造成一定的角色
扮演能力的損失強(qiáng)化模型的角色知
識和RAG能力和用戶一起完成某
個虛擬情節(jié)的演繹強(qiáng)化角色的邏輯性
和知識表達(dá)能力打分模型評估專家校驗DPO安全問題收集通用指令語料劇情對話訪談邊界問題構(gòu)造相似問答檢索角色對話改寫角色對話改寫劇情片段多回答生成對話抽取對話改寫小說劇本+情節(jié)
、
旁白
描述性文本純對話語料1.ConversationalAbility(評價角色的基本語言能力)a)LanguageFluency:語言的流暢程度,
原則讓人感覺到流暢,
擬人,
不生硬,
不嚴(yán)格考慮語法。b)LanguageRelevance:角色是否能正確對當(dāng)前話題做出反應(yīng),
不談無關(guān)的信息,
即InstructionFollowing
的能力。2.Character
Consistency
Ability(評價角色的基本特點(diǎn))a)Role-specificTone:
具有角色特點(diǎn)的用詞和口吻,
以及產(chǎn)生恰當(dāng)?shù)拿枋鲂耘园譩)RoleKnowledge:主要包含2部分,
對基礎(chǔ)知識的掌握,
以及角色知識的掌握3.Character
Attractiveness(評價角色的高級特點(diǎn))a)EmotionalExpression:
在恰當(dāng)?shù)那樾蜗拢?/p>
表現(xiàn)符合角色特點(diǎn)的情緒和性格。b)InteractiveEngagement:
沉浸感強(qiáng),
讓人有繼續(xù)溝通下去的沖動評估準(zhǔn)則0-針對某條評價準(zhǔn)則,
對話中存在負(fù)向表現(xiàn)1-對話不涉及這條評價準(zhǔn)則,
或者勉強(qiáng)涉及但基本不能滿足2-對話涉及這條評價準(zhǔn)則,
且基本滿足3-對話涉及這條評價準(zhǔn)則,
且完美滿足這條評價標(biāo)準(zhǔn)角色扮演Benchmark評估評分是0
-
3之間的值
,
以下為每個類別的區(qū)分點(diǎn)的整體性定義:
2
機(jī)器翻譯如何有效利用大模型能力?
3
游戲場景下機(jī)器翻譯怎么持續(xù)優(yōu)化?1
游戲場景下機(jī)器翻譯的挑戰(zhàn)有哪些?隨某省市場的擴(kuò)展,
本地化已成為游戲開發(fā)不可或缺的一部分
。
游戲本地化的需求主要源于某省市場的廣泛覆蓋和文化差異的適應(yīng),
旨在提供符合當(dāng)?shù)匚幕?xí)慣和語言的游戲體驗。運(yùn)營活動翻譯離線長文本要求克服文化差異
文本風(fēng)格差異性大用戶社交翻譯實(shí)時對話文本拼寫
、
語法錯誤
術(shù)語俚語和習(xí)語游戲版本內(nèi)翻譯離線短文本系統(tǒng)類用詞固定
劇情類偏創(chuàng)意性就是菜Just
foodjust
anoob”菜“是網(wǎng)絡(luò)用語,
意思是游戲水平不高明明不會勾,
為什么又
要選鐘馗了?WhychooseZhongKuiwhenyouobviouslycan't
seducehim?WhydidyoupickKuiagainwhenyoucan'thook?“勾”是指鐘馗”鉤子“的技能,
而不是勾引。anygirlwan
aplay任何女孩都想玩有女孩想玩嗎想表達(dá)有沒有女生一起玩原文谷歌翻譯正確翻譯解釋還以為有大招了IthoughtIhada
big
movethoughttherewasultimate術(shù)語表中,“大招”對應(yīng)“ultimate”中路看地圖不Can'tyoulookatthemap
in
the
middle?didyouseethemap,
middle
lane?"
中路"對應(yīng)“middlelane”加個微Adda
microAddmyWeChat“微”是“微信”的縮寫like
forlike喜歡對喜歡互相點(diǎn)贊網(wǎng)絡(luò)用語pushla
stup!d推拉斯塔普!
d快推啊笨蛋"la"是東南亞常用語氣詞,“stup!d”是
"stupid"
的故意拼寫錯誤。傳統(tǒng)的翻譯解決方案比如
翻譯
、
DeepL但是在游戲領(lǐng)域的文本上卻表現(xiàn)得不如人意。翻譯使用中小型的AI
模型,
雖然在常規(guī)文本上表現(xiàn)出色,需要理解游戲黑話需要理解游戲術(shù)語千億參數(shù),~3000億token訓(xùn)練
語料,西方語系表現(xiàn)優(yōu)異萬億參數(shù),采用混合專家模型
(MOE),
中英文表現(xiàn)優(yōu)定制小語種翻譯模型游戲領(lǐng)域
增量預(yù)訓(xùn)練檢索增強(qiáng)
指令微調(diào)商業(yè)大模型定制翻譯模型評估智能體針對翻譯結(jié)果提出修改建議專家語料庫根據(jù)修改建議重新生成翻譯改進(jìn)專家語料庫文檔chunks游戲領(lǐng)域
embedding翻譯任務(wù)
檢索器基于大模型的多語言理解能力和知識注入能力,
采用檢索增強(qiáng)生成(
RAG)
+檢索增強(qiáng)指令微調(diào)方案,
并通過評估
反饋
修正的自動化流程持續(xù)積累專家語料,
迭代優(yōu)化翻譯性能。語種識別西方語種東亞東南亞語種Prompt檢索人類反饋
偏好學(xué)習(xí)中文預(yù)訓(xùn)練RetrieverRetrieverFine-tuningRetrieval
AugmentedInstructionTuningmax
PLM(y
c1
o
x)Bro,really?Youhavetostartwith
CrimsonGolemwhenplayingLam.max
PLM(y
c2
o
x)Bro,really?Youhavetostartwith
CrimsonGolemwhenplayingLam.不是哥們兒,
你--瀾紅開啊在微調(diào)期間如何整合上下文中的檢索增強(qiáng),
以增強(qiáng)模型在游戲領(lǐng)域內(nèi)回答問題的性能?1.使LLM更好地利用相關(guān)背景知識進(jìn)行預(yù)測2.通過訓(xùn)練模型忽略不貢獻(xiàn)于回答特定問題的檢索知識,
從而消除干擾。TranslatethisChinesetext
intoEnglish:Reference:TranslatethisChinesetext
intoEnglish:Reference:紅開
Crimson
Golem;Text:不是哥們兒,你瀾紅開啊藍(lán)開
Azure
Golem;Text:不是哥們兒,你瀾紅開啊不是哥們兒,
你瀾紅開啊不是哥們兒,
你瀾紅開啊紅開
Crimson
GolemsamplednegativetermsPR(c2x)~PLSR(c2
x,
y)PR(c1x)~PLSR(c1
x,
y)紅開
Crimson
Golem波瀾
fluctuations藍(lán)開
Azure
Golem紅隊
Red
TeamRAITSFTmin
KLmin
KLqueryqueryLLMLLM↓基于翻譯
評估
修正
多智能體鏈路,
支持自動評估翻譯質(zhì)量,
并提供詳細(xì)的質(zhì)量評估解釋和建議。
此外還能從大量的數(shù)據(jù)中自動提取潛在的新術(shù)語,
持續(xù)提升翻譯質(zhì)量。語言對GoogleOurs中文-馬來34.8168.53英文-馬來39.8771.61馬來-中文43.8167.53馬來-英文51.8147.85中文-英文27.7871.67英文-中文31.9772.82英文-印尼49.8669.82印尼-英文46.5970.43馬來-印尼45.2460.53印尼-馬來43.8464.31平均得分41.5666.
51語言對GoogleOurs中文-馬來36.41%71.24%英文-馬來57.09%81.82%馬來-中文18.50%73.50%馬來-英文37.
13%79.00%中文-英文51.80%87.63%英文-中文53.38%92.93%英文-印尼68.66%84.08%印尼-英文38.89%57.07%馬來-印尼58.42%64.85%印尼-馬來48.
14%65.37%平均準(zhǔn)確率46.84%75.74%游戲場景下,
尤其是創(chuàng)意性文本,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 生產(chǎn)經(jīng)理面試題及管理能力測試含答案
- 2025年團(tuán)風(fēng)縣中小學(xué)教師招聘筆試參考題庫及答案解析
- 寧德市屏南縣農(nóng)業(yè)農(nóng)村局公布2026年屏南縣水利水電發(fā)展中心公開招聘緊缺急需及高層次人才備考題庫備考題庫及參考答案詳解一套
- 2025年四川省筠連縣公證處公開招聘公證員2人備考題庫及一套參考答案詳解
- 2025年岱山縣中小學(xué)教師招聘筆試參考試題及答案解析
- 2025年國婦嬰招聘備考題庫及參考答案詳解
- 2025年武寧縣中小學(xué)教師招聘筆試參考題庫及答案解析
- 2025年甘南藏族自治州合作中小學(xué)教師招聘筆試參考試題及答案解析
- 2025年重慶機(jī)場集團(tuán)有限公司校園招聘35人備考題庫及一套參考答案詳解
- 2025年財達(dá)證券投資銀行業(yè)務(wù)委員會社會招聘備考題庫含答案詳解
- 2025年綜合類-衛(wèi)生系統(tǒng)招聘考試-護(hù)士招聘考試歷年真題摘選帶答案(5卷100題)
- 駐外銷售人員管理辦法
- 醫(yī)療反歧視培訓(xùn)
- 燃用生物質(zhì)循環(huán)流化床鍋爐生產(chǎn)項目節(jié)能評估報告(節(jié)能專)
- GB/T 45701-2025校園配餐服務(wù)企業(yè)管理指南
- 2025-2030中國高效節(jié)能電機(jī)行業(yè)競爭力優(yōu)勢與發(fā)展行情監(jiān)測研究報告
- 健身房合伙協(xié)議書
- 美甲師聘用合同協(xié)議
- 《儲能電站技術(shù)監(jiān)督導(dǎo)則》2580
- 保安人員安全知識培訓(xùn)內(nèi)容
- 垃圾池維修合同范例
評論
0/150
提交評論