DataFun海外游戲場景的大模型落地實(shí)踐_第1頁
DataFun海外游戲場景的大模型落地實(shí)踐_第2頁
DataFun海外游戲場景的大模型落地實(shí)踐_第3頁
DataFun海外游戲場景的大模型落地實(shí)踐_第4頁
DataFun海外游戲場景的大模型落地實(shí)踐_第5頁
已閱讀5頁,還剩15頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

演講嘉賓:黃裕城-騰訊

2022年加入騰訊IEG

Global,

主要從事游戲出海場景NLP

&Speech算法的研究與落地

研究方向:

多模態(tài)理解,

大語言模型,

A

I智能體等黃裕城騰訊海外游戲算法研究員基于大模型的NPC角色扮演

1

角色扮演的數(shù)據(jù)構(gòu)造流程是什么?

2

角色扮演大模型如何進(jìn)行訓(xùn)練?

3

角色扮演的評測體系如何構(gòu)建?基于大模型的本地化翻譯

1

游戲場景下機(jī)器翻譯的挑戰(zhàn)有哪些?

2

機(jī)器翻譯如何有效利用大模型能力?

3

游戲場景下機(jī)器翻譯怎么持續(xù)優(yōu)化?CONTENTS

1

角色扮演的數(shù)據(jù)構(gòu)造流程是什么?

2

角色扮演大模型如何進(jìn)行訓(xùn)練?

3

角色扮演的評測體系如何構(gòu)建?維度通用AI角色AI句式表達(dá)句式完整;

書面語非統(tǒng)一格式;口語化情緒無有立場中立有偏好道德約束高隨人設(shè),

不設(shè)限通用大模型的答案具有一種濃濃的「Assistant」

語氣,

具體

來說就是很官方

、

書面,

具有強(qiáng)烈的說教口吻,

不夠口語化角色扮演大模型旨在為游戲中的

NPC(非玩家角色)

提供可

定制的、

高度擬人化的有情緒、

有交互數(shù)據(jù)來源

多來源人設(shè)的角色數(shù)據(jù),

包括小說

、

劇本

、

游戲等

針對游戲特定的情境,

采集相關(guān)的類別數(shù)據(jù),

如奇

、

科幻

、

歷史

、

二次元等題材角色檔案

角色設(shè)定“5+3”

原則:?基本要素:

姓名

性別

、

年齡

、

性格和背景?附加要素:

動作表情

、

對話風(fēng)格和角色知識

場景構(gòu)建三要素:

對話場景+對話者+對話者關(guān)系安全問題防越獄認(rèn)知邊界懂拒絕StageI:

SupervisedFT角色扮演對話數(shù)據(jù)StageIII:PreferenceFT+

偏好拒絕對話數(shù)據(jù)StageII:Retrieval

AugmentedFT+

知識注入對話數(shù)據(jù)角色扮演大模型訓(xùn)練:

StagingTrain通用世界知識

角色特定知識角色扮演≠無所不知百曉生角色扮演≠喪失邏輯能力角色扮演≠超擬人會造成一定的角色

扮演能力的損失強(qiáng)化模型的角色知

識和RAG能力和用戶一起完成某

個虛擬情節(jié)的演繹強(qiáng)化角色的邏輯性

和知識表達(dá)能力打分模型評估專家校驗DPO安全問題收集通用指令語料劇情對話訪談邊界問題構(gòu)造相似問答檢索角色對話改寫角色對話改寫劇情片段多回答生成對話抽取對話改寫小說劇本+情節(jié)

旁白

描述性文本純對話語料1.ConversationalAbility(評價角色的基本語言能力)a)LanguageFluency:語言的流暢程度,

原則讓人感覺到流暢,

擬人,

不生硬,

不嚴(yán)格考慮語法。b)LanguageRelevance:角色是否能正確對當(dāng)前話題做出反應(yīng),

不談無關(guān)的信息,

即InstructionFollowing

的能力。2.Character

Consistency

Ability(評價角色的基本特點(diǎn))a)Role-specificTone:

具有角色特點(diǎn)的用詞和口吻,

以及產(chǎn)生恰當(dāng)?shù)拿枋鲂耘园譩)RoleKnowledge:主要包含2部分,

對基礎(chǔ)知識的掌握,

以及角色知識的掌握3.Character

Attractiveness(評價角色的高級特點(diǎn))a)EmotionalExpression:

在恰當(dāng)?shù)那樾蜗拢?/p>

表現(xiàn)符合角色特點(diǎn)的情緒和性格。b)InteractiveEngagement:

沉浸感強(qiáng),

讓人有繼續(xù)溝通下去的沖動評估準(zhǔn)則0-針對某條評價準(zhǔn)則,

對話中存在負(fù)向表現(xiàn)1-對話不涉及這條評價準(zhǔn)則,

或者勉強(qiáng)涉及但基本不能滿足2-對話涉及這條評價準(zhǔn)則,

且基本滿足3-對話涉及這條評價準(zhǔn)則,

且完美滿足這條評價標(biāo)準(zhǔn)角色扮演Benchmark評估評分是0

-

3之間的值

,

以下為每個類別的區(qū)分點(diǎn)的整體性定義:

2

機(jī)器翻譯如何有效利用大模型能力?

3

游戲場景下機(jī)器翻譯怎么持續(xù)優(yōu)化?1

游戲場景下機(jī)器翻譯的挑戰(zhàn)有哪些?隨某省市場的擴(kuò)展,

本地化已成為游戲開發(fā)不可或缺的一部分

。

游戲本地化的需求主要源于某省市場的廣泛覆蓋和文化差異的適應(yīng),

旨在提供符合當(dāng)?shù)匚幕?xí)慣和語言的游戲體驗。運(yùn)營活動翻譯離線長文本要求克服文化差異

文本風(fēng)格差異性大用戶社交翻譯實(shí)時對話文本拼寫

語法錯誤

術(shù)語俚語和習(xí)語游戲版本內(nèi)翻譯離線短文本系統(tǒng)類用詞固定

劇情類偏創(chuàng)意性就是菜Just

foodjust

anoob”菜“是網(wǎng)絡(luò)用語,

意思是游戲水平不高明明不會勾,

為什么又

要選鐘馗了?WhychooseZhongKuiwhenyouobviouslycan't

seducehim?WhydidyoupickKuiagainwhenyoucan'thook?“勾”是指鐘馗”鉤子“的技能,

而不是勾引。anygirlwan

aplay任何女孩都想玩有女孩想玩嗎想表達(dá)有沒有女生一起玩原文谷歌翻譯正確翻譯解釋還以為有大招了IthoughtIhada

big

movethoughttherewasultimate術(shù)語表中,“大招”對應(yīng)“ultimate”中路看地圖不Can'tyoulookatthemap

in

the

middle?didyouseethemap,

middle

lane?"

中路"對應(yīng)“middlelane”加個微Adda

microAddmyWeChat“微”是“微信”的縮寫like

forlike喜歡對喜歡互相點(diǎn)贊網(wǎng)絡(luò)用語pushla

stup!d推拉斯塔普!

d快推啊笨蛋"la"是東南亞常用語氣詞,“stup!d”是

"stupid"

的故意拼寫錯誤。傳統(tǒng)的翻譯解決方案比如

Google

翻譯

、

DeepL但是在游戲領(lǐng)域的文本上卻表現(xiàn)得不如人意。翻譯使用中小型的AI

模型,

雖然在常規(guī)文本上表現(xiàn)出色,需要理解游戲黑話需要理解游戲術(shù)語千億參數(shù),~3000億token訓(xùn)練

語料,西方語系表現(xiàn)優(yōu)異萬億參數(shù),采用混合專家模型

(MOE),

中英文表現(xiàn)優(yōu)定制小語種翻譯模型游戲領(lǐng)域

增量預(yù)訓(xùn)練檢索增強(qiáng)

指令微調(diào)商業(yè)大模型定制翻譯模型評估智能體針對翻譯結(jié)果提出修改建議專家語料庫根據(jù)修改建議重新生成翻譯改進(jìn)專家語料庫文檔chunks游戲領(lǐng)域

embedding翻譯任務(wù)

檢索器基于大模型的多語言理解能力和知識注入能力,

采用檢索增強(qiáng)生成(

RAG)

+檢索增強(qiáng)指令微調(diào)方案,

并通過評估

反饋

修正的自動化流程持續(xù)積累專家語料,

迭代優(yōu)化翻譯性能。語種識別西方語種東亞東南亞語種Prompt檢索人類反饋

偏好學(xué)習(xí)中文預(yù)訓(xùn)練RetrieverRetrieverFine-tuningRetrieval

AugmentedInstructionTuningmax

PLM(y

c1

o

x)Bro,really?Youhavetostartwith

CrimsonGolemwhenplayingLam.max

PLM(y

c2

o

x)Bro,really?Youhavetostartwith

CrimsonGolemwhenplayingLam.不是哥們兒,

你--瀾紅開啊在微調(diào)期間如何整合上下文中的檢索增強(qiáng),

以增強(qiáng)模型在游戲領(lǐng)域內(nèi)回答問題的性能?1.使LLM更好地利用相關(guān)背景知識進(jìn)行預(yù)測2.通過訓(xùn)練模型忽略不貢獻(xiàn)于回答特定問題的檢索知識,

從而消除干擾。TranslatethisChinesetext

intoEnglish:Reference:TranslatethisChinesetext

intoEnglish:Reference:紅開

Crimson

Golem;Text:不是哥們兒,你瀾紅開啊藍(lán)開

Azure

Golem;Text:不是哥們兒,你瀾紅開啊不是哥們兒,

你瀾紅開啊不是哥們兒,

你瀾紅開啊紅開

Crimson

GolemsamplednegativetermsPR(c2x)~PLSR(c2

x,

y)PR(c1x)~PLSR(c1

x,

y)紅開

Crimson

Golem波瀾

fluctuations藍(lán)開

Azure

Golem紅隊

Red

TeamRAITSFTmin

KLmin

KLqueryqueryLLMLLM↓基于翻譯

評估

修正

多智能體鏈路,

支持自動評估翻譯質(zhì)量,

并提供詳細(xì)的質(zhì)量評估解釋和建議。

此外還能從大量的數(shù)據(jù)中自動提取潛在的新術(shù)語,

持續(xù)提升翻譯質(zhì)量。語言對GoogleOurs中文-馬來34.8168.53英文-馬來39.8771.61馬來-中文43.8167.53馬來-英文51.8147.85中文-英文27.7871.67英文-中文31.9772.82英文-印尼49.8669.82印尼-英文46.5970.43馬來-印尼45.2460.53印尼-馬來43.8464.31平均得分41.5666.

51語言對GoogleOurs中文-馬來36.41%71.24%英文-馬來57.09%81.82%馬來-中文18.50%73.50%馬來-英文37.

13%79.00%中文-英文51.80%87.63%英文-中文53.38%92.93%英文-印尼68.66%84.08%印尼-英文38.89%57.07%馬來-印尼58.42%64.85%印尼-馬來48.

14%65.37%平均準(zhǔn)確率46.84%75.74%游戲場景下,

尤其是創(chuàng)意性文本,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論