版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
計(jì)算機(jī)行業(yè)AIGC市場(chǎng)分析
ChatGPT概述
OpenAI:人工智能研究領(lǐng)域最前沿的公司之一
OpenAI深耕AI領(lǐng)域研究,特色產(chǎn)品包括ChatGPT、DALL?E2、
Whisper等。OpenAI是于2015年12月在美國(guó)成立的人工智能研究
公司,由馬斯克、美國(guó)創(chuàng)業(yè)孵化器YCombinator總裁阿爾特曼、全
球在線支付平臺(tái)PayPal聯(lián)合創(chuàng)始人彼得?蒂爾等硅谷科技大亨創(chuàng)立。
研究方向可以分為三類:訓(xùn)練生成模型算法,即深度學(xué)習(xí)生成模型;
從數(shù)據(jù)中推斷算法的算法,即神經(jīng)圖靈機(jī);強(qiáng)化學(xué)習(xí)方法,可以理解
為深度增強(qiáng)學(xué)習(xí)。
ChatGPT月度用戶已破億,正在逐步探索商業(yè)化途徑
ChatGPT是OpenAI在2022年11月30日發(fā)布的全新聊天機(jī)器人
模型。它能夠通過(guò)學(xué)習(xí)和理解人類的語(yǔ)言來(lái)進(jìn)行對(duì)話,還能根據(jù)聊天
的上下文進(jìn)行互動(dòng),真正像人類一樣來(lái)聊天交流,甚至能完成撰寫郵
件、視頻腳本、文案、翻譯、代碼等任務(wù)。ChatGPT月度用戶已破
億,正在逐步探索商業(yè)化途徑。根據(jù)UBS統(tǒng)計(jì)數(shù)據(jù)顯示,ChatGPT
上線2個(gè)月后月度用戶數(shù)量破1億。2023年2月1日,OpenAI推
出付費(fèi)訂閱項(xiàng)目ChatGPTPIus,價(jià)格為$20/月,目前面向美國(guó)用戶。
ChatGPT基于GPT3.5模型進(jìn)化微調(diào),從人類反饋中學(xué)習(xí)
OpenAI基于GPT模型,使用監(jiān)督學(xué)習(xí)和強(qiáng)化學(xué)習(xí)的組合來(lái)調(diào)優(yōu)
ChatGPT,其中人類反饋強(qiáng)化學(xué)習(xí)(RLHF)使ChatGPT趨近人類
價(jià)值觀及意圖。ChatGPT的訓(xùn)練分為三步:一是訓(xùn)練及微調(diào)GPT模
型,獲得語(yǔ)言及代碼的生成能力;二是根據(jù)人類意圖訓(xùn)練,人為標(biāo)記
生成內(nèi)容的排序,訓(xùn)練出獎(jiǎng)勵(lì)模型(RewardModel);三是通過(guò)獎(jiǎng)
勵(lì)模型為生成內(nèi)容打分,通過(guò)近端策略優(yōu)化(PPO)來(lái)優(yōu)化生成模型,
使其趨近人類的意圖。
第一步:收集數(shù)據(jù)微調(diào)GPT3.5模型
預(yù)訓(xùn)練的GPT3.5在少量已標(biāo)注的數(shù)據(jù)上進(jìn)行調(diào)優(yōu),以學(xué)習(xí)從給定的
提示詞(prompt)列表生成輸出的有監(jiān)督的策略。模型選擇:選擇了
GPT-3.5系列中的預(yù)訓(xùn)練模型,參考InstructGPT,參數(shù)量最高達(dá)
175B。例如,輸入“你好”,通過(guò)GPT后輸出“美工GPT每一次的輸
出可能都是不同的,因?yàn)樵诰W(wǎng)絡(luò)上的語(yǔ)句中,“你好”后面有多種接法,
例如“你好高”、“你好嗎”,而輸出結(jié)果是遵循概率分布的,高頻組合
出現(xiàn)的概率較高。數(shù)據(jù)收集:使用了兩種不同的提示詞來(lái)源。一些是
直接使用標(biāo)注人員或研究人員準(zhǔn)備的,另一些是從OpenAI的API
請(qǐng)求(即從GPT-3用戶那里)獲取的。策略生成:選擇一個(gè)提示列
表,標(biāo)注人員按要求寫下預(yù)期的輸出。最終得到的結(jié)果是一個(gè)相對(duì)較
小、高質(zhì)量的數(shù)據(jù)集,可用于調(diào)優(yōu)預(yù)訓(xùn)練的語(yǔ)言模型。
第二步:模擬人類偏好,訓(xùn)練獎(jiǎng)勵(lì)模型
對(duì)大量的模型輸出進(jìn)行排序,創(chuàng)建了一個(gè)由比較數(shù)據(jù)組成的新數(shù)據(jù)集。
在此數(shù)據(jù)集上訓(xùn)練新模型,被稱為訓(xùn)練獎(jiǎng)勵(lì)模型(RewardModel,
RM)o輸出排序:標(biāo)注者根據(jù)人類偏好將輸出從最佳到最差排序。
結(jié)果是一個(gè)新的標(biāo)簽數(shù)據(jù)集。獎(jiǎng)勵(lì)模型:將有標(biāo)簽的數(shù)據(jù)集用于訓(xùn)練
RM模型,并將生成模型的輸出,按優(yōu)先順序?qū)λ鼈冞M(jìn)行排序。例如,
輸入“臺(tái)灣最高的山是哪座?”,輸出可能有兩個(gè)結(jié)果,輸出一是“玉山”,
輸出二是,誰(shuí)來(lái)告訴我呀,兩個(gè)回答都可以與問(wèn)題銜接,但是人類的
偏好是輸出一,因此RM給兩個(gè)輸出排序忖,輸出一是高于輸出二。
第二步:使用獎(jiǎng)勵(lì)模型,基于PPO進(jìn)行最優(yōu)化
強(qiáng)化學(xué)習(xí)被應(yīng)用于通過(guò)優(yōu)化RM模型來(lái)調(diào)優(yōu)模型,所使用的特定算法
稱為近端策略優(yōu)化(PPO)。PPO:強(qiáng)化學(xué)習(xí)中的一種方式,通過(guò)
學(xué)習(xí)策略以達(dá)成回報(bào)最大化或?qū)崿F(xiàn)特定目標(biāo)的問(wèn)題。PPO在實(shí)現(xiàn)的
便利性、樣本復(fù)雜性和調(diào)優(yōu)的便利性之間取得了平衡,試圖在每一步
計(jì)算一個(gè)更新,使代價(jià)函數(shù)最小化,同時(shí)確保與前一個(gè)策略的偏差相
對(duì)較小。調(diào)整目標(biāo):使用RM作為獎(jiǎng)勵(lì)函數(shù),通過(guò)PPO算法微調(diào)策
略,調(diào)整參數(shù)獲得最大的獎(jiǎng)勵(lì)。
核心優(yōu)勢(shì)
優(yōu)勢(shì)一:公司與微軟合作,提供上下游支持
微軟作為OpenAI的LP投資者,為公司提供研發(fā)底層支撐及應(yīng)用的
大力支持。資金支持:2019年7月22日,微軟投資OpenAIIO億美
元;2023年1月23日,微軟宣布與OpenAI建立長(zhǎng)期合作伙伴關(guān)系
進(jìn)入第三階段,通過(guò)一項(xiàng)為期多年、數(shù)十億美元的投資來(lái)加速AI的
突破。服務(wù)支持:1)大規(guī)模超級(jí)計(jì)算—微軟將增加對(duì)開發(fā)和部署
專用超級(jí)計(jì)算系統(tǒng)的投資,以加速OpenAI的研究;繼續(xù)構(gòu)建Azure
領(lǐng)先的Al基礎(chǔ)結(jié)構(gòu)。2)獨(dú)家云提供商-Azure將為研究、產(chǎn)品和API
服務(wù)中的所有OpenAI工作提供支持。應(yīng)用支持:1月17日微軟表
示,計(jì)劃將包括ChatGPT、DALL-E等人工智能工具整合進(jìn)微軟旗
下的所有產(chǎn)品中,并將其作為平臺(tái)供其他企業(yè)使用,包括且不限于
Bing搜索引擎、MicrosoftOffice、Azure云服務(wù)、Teams聊天程序等。
應(yīng)用場(chǎng)景
ChatGPT以采取會(huì)員收費(fèi),未來(lái)或拓展商業(yè)模式
OpenAI的商業(yè)模式為,會(huì)員收費(fèi)、開放API以及與微軟的戰(zhàn)略合作。
會(huì)員服務(wù):2023年2月1日,OpenAI推出付費(fèi)訂閱項(xiàng)目
ChatGPTPIus,價(jià)格為$20/月,目前面向美國(guó)用戶。付費(fèi)服務(wù)包括,
在高峰時(shí)段也可常規(guī)訪問(wèn)ChatGPT、更快的響應(yīng)、以及優(yōu)先訪問(wèn)新
功能和改進(jìn)。ChatGPT將繼續(xù)提供免費(fèi)訪問(wèn)。API服務(wù):ChatGPT
或?qū)⒓尤隣penAIAPL從下游用戶的使用中收取費(fèi)用。目前OpenAI
的API以Token對(duì)于NLP的文字進(jìn)行收費(fèi),例如莎士比亞作品集需
要1.2M的Token。與微軟合作:使用AzureOpenAI服務(wù),采用即
用即付的消費(fèi)模式,以Token或托管時(shí)長(zhǎng)進(jìn)行收費(fèi)。
GPT系列API可為下游應(yīng)用提供語(yǔ)言和代碼處理
ChatGPT尚未開放API,因此參考已開放API的Text-davinci-003
和Code-davinci-002來(lái)解讀其功能。ChatGPT與Text-davinci-003
的能力相似,均屬于GPT3.5系列模型。實(shí)現(xiàn)功能包括:回答問(wèn)題、
分類、編寫代碼、對(duì)話、生成、翻譯和轉(zhuǎn)換。
ToB:GPT系列已應(yīng)用到辦公應(yīng)用、智能客服等
辦公應(yīng)用:1)AI輔助編程:GitHubCopilot可輔助程序員編程,通
過(guò)Codex在代碼編輯器中為整行或某個(gè)函數(shù)提供建議。2)市場(chǎng)調(diào)研
工具:Viable使用GPT-3從客戶反饋中提供有用的見(jiàn)解,可以從調(diào)
查、票證、實(shí)時(shí)聊天日志、評(píng)論等中識(shí)別和提取主題內(nèi)容和情緒,并
在幾秒鐘內(nèi)提供內(nèi)容總結(jié)。智能客服:Algolia和ActiveChat使月了
GPT-3來(lái)更好地理解客戶的問(wèn)題,并將他們連接到回答他們問(wèn)題的
內(nèi)容的特定部分。
ToC:GPT系列已應(yīng)用到學(xué)習(xí)類于創(chuàng)作類生成
學(xué)習(xí)類:1)論文檢索:G計(jì)hubElicit是一個(gè)人工智能研究助手,通過(guò)
檢索已發(fā)表的論文,從大量研究論文中查找最相關(guān)的摘要,并應(yīng)用
GPT-3的自定義功能來(lái)生成答案。2)語(yǔ)言學(xué)習(xí):Duolingo作為一個(gè)
語(yǔ)言學(xué)習(xí)平臺(tái),已經(jīng)使用GPT3進(jìn)行法語(yǔ)語(yǔ)法更正。Duoling。的一
項(xiàng)內(nèi)部研究表明,使用此功能可以顯著提高用戶的第二語(yǔ)言寫作技巧。
創(chuàng)作類:1)Blog創(chuàng)意生成:BlogldeaGenerator通過(guò)采用搜索關(guān)鍵
字來(lái)分析該主題在Google里最受歡迎的內(nèi)容?;讷@取的數(shù)據(jù),軟
件通過(guò)GPT-3生成內(nèi)容來(lái)獲得更高的閱讀量。2)寫作造句工具:
Compose.ai是一個(gè)免費(fèi)的Chrome擴(kuò)展程序,可使用AI自動(dòng)進(jìn)行寫
作。只需要輸入關(guān)鍵字詞和主要內(nèi)容,GPT-3可協(xié)助生成完整語(yǔ)句,
構(gòu)成全文。
ToC:GPT系列還應(yīng)用于娛樂(lè)及生活類APP
娛樂(lè)類:1)AI驅(qū)動(dòng)游戲:AIDungeon是一款由AI驅(qū)動(dòng)的基于文本
的角色扮演游戲,AI會(huì)自動(dòng)生成故事,玩家可以在其中輸入對(duì)話,
人工智能將以新的事件和對(duì)話作出回應(yīng),創(chuàng)造獨(dú)特且不可預(yù)測(cè)的游戲
體驗(yàn)。2)AI聊天伙伴:WhatsApp上的A舊uddy是由GPT-3.5驅(qū)
動(dòng)的軟件,可以和用戶進(jìn)行對(duì)話,就像發(fā)消息給朋友一樣。例如,“給
我講個(gè)笑話”、“給我一個(gè)博客構(gòu)思”等。
生活類:稅務(wù)助手:KeeperTax可幫助個(gè)人記錄稅務(wù)情況。在關(guān)聯(lián)到
個(gè)人財(cái)務(wù)賬號(hào)后,KeeperTax用不同模型提取文本信息并分類交易類
型。
應(yīng)用一:ChatGPT已與搜索引擎相結(jié)合
ChatGPT已加入瀏覽器擴(kuò)展程序,集成了ChatGPT-4的BING短暫
上線。ChatGPT已作為擴(kuò)展程序加入到Chrome、Firefox.Edge等
瀏覽器的應(yīng)用中;Bing、谷歌等搜索引擎中將接入ChatGPT,得到自
然語(yǔ)言回答。集成了ChatGPT-4的新版Bing曾于2月4日短暫上
線。據(jù)設(shè)計(jì)師OwenYin分享的截圖,新版Bing的搜索框變?yōu)榱奶炜颍?/p>
會(huì)在聊天氣泡中回復(fù)用戶的問(wèn)題。新版Bing鼓勵(lì)用戶使用自然語(yǔ)言
而不是關(guān)鍵字進(jìn)行搜索,還能夠根據(jù)用戶的要求調(diào)整搜索結(jié)果。
應(yīng)用二:泛娛樂(lè)行業(yè)應(yīng)用,包括游戲、直播等方面
元境科技率先接入ChatGPT,結(jié)合自研多模態(tài)智能算法,完成了行
業(yè)首個(gè)AIGC互動(dòng)直播功能的落地。元境科技虛擬數(shù)字人已經(jīng)接入
ChatGPT等模型,并已在TikTok跨境電商直播、虛擬主播直播互動(dòng)
等場(chǎng)景實(shí)現(xiàn)應(yīng)用,并形成產(chǎn)品化解決方案c未來(lái),將更加關(guān)注數(shù)字人
與ChatGPT等模型的整合應(yīng)用,快速擴(kuò)展到不同行業(yè)、不同場(chǎng)景。
行業(yè)首個(gè)應(yīng)用此項(xiàng)技術(shù)的虛擬主播是虛擬二次元網(wǎng)紅CiCi。在最近的
一大段時(shí)間里CiCi的直播早已替換為了AIGC互動(dòng)直播,在測(cè)試應(yīng)
用期間一眾粉絲均未看出任何異樣,同時(shí)在使用測(cè)試期間粉絲量也持
續(xù)穩(wěn)步提升。
類似產(chǎn)品
Claude:谷歌旗下ChatGPT有力競(jìng)品
Claude是Anthropic新推出的一款類似于ChatGPT的AI助手,谷
歌已經(jīng)向Anthropic投資約3億美元。Anthropic是由前OpenAI的一
支研發(fā)團(tuán)隊(duì)出走成立的人工智能初創(chuàng)公司,大多為OpenAI的早期及
核心員工,深度參與過(guò)OpenAI的多項(xiàng)課題,比如GPT?3、神經(jīng)網(wǎng)絡(luò)
里的多模態(tài)神經(jīng)元、引入人類偏好的強(qiáng)化學(xué)習(xí)等。根據(jù)
FinancialTimes報(bào)道,谷歌已經(jīng)向Anthropic投資約3億美元。通過(guò)
這筆交易,谷歌將獲得Anthropic約10%的股份,后者要用這筆錢從
前者的云計(jì)算部門購(gòu)買大量計(jì)算資源。Claude目前還處于實(shí)驗(yàn)階段,
開創(chuàng)性引入了“憲法人工智能”(ConstitutionalALCAI)的概念。與
RLHF不同,憲法AI的過(guò)程使用模型而不是人類來(lái)生成微調(diào)輸出的
初始排名,根據(jù)一系列基本原則選擇最佳回復(fù),即RLAIFo
百度:擁有打造國(guó)產(chǎn)ChatGPT能力的公司
百度擁有飛槳(深度學(xué)習(xí)開源框架)、百度AI大底座(全棧AI基礎(chǔ)
設(shè)施)和文心大模型(AI應(yīng)用場(chǎng)景全覆蓋)。PaddlePaddle飛槳是
中國(guó)自主研發(fā)的第一個(gè)深度學(xué)習(xí)框架。深度學(xué)習(xí)框架是在完成深度學(xué)
習(xí)時(shí)一套可以復(fù)用的代碼,使得使用者在開發(fā)深度學(xué)習(xí)程序時(shí)可以不
用從復(fù)雜的神經(jīng)網(wǎng)絡(luò)搭建開始編代碼,而是在已有的模型上進(jìn)行個(gè)性
化改進(jìn)。百度AI大底座:國(guó)內(nèi)首個(gè)全棧自研的AI基礎(chǔ)設(shè)施,面向企
業(yè)AI開發(fā)和應(yīng)用,提供端到端自主可控、自我進(jìn)化的解決方案讓企
業(yè)可以快捷、低成本地實(shí)現(xiàn)‘AI能力隨用隨取“。文心大模型:源于產(chǎn)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025廣東廣州市欖核咨詢服務(wù)有限公司招聘10人備考考試試題及答案解析
- 網(wǎng)絡(luò)安全產(chǎn)品經(jīng)理面試題及答案解析
- 護(hù)理組長(zhǎng)沖突管理與溝通策略
- 新生兒洗澡與撫觸
- 教育機(jī)構(gòu)市場(chǎng)部經(jīng)理崗位能力測(cè)試問(wèn)題集
- 2025下半年四川成都交通投資集團(tuán)有限公司第四批次招聘?jìng)淇脊P試試題及答案解析
- 建研院研發(fā)部主管理能力考試題含答案
- 護(hù)理基礎(chǔ)知識(shí):核心概念
- 2025年甘肅省慶陽(yáng)市精神康復(fù)社會(huì)福利院招聘100人模擬筆試試題及答案解析
- 2025四川遂寧西充縣新興領(lǐng)域黨建工作專員招聘2人參考筆試題庫(kù)及答案解析
- 土地政策學(xué)形成性考核一-國(guó)開(SC)-參考資料
- 2024年新人教版四年級(jí)數(shù)學(xué)上冊(cè)《教材練習(xí)21練習(xí)二十一(附答案)》教學(xué)課件
- 2024秋期國(guó)家開放大學(xué)《建筑制圖基礎(chǔ)》一平臺(tái)在線形考(形考性考核作業(yè)一至四)試題及答案
- 新能源汽車公司售后維修培訓(xùn)
- 科幻小說(shuō)賞析與創(chuàng)意寫作-知到答案、智慧樹答案
- DB32T3916-2020建筑地基基礎(chǔ)檢測(cè)規(guī)程
- (正式版)HGT 6313-2024 化工園區(qū)智慧化評(píng)價(jià)導(dǎo)則
- 卡博特藍(lán)星化工(江西)有限公司年產(chǎn)8000噸氣相二氧化硅項(xiàng)目環(huán)境影響報(bào)告
- 內(nèi)燃機(jī)車柴油機(jī) 課件 2-1-6 16V280型柴油機(jī)調(diào)控系統(tǒng)認(rèn)知
- 安全運(yùn)維審計(jì)運(yùn)維報(bào)告
- 臨床微生物實(shí)驗(yàn)室血培養(yǎng)操作規(guī)范
評(píng)論
0/150
提交評(píng)論