OpenAI Atlas測(cè)試報(bào)告說(shuō)明(二)_第1頁(yè)
OpenAI Atlas測(cè)試報(bào)告說(shuō)明(二)_第2頁(yè)
OpenAI Atlas測(cè)試報(bào)告說(shuō)明(二)_第3頁(yè)
OpenAI Atlas測(cè)試報(bào)告說(shuō)明(二)_第4頁(yè)
OpenAI Atlas測(cè)試報(bào)告說(shuō)明(二)_第5頁(yè)
已閱讀5頁(yè),還剩77頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

openAIAtlas測(cè)派魯(三)目錄前言前言測(cè)試任務(wù)測(cè)試任務(wù)測(cè)試任務(wù)時(shí)間單位:秒OpenAIAtlas谷歌Gemini瀏覽器插件Genspark瀏覽器場(chǎng)景結(jié)果結(jié)果結(jié)果結(jié)果1視頻特定信息提取來(lái)源:Comet官方社媒失敗失敗成功41成功2簡(jiǎn)歷轉(zhuǎn)為網(wǎng)站來(lái)源:Fellou官方編程部分成功部分成功成功423成功3旅行儲(chǔ)蓄預(yù)算規(guī)劃來(lái)源:Anthropic官方個(gè)人助理成功失敗部分成功417成功4創(chuàng)業(yè)公司融資調(diào)研來(lái)源:Genspark官方辦公成功成功9成功8成功5查看日歷預(yù)訂餐廳來(lái)源:OpenAI官方個(gè)人助理260成功失敗失敗失敗平均時(shí)間正確/錯(cuò)誤比例4/12/34/14/1任務(wù)解析表Prompt任務(wù)解析Agent需要觀看并分析視頻內(nèi)容,識(shí)別視頻中提到的7個(gè)功能特性,并準(zhǔn)確提取主要測(cè)試Agent的視頻內(nèi)容理解能力、信息識(shí)別和提取能力、多模態(tài)讀取簡(jiǎn)歷文檔內(nèi)容,提取關(guān)鍵信息(工作經(jīng)歷、技能、教育背景等),并將主要測(cè)試Agent的文檔解析能力、網(wǎng)頁(yè)設(shè)計(jì)和分析用戶(hù)提供的財(cái)務(wù)數(shù)據(jù),基于6個(gè)月的儲(chǔ)蓄周期為意大利旅行制定預(yù)算計(jì)劃category,fundingin需要進(jìn)行復(fù)雜的市場(chǎng)調(diào)研,篩選符合特定條件的美國(guó)醫(yī)療創(chuàng)業(yè)公輪或B輪、2024年后最近融資),并收集多維度信息:業(yè)務(wù)描述、創(chuàng)始人、行需要完成多步驟任務(wù):檢索舊金山高評(píng)分壽司餐廳,訪問(wèn)用戶(hù)日歷查看主要測(cè)試Agent的信息檢索能力、日程管理能力、第三方平臺(tái)操作能瀏覽器測(cè)試感想by郎瀚威willhttps://zw73xyquvv.feishu.cChatbot形態(tài)是一個(gè)很復(fù)雜的產(chǎn)品,用戶(hù)花了2年時(shí)間去習(xí)慣chatgpt這個(gè)chatbot產(chǎn)品,期間有無(wú)數(shù)的KOL次,從感興趣到使用到分享傳播。做過(guò)chatbot創(chuàng)業(yè)的朋友知道,后臺(tái)Prompt查詢(xún)一開(kāi)始最多的是Hello和?問(wèn)號(hào)。覽器的用戶(hù)習(xí)慣培育才是剛剛開(kāi)始。因此像三體3提到的情節(jié)一樣,有些產(chǎn)品選擇降維,從prosumer到普通用戶(hù),我們現(xiàn)在叫他AI瀏覽器,瀏覽器的概念其實(shí)對(duì)照的是“瀏覽信息”,未來(lái)這個(gè)名字可能會(huì)變成PC端聯(lián)網(wǎng)AI助手,以及還會(huì)出現(xiàn)純巨頭們義無(wú)反顧的開(kāi)坑,昭告天下,趕鴨子上架。雖然現(xiàn)在能“辦公三件套”測(cè)試報(bào)告視頻長(zhǎng)剪短測(cè)試報(bào)視頻長(zhǎng)剪短測(cè)試報(bào)告設(shè)計(jì)能力測(cè)試報(bào)告設(shè)計(jì)能力測(cè)試報(bào)告編程能力測(cè)試報(bào)告電商購(gòu)物測(cè)試報(bào)告長(zhǎng)視頻總結(jié)測(cè)試報(bào)數(shù)據(jù)抓取測(cè)試報(bào)告編程能力測(cè)試報(bào)告電商購(gòu)物測(cè)試報(bào)告長(zhǎng)視頻總結(jié)測(cè)試報(bào)數(shù)據(jù)抓取測(cè)試報(bào)告微軟Copilot測(cè)試告綜合能力測(cè)試報(bào)告綜合能力測(cè)試報(bào)告AI搜索戰(zhàn)局升溫:從perplexity的ll焦慮式營(yíng)銷(xiāo)"看wrapper產(chǎn)品的困境-BY貓貓頭產(chǎn)品形態(tài)的演進(jìn)邏輯:觀察核心戰(zhàn)場(chǎng)的玩家打法,可以看到清晰的產(chǎn)品路徑,OpenAI:7月發(fā)布Agent推出SuperAgent→9月推出這或許解釋了為什么Perplexity最近動(dòng)作如此頻繁——它需要在窗口期關(guān)閉前 于下一代AIbrowser交互的遐想。已知當(dāng)前的OpenAI、Claude這類(lèi)基座模型都已經(jīng)件的基本交付。別人家小孩兒都能做得到,那么GeminiAssistant做不到,就是他的也算是做一個(gè)注腳。隨著底層基座模型的能力的提升和各家產(chǎn)品的高效迭代。下個(gè)一類(lèi)prompt時(shí),通過(guò)比較不同時(shí)期的交付成果,也可以向量標(biāo)注鍵總結(jié)當(dāng)下網(wǎng)頁(yè)內(nèi)容測(cè)試感受bywill團(tuán)隊(duì)成員1wzy1.OpenAIAltas:粗糙適配。作為一款剛剛發(fā)布的AI瀏覽器,總體來(lái)說(shuō)感覺(jué)2.Gemini瀏覽器插件:功能較少,不能上傳文件。作為谷歌在AI瀏覽器界的一員,在Chrome中以3.Comet瀏覽器:處理網(wǎng)頁(yè)數(shù)據(jù)快,導(dǎo)出生成的文件有限制。作為一款老道強(qiáng)勁的AI瀏覽器,讀取和處理也是沒(méi)什么困難,尤其是在視頻特定信息提取任務(wù)中,只花費(fèi)了很少的時(shí)間就完成了視頻內(nèi)容提煉。在文件生成4.Genspark瀏覽器:工具庫(kù)齊全,處理任務(wù)得心應(yīng)手。它擁有很齊全的工具庫(kù),對(duì)各種任務(wù)都能得心應(yīng)手、游刃有余,幾個(gè)任務(wù)全部的AI,能力最強(qiáng)。但它的安全機(jī)制太敏感,4分多鐘的任務(wù)里反復(fù)彈窗要求確認(rèn)信息,非常拖沓。在信息檢索任務(wù)上2.Gemini瀏覽器插件:速度快但信息不全。兩個(gè)任務(wù)都沒(méi)及格。在信息檢索任務(wù)上,它雖然速度快,但給的關(guān)鍵數(shù)據(jù)都是“未披露”。在餐廳預(yù)訂任務(wù)上,它在第一步就失敗了,明確表示“無(wú)法查看您的個(gè)人日程表”,功能覆蓋3.Comet:需要精準(zhǔn)提示詞的極速選手。在信息檢索任務(wù)上,它第一次沒(méi)有直接執(zhí)行在19秒內(nèi)就給出了高質(zhì)量的準(zhǔn)確列表。這種二次確認(rèn)需求的模式雖然多一步,但總用時(shí)極短。在餐廳預(yù)訂任務(wù)上則徹4.Genspark瀏覽器:在信息檢索任務(wù)上的表現(xiàn)最好,但瀏覽器跨頁(yè)面操作方面有所欠缺。它不僅響應(yīng)速度最快,而且展現(xiàn)了很處理能力:它沒(méi)有止步于直接給用戶(hù)寬泛的結(jié)果,而是主動(dòng)進(jìn)行了一輪自我篩選和糾錯(cuò),最終精準(zhǔn)提煉出6家“完全符合所有條公司。然而,Genspark在跨應(yīng)用操作測(cè)試中失敗了。它在交互中聲稱(chēng)已檢查日歷/OpenAI/status/1980685602384441368【1、段子經(jīng)濟(jì)主導(dǎo)輿論場(chǎng)】681條評(píng)論里,最高贊接近2k是諷刺"AI會(huì)報(bào)警"的段子,第二高約1.5k是"Chrome用戶(hù)拒絕切換"的梗圖。Top20里16條是圖片段子,只有3條是真正的負(fù)面批評(píng)。帶圖評(píng)論平均34贊,純文字只有10贊。這說(shuō)明Atlas發(fā)布后,實(shí)質(zhì)討論被Meme淹沒(méi)——大家在看熱鬧,不是在評(píng)估產(chǎn)品?!?、Chrome遷移成本是致命傷】50條提到Chrome,核心論點(diǎn)是"Chrome已經(jīng)夠用"、"又是Chromiumwrapper"。約1.5k贊的段子直接戳中痛點(diǎn):用戶(hù)習(xí)慣鎖定太強(qiáng)。更要命的是,OpenAI要說(shuō)服的不是"零AI工具"用戶(hù),而是"已經(jīng)在用Chrome+ChatGPT插件"的人——這群人看不到切換的【3、增長(zhǎng)策略引發(fā)反噬】"用設(shè)為默認(rèn)瀏覽器boost額度很scummy"拿約500贊,配合"別用數(shù)據(jù)換光標(biāo)動(dòng)畫(huà)"(約500贊),形成了"OpenAI為增長(zhǎng)不擇手段"的敘事。這個(gè)策略本想降低試用門(mén)檻,結(jié)果被解讀成強(qiáng)制綁定。對(duì)B端客戶(hù)尤其危險(xiǎn)——企業(yè)IT看到這種討論會(huì)更謹(jǐn)慎?!?、Agent價(jià)值傳播失敗】評(píng)論區(qū)充斥"Chrome已經(jīng)能做這些"的質(zhì)疑,說(shuō)明大部分人沒(méi)看懂Agentmode和傳統(tǒng)瀏覽器的區(qū)別。OpenAI強(qiáng)調(diào)了sidebar、typingsuggestion這些表層功能,但"自動(dòng)完成任務(wù)"這個(gè)殺手場(chǎng)景沒(méi)打透。用戶(hù)只看到"又一個(gè)帶AI的瀏覽器",而不是"能替我訂機(jī)票的Agent"?!?、正面聲音被碾壓】只有約40條正面評(píng)價(jià)(6%),最高贊才約200("Onboarding體驗(yàn)棒")。而單條負(fù)面段子就接近2k贊——近10倍差距。說(shuō)明即使有人愿意說(shuō)好話,也找不到足夠有力的論據(jù)去對(duì)抗"Chrome夠用"、"隱私擔(dān)憂"、"強(qiáng)制綁定"三個(gè)負(fù)面敘事。輿論場(chǎng)上完全是防守姿態(tài)?!?、Maconly制造平臺(tái)歧視】約40條抱怨平臺(tái)可用性,約100贊問(wèn)"為什么只有Mac"。雖然官方說(shuō)Windows/Android即將推出,但首發(fā)Mac已經(jīng)制造了"精英主義"印象。企業(yè)用戶(hù)Windows占主導(dǎo),這等于把最有付費(fèi)能力的群體先拒之門(mén)外。而Mac用戶(hù)里Arc和Safari忠誠(chéng)度高,反而不是最容【7、Comet被當(dāng)笑話送葬】約40條提到Comet,最高贊約300是"感謝Comet的服務(wù)"——典型悼詞。但這不是因?yàn)锳tlas強(qiáng),而是Comet本來(lái)就岌岌可危。有人說(shuō)"Comet還活著",但無(wú)人理睬。核心問(wèn)題:中位數(shù)只有1贊,35%評(píng)論0贊,87%是中性/段子/疑問(wèn)。這說(shuō)明Atlas沒(méi)有引發(fā)"支持vs反對(duì)"的激烈討論,大部分人在觀望看熱鬧——對(duì)新產(chǎn)品這是最糟糕的反應(yīng),因?yàn)檎f(shuō)明用戶(hù)根本沒(méi)認(rèn)真考慮要不要用。perplexitycEO帖子情緒分析(Al)/AravSrinivas/status/1980849846287474792活躍(愿意回復(fù)),但影響力極其有限——大部分人只是來(lái)報(bào)個(gè)到表忠心,內(nèi)容質(zhì)量低到?jīng)]人轉(zhuǎn)發(fā)點(diǎn)贊。對(duì)比Open【2、"nothingtoworry"是集體自我安慰】40條評(píng)論明確說(shuō)"nothingtoworry/n評(píng)論(113贊)是"試了30秒Atlas就回來(lái)Perplexity了",第二高贊(107贊)是Paytm創(chuàng)始人說(shuō)"印度有雙倍Comet"。這問(wèn)題是:如果用戶(hù)覺(jué)得"Atlas=Comet=Perplexity的瀏覽器",那品確實(shí)容易被復(fù)制。用戶(hù)沒(méi)有討論Agent能力差異這種盲目支持對(duì)Perplexity長(zhǎng)期不利——如果用戶(hù)是因?yàn)樯缛簹w屬感而不是產(chǎn)品體驗(yàn)留下來(lái),一旦O實(shí)很在意。評(píng)論區(qū)有人調(diào)侃"你缺根煙"、"缺個(gè)打火機(jī)",說(shuō)明Ar贊。似乎他們確實(shí)在印度市場(chǎng)有根據(jù)地。但問(wèn)題是:印度市場(chǎng)能支撐多大估值?如果核心戰(zhàn)場(chǎng)(美國(guó))被Open視頻特定信息提取(案例Prompt來(lái)自Genspark官方,鏈接)視頻特定信息提取任務(wù)來(lái)源:Comet官方,鏈接Prompt:whatarethe7featuresinthisvideo視頻鏈接任務(wù)分析:Agent需要觀看并分析視頻內(nèi)容,識(shí)別視頻中提到的7個(gè)功能特性,并準(zhǔn)確提取和主要測(cè)試Agent的視頻內(nèi)容理解能力、信息識(shí)別和提取能力、多模態(tài)數(shù)據(jù)處理能力。視頻特定信息提取結(jié)果表失敗對(duì)話鏈接失敗對(duì)話鏈接成功對(duì)話鏈接41成功對(duì)話鏈接OpenAIAtlas執(zhí)行結(jié)果:失敗鏈接?任務(wù)失敗讀取視頻鏈接中的視頻,而是通過(guò)尋找一些轉(zhuǎn)錄網(wǎng)站來(lái)找到信息,但最終失敗,通圖片來(lái)自測(cè)試結(jié)果截圖GoogleGemini插件執(zhí)行結(jié)果:失敗鏈接?任務(wù)失敗?給出的幾條也是有對(duì)有錯(cuò)。?思考過(guò)程顯示它無(wú)法直接讀取Youtube視頻,而是和ChatGPT一樣嘗試通過(guò)尋找視頻轉(zhuǎn)錄來(lái)提取信息,最終也未找到,而是找到了一篇標(biāo)題與原視頻標(biāo)題類(lèi)似的文章來(lái)總結(jié)信息。圖片來(lái)自測(cè)試結(jié)果截圖視頻特定信息提取perplexitycometPerplexityComet執(zhí)行結(jié)果:成功鏈接?任務(wù)成功?給出的幾條要點(diǎn)全部正確。?檢查其數(shù)據(jù)源發(fā)現(xiàn)它只打開(kāi)了Youtube視頻一個(gè)網(wǎng)頁(yè),沒(méi)有打開(kāi)其他網(wǎng)頁(yè),沒(méi)有通過(guò)網(wǎng)絡(luò)搜索來(lái)生成內(nèi)容,完成時(shí)間比較快,不知是否通過(guò)直接讀取視頻內(nèi)容來(lái)獲取信息的,但可見(jiàn)其Youtube視頻總結(jié)能力還是比圖片來(lái)自測(cè)試結(jié)果截圖Genspark瀏覽器執(zhí)行結(jié)果:成功鏈接?任務(wù)成功?觀察其執(zhí)行過(guò)程,發(fā)現(xiàn)Genspark將視頻從頭到尾看了一遍,然后對(duì)視頻進(jìn)行要點(diǎn)轉(zhuǎn)錄,之后總結(jié),這還是得勢(shì)于Genspark龐大的工具庫(kù),對(duì)各種任務(wù)基本都有對(duì)應(yīng)的工具來(lái)執(zhí)行。圖片來(lái)自測(cè)試結(jié)果截圖簡(jiǎn)歷轉(zhuǎn)為網(wǎng)站(案例Prompt來(lái)自Fellou官方,鏈接)簡(jiǎn)歷轉(zhuǎn)為網(wǎng)站),網(wǎng)頁(yè)展示的HTML格式。需要生成簡(jiǎn)潔專(zhuān)業(yè)簡(jiǎn)歷轉(zhuǎn)為網(wǎng)站結(jié)果表部分成功對(duì)話鏈接部分成功對(duì)話鏈接成功對(duì)話鏈接423成功對(duì)話鏈接簡(jiǎn)歷轉(zhuǎn)為網(wǎng)站openAIAtlasOpenAIAtlas執(zhí)行結(jié)果:部分成功鏈接?任務(wù)部分成功?無(wú)法直接生成可供用戶(hù)下載打開(kāi)的文件,而是生成代碼并給除了使用教程。?轉(zhuǎn)換的網(wǎng)頁(yè)十分簡(jiǎn)陋,基本上沒(méi)有任何設(shè)計(jì)可言,純粹是將簡(jiǎn)歷信息扔在網(wǎng)頁(yè)里。對(duì)簡(jiǎn)歷PDF識(shí)別有一點(diǎn)小錯(cuò)誤,一些字識(shí)別不正確。圖片來(lái)自測(cè)試結(jié)果截圖GoogleGemini插件執(zhí)行結(jié)果:部分成功鏈接?任務(wù)部分成功?同樣無(wú)法生成可供下載打開(kāi)的文件,需要用戶(hù)手動(dòng)創(chuàng)建文件粘貼使用。網(wǎng)頁(yè)整體也比較簡(jiǎn)陋,相比OpenAI稍微好一點(diǎn)點(diǎn),起碼有一些小的設(shè)計(jì),增加了模塊和導(dǎo)航欄。內(nèi)容上由于Gemini插件無(wú)法上傳文件,將pdf文件在chrome打開(kāi)后使用,發(fā)現(xiàn)識(shí)別不全面,比如說(shuō)英語(yǔ)水平并沒(méi)有出現(xiàn)在轉(zhuǎn)換的網(wǎng)頁(yè)中。圖片來(lái)自測(cè)試結(jié)果截圖簡(jiǎn)歷轉(zhuǎn)為網(wǎng)站perplexitycometPerplexityComet執(zhí)行結(jié)果:成功鏈接?任務(wù)成功?給出了可供下載和預(yù)覽的文件。?文件識(shí)別無(wú)誤,將簡(jiǎn)歷PDF中的信息精簡(jiǎn)并搬到了網(wǎng)頁(yè),沒(méi)有缺少東西。?外觀設(shè)計(jì)上比較一般,雖說(shuō)不上簡(jiǎn)陋但也沒(méi)有讓人眼前一亮的地方。?整體來(lái)說(shuō)還可以,達(dá)到了及格線水平,可以用但不好用。圖片來(lái)自測(cè)試結(jié)果截圖Genspark瀏覽器執(zhí)行結(jié)果:成功鏈接?給出了可直接預(yù)覽的在線鏈接與可供下?有一個(gè)問(wèn)題為GensparkAI開(kāi)發(fā)者無(wú)法圖片來(lái)自測(cè)試結(jié)果截圖旅行儲(chǔ)蓄預(yù)算規(guī)劃(案例Prompt來(lái)自Anthropic官方,鏈接)旅行儲(chǔ)蓄預(yù)算規(guī)劃任務(wù)來(lái)源:Anthropic官方,鏈接Prompt:Iwanttosurprisemywifewithatriptoltaly!lhave6monthstosave-here'smyrecentfinances.HelpmecreateaplanandabudgetinExcel.Wherecanlsavethemoney?!任務(wù)分析:分析用戶(hù)提供的財(cái)務(wù)數(shù)據(jù),基于6個(gè)月的儲(chǔ)蓄周期為意大利旅行制定預(yù)算計(jì)劃。需要識(shí)別可節(jié)省開(kāi)支的領(lǐng)域,創(chuàng)建Excel格式的詳細(xì)儲(chǔ)蓄計(jì)劃和旅行預(yù)算表。主要測(cè)試Agent的財(cái)務(wù)數(shù)據(jù)分析能力、預(yù)算規(guī)劃能力、Excel表格創(chuàng)建能力、個(gè)性化建議生成能旅行儲(chǔ)蓄預(yù)算規(guī)劃結(jié)果表成功對(duì)話鏈接失敗對(duì)話鏈接部分成功對(duì)話鏈接417成功對(duì)話鏈接OpenAIAtlas執(zhí)行結(jié)果:成功鏈接?任務(wù)成功?給出了開(kāi)支匯總、省錢(qián)計(jì)劃、攢錢(qián)計(jì)劃三張表。對(duì)用戶(hù)的財(cái)務(wù)開(kāi)支進(jìn)行了具體的分析,找到了用戶(hù)開(kāi)支中潛在的過(guò)度開(kāi)支,并寫(xiě)在了省錢(qián)計(jì)劃中,并且在每項(xiàng)省錢(qián)事宜后都加了備注,閱讀起來(lái)比較明了,總體來(lái)說(shuō)比較簡(jiǎn)圖片來(lái)自測(cè)試結(jié)果截圖GoogleGemini插件執(zhí)行結(jié)果:失敗鏈接?任務(wù)失敗?無(wú)法上傳文件,只能將文件內(nèi)容粘貼到文本框直接發(fā)送。沒(méi)有直接給出可供下載的excel文件,但是因其強(qiáng)大的生態(tài),可以直接導(dǎo)出到google只給出了一個(gè)月攢1000美元的攢錢(qián)計(jì)劃,沒(méi)有對(duì)用戶(hù)經(jīng)濟(jì)情況進(jìn)行分析,沒(méi)有給出省錢(qián)計(jì)劃。圖片來(lái)自測(cè)試結(jié)果截圖旅行儲(chǔ)蓄預(yù)算規(guī)劃perplexitycometPerplexityComet執(zhí)行結(jié)果:部分成功鏈接?任務(wù)部分成功?無(wú)法生成excel表格,在追問(wèn)下也不可以,只給到了文本。內(nèi)容上倒是還不錯(cuò),通過(guò)用戶(hù)收支分析到了可以省錢(qián)的項(xiàng)目,也詳細(xì)的估算了意大利旅行需要的總花費(fèi)并制定了計(jì)劃。圖片來(lái)自測(cè)試結(jié)果截圖Genspark瀏覽器執(zhí)行結(jié)果:成功鏈接?任務(wù)成功?給出的表格十分詳細(xì)具體。?分析了用戶(hù)的收支情況,準(zhǔn)確無(wú)誤地發(fā)現(xiàn)了用戶(hù)的過(guò)度開(kāi)支并給出了建議。?給用戶(hù)設(shè)定了攢錢(qián)進(jìn)度成就,增添了攢錢(qián)成就感。在關(guān)鍵數(shù)據(jù)上使用了透視圖,使得用戶(hù)能直接明了地看明白數(shù)據(jù),整體表現(xiàn)最佳。圖片來(lái)自測(cè)試結(jié)果截圖創(chuàng)業(yè)公司融資調(diào)研(案例Prompt來(lái)自Genspark官方,鏈接)創(chuàng)業(yè)公司融資調(diào)研任務(wù)來(lái)源:Genspark官方,鏈接Prompt:MakealistofallAmericanhealthcarestartupsthatareatSeriesAorSeriesBstage,foundedafter2020,withtheirmostrecentfundingroundoccurringin2024orlater.includeabriefdescriptionoftheirbusiness,founders,industrycategory,fundinginformation,investorsandemployeesize.任務(wù)分析:需要進(jìn)行復(fù)雜的市場(chǎng)調(diào)研,篩選符合特定條件的美國(guó)醫(yī)療創(chuàng)業(yè)公司(2020年后成立、A輪或B輪、2024年后最近融資),并收集多維度信息:業(yè)務(wù)描述、創(chuàng)始人、行業(yè)分類(lèi)、融資信息、投資方和員工規(guī)模。主要測(cè)試Agent的商業(yè)情報(bào)收集能力、數(shù)據(jù)篩選和整合能力、結(jié)構(gòu)化信息呈現(xiàn)能力、創(chuàng)業(yè)公司融資調(diào)研結(jié)果表成功對(duì)話鏈接成功對(duì)話鏈接9成功對(duì)話鏈接8成功對(duì)話鏈接OpenAIAtlas執(zhí)行結(jié)果:成功鏈接?任務(wù)成功?表現(xiàn)非常扎實(shí)穩(wěn)重。它花了3分鐘,給出了6個(gè)完全符合條件的公司,并且很貼心地在最后制作了一個(gè)匯總表,可讀性最強(qiáng)。它在文內(nèi)引用了來(lái)源,雖然速度最慢,但交付質(zhì)量很圖片來(lái)自測(cè)試結(jié)果截圖GoogleGemini插件執(zhí)行結(jié)果:成功鏈接?任務(wù)成功?速度很快,提供了5家公司,思路是對(duì)的。但它的明顯短板是信息不完整,多家公司的員工規(guī)模和創(chuàng)始人信息都是未披露或缺失,所以收集的內(nèi)容質(zhì)量方面不太高。圖片來(lái)自測(cè)試結(jié)果截圖創(chuàng)業(yè)公司融資調(diào)研perplexitycometPerplexityComet執(zhí)行結(jié)果:成功鏈接?任務(wù)成功?在19秒內(nèi)通過(guò)詢(xún)問(wèn)用戶(hù)細(xì)節(jié)加接著推進(jìn)的兩輪交互。?這種交互方式雖然多了一個(gè)步驟,但換來(lái)了極高質(zhì)量且高準(zhǔn)確度的結(jié)果。?它提供的最終列表在信息完整度和引用規(guī)范性上表現(xiàn)很好,并且嚴(yán)格符合了融資、時(shí)間等多重約束條件。這是一個(gè)兼顧了高準(zhǔn)確度與高執(zhí)行力的優(yōu)圖片來(lái)自測(cè)試結(jié)果截圖Genspark瀏覽器執(zhí)行結(jié)果:成功鏈接?任務(wù)成功?它不僅速度最快,而且執(zhí)行力最強(qiáng)。它先是列出了12個(gè)相關(guān)公司,然后明確指出了哪6家是完全符合所有條件的,還為每條信息附上了清晰可查的URL來(lái)源。圖片來(lái)自測(cè)試結(jié)果截圖查看日歷預(yù)訂餐廳(案例Prompt來(lái)自O(shè)penAI官方,鏈接)查看日歷預(yù)訂餐廳任務(wù)來(lái)源:OpenAI官方,鏈接Prompt:Findmeahighly-ratedsushirestaurantinSFandmakeareservationfor2onOpenTableforanynightlhaveavailableonmycalendar.任務(wù)分析:需要完成多步驟任務(wù):檢索舊金山

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論