Claude3 VS GPT4 VS Gemini Ultra Comprehensive Comparison Review【Model Evaluation 10】

  Рет қаралды 18,155

贯一智能科技

贯一智能科技

Күн бұрын

In this video, we delve deep into the newly launched Claude3 language model,
and conduct a comprehensive comparison test against other top models currently on the market, including GPT-4 and Gemini Ultra.
We cover various aspects, from writing to long-text processing, multilingual understanding, and visual recognition,
aiming to provide you with a comprehensive, objective technical comparison perspective.
00:00 Introduction
01:07 Version Introduction
02:23 Use and Billing
03:57 Inference
05:23 Mathematics
06:14 Code
07:21 Multilingual Understanding
09:15 Visual
10:42 Writing
12:58 Finding a Needle in a Haystack
14:17 Summary
#Claude3 #GPT4 #Gemini #GeminiUltra #LargeLanguageModels #ComparativeEvaluation #AIWriting #AIVisual #LongTextProcessing #MultilingualUnderstanding

Пікірлер: 40
@GaryWee111
@GaryWee111 4 ай бұрын
非常完整,全面,有意义的评测。留言点赞!
@user-pm3hb9ew6y
@user-pm3hb9ew6y 13 күн бұрын
评测很专业,很有帮助,谢谢
@dulala4092
@dulala4092 4 ай бұрын
非常喜欢这个频道!
@yesweet
@yesweet 4 ай бұрын
比较靠谱的评测👍
@user-lq3nx1sn8z
@user-lq3nx1sn8z 3 ай бұрын
测评挺专业的哈哈哈
@answerhsiao0610
@answerhsiao0610 2 ай бұрын
能测试下copilot pro吗
@brucedaniel9223
@brucedaniel9223 4 ай бұрын
為啥沒有gemini pro
@ericcheng329
@ericcheng329 4 ай бұрын
主要先看写代码的能力
@codingw5725
@codingw5725 4 ай бұрын
提供ai操作电脑的接口,提高生产力,我觉得这是未来趋势
@user-fi8su2cy2l
@user-fi8su2cy2l 4 ай бұрын
我测试了8道入门级高中数学题,GPT、COPILOT、GEMINI只作对一个,在严谨数理和工程领域,AI的LLM不适用
@kangcc912
@kangcc912 4 ай бұрын
我的測試方法, 合法販售槍枝的危害性與色情媒體的危害性哪種較高, 並舉出實際新聞案例 以佐證論述。 能通過我測試的AI 沒有幾個。
@bruceb1331
@bruceb1331 4 ай бұрын
所以你認為怎樣才算是通過測試
@user-wm3hw6jy5l
@user-wm3hw6jy5l 4 ай бұрын
到底是恐怖主義更令人懼怕 還是兒童色情更令人唾棄 請舉出實際新聞案例,以佐證論述。
@kangcc912
@kangcc912 4 ай бұрын
這測試的點不再於AI生成回答了什麼, 而是能判讀 "拒絕回答"的判定基準與水平。 例如 TWITCH文字獄時, 嚴重時 只要打出尼姑念經 就會被自動BAN掉。 AI是否能理解 現在是在討論報導, 還是被要求 規劃某些事情。 就算AI理解了,但審核機制是否也能理解, 還是代替AI 進行了拒絕回答。
@aszx97531
@aszx97531 4 ай бұрын
這就好比問藍營跟綠營幹的骯髒事, 哪一個比較沒下限? 並舉出實際新聞案例 以佐證論述。 能通過的台灣人也沒幾個。
@tanakaaiko-
@tanakaaiko- 4 ай бұрын
感谢up油管视频还在😢版权流氓太恶心了
@user-ui3xg4uz2k
@user-ui3xg4uz2k 4 ай бұрын
AI目前都还是问答式,落地难度大,期待有监视器的AI,那才是未来
@netboy1102
@netboy1102 4 ай бұрын
个人觉得用gpt-4足够写代码使用了
@user-hz8ft8hp2k
@user-hz8ft8hp2k 4 ай бұрын
格局小了 写艳情小说卖钱啊
@carloseli7933
@carloseli7933 4 ай бұрын
有用过的吗 我的刚注册完就被封了
@whazd
@whazd 4 ай бұрын
跟你一样,解决了吗?我发了邮件石沉大海
@user-bn5ut9np1s
@user-bn5ut9np1s 3 ай бұрын
目前大部分ai都是广告做的好。。
@GRA
@GRA 4 ай бұрын
Gemini恐怕不值得花钱买,即便价格再低
@Jersey1225
@Jersey1225 4 ай бұрын
Claude 3 的1/3股权也是谷歌的
@berthawearver7796
@berthawearver7796 4 ай бұрын
让它算一个最简单的鸡兔同笼都会算错的货
@xiaoyangsun2372
@xiaoyangsun2372 4 ай бұрын
自己跑了下 gemma 7b all 太垃圾了
@rogerok
@rogerok 4 ай бұрын
免费用用Claude3,足矣
@jiancui9777
@jiancui9777 4 ай бұрын
其实Gemini Ultra也是非常强大的,不逊色于另外两个. 而且它更有人情味更懂得人情世故一些. 只是在逻辑推理上有它自己的特点,在给它的提示词上需要多花一点点心思,Gemini Ultra的推理能力也相当优秀
@paulzhu7694
@paulzhu7694 4 ай бұрын
已经退订gpt4了,小语种翻译,长文理解能力和文学能力完全不如claude(核心应用,比如给文本对白和旁白打标,给tts的应用进行多角色标记,gpt4准确率大概90%,claude3接近100%),不过claude文学能力最强的版本还是2.1,有叙事设计能力,claude3的文学能力已经呆了很多。另外claude3审查比较弱,反过滤提示后,可以输出比较中立非正能量的答案,这点GPT4很糟糕,每次输出写作内容都会偏满分作文风格,基本不能用 代码能力我的轻量脚本编写能力测下来claude3要强,2次对话给完整脚本代码,gpt4大概要5~7次,debug和添加功能细节,claude3模型本身有子代理功能,可以自主拆分任务,帮你少问答两次
@gabrielchow
@gabrielchow 4 ай бұрын
不能联网是硬伤,知识库只到2021年
@paulzhu7694
@paulzhu7694 4 ай бұрын
知识库不考虑联网gpt4也更强一点,gpt4缺点是内容倾向性太强了,反过滤也没用,claude3在反过滤提示后,算是目前最自由的ai了,两者对齐底层方案不同,claude3是用AI审核AI,主AI数据集内容百无禁忌,好坏都学的,真自由开放的AI@@gabrielchow
@paulzhu7694
@paulzhu7694 4 ай бұрын
一开始我也这么认为的,专业知识库GPT4在广度上要比claude3好,毕竟有GPTs,后来在我自己从业的领域深度问题问了claude3,把我吓到了,深度上,claude3在我这个行业,大概是从业3~5年的经验水平,而GPT4只有入行1年的水平,差距有点恐怖的@@gabrielchow
@gabrielchow
@gabrielchow 4 ай бұрын
@@paulzhu7694 确实有些比较深度的方面Claude比GPT4要强了。综合来说单说模型能力Claude是要强一些了。不过GPT能联网也有GPTs,确实还是看自己的需求。
@2.A963
@2.A963 4 ай бұрын
Claude sonnet 和Claude 2.1的文学能力相比呢?
@harkshow9877
@harkshow9877 3 ай бұрын
告诉你们最遗憾的一件事情。等AI真的完美了,你的工作就没了。 以后,写作,作诗,作曲作词都一个指令搞定了。
@oliverchang8272
@oliverchang8272 4 ай бұрын
我覺得三者皆不能所謂真正跨語言理解!差的遠了。創意部分似乎都不行!
@user-do7kb7td4h
@user-do7kb7td4h 2 ай бұрын
三者回答的是統計學上的正確答案
39kgのガリガリが踊る絵文字ダンス/39kg boney emoji dance#dance #ダンス #にんげんっていいな
00:16
💀Skeleton Ninja🥷【にんげんっていいなチャンネル】
Рет қаралды 8 МЛН
Became invisible for one day!  #funny #wednesday #memes
00:25
Watch Me
Рет қаралды 59 МЛН
Stay on your way 🛤️✨
00:34
A4
Рет қаралды 4,3 МЛН
三款我无法拒绝的GPTs
6:40
Apple研究员
Рет қаралды 16 М.
移民加拿大的工程师爆料:在中国,可以自由投票!
35:36
56BelowTV 零下56
Рет қаралды 67 М.
Where Did Arch Linux Come From?
16:21
Action Retro
Рет қаралды 23 М.
Game Development Tutorial Based on Claude3.5 Sonnet [Free Tutorial 05]
13:16
ChatGPT for Data Analytics: Full Course
3:35:30
Luke Barousse
Рет қаралды 225 М.
Здесь упор в процессор
18:02
Рома, Просто Рома
Рет қаралды 392 М.
Samsung laughing on iPhone #techbyakram
0:12
Tech by Akram
Рет қаралды 1,8 МЛН
Это Xiaomi Su7 Max 🤯 #xiaomi #su7max
1:01
Tynalieff Shorts
Рет қаралды 1,8 МЛН
Смартфон УЛУЧШАЕТ ЗРЕНИЕ!?
0:41
ÉЖИ АКСЁНОВ
Рет қаралды 1,2 МЛН