OpenAIのGPT4oは本当に圧倒的に強いのか?解説してみた

  Рет қаралды 10,360

にゃんたのAI実践チャンネル

にゃんたのAI実践チャンネル

Күн бұрын

こんにちは、にゃんたです。
今回は先日リリースされたGPT4oについて、
性能をちゃんと見ながら本当に圧倒的に強いのか?といことを解説してみました😆
実は、OpenAIが発表した性能のグラフはちょっと突っ込みどころがあったりします…!
■LINE公式で限定コンテンツ配布中!
▼登録はこちらから行えます▼
liff.line.me/2004040861-3Jvq4bAG
今ならキーワード「プレゼント」と入力すると
・ChatGPTのプロンプトまとめ
・Caludeのプロンプトまとめ
・Difyのまとめ
を無料でお渡ししています!
■チャプター
00:00 オープニング
01:38 GPT-4omniの性能
10:06 画像認識精度について
15:24 コスパについて
■以前の関連動画
OpenAI最新モデル!GPT-4oについて徹底解説してみた
• OpenAI最新モデル!GPT-4oについて...
OpenAIのGPT-4oの画像生成がどう変わるのかを解説してみた
• OpenAIのGPT-4oの画像生成がどう変...
■Udemy
ChatGPTAPIの使い方講座も作成しているので興味があれば是非!(クーポン発行してます!)
linktr.ee/nyanta_youtuber
■X, インスタグラム
/ vtuber_nyanta
/ vtuber_nyanta
■note
note.com/nyanta123
■言語モデル関連のおすすめ書籍
[書籍]大規模言語モデルは新たな知能か――ChatGPTが変えた世界
amzn.to/3YhtYCk
[紹介動画]一流研究者による大規模言語モデルの解説がわかりやすい
• 一流研究者による大規模言語モデルの解説がわか...
■にゃんた愛用のガジェット達
HHKBのキーボード(タイピングが心地よい!)
amzn.to/3VHE4Nd
パームレスト(外出時もタイピングの位置が安定する)
amzn.to/3Rtcz7G
マウス(手の負荷が下がる!)
amzn.to/3KI72q7
iiyamaモニター(ChatGPT用にディスプレイが必要・・・!)
amzn.to/3VpljNd
モニターアーム(コスパ良かった!)
amzn.to/4bZMTaJ
■連絡先(全て返信できないかもしれません!)
vtuber.nyanta@gmail.com
※上記製品リンクURLはAmazonアソシエイトのリンクを使用しています。
---------------------------------------------------------------------------
■楽曲提供
フリーBGM DOVA-SYNDROME : dova-s.jp/
効果音ラボ : soundeffect-lab.info/
■編集
にゃんた妻
 一言:比較表の部分の編集、頑張りました😄
---------------------------------------------------------------------------
#AI #生成AI #python #プログラミング #ChatGPT #Gemini

Пікірлер: 39
@mackerel38
@mackerel38 Ай бұрын
面白い比較!評価基準しらなかったので勉強になりました!!😊
@aivtuber2866
@aivtuber2866 Ай бұрын
ありがとうございます! そう言って貰えてまとめた甲斐がありました😊
@user-qq5cd3co5c
@user-qq5cd3co5c Ай бұрын
にゃんた様へ 本当に技術用語やリテラシーが凄いですね❗ 僕なんかはまだよろよろというスピードでございます。
@aivtuber2866
@aivtuber2866 Ай бұрын
ありがとうございます! 私もわからないことだらけで勉強中ですよ😆 マイペースで頑張りましょう😊
@hassy3001
@hassy3001 Ай бұрын
いつも勉強させて頂いております。 GPT-4oの強みは、マルチモーダル性にあると聞いたことがあります。全てのタスクを、一つのモデルで扱うこと、個々の性能で見ると下がるけれども、総合的性能では向上する。なのであえて、言語モデルに特化したGPT-4も選択できるのかなと思っています。
@aivtuber2866
@aivtuber2866 Ай бұрын
ありがとうございます! おっしゃるように音声とか画像などを含めて利用したい時はオムニを使って テキストのみの場合は、GPT4を使うとか使い分けも良いかもしれませんね🤔
@salmon54561
@salmon54561 Ай бұрын
API経由で使う時は、レスポンスの速さが求められるケースも多いと思います。Groqのモデルが、あまり日本語が得意じゃないということで、4oは性能が高いのに速いので結構アドバンテージがあると思います!
@aivtuber2866
@aivtuber2866 Ай бұрын
実用性を考えたら速さも重要な評価指標ですよね! 読んで理解するスピードより速く出力されている気がするので 対話用途ではこれ以上は必要ないかもですが・・・笑
@madeinhokkaido816
@madeinhokkaido816 Ай бұрын
4oは嘘をつくのが巧みになっている印象です。Tableauに関して言えば、完全にGPT4>4oですね。一方で、RAGの精度については、4oはかなりのものですね。
@aivtuber2866
@aivtuber2866 Ай бұрын
ありがとうございます! 精度が上がっていくとハルシネーションも巧みになっていくのかもしれませんね・・・笑 GPT4に切り替えて検証はしていませんでしたが 確かにタスクによっては最適なものを探すの良さそうですね😲
@kinpatsumania57
@kinpatsumania57 Ай бұрын
Claude 3.5 Sonnet…いきなり何やらすごいものが出てきましたね…(ボソッ
@aivtuber2866
@aivtuber2866 Ай бұрын
めちゃ凄そうで撮りたかったのですが 外出中で撮れず‥😢
@goisesan
@goisesan Ай бұрын
精度とは違った観点での比較も気になります…!個人的にはGPT4oは丁寧で文章が長くなる傾向があり要領を得てないなと感じることもあるのですが、Gemini1.5proは取捨選択できていて会話しやすくコミュニーケーションが気持ちいいなと感じます。これ精度とは違う論点ですよね?実装方針の違いとかあるのかなあと。たぶん多くのユーザーにとっては数%の精度の違いよりUXが優れてる方を選ぶん気もするんですよね。なんだかよく分からないので解説いただけると非常にありがたいです🙇‍♂️🙇‍♂️🙇‍♂️
@aivtuber2866
@aivtuber2866 Ай бұрын
ありがとうございます! 単純に正しさとは別で、モデル毎に出力する文章の特徴(GPT4oは長い、Opusはユーザーに寄り添うなど?)があったりしますよね! そこらへんは好き嫌いもあるかもですが、 Gemini 1.5 Proも使い込んでみて各モデル解説できたら良さそうですね!🤔
@takaneABC
@takaneABC Ай бұрын
88.7%でも86.8%でもいいのですが、誤差の範囲だと思います。 ところで、ここまでくるとそろそろLLMの限界まで来ているように思えます。 もし、GPT5が出て、性能が92%とかになったら、LLMは限界にきていると解釈できないでしょうか?
@tatami204
@tatami204 Ай бұрын
言語モデルの比較データは英語でのパフォーマンスですよね?日本語だと結果がかなり違うのではないでしょうか。個人的にはGPT-4oよりもClaude3のほうがはるかに疎通性が高い気がします。
@aivtuber2866
@aivtuber2866 Ай бұрын
おっしゃるように日本語だと結果が変わってきそうですね! Claude3の方がユーザーに質問を投げかけてくることが多く 対話として意図を伝えやすいように感じますよね~🤔
@re-sato4458
@re-sato4458 Ай бұрын
今回のGPT-4oは、あくまでマイナーチェンジかなと思います! Open AIは、わざと競合よりも少しだけ性能をアップさせている印象です笑 それでもこの賢さは素晴らしいですし、より実用的です! 現在も仕事でガシガシ使っていて、精度がかなり上がっていることを実感しています! GPT-4oの一番の利点は、何度リクエストを投げても制限がかかりにくくなった点です! 実用性の面では圧倒的にGPT-4oですねー。 以前、課金してOpusも使っていましたが、GPT-4oの方が👍
@aivtuber2866
@aivtuber2866 Ай бұрын
確かに今回は、音声対話機能がメインで そのために速度重視にしただけで 性能が高いモデルも持ってそうですよね😆 GPT-4o回数制限緩いのもヘビーユーザーにとっては嬉しいですね😊
@user-fd7pg6lk6n
@user-fd7pg6lk6n Ай бұрын
チャットGPTにアップしてもテキストが、抽出できませんでした。と表示されてしまうPDFがあるのですがどんな原因と解決策が考えられるか教えてもらえないでしょうか😢
@aivtuber2866
@aivtuber2866 Ай бұрын
私も手元で再現できていないので解決策が提示できませんが、 画像などがPDFに含まれていると テキストとして認識できずエラーが出ているのかもしれません・・・! ADAで読み込んでいると思うので、エラーページは無視してテキストを抽出してください などとプロンプトを入れたらどうなんでしょう🤔
@user-lp5mc2nl3i
@user-lp5mc2nl3i Ай бұрын
プログラミングに関する精度に関しては、GPT4>GPT4oだって言ってる人も結構いる印象がある気がしますねぇ
@aivtuber2866
@aivtuber2866 Ай бұрын
ありがとうございます! 他のコメントでもGPT4の方が良いという方もいたのでここらへんは結構気になりますね🤔
@tomoJP
@tomoJP Ай бұрын
正直よくわからないけど最強やで
@tststs2222
@tststs2222 Ай бұрын
AIモデルさんたちも、インスタの自撮り画像盛りまくっちゃうお年頃お嬢さんみたいな感じですね^^
@we-iz503
@we-iz503 Ай бұрын
AIモデルは精度の高さが命だからしょうがない
@brown0101
@brown0101 Ай бұрын
GeminiはCoTなしなんでしょうか?
@aivtuber2866
@aivtuber2866 Ай бұрын
画像の評価に関してはCoT無しだと理解してます!
@takahironakagawa7730
@takahironakagawa7730 Ай бұрын
Gemini1.5proも凄いですが、本当に凄いのはGemini1.5flashだと思います。はっきり言って値段設定がおかしいと思うレベル。 しかも、100万トークンまで使えますしね。 APIを使うサービスでは、Gemini1.5flash以外選択肢はないのではと思いますね。
@aivtuber2866
@aivtuber2866 Ай бұрын
あまり注目されていない?気がしますが flashコスパめちゃくちゃ良いですよね😆
Smart Sigma Kid #funny #sigma #comedy
00:25
CRAZY GREAPA
Рет қаралды 39 МЛН
WHO LAUGHS LAST LAUGHS BEST 😎 #comedy
00:18
HaHaWhat
Рет қаралды 23 МЛН
Sigma Kid Hair #funny #sigma #comedy
00:33
CRAZY GREAPA
Рет қаралды 31 МЛН
БОЛЬШОЙ ПЕТУШОК #shorts
00:21
Паша Осадчий
Рет қаралды 11 МЛН
OpenAIのGPTsより凄い!無料で使えるDifyを徹底解説してみた
38:08
にゃんたのAI実践チャンネル
Рет қаралды 52 М.
何が凄いのか?最新の技術GraphRAGについて解説してみた
25:18
にゃんたのAI実践チャンネル
Рет қаралды 40 М.
ChatGPTの次?AIエージェントって何なのか解説してみた
14:27
にゃんたのAI実践チャンネル
Рет қаралды 13 М.
誰もがAIを使いこなす時代が来そう。Googleの最新AIさわってきた🌎
13:54
OpenAI最新モデル!GPT-4oについて徹底解説してみた
29:59
にゃんたのAI実践チャンネル
Рет қаралды 135 М.
GPT4に匹敵? Command R+を徹底解説してみた
19:38
にゃんたのAI実践チャンネル
Рет қаралды 10 М.
使えるの?Gemini Pro1.5の100万トークンの実力を検証してみた
19:46
にゃんたのAI実践チャンネル
Рет қаралды 8 М.
OpenAIのGPT-4oの画像生成がどう変わるのかを解説してみた
20:49
にゃんたのAI実践チャンネル
Рет қаралды 29 М.
何故ChatGPTで音声入力を使うべきなのか解説してみた
15:24
にゃんたのAI実践チャンネル
Рет қаралды 9 М.
Smart Sigma Kid #funny #sigma #comedy
00:25
CRAZY GREAPA
Рет қаралды 39 МЛН