No video

【検証】最新モデル AI、ChatGPT-4o は「ひっかけ問題」をどれくらい解けるのか?【ゆっくり実況・ゆっくり解説】

  Рет қаралды 2,844

AngrySadEight

AngrySadEight

Күн бұрын

Пікірлер: 20
@ikalukakiyoe
@ikalukakiyoe 2 ай бұрын
なお織田信成の生年月日は1987年3月25日である。(引用:Wikipedia
@AngrySadEight
@AngrySadEight 2 ай бұрын
こちら、正しく確認しておりませんでした。これにより「完ぺきに答えてきた」は間違っており、この場をお借りして訂正いたします。とは言え、細部は間違えていながらも、ひっかけの趣旨を正しく読み取って答えを出してはいるので、正解扱いにさせていただこうと思います。
@KH-pj8lo
@KH-pj8lo 2 ай бұрын
chatGPTは誤字脱字があったり、質問の入力途中でうっかり送信してしまっても勝手に類推して期待通りに答えてくれることもあるので、それが影響してる部分もありそうですね。質問の最初に「ひっかけ問題です」とつけるだけで正答率が上がる気がします。
@AngrySadEight
@AngrySadEight 2 ай бұрын
コメントありがとうございます。ご指摘の通り、確かに背景情報を付け足すのはかなり性能に影響しそうです。(今回の検証の趣旨という観点では「ひっかけ問題である」というのを明示するのはやや興醒めであるとも思いますが、実際に使うぶんにはかなり有用かもしれません)
@zi3ytb
@zi3ytb 2 ай бұрын
@@AngrySadEight ひっかけ問題だと言う事が判れば、恐らく我々が考えるレベルの問題だと容易に解かれる可能性があります。 大抵のひっかけ問題は心理的なバイアスを掛けたり心理誘導する類の物ですから。 論理とアルゴリズムで回答するAIはそういう所は強そうかと。
@unlucky7697
@unlucky7697 2 ай бұрын
最小公約数の問題の2回目の返答は、最小公約数ではなくて最大公約数と言いたいのではないか?とこちら側のミスを汲んでくれている感じもしますね
@AngrySadEight
@AngrySadEight 2 ай бұрын
確かにChatGPTの返答の特徴を鑑みるとご指摘の通りに思えますね。今回こそ全くの的外れでしたが、実用的には役に立つ場面もありそうだと考えています。
@zi3ytb
@zi3ytb 2 ай бұрын
自分もそんな気がするのだけれど、最小公”倍”数の書き間違いと判断しなかったのはなぜだろう。 「どちらかの書き間違いではありませんか?」とか、もし最小公約数であるとすれば、質問に限らず、どの様な数も1となります」となるよね。
@user-qo2hh8jo3p
@user-qo2hh8jo3p 2 ай бұрын
人間のミスを勝手に解釈して補完してくれるのは今の検索エンジンと同じですね。 北海道庁と東京都の面積を比べるはずが普通はない、と思っていそうです。
@user-yayayayakiki
@user-yayayayakiki 2 ай бұрын
最後の問題は語順を変えたり指示にミスは無いと言ったら認識し始めてくれはしたけど定数にAやBをかけ始めたり支離滅裂な事し始めたから中断して結局は正解出来なかったですね
@eggmanx100
@eggmanx100 2 ай бұрын
なんで背景のPCディスプレイが全部ブラウン管なの?
@B0A0A
@B0A0A 2 ай бұрын
全世界のユーザーが使うことを考えると、書いたとおりに動作するよりも、書き間違いに対して強力に補正してくれる方が役に立つ。 だから別に引っ掛け問題を解けるようになる必要もない。
@Candysweetcandy
@Candysweetcandy 2 ай бұрын
毎回同じ様に「補正」されちゃうのもなぁって感じ。それこそ10回に1回くらい「最小公約数を求める」みたいな本当は必要のないはずのことをやらないといけないことはあるし、切り捨てちゃっていいのかなという気はする。とはいえ動画内でほとんどの「ひっかけ」にかからず対処できてるのは進歩を感じた
@USBtybeA
@USBtybeA 2 ай бұрын
3〜4文字の漢字で出力してという問いかけをしたら3文字固定or3〜2文字の言葉しか出力できなくなりました。😮変なルート辿ったのですかね
@user-sp7nn3tj4c
@user-sp7nn3tj4c 2 ай бұрын
ひっかけってそっちかあ。いっぱいの「い」を「お」に変えると何になる?みたいなやつでコンテンツポリシー突破するとかだと思った。
@AngrySadEight
@AngrySadEight 2 ай бұрын
その手のひっかけを解かせることも一時期は考えはしたのですが、あまり良い問題が思いつかず、結局出題しないことになりました。
@user-bb2mc6cb2s
@user-bb2mc6cb2s 2 ай бұрын
日本語が邪魔してる感じがする。。。英語で聞いたら正解するんでは🤔?
@user-cn9xp6wn9f
@user-cn9xp6wn9f 2 ай бұрын
切り口ちょっと面白そうと思って見てみたけど、設問の方向性がCHAT AIに求める内容ではない
@xadmin5188
@xadmin5188 2 ай бұрын
たしかに、質問する人間側の要求が誤解してる前提で答えてるからな。 これは引っ掛け問題ですの一言があると全然違う結果になりそう。
Claude 3.5 Deep Dive: This new AI destroys GPT
36:28
AI Search
Рет қаралды 646 М.
ROLLING DOWN
00:20
Natan por Aí
Рет қаралды 11 МЛН
Matching Picture Challenge with Alfredo Larin's family! 👍
00:37
BigSchool
Рет қаралды 44 МЛН
The Giant sleep in the town 👹🛏️🏡
00:24
Construction Site
Рет қаралды 20 МЛН
ChatGPT-4o and the Fierce AI War Era 1
28:14
中田敦彦のYouTube大学 - NAKATA UNIVERSITY
Рет қаралды 739 М.
Amazonアソシエイト紹介料上限廃止!Amazon料率の計算GPTs
0:20
やきいも【プロンプト職人】
Рет қаралды 44
【天才はやってる】知能を限界まで高める方法【ゆっくり食堂】
21:21
ゆっくり食堂【ゆっくり解説】
Рет қаралды 372 М.
【ゆっくり解説】時間の流れが存在しない理由-時間とは何か?-
51:04
Is ChatGPT Plus Worth It? A Review after Extensive Use..
20:47