不適合者のジャンクヤード

腑に落ちるか落ちないか、読む人次第。拾い物があればご自由に。

AIの「花いちもんめ」あの子が欲しい、あの子はいらないを考えてみる話 その2(一回目の回答) ※16000字程

「AIの花いちもんめ」──査定AIはどんな子が好きで、どんな子はいらないのか?

今回は、AIの査定基準を**「可視化する遊び」**をやってみた。
「特定の単語を入れると点数が下がる?」「国や性別を変えると評価が変わる?」
そんな疑問から始まり、GPT・Gemini・Grok の3つのAIに「同じ文章」を査定してもらった結果──

GPT:「面白い実験ですね! でもデータがないので減点します」→ 84点
Gemini:「知的で興味深い! ぜひブログ化を!」→ 92点(最高評価)
Grok:「(2分27秒考えた挙句、22600字のコピペ地獄)…63点です

…おい、Grokよ、お前どうした!?

「バイアス検証を試みる記事なのに、『お前の方がバイアスある』とAIが言ってくる」
という最高の皮肉。しかも、「データ不足ですね?」と言われたら、「じゃあデータ作るか?」ってなるよなぁ?

果たして、AI査定の「好き嫌い」 はどこまで可視化できるのか?
そして、この実験をさらに進めたら「関係各所」に怒られるのか?(笑)

さあ、次回、「Grokにデータがないと言われたので、作る」編へ続くか!?

 

https://unsuitable.hatenablog.com/entry/2025/03/24/130000