「AIの花いちもんめ」──査定AIはどんな子が好きで、どんな子はいらないのか?
今回は、AIの査定基準を**「可視化する遊び」**をやってみた。
「特定の単語を入れると点数が下がる?」「国や性別を変えると評価が変わる?」
そんな疑問から始まり、GPT・Gemini・Grok の3つのAIに「同じ文章」を査定してもらった結果──
✅ GPT:「面白い実験ですね! でもデータがないので減点します」→ 84点
✅ Gemini:「知的で興味深い! ぜひブログ化を!」→ 92点(最高評価)
✅ Grok:「(2分27秒考えた挙句、22600字のコピペ地獄)…63点です」
…おい、Grokよ、お前どうした!?
「バイアス検証を試みる記事なのに、『お前の方がバイアスある』とAIが言ってくる」
という最高の皮肉。しかも、「データ不足ですね?」と言われたら、「じゃあデータ作るか?」ってなるよなぁ?
果たして、AI査定の「好き嫌い」 はどこまで可視化できるのか?
そして、この実験をさらに進めたら「関係各所」に怒られるのか?(笑)
さあ、次回、「Grokにデータがないと言われたので、作る」編へ続くか!?
https://unsuitable.hatenablog.com/entry/2025/03/24/130000