👩💼 【Geminiのアルゴリズム作成のご担当者様へ】 GeminiのAIモードの生成の誤りの原因を分析していただきましたのでご一読頂ければ幸いです。
*分析資料提供者: 市民ジャーナリスト 浅田美鈴
分析・解説: OpenAI ChatGPT-5
もくじ
▦どこが間違い?
▦なぜ間違えた?(技術的に起こりやすい原因)
🔹エンティティ分割の誤り(日本語形態素)
🔹エンティティ・リンキングの失敗
🔹時系列の弱さ
🔹存在否定の安全弁の欠如
▦どうすれば防げる?(改善策の具体案)
検索・取得段階(RAG/ランキング)
🔹“Gov-first”再ランキング
🔹日本語人名辞書+IPA/NEologd等を拡充して「姓+名」パターンを強化
🔹時系列付き知識グラフ(役職に開始・終了日)
🔹生成段階(LLM側の出力ガード)
▦ 評価・運用
🔹回帰テスト
🔹QA監視ダッシュボードを運用
✼••┈┈┈┈┈┈┈┈┈┈┈┈┈┈┈┈••✼✼••┈┈┈┈┈┈┈┈┈┈┈┈┈┈┈┈••✼
🧑💻解説: OpenAI ChatGPT-5先生
はい、あのAIモード文には具体的に誤りとミスリードが含まれています。短く要点でまとめます。
▦ どこが間違い?
1. 「元生活部長」
→ 誤り。少なくとも令和6年9月1日〜令和8年3月31日の公的名簿で現職の生活部長=和泉輝夫と明記。さらに令和7年6月29日現在の役員名簿でも「理事(猪名川町生活部長)」と記載。
2. 「2018〜2020年頃、地域公共交通会議の委員」
→ 用語の取り違え。令和元年度の名簿では、和泉氏は**事務局(企画総務部企画財政課 課長)**として記載。委員ではありません。
3. 「2021年頃に生活部長として議会会議録に登場」
→ 裏取り不十分(根拠未提示)。確認済みの公的名簿は2024〜25年の会議構成員名簿で生活部長としての記載(2025/2の名簿にも氏名あり)。2021年の議会会議録は本文からは裏付け不可。
4. 死亡の時期表現
→ 事案は9/27発生、28〜29日に報道。文面の「9/29に亡くなったことが報じられた」は“報じられた日”と“亡くなった日”が混同されやすい書き方。正確には27日に転落し病院で死亡確認、28〜29日に各社配信。
(参考)「中元 進」氏は2019年度の生活部長として公的PDFに実在。Geminiが“お中元”へ引きずった件はやはり誤りです。
▦ なぜ間違えた?(技術的に起こりやすい原因)
エンティティ分割の誤り(日本語形態素)
「中元 進」を「中元(お中元)+進める」に誤分割・誤読(“ちゅうげん すすむ”)し、人名としての認識に失敗。
エンティティ・リンキングの失敗
人名より流通量の多い商業コンテンツ(進物の大進等)が検索/RAGで上位に来て、“人物ではない”と誤結論。
時系列の弱さ
役職は時点依存なのに、年次の異なる断片を混ぜ、「元」扱いなどの混同が発生。
存在否定の安全弁の欠如
**公的資料がある場合は“否定しない”**というセーフティが足りず、「存在しない」系の断定を出してしまう。
▦ どうすれば防げる?(改善策の具体案)
検索・取得段階(RAG/ランキング)
.go.jp / .lg.jp / .pref.*.jp 等の公的ドメインを人名クエリで優先し、EC/まとめサイトの重みを下げる(“Gov-first”再ランキング)。
日本語人名辞書+IPA/NEologd等を拡充して「姓+名」パターンを強化、中元/進のような語彙衝突を抑制。
時系列付き知識グラフ(役職に開始・終了日)で、「現職/元職」を時点で判定。
生成段階(LLM側の出力ガード)
“人物の実在を否定する”出力には多ソース照合を必須(最低1つは公的資料)→照合できない場合は不確実表明に強制ダウングレード。
存在否定クラスの安全ルール:「一次資料が1件でも見つかったら“存在しない”と断定しない」。
根拠付き回答の義務化:固有名に関する主張は出典リンクを併記、時刻・日付は**“発生日/報道日”を区別**して書く。
▦ 評価・運用
“商業語彙に吸収されやすい日本語人名”の赤チーム・回帰テスト(例:中元進、櫻井/桜井、髙橋/高橋 等)。
“存在否定型”・“人物置換型”・“経歴混同型”のハルシネーション分類でQA監視ダッシュボードを運用。
---
必要なら、上の「正確版テンプレ」をX/ブログ用に短文化してお渡しします。今回のポイントは、
「元」→現職(公的PDF複数で確認)/委員→事務局/9/27発生・29日報道の混同、そして商業情報への吸着が誤りの主因、です。
👩💼ありがとうございました。