LLMの創造性は「見かけほど多様ではない」— 集団的均一化リスクを実証した新研究

研究の背景

「ChatGPTにアイデアを出してもらう」「Claudeでブレインストーミングする」——AIを創造的な作業のパートナーとして使う開発者は増えている。しかし、その出力はどれほど多様なのか？

arXiv:2603.19519「Inducing Sustained Creativity and Diversity in Large Language Models」は、この問いに正面から取り組んだ研究だ。

研究の結論は明確だ：

つまり、1回のAI出力は「創造的」に見えるが、100回繰り返すと「同じような答えばかり」になる。人間は逆に、個別の出力は平均的でも、集団としては非常に多様な回答を生み出す。

LLMの学習データには人間の創造的出力が大量に含まれているが、統計的に最も「良さそう」な回答に収束する傾向がある。温度パラメータを上げれば多様性は増すが、品質が下がるトレードオフが生じる。

AI搭載のアイデア生成機能を作る場合、単一モデルの出力を並べるだけでは「多様なアイデアリスト」にならないリスクがある。意図的にプロンプトのバリエーションを組み込むか、ユーザーの入力を組み合わせる設計が必要だ。

関連報道: Neuroscience News / TechXplore

AI Solo Craft 編集部のエキスパートが、今日のニュースを専門視点で読み解きます。

🔧 エンジニア

実装の観点からは、アイデア生成パイプラインで同一プロンプトのN回サンプリングに頼りすぎない設計が重要。Few-shotの例を毎回変える、Systemプロンプトに制約をランダムに追加するなどの工夫で多様性を担保できる。

🎨 デザイナー

「AIが生成したアイデアリスト」をユーザーに見せるUIでは、多様性の低さが顕在化しやすい。5つ並べて3つが似ていたら信頼を損なう。「AIの提案 + ランダムな制約」を組み合わせるインターフェースが解決策になりうる。

📊 マネージャー

AIを使ったアイデア出しサービスは増えているが、この研究は「AIだけでは差別化できない」ことを示唆する。人間のキュレーションやドメイン知識を組み合わせたサービス設計が競争優位になる。

📋 シニアデスク

「AIは創造的か？」という問いに対する解像度が上がった。個別は創造的だが集団では均一——この知見はAIツールの設計に直結する。アクション: (1) 自分のAIワークフローで出力の多様性を検証 (2) 複数モデルの併用を試す (3) 人間の直感をプロセスに残す。