Skip to main content

通信トポロジは熟議を左右する:マルチエージェント LLM における正解率と多様性の分析

Venue #

言語処理学会第32回年次大会 (NLP 2026), B4-21

Authors #

Junya G. Honda (TUT), Kotaro Sakamoto, Jumpei Ukita, Takeshi Kojima, Yusuke Iwasawa, Yutaka Matsuo (UTokyo)

複数の大規模言語モデル(LLM)エージェントに議論させるマルチエージェント議論は,単一モデルの誤りを相互に訂正できる一方,「強い単一エージェント+多数決」を上回らない場合も報告されている.議論のプロトコルを固定したまま通信トポロジと議論の深さのみを制御し,正解率と多様性の時間発展を系統的に比較した.リング,スター,完全グラフ,Erdős–Rényi,スモールワールド,スケールフリーの6種を対象に,各ラウンドで近傍要約を共有しつつ最終解を出力して多数決で集約した.語彙指標(n-gramエントロピー等)と埋め込み空間における分散を解析すると,(1) 疎なリングは混合が遅く初期改善が鈍い,(2) ハブを持つグラフは1–2ラウンドで高精度に達しやすい,(3) 語彙多様性と意味多様性は乖離し得る,という傾向が得られた.さらに,日本語タスクへ置き換える際の指標設計上の注意点を議論する.