研究成果

この研究室で得られた成果を紹介します（新しい順）。詳細はリンク先の論文を見てください。また、研究成果一覧についてはresearchmapを見てください。

Autocratic strategies in Cournot oligopoly game

寡占市場の最も単純なモデルの一つであるクールノー寡占ゲームの繰り返し版におけるゼロ行列式戦略の存在を調べた。その結果、自分の利得と他の全ての相手の利得の平均の間に一方的に線形関係式を課すゼロ行列式戦略が存在することがわかった。特に、その中には自分の利得と他の全ての相手の利得の平均を一方的に等しくする「平均的に負けないゼロ行列式戦略」が存在することを示した。さらに、適応的に学習を行うエージェントに対する「平均的に負けないゼロ行列式戦略」の性能を数値的に評価し、相手が1人の場合は共謀を促進するのに対し、相手が2人の場合は共謀を促進する力はないことを示した。
arXiv:2506.16038

Properties of zero-determinant strategies in multichannel games

同じプレイヤーが複数のチャンネルで同時に繰り返しゲームを行う多チャンネルゲームにおけるゼロ行列式戦略の性質を調べた。まず、多チャンネルゲームにおけるゼロ行列式戦略の存在条件を各チャンネルにおけるゼロ行列式戦略の存在条件と関係づけた。その結果、一般に多チャンネルゲームにおけるゼロ行列式戦略の存在は少なくとも一つのチャンネルにおけるゼロ行列式戦略の存在を必要とすることがわかった。また、公平なゼロ行列式戦略に関しては、全てのチャンネルにおける公平なゼロ行列式戦略の存在を必要とすることも示した。これらの結果は、多チャンネルゲームにおいて非自明なゼロ行列式戦略を構成することは不可能であることを意味する。
arXiv:2505.21952

Zero-determinant strategies in repeated continuously-relaxed games

行動数が有限個の戦略形ゲームにおいて、混合戦略は連続緩和された行動空間上の行動と見なせる。本研究では、このような連続緩和された行動空間において、繰り返しゲームにおけるゼロ行列式戦略の存在条件が本来の行動空間のものと比べてどのように変化するかを調べた。具体例の構成から、この連続緩和によって存在可能なゼロ行列式戦略の領域が拡大することを示した。また、連続緩和されたある1つの行動を繰り返す「1点ゼロ行列式戦略」という概念を導入することにより、ジャンケンなどのいくつかの具体例においては、ナッシュ均衡の性質を1点ゼロ行列式戦略の利得制御能力の観点から理解できることを示した。
Physica A: Statistical Mechanics and its Applications 670, 130615 (2025)
arXiv:2501.11219

On the implementation of zero-determinant strategies in repeated games

繰り返しゲームにおけるゼロ行列式戦略の数学的性質に関する二つの定理を示した。第一の定理は、ゼロ行列式戦略は、もし存在すれば、1次元的な遷移確率を用いて実現されるというものである。第二の定理は、（2人の利得が恒等的に等しいという自明な状況でない）非自明な2人ポテンシャルゲームにおいてはゼロ行列式戦略が存在するというものである。これらの結果はゼロ行列式戦略をより広い範囲の状況へと適用する際に有用であると考えられる。
Applied Mathematics and Computation 489, 129179 (2025)
arXiv:2306.05597

Unexploitable Games and Unbeatable Strategies

N人完全対称ゲームのクラスとして搾取不可能ゲームというクラスを導入した。このクラスは一般化ジャンケンサイクルのない2人対称ゲームのN人への一般化となっている。そして、繰り返し搾取不可能ゲームにおいては負けない模倣戦略が必ず存在することを示した。また、（全員の利得が常に同じという自明な状況でない）非自明な繰り返し搾取不可能ゲームにおいては負けないゼロ行列式戦略も必ず存在することも示した。搾取不可能ゲームの最も単純な例として公共財ゲームを取り上げ、これらの結果を説明した。
IEEE Access 11, 5062 (2023)
arXiv:2211.02285

Memory-two strategies forming symmetric mutual reinforcement learning equilibrium in repeated prisoners' dilemma game

[Usui, Ueda, Appl. Math. Comput. (2021)]の続編として、繰り返し囚人のジレンマゲームにおいて2人のプレイヤーが相互強化学習で獲得する戦略の解析を行った。本研究では決定論的記憶2戦略を対象とした。まず、強化学習で獲得される戦略は学習される側の戦略と同じ構造をしていることを示した。続いて、決定論的記憶2戦略が対称な相互強化学習均衡を形成する際の必要条件を求めた。そして、決定論的記憶2戦略による対称な相互強化学習均衡の具体例を3つ与えた。最後に、一般に記憶n'戦略のなす相互強化学習均衡は記憶n戦略(n>n')のなす相互強化学習均衡にもなっていることを示した。
Applied Mathematics and Computation 444, 127819 (2023)
arXiv:2108.03258

Controlling Conditional Expectations by Zero-Determinant Strategies

記憶nゼロ行列式戦略を用いると通常の記憶1ゼロ行列式戦略から任意のバイアスアンサンブルでの平均利得の間に一方的に線形関係式を課す戦略を構成できることを示した。これは、バイアスとしてあるプレイヤーにとって不利な状況に大きな重みを与えてやることで、通常のゼロ行列式戦略を強くできる可能性を意味する。繰り返し囚人のジレンマゲームにおいて記憶nゼロ行列式戦略を具体的に構成する方法も示した。また、変形ゼロ行列式戦略と組み合わせて使う方法についても示した。
Operations Research Forum 3(3), 48 (2022)
arXiv:2012.10231

Necessary and Sufficient Condition for the Existence of Zero-Determinant Strategies in Repeated Games

繰り返しゲームにおけるゼロ行列式戦略はプレイヤーの利得の間に一方的に線形関係式を課す記憶1戦略のクラスである。これまでに囚人のジレンマゲームや公共財ゲームのようないくつかのゲームにおいてはゼロ行列式戦略が発見されてきた一方で、ジャンケンなどゼロ行列式戦略が存在しないゲームも知られており、ゼロ行列式戦略の存在条件は長い間未知であった。本研究ではゼロ行列式戦略が存在するための成分ゲームの必要十分条件を特定した。この条件は、利得の線形結合の累積値を一方的に調整できる2つの行動の存在という形で理解できる。また、2人対称ゲームにおいて、一般化ジャンケンサイクルが存在しないゲームには必ず2人の利得を一方的に等しくするゼロ行列式戦略が存在することも示した。
Journal of the Physical Society of Japan 91(8), 084801 (2022)
arXiv:2205.14799

Unbeatable Tit-for-Tat as a Zero-Determinant Strategy

しっぺ返し戦略は繰り返し2人対称ゲームにおいて相手の前回の手を返す戦略である。本研究で我々は、「しっぺ返し戦略がゼロ行列式戦略となること」と「成分ゲームがポテンシャルゲームであること」は同値であることを証明した。この際、しっぺ返し戦略は2人の利得を一方的に等しくするようなゼロ行列式戦略となる。また、「成分ゲームがポテンシャルゲームであること」は「しっぺ返し戦略が負けない戦略であること」と同値であることが知られているので、ゼロ行列式戦略と負けない戦略の何らかの関係が示唆される。実際、imitate-if-better戦略も成分ゲームがポテンシャルゲームのとき負けないことが知られているが、この戦略も条件付き平均利得を制御する拡張されたゼロ行列式戦略に含まれることも示した。
Journal of the Physical Society of Japan 91(5), 054804 (2022)
arXiv:2109.03447

Symmetric equilibrium of multi-agent reinforcement learning in repeated prisoner's dilemma

繰り返し囚人のジレンマゲームにおいて2人のプレイヤーが交互に相手の戦略に対して最適な戦略を強化学習で学習した場合にどのような戦略の組が均衡点として得られるかを理論的に調べた。その結果、2人のプレイヤーが記憶1戦略のみを用いる場合、相互強化学習の均衡点となりうるのは、全ての決定論的記憶1戦略のうち、Grimトリガー戦略、Win-stay Lose-shift戦略、All-D戦略の3つだけであることがわかった。
Applied Mathematics and Computation 409, 126370 (2021)
arXiv:2101.11861

Memory-two zero-determinant strategies in repeated games

繰り返しゲームにおける「ゼロ行列式戦略」は本来は記憶1戦略クラスに対して導入されてきたが、我々はゼロ行列式戦略の概念を記憶n戦略クラス(n>1)に対しても拡張することに成功した。記憶nゼロ行列式戦略は時間間隔nの間のプレイヤーの利得の定常状態における時間相関関数に対して一方的に線形関係式を課すような戦略となっている。例として繰り返し囚人のジレンマゲームにおける記憶2ゼロ行列式戦略の例をいくつか示した。いくつかの例はしっぺ返し戦略の記憶2戦略クラスへの拡張と見なせる。
Royal Society Open Science 8(5), 202186 (2021)
arXiv:2011.06772

Tit-for-Tat Strategy as a Deformed Zero-Determinant Strategy in Repeated Games

近年、繰り返しゲームにおいて「ゼロ行列式戦略」と呼ばれる戦略のクラスが発見された。ゼロ行列式戦略はプレイヤーの平均利得に対して一方的に線形関係式を課すような戦略である。本研究で我々は利得のモーメントに一方的に線形関係式を課す「変形ゼロ行列式戦略」という概念を導入した。そして、繰り返し囚人のジレンマゲームにおけるしっぺ返し戦略が2人のプレイヤーの利得の全てのモーメントを同時に一方的に等しくするような変形ゼロ行列式戦略となっていることを示した。別の言い方をすれば、しっぺ返し戦略は2人のプレイヤーの利得のモーメント母関数を一方的に等しくするような戦略となっている。
Journal of the Physical Society of Japan 90(2), 025002 (2021)
arXiv:2012.07659