オムロンサイニックエックス(OSX)は3日、同社の共同研究成果が、「Forty-Second International Conference on Machine Learning (ICML 2025)」に採択されたと発表した。
採択された論文は、「The Harder Path: Last Iterate Convergence for Uncoupled Learning in Zero-Sum Games with Bandit Feedback(茨の道:バンディットフィードバック設定のゼロ和ゲームにおける独立学習の最終反復収束)」
同論文では、プレイヤー間の情報共有が許されず、自身の報酬と行動のみを観測する独立学習およびバンディットフィードバック設定下での繰り返しゼロ和行列ゲームにおける学習を調べた。理論的に、最終反復のナッシュ均衡への収束を保証することには大きなコストが伴うことを示した。
具体的には、達成可能な最良の収束率がO(1/T0.25)であり、平均反復収束の標準的な収束率O(1/T0.5)と比べて大幅に遅いことを示した。その後、定数因子および対数因子を除いて、この最適収束率を達成する二つのアルゴリズムを提案している。
「ICML」は「Neural Information Processing Systems(NeurIPS)」と並び、機械学習などの分野において国際的に権威のある主要国際会議の一つ。カナダのバンクーバーで7月13~19日(現地時間)、開催される。
「医療機器・化粧品」の記事に関するご意見・お問合せは下記へ。
担当者:河辺
E-mail:kawabe_s@yakuji.co.jp
TEL:03-3866-8499