田畑公次 准教授
研究内容
当たる確率が違うスロットマシンが10台あって、プレイして当たれば金貨がもらえるとします。合計1000回プレイできるとしたら、どんな戦略を取るといいでしょうか?
これは多腕バンディット問題と呼ばれる問題で、できるだけ多く当たりやすいマシンをプレイしたいけれど、当たりやすいスロットマシンがどれかを特定するためには全体的にプレイしないといけないというジレンマをモデル化したものになっていて、この研究はオンライン広告配信、ゲームのAIなどにも応用されています。
私の専門は機械学習で、特に多腕バンディット問題やその拡張や応用に関する研究を行っています。
主要論文
- Koji Tabata, Atsuyoshi Nakamura, Tamiki Komatsuzaki, “Classification Bandits: Classification Using Expected Rewards as Imperfect Discriminators”, Pacific-Asia Conference on Knowledge Discovery and Data Mining: PAKDD 2021 International Workshops: PAKDD 2021 Workshops, WSPA, MLMEIN, SDPRA, DARAI, and AI4EPT, 57-69, 2021.
- Koji Tabata, Atsuyoshi Nakamura, Junya Honda and Tamiki Komatsuzaki, “A bad arm existence checking problem: How to utilize asymmetric problem structure?”, Machine Learning, 109(2), 327-372, 2020.
- Aurelien Pelissier, Atsuyoshi Nakamura, Koji Tabata,“Feature selection as Monte-Carlo Search in Growing Single Rooted Directed Acyclic Graph by Best Leaf”, SIAM International Conference on Data Mining, 450-458 (2019).
連絡先
ktabata(at)es.hokudai.ac.jp
学生へのひとこと
将来どんなことが役に立つか分からないので、幅広く勉強し、いろんな経験をすることをお勧めします。