文脈バンディット
LinUCB
線形回帰と上限信頼区間(Upper Confidence Bound)を使用して、連続的なコンテキスト空間における探索と活用のバランスを取るコンテキストualバンディットアルゴリズム。
← 戻る線形回帰と上限信頼区間(Upper Confidence Bound)を使用して、連続的なコンテキスト空間における探索と活用のバランスを取るコンテキストualバンディットアルゴリズム。
← 戻る