人工知能の完全辞典
初期A/Bテストと、最も優れたバリアントへ漸進的に適応的割り当てを行うハイブリッドアプローチ
リアルタイムで観察されたパフォーマンスに基づいてトラフィック割り当てを動的に調整する実験手法
コンバージョンを最適化するために、相対的なパフォーマンスに応じてバリアント間でトラフィックを継続的に再配分する戦略
各アクションの選択を、それが最適であると推定される確率に比例させる選択戦略
報酬が試行間で独立な、未知の固定確率分布に従うタイプのバンディット問題