Aprendizaje por Refuerzo Estocástico

📂

subcategorías

Procesos de Decisión de Markov Estocásticos

MDP donde las transiciones y recompensas siguen distribuciones probabilísticas, modelando la incertidumbre ambiental.

17 términos

📂

subcategorías

Métodos Monte Carlo en RL

Algoritmos que utilizan muestreo aleatorio repetido para estimar los valores de estado-acción en entornos estocásticos.

14 términos

📂

subcategorías

Políticas Estocásticas

Estrategias que devuelven distribuciones de probabilidad sobre las acciones en lugar de acciones deterministas.

11 términos

📂

subcategorías

Aprendizaje por Refuerzo Bayesiano

Enfoque que aborda la incertidumbre sobre los parámetros del modelo utilizando distribuciones de probabilidad.

9 términos

📂

subcategorías

Bandidos Estocásticos Multi-brazos

Problema de exploración-explotación donde cada brazo tiene una distribución de recompensa estocástica desconocida.

7 términos

📂

subcategorías

Métodos Bootstrap en RL

Técnicas que utilizan el remuestreo para cuantificar la incertidumbre en las estimaciones de valor.

15 términos

📂

subcategorías

Procesos Gaussianos para RL

Uso de procesos gaussianos para modelar la incertidumbre en la función de valor o de transición.

10 términos

📂

subcategorías

Métodos de Conjunto en RL Estocástico

Combinación de múltiples estimadores para capturar la incertidumbre epistémica en el aprendizaje.

19 términos

📂

subcategorías

Aprendizaje por Refuerzo Distribucional

Aprendizaje de la distribución completa de los retornos en lugar de solo su esperanza matemática.

5 términos

📂

subcategorías

Regresión Cuantil DRL

Enfoque específico del RL distribucional utilizando la regresión cuantil para modelar la incertidumbre.

8 términos

📂

subcategorías

MDP Parcialmente Observables Estocásticos

Extensión de los MDP estocásticos con observación parcial, aumentando la incertidumbre sobre el estado.

8 términos

📂

subcategorías

Optimización Estocástica en RL

Métodos de optimización que consideran el ruido y la incertidumbre en los gradientes y las actualizaciones.

10 términos

Glosario IA

Procesos de Decisión de Markov Estocásticos

Métodos Monte Carlo en RL

Políticas Estocásticas

Aprendizaje por Refuerzo Bayesiano

Bandidos Estocásticos Multi-brazos

Métodos Bootstrap en RL

Procesos Gaussianos para RL

Métodos de Conjunto en RL Estocástico

Aprendizaje por Refuerzo Distribucional

Regresión Cuantil DRL

MDP Parcialmente Observables Estocásticos

Optimización Estocástica en RL

No se encontraron resultados