Una Introducción amable pero riguroza al aprendizaje por refuerzo
La interacción con el mundo es una de las principales formas en las que se genera el aprendizaje, pues es el medio por el cuál se obtiene información del entorno, y se experimentan relaciones causa-efecto. Esta idea de aprender mediante la interacción es una aspecto fundamental en muchas teorías de...
Saved in:
| Main Authors: | , , |
|---|---|
| Format: | Article |
| Language: | English |
| Published: |
Universidad de Guadalajara
2023-06-01
|
| Series: | ReCIBE |
| Subjects: | |
| Online Access: | http://recibe.cucei.udg.mx/index.php/ReCIBE/article/view/268 |
| Tags: |
Add Tag
No Tags, Be the first to tag this record!
|
| _version_ | 1849427638109601792 |
|---|---|
| author | Mauro Alejandro Montenegro Meza Rolando Menchaca Méndez Ricardo Menchaca Méndez |
| author_facet | Mauro Alejandro Montenegro Meza Rolando Menchaca Méndez Ricardo Menchaca Méndez |
| author_sort | Mauro Alejandro Montenegro Meza |
| collection | DOAJ |
| description |
La interacción con el mundo es una de las principales formas en las que se genera el aprendizaje, pues es el medio por el cuál se obtiene información del entorno, y se experimentan relaciones causa-efecto. Esta idea de aprender mediante la interacción es una aspecto fundamental en muchas teorías del aprendizaje y, en este artículo abordaremos un enfoque computacional llamado "aprendizaje por refuerzo" (Reinforcement Learning, RL) además de construir de manera progresiva y sencilla sus bases matemáticas, así como los métodos principales de solución. Por último, mostramos aplicaciones y algoritmos que son relevantes en la industria e investigación.
|
| format | Article |
| id | doaj-art-4745bacb92f5480ebb2f9b1fa62e6534 |
| institution | Kabale University |
| issn | 2007-5448 |
| language | English |
| publishDate | 2023-06-01 |
| publisher | Universidad de Guadalajara |
| record_format | Article |
| series | ReCIBE |
| spelling | doaj-art-4745bacb92f5480ebb2f9b1fa62e65342025-08-20T03:28:58ZengUniversidad de GuadalajaraReCIBE2007-54482023-06-0112110.32870/recibe.v12i1.268Una Introducción amable pero riguroza al aprendizaje por refuerzoMauro Alejandro Montenegro Meza0Rolando Menchaca Méndez1Ricardo Menchaca Méndez2Centro de Investigación en ComputaciónCentro de Investigación en Computación del IPNCentro de Investigación en Computación del IPN La interacción con el mundo es una de las principales formas en las que se genera el aprendizaje, pues es el medio por el cuál se obtiene información del entorno, y se experimentan relaciones causa-efecto. Esta idea de aprender mediante la interacción es una aspecto fundamental en muchas teorías del aprendizaje y, en este artículo abordaremos un enfoque computacional llamado "aprendizaje por refuerzo" (Reinforcement Learning, RL) además de construir de manera progresiva y sencilla sus bases matemáticas, así como los métodos principales de solución. Por último, mostramos aplicaciones y algoritmos que son relevantes en la industria e investigación. http://recibe.cucei.udg.mx/index.php/ReCIBE/article/view/268Proceso de decisión markoviano |
| spellingShingle | Mauro Alejandro Montenegro Meza Rolando Menchaca Méndez Ricardo Menchaca Méndez Una Introducción amable pero riguroza al aprendizaje por refuerzo ReCIBE Proceso de decisión markoviano |
| title | Una Introducción amable pero riguroza al aprendizaje por refuerzo |
| title_full | Una Introducción amable pero riguroza al aprendizaje por refuerzo |
| title_fullStr | Una Introducción amable pero riguroza al aprendizaje por refuerzo |
| title_full_unstemmed | Una Introducción amable pero riguroza al aprendizaje por refuerzo |
| title_short | Una Introducción amable pero riguroza al aprendizaje por refuerzo |
| title_sort | una introduccion amable pero riguroza al aprendizaje por refuerzo |
| topic | Proceso de decisión markoviano |
| url | http://recibe.cucei.udg.mx/index.php/ReCIBE/article/view/268 |
| work_keys_str_mv | AT mauroalejandromontenegromeza unaintroduccionamableperorigurozaalaprendizajeporrefuerzo AT rolandomenchacamendez unaintroduccionamableperorigurozaalaprendizajeporrefuerzo AT ricardomenchacamendez unaintroduccionamableperorigurozaalaprendizajeporrefuerzo |