알고리즘
Discrete Action Space & Continuous Action Space
WDmil
2024. 6. 26. 02:29
728x90
Discrete Action Space
에이전트가 취할 수 있는 행동이 n개의 행동중에 한개로 나누어 떨어지는 문제정의이다.
예를들어, 왼쪽 오른쪽 위 아래로 이동한다는 행동 4가지가 있을 때, 행동을 무조건 1개 선택해서 진행해야 한다고 하면.
위 또는 아래 오른쪽 왼쪽으로 이동하는 결과 한개가 나타나는걸 말한다.
A = [ 왼쪽, 위, 오른쪽, 아래 ]
Continuous Action Space
에이전트가 취할 수 있는 행동이 연속된 값을 선택하는 문제 정의 이다.
예를 들어, 로봇의 팔 관절이 몇도의 각도로 움직여야 할 지를 결정하는 문제는 Continuous Action Space이다.
A = 0 ~ 360(팔각도)
728x90