« 2025/09 »
일	월	화	수	목	금	토
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30

MP(Markov Process)

카테고리

알고리즘

작성일

2024. 6. 24. 00:16

작성자

WDmil

728x90

MP(Markov Process)

MP는 상태s 와 상태 전이(state trainsition)확률 $P_{ss'}$ 로 구성된 환경이다.

$MP(Markov Process) = < S, P >$

예를 들어 아래 MP(MarkovProcess)는 맑음 $s_{1}$ 과 흐림 $s_{2}$ 2가지 상태로 구성된다.

Markov Process는 markov Property를 따른다. MarkovProperty는

다음 상태를 결정하는데 오직 바로 이전 상태만 고려한다는 가정

이다.

$P[s_{t}|s_{t}] = P[s_{t+1}|s_{1},s_{2}, ... , s_{t}]$

즉, 바로 이전 상태 이전에 어떤 상황을 거쳐서 현재 상태에 도달했든 $(s_{1}, s_{2}, s_{2}, s_{1} = s_{2}, s_{1}, s_{1}, s_{1} = s_{2}, s_{2}, s_{2}, s_{1} )$ 현재 상태 $(s_{t})$ 만을 기준으로 미래의 상태 변화를 예측한다는 가정이다.

728x90

'알고리즘' 카테고리의 다른 글

MRP(Markov Reward Process) & MDP(Markov Decision Process) (0)	2024.06.24
강화학습 알고리즘 기초개요 (0)	2024.06.24
강화학습 (0)	2024.06.23
TensorFlow 2.0 파라미터 저장 & 불러오기 (0)	2024.06.21
TensworFlow 2.0을 이용한 Char-RNN구현 (0)	2024.06.20

프로그래밍 공부 프로그래밍 공부하는 블로그

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

개인정보

MP(Markov Process)

MP(Markov Process)

다음 상태를 결정하는데 오직 바로 이전 상태만 고려한다는 가정

'알고리즘' 카테고리의 다른 글

티스토리툴바

단축키

내 블로그

블로그 게시글

모든 영역