3.5 Results

์œ„์˜ ๊ฒฐ๊ณผ์—์„œ ๋ณด๋“ฏ, COMA๋Š” ๋ชจ๋“  IAC๋ณด๋‹ค ์›”๋“ฑํ•œ ์„ฑ๋Šฅ์„ ๋ณด์ž…๋‹ˆ๋‹ค. ๋ณด๋ฉด IAC๊ฐ€ ์–ด๋Š์ •๋„ reasonableํ•œ ์„ฑ๋Šฅ์„ ๋‚ด๊ธด ํ•˜์ง€๋งŒ ์ˆ˜๋ ด์†๋„๊ฐ€ ์ œ์ผ ๋Š๋ฆฐ๋ฐ, ์ด๋Š” IAC์˜ parameter๊ฐ€ ์ ์–ด์„œ ๋นจ๋ฆฌ ํ•™์Šต๋ ๊ฑฐ๋ผ๋Š” intuition๊ณผ ๋ฐ˜๋Œ€๋ฉ๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ๊ฒฐ๊ณผ๋Š” global state๋ฅผ ํ†ตํ•ด ์–ป์€ ์ข‹์€ critic์ด ๋„คํŠธ์›Œํฌ๋ฅผ ๋ถ„๋ฆฌํ•˜๋Š” ๊ฒƒ์˜ ์˜ค๋ฒ„ํ—ค๋“œ๋ฅผ ์••๋„ํ–ˆ์Œ์„ ๋‚˜ํƒ€๋ƒ…๋‹ˆ๋‹ค.

๋˜ํ•œ, central-QV๋ณด๋‹ค COMA๊ฐ€ ํ•™์Šต์†๋„๋‚˜ ์„ฑ๋Šฅ์—์„œ ๋ชจ๋‘ ์šฐ์›”ํ•œ ์„ฑ๋Šฅ์„ ๋ณด์˜€๋Š”๋ฐ ์ด๋Š” counterfactual baseline์ด ์œ ํšจํ•จ์„ ๋“œ๋Ÿฌ๋ƒ…๋‹ˆ๋‹ค.

๊ฒฐ๊ณผ์ ์œผ๋กœ, Usunier์˜ ์‹คํ—˜์€ ์ข€ ๋” ํ™˜๊ฒฝ์ด ๋œ ์ œํ•œ์ด ๋˜์—ˆ์œผ๋‚˜ ์„ฑ๋Šฅ์€ ๋น„๊ตํ• ๋งŒํ•˜๋‹ค๋Š” ๊ฒƒ์„ ๋ณผ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

Last updated