9.7 Conclusion & Future Work
์ด๋ฒ chapter์์๋ SCG์์ ์ด๋ค ์ฐจ์์ gradient๋ ์ ํํ๊ฒ ๊ณ์ฐํ ์ ์๋ DiCE ๊ธฐ๋ฒ์ ์์๋ณด์์ต๋๋ค. DiCE๋ ํ์ฌ์ ๋์ ์ฐจ์์ gradient๋ฅผ ๊ณ์ฐํ๋ ํ๊ณ์ ์ ํด๊ฒฐํ์์ต๋๋ค. Surrogate Loss๋ฅผ ์ด์ฉํ ์ ๊ทผ์ ๊ณ์ฐ๋ ๋ณต์กํด์ง ๋ฟ๋ง ์๋๋ผ, ์ ํํ์ง ์์์ ๊ฐ๋จํ ์์ ๋ก ๋ณด์์ต๋๋ค. DiCE์ ์ ํ์ฑ์ ๋ํด ์ฆ๋ช ํ์์ผ๋ฉฐ, ๊ฐ๋จํ ์คํ์ ํตํด ์ ํจํจ์ ๋ณด์์ต๋๋ค.
์ ์๋ DiCE๊ฐ ๋์ ์ฐจ์์ gradient๊ฐ ์ฌ์ฉ๋๋ ๋ง์ ๋ถ์ผ์ ์ ์ฉ๋์ด ์๋ก์ด ์งํ์ ์ด๊ฒ์ด๋ผ๊ณ ๊ธฐ๋ํฉ๋๋ค. ๋ํ future work์ผ๋ก DiCE๋ฅผ action-dependent baseline๊ณผ ์ผ๋ฐํ๋๊ณ ๋์ ์ฐจ์์ baseline์ ๋ง๋๋ function์ ํฌํจํ๊ณ ์ถ์ดํฉ๋๋ค.
Last updated