9.7 Conclusion & Future Work

์ด๋ฒˆ chapter์—์„œ๋Š” SCG์—์„œ ์–ด๋–ค ์ฐจ์ˆ˜์˜ gradient๋“  ์ •ํ™•ํ•˜๊ฒŒ ๊ณ„์‚ฐํ•  ์ˆ˜ ์žˆ๋Š” DiCE ๊ธฐ๋ฒ•์„ ์•Œ์•„๋ณด์•˜์Šต๋‹ˆ๋‹ค. DiCE๋Š” ํ˜„์žฌ์˜ ๋†’์€ ์ฐจ์ˆ˜์˜ gradient๋ฅผ ๊ณ„์‚ฐํ•˜๋Š” ํ•œ๊ณ„์ ์„ ํ•ด๊ฒฐํ•˜์˜€์Šต๋‹ˆ๋‹ค. Surrogate Loss๋ฅผ ์ด์šฉํ•œ ์ ‘๊ทผ์€ ๊ณ„์‚ฐ๋„ ๋ณต์žกํ•ด์งˆ ๋ฟ๋งŒ ์•„๋‹ˆ๋ผ, ์ •ํ™•ํ•˜์ง€ ์•Š์Œ์„ ๊ฐ„๋‹จํ•œ ์˜ˆ์ œ๋กœ ๋ณด์•˜์Šต๋‹ˆ๋‹ค. DiCE์˜ ์ •ํ™•์„ฑ์— ๋Œ€ํ•ด ์ฆ๋ช…ํ•˜์˜€์œผ๋ฉฐ, ๊ฐ„๋‹จํ•œ ์‹คํ—˜์„ ํ†ตํ•ด ์œ ํšจํ•จ์„ ๋ณด์˜€์Šต๋‹ˆ๋‹ค.

์ €์ž๋Š” DiCE๊ฐ€ ๋†’์€ ์ฐจ์ˆ˜์˜ gradient๊ฐ€ ์‚ฌ์šฉ๋˜๋Š” ๋งŽ์€ ๋ถ„์•ผ์— ์ ์šฉ๋˜์–ด ์ƒˆ๋กœ์šด ์ง€ํ‰์„ ์—ด๊ฒƒ์ด๋ผ๊ณ  ๊ธฐ๋Œ€ํ•ฉ๋‹ˆ๋‹ค. ๋˜ํ•œ future work์œผ๋กœ DiCE๋ฅผ action-dependent baseline๊ณผ ์ผ๋ฐ˜ํ™”๋˜๊ณ  ๋†’์€ ์ฐจ์ˆ˜์˜ baseline์„ ๋งŒ๋“œ๋Š” function์„ ํฌํ•จํ•˜๊ณ  ์‹ถ์–ดํ•ฉ๋‹ˆ๋‹ค.

Last updated