4.4 Common Knowledge
Last updated
Was this helpful?
Last updated
Was this helpful?
binary mask ์ ๋ํ ์ค์ํ ํน์ฑ์ agent๊ฐ entity ๋ฅผ ๋ณผ ์ ์๋๋์๋ง ๋ฌ๋ ค ์๋ค๋ ์ ์ ๋๋ค. ๊ทธ๋ ๊ธฐ ๋๋ฌธ์ ๋ง์ฝ agent ์ ๋ชจ๋ mask ๊ฐ common knowledge๋ผ๋ฉด, ๋ค๋ฅธ agent ๊ฐ ๋ฅผ ๋ณผ ์ ์๋ค๋ฉด ์ ๊ทธ๊ฐ ๋ณผ ์ ์๋ entities ์ ๋ํด ์์ ์ ์ ์์ต๋๋ค.
ํ ๊ทธ๋ฃน์ด ์๊ณ ์๋ Mutual knowledge ๋ผ๊ณ ์ ์ํ ๋ ์ด๋ ๋ค์๊ณผ ๊ฐ์ด ํํํ ์ ์์ต๋๋ค.
๊ทธ๋ฌ๋ ์ด๋ฌํ mutual knowledge๋ common knowledge๋ฅผ ๋ปํ์ง ์์ต๋๋ค. ๊ทธ์ ๋ค๊ฐ์ด ์๊ณ ์๋ entities์ด๊ธฐ ๋๋ฌธ์ ๋๋ค. ๋์ ํ group์ common knowledge๋ ๋ก ํํํ๋๋ฐ, ์ด๋ ์ ์๋๋ก group ๊ฐ ๋ฅผ ์๊ณ , ๋ชจ๋๊ฐ ๋ฅผ ์๋ค๋ ์ฌ์ค์ ์๋ ์ ๋ณด์ ๋๋ค.
agent ๊ฐ ๋ค๋ฅธ agent ๋ ๋ฅผ ๋ณด๊ณ ์๋์ง ์๊ธฐ ์ํด์ , agent ๋ ๋ฅผ ๋ด์ผํ๊ณ ๊ฐ ๋ฅผ ๋ณด๊ณ ์๋์ง ์์์ผํ๋๋ฐ ์ด๋ ๋ค์๊ณผ ๊ฐ์ด ํ๊ธฐํ ์ ์์ต๋๋ค.
๋ ๋ค์๊ณผ ๊ฐ์ด ์ฌ๊ท์ ์ธ ํํ๋ก ํํ๋ ๊ฐ๋ฅํฉ๋๋ค. ๋ชจ๋ agent ๊ฐ ๊ทธ๋ฃน ์ ์ํ๋ค๋ฉด, ๋ค์๊ณผ ๊ฐ์ด ํํ ๊ฐ๋ฅํฉ๋๋ค.
์ด๋ iteration m=0์ผ ๋, agent ์ ๋ํ mutual knowledge ๋ ์ ๊ฐ์ต๋๋ค. ์ค์ค๋ก ๊ฐ์ง๊ณ ์๋ mutual knowledge๋ ์ค์ค๋ก์ common knowledge๊ฐ ๋ฉ๋๋ค.
m = 1๋ก iteration์ ์งํํด๋ณด๊ฒ ์ต๋๋ค.
์ด๋ฅผ ํด์ํ๋ฉด, a๊ฐ observeํ ๋, a๊ฐ ๋ณด๋ b์ ๊ดํ entities์ ๋ํด mutual knowledge์ ํฌํจ๋๊ณ , ์ด๊ฒ์ ๋ํ ๊ทธ๋ฃน ์ ์ฒด์ ๊ต์งํฉ์ ํ๊ฒ ๋๋ฉด, ๋ ๊ทธ๋ฃน ๋ด ์ ์ฒด๊ฐ ์๋ entities๋ผ๋ ๊ฒ์ ์ ์ ์์ต๋๋ค.
m = 2๋ก iteration์ ๋ ์งํํด ๋ณด๊ฒ ์ต๋๋ค.
๊ฒฐ๊ตญ, agent๊ฐ a๊ฐ ๋ดค์ ๋, ๋ชจ๋ agent๊ฐ ๋ฅผ ์๊ณ ์๋ค๋ ์ฌ์ค์ ์๋๋ฐฉ์ด ์๊ณ ์๋ค๋๊ฑธ ์๊ณ ์๋ ์ํ๋ฅผ ์๋ฏธํฉ๋๋ค. ์ด๋ฅผ ๋ฌดํ๋๋ก ๋ณด๋ด๋ ํ์๋ ์์ ํ์๋ฅผ ๋ฐ๋ณตํ๋ ๊ฒ์ mutual knowledge๊ฐ common knowledge๊ฐ ๋๋ค๋ ๊ฒ์ ์ ์ ์์ต๋๋ค.
์์ ์ฌ๊ท์ ์ธ ํํ์์๋ ๊ณต์งํฉ์๋ํด roughํ๊ฒ ๋ณด์ฌ์คฌ์ง๋ง ์ฌ๊ธฐ์๋ ์ข ๋ ์๊ฒฉํ๊ฒ ๋ํ๋ด์๋ค๊ณ ๋ณผ ์ ์์ต๋๋ค.
๊ทธ๋ฌ๋ฏ๋ก ๊ทธ๋ฃน๋ด์ ์ด๋ agent์ knowledge๋ก ๋ถํฐ ์์ํ๋์ง, agent๋ ๋ชจ๋ agent๋ ์๋ก๋ฅผ ๋ณผ ์ ์์ต๋๋ค.
Common Knowledge๋ ๊ทธ๋ฃน ๋ด์ ๋ชจ๋ agent์ ๋ํด ์ค์ง ๋ณผ ์ ์๋ mutual knowledge์์๋ง ๊ณ์ฐ๋์ด ์ป์ด์ง ์ ์์ต๋๋ค. policy์ ์ํด ์ ํ๋ action์ ๊ทธ ์์ฒด๋ก Common knowledge๋ก ๋ณผ ์ ์๋๋ฐ, ์ด๋ ์ค์ง common knowledge์ ๊ทธ๋ฅผ ๋๋ค์ผ๋ก ์ ํํ ๋์ seed์ ๋ํ rule common knowledge์๋ง ์์กดํฉ๋๋ค.
๋ง์ฝ ๋ชจ๋ mask ๊ฐ ๋ชจ๋ agent์๊ฒ ์๋ ค์ ธ์๋ค๋ฉด, common knowledge ๋ ๋ค์๊ณผ ๊ฐ์ด ์ ์ํ ์ ์์ต๋๋ค.
์ด๋ฅผ ํด์ํด๋ณด๋ฉด, ๊ฐ agent๊ฐ ๋ค๋ฅธ ๋ชจ๋ agent๋ฅผ ๊ด์ฐฐํ์ ๋์ ๊ณตํต์ ์ผ๋ก ์๋ mutual knowledge์ ๋ํด common knowledge ๋ก ํํํ ์ ์๋ค๋ ๋ป์ ๋๋ค.
์ด๋ฅผ ์ ์ํ๊ธฐ ์ํด (4.4.2)๋ฅผ ๋ณด๊ฒ ์ต๋๋ค. ์ด๋ ์ฌ๊ท์ ๋ถํฐ ์์ํ๋ค๋ฉด, ์๋์ ๊ฐ์์ ์ ์ ์์ต๋๋ค.
์ด ๋, ๊ทธ๋ฃน๋ด์ mutual knowledge๋ ๊ท๋ฉ์ ์ผ๋ก ๋ช๋ฒ์ iteration ํ์ ์ด ๋จ์ ๋ณผ๊ฑด๋ฐ, ์ด์ ์ mutual knowledge๊ฐ common knowledge๊ฐ ๋๋ ๊ฒ์ 2๋ฒ์์ ๋ณด์์ต๋๋ค. ์ด๋ ๋ค์์ ํตํด ์์ํ ๊ฐ๋ฅํฉ๋๋ค.
๊ทธ๋ฃน ๋ด์์ ์๊ฐ์ ๋ฐ๋ฅธ common knowledge๋ ์ด์ ์ trajectories ๋ถํฐ ์ต๊ทผ ๊ด์ธกํ trajectory ์ ๊ฐ ์์ต๋๋ค. ๋ชจ๋ masks ๋ฅผ ์๋ ๊ฒ์ ๋ฅผ ๋ฅผ ํตํด ๋์ถํ ์ ์๋ ๊ฒ์ ์๋ฏธํฉ๋๋ค. ๊ทธ๋ ๊ธฐ ๋๋ฌธ์์ ์ํด ์กฐ๊ฑดํ๋๋ ๋ชจ๋ ํจ์๋ ๊ทธ๋ฃน๋ด์ agent์ ์ํด ๋ ๋ฆฝ์ ์ผ๋ก ๊ณ์ฐ๋ ์ ์์ต๋๋ค.