4.4 Common Knowledge
binary mask ์ ๋ํ ์ค์ํ ํน์ฑ์ agent๊ฐ entity ๋ฅผ ๋ณผ ์ ์๋๋์๋ง ๋ฌ๋ ค ์๋ค๋ ์ ์ ๋๋ค. ๊ทธ๋ ๊ธฐ ๋๋ฌธ์ ๋ง์ฝ agent ์ ๋ชจ๋ mask ๊ฐ common knowledge๋ผ๋ฉด, ๋ค๋ฅธ agent ๊ฐ ๋ฅผ ๋ณผ ์ ์๋ค๋ฉด ์ ๊ทธ๊ฐ ๋ณผ ์ ์๋ entities ์ ๋ํด ์์ ์ ์ ์์ต๋๋ค.
ํ ๊ทธ๋ฃน์ด ์๊ณ ์๋ Mutual knowledge ๋ผ๊ณ ์ ์ํ ๋ ์ด๋ ๋ค์๊ณผ ๊ฐ์ด ํํํ ์ ์์ต๋๋ค.
๊ทธ๋ฌ๋ ์ด๋ฌํ mutual knowledge๋ common knowledge๋ฅผ ๋ปํ์ง ์์ต๋๋ค. ๊ทธ์ ๋ค๊ฐ์ด ์๊ณ ์๋ entities์ด๊ธฐ ๋๋ฌธ์ ๋๋ค. ๋์ ํ group์ common knowledge๋ ๋ก ํํํ๋๋ฐ, ์ด๋ ์ ์๋๋ก group ๊ฐ ๋ฅผ ์๊ณ , ๋ชจ๋๊ฐ ๋ฅผ ์๋ค๋ ์ฌ์ค์ ์๋ ์ ๋ณด์ ๋๋ค.
agent ๊ฐ ๋ค๋ฅธ agent ๋ ๋ฅผ ๋ณด๊ณ ์๋์ง ์๊ธฐ ์ํด์ , agent ๋ ๋ฅผ ๋ด์ผํ๊ณ ๊ฐ ๋ฅผ ๋ณด๊ณ ์๋์ง ์์์ผํ๋๋ฐ ์ด๋ ๋ค์๊ณผ ๊ฐ์ด ํ๊ธฐํ ์ ์์ต๋๋ค.
๋ ๋ค์๊ณผ ๊ฐ์ด ์ฌ๊ท์ ์ธ ํํ๋ก ํํ๋ ๊ฐ๋ฅํฉ๋๋ค. ๋ชจ๋ agent ๊ฐ ๊ทธ๋ฃน ์ ์ํ๋ค๋ฉด, ๋ค์๊ณผ ๊ฐ์ด ํํ ๊ฐ๋ฅํฉ๋๋ค.
์ด๋ iteration m=0์ผ ๋, agent ์ ๋ํ mutual knowledge ๋ ์ ๊ฐ์ต๋๋ค. ์ค์ค๋ก ๊ฐ์ง๊ณ ์๋ mutual knowledge๋ ์ค์ค๋ก์ common knowledge๊ฐ ๋ฉ๋๋ค.
m = 1๋ก iteration์ ์งํํด๋ณด๊ฒ ์ต๋๋ค.
์ด๋ฅผ ํด์ํ๋ฉด, a๊ฐ observeํ ๋, a๊ฐ ๋ณด๋ b์ ๊ดํ entities์ ๋ํด mutual knowledge์ ํฌํจ๋๊ณ , ์ด๊ฒ์ ๋ํ ๊ทธ๋ฃน ์ ์ฒด์ ๊ต์งํฉ์ ํ๊ฒ ๋๋ฉด, ๋ ๊ทธ๋ฃน ๋ด ์ ์ฒด๊ฐ ์๋ entities๋ผ๋ ๊ฒ์ ์ ์ ์์ต๋๋ค.
m = 2๋ก iteration์ ๋ ์งํํด ๋ณด๊ฒ ์ต๋๋ค.
๊ฒฐ๊ตญ, agent๊ฐ a๊ฐ ๋ดค์ ๋, ๋ชจ๋ agent๊ฐ ๋ฅผ ์๊ณ ์๋ค๋ ์ฌ์ค์ ์๋๋ฐฉ์ด ์๊ณ ์๋ค๋๊ฑธ ์๊ณ ์๋ ์ํ๋ฅผ ์๋ฏธํฉ๋๋ค. ์ด๋ฅผ ๋ฌดํ๋๋ก ๋ณด๋ด๋ ํ์๋ ์์ ํ์๋ฅผ ๋ฐ๋ณตํ๋ ๊ฒ์ mutual knowledge๊ฐ common knowledge๊ฐ ๋๋ค๋ ๊ฒ์ ์ ์ ์์ต๋๋ค.
Lemma 4.4.1
๋ง์ฝ ๋ชจ๋ mask ๊ฐ ๋ชจ๋ agent์๊ฒ ์๋ ค์ ธ์๋ค๋ฉด, common knowledge ๋ ๋ค์๊ณผ ๊ฐ์ด ์ ์ํ ์ ์์ต๋๋ค.
์ด๋ฅผ ํด์ํด๋ณด๋ฉด, ๊ฐ agent๊ฐ ๋ค๋ฅธ ๋ชจ๋ agent๋ฅผ ๊ด์ฐฐํ์ ๋์ ๊ณตํต์ ์ผ๋ก ์๋ mutual knowledge์ ๋ํด common knowledge ๋ก ํํํ ์ ์๋ค๋ ๋ป์ ๋๋ค.
์์ ์ฌ๊ท์ ์ธ ํํ์์๋ ๊ณต์งํฉ์๋ํด roughํ๊ฒ ๋ณด์ฌ์คฌ์ง๋ง ์ฌ๊ธฐ์๋ ์ข ๋ ์๊ฒฉํ๊ฒ ๋ํ๋ด์๋ค๊ณ ๋ณผ ์ ์์ต๋๋ค.
์ด๋ฅผ ์ ์ํ๊ธฐ ์ํด (4.4.2)๋ฅผ ๋ณด๊ฒ ์ต๋๋ค. ์ด๋ ์ฌ๊ท์ ๋ถํฐ ์์ํ๋ค๋ฉด, ์๋์ ๊ฐ์์ ์ ์ ์์ต๋๋ค.
์ด ๋, ๊ทธ๋ฃน๋ด์ mutual knowledge๋ ๊ท๋ฉ์ ์ผ๋ก ๋ช๋ฒ์ iteration ํ์ ์ด ๋จ์ ๋ณผ๊ฑด๋ฐ, ์ด์ ์ mutual knowledge๊ฐ common knowledge๊ฐ ๋๋ ๊ฒ์ 2๋ฒ์์ ๋ณด์์ต๋๋ค. ์ด๋ ๋ค์์ ํตํด ์์ํ ๊ฐ๋ฅํฉ๋๋ค.
๊ทธ๋ฌ๋ฏ๋ก ๊ทธ๋ฃน๋ด์ ์ด๋ agent์ knowledge๋ก ๋ถํฐ ์์ํ๋์ง, agent๋ ๋ชจ๋ agent๋ ์๋ก๋ฅผ ๋ณผ ์ ์์ต๋๋ค.
Common Knowledge๋ ๊ทธ๋ฃน ๋ด์ ๋ชจ๋ agent์ ๋ํด ์ค์ง ๋ณผ ์ ์๋ mutual knowledge์์๋ง ๊ณ์ฐ๋์ด ์ป์ด์ง ์ ์์ต๋๋ค. policy์ ์ํด ์ ํ๋ action์ ๊ทธ ์์ฒด๋ก Common knowledge๋ก ๋ณผ ์ ์๋๋ฐ, ์ด๋ ์ค์ง common knowledge์ ๊ทธ๋ฅผ ๋๋ค์ผ๋ก ์ ํํ ๋์ seed์ ๋ํ rule common knowledge์๋ง ์์กดํฉ๋๋ค.
๊ทธ๋ฃน ๋ด์์ ์๊ฐ์ ๋ฐ๋ฅธ common knowledge๋ ์ด์ ์ trajectories ๋ถํฐ ์ต๊ทผ ๊ด์ธกํ trajectory ์ ๊ฐ ์์ต๋๋ค. ๋ชจ๋ masks ๋ฅผ ์๋ ๊ฒ์ ๋ฅผ ๋ฅผ ํตํด ๋์ถํ ์ ์๋ ๊ฒ์ ์๋ฏธํฉ๋๋ค. ๊ทธ๋ ๊ธฐ ๋๋ฌธ์์ ์ํด ์กฐ๊ฑดํ๋๋ ๋ชจ๋ ํจ์๋ ๊ทธ๋ฃน๋ด์ agent์ ์ํด ๋ ๋ฆฝ์ ์ผ๋ก ๊ณ์ฐ๋ ์ ์์ต๋๋ค.
Last updated
Was this helpful?