4.4 Common Knowledge
Last updated
Last updated
binary mask 에 대한 중요한 특성은 agent가 entity 를 볼 수 있느냐에만 달려 있다는 점입니다. 그렇기 때문에 만약 agent 의 모든 mask 가 common knowledge라면, 다른 agent 가 를 볼 수 있다면 와 그가 볼 수 있는 entities 에 대해 임을 알 수 있습니다.
한 그룹이 알고있는 Mutual knowledge 라고 정의할 때 이는 다음과 같이 표현할 수 있습니다.
그러나 이러한 mutual knowledge는 common knowledge를 뜻하지 않습니다. 그저 다같이 알고있는 entities이기 때문입니다. 대신 한 group의 common knowledge는 로 표현하는데, 이는 정의대로 group 가 를 알고, 모두가 를 안다는 사실을 아는 정보입니다.
agent 가 다른 agent 도 를 보고있는지 알기 위해선, agent 도 를 봐야하고 가 를 보고있는지 알아야하는데 이는 다음과 같이 표기할 수 있습니다.
는 다음과 같이 재귀적인 형태로 표현도 가능합니다. 모든 agent 가 그룹 에 속한다면, 다음과 같이 표현 가능합니다.
이는 iteration m=0일 때, agent 에 대한 mutual knowledge 는 와 같습니다. 스스로 가지고 있는 mutual knowledge는 스스로의 common knowledge가 됩니다.
m = 1로 iteration을 진행해보겠습니다.
이를 해석하면, a가 observe할 때, a가 보는 b에 관한 entities에 대해 mutual knowledge에 포함되고, 이것에 대한 그룹 전체의 교집합을 하게 되면, 는 그룹 내 전체가 아는 entities라는 것을 알 수 있습니다.
m = 2로 iteration을 더 진행해 보겠습니다.
결국, agent가 a가 봤을 때, 모든 agent가 를 알고 있다는 사실은 상대방이 알고있다는걸 알고있는 상태를 의미합니다. 이를 무한대로 보내는 행위는 위의 행위를 반복하는 것은 mutual knowledge가 common knowledge가 된다는 것을 알 수 있습니다.
위의 재귀적인 표현에서는 공집합에대해 rough하게 보여줬지만 여기서는 좀 더 엄격하게 나타내었다고 볼 수 있습니다.
그러므로 그룹내의 어느 agent의 knowledge로 부터 시작하던지, agent는 모든 agent는 서로를 볼 수 있습니다.
Common Knowledge는 그룹 내의 모든 agent에 대해 오직 볼 수 있는 mutual knowledge에서만 계산되어 얻어질 수 있습니다. policy에 의해 선택된 action은 그 자체로 Common knowledge로 볼 수 있는데, 이는 오직 common knowledge와 그를 랜덤으로 선택할때의 seed에 대한 rule common knowledge에만 의존합니다.
만약 모든 mask 가 모든 agent에게 알려져있다면, common knowledge 는 다음과 같이 정의할 수 있습니다.
이를 해석해보면, 각 agent가 다른 모든 agent를 관찰했을 때에 공통적으로 아는 mutual knowledge에 대해 common knowledge 로 표현할 수 있다는 뜻입니다.
이를 정의하기 위해 (4.4.2)를 보겠습니다. 이는 재귀의 부터 시작한다면, 아래와 같음을 알 수 있습니다.
이 때, 그룹내의 mutual knowledge는 귀납적으로 몇번의 iteration 후에 이 됨을 볼건데, 이전에 mutual knowledge가 common knowledge가 되는 것은 2번임을 보았습니다. 이는 다음을 통해 수식화 가능합니다.
그룹 내에서 시간에 따른 common knowledge는 이전의 trajectories 부터 최근 관측한 trajectory 와 가 있습니다. 모든 masks 를 아는 것은 를 를 통해 도출할 수 있는 것을 의미합니다. 그렇기 때문에에 의해 조건화되는 모든 함수는 그룹내의 agent에 의해 독립적으로 계산될 수 있습니다.