8.3.4 LOLA with Opponent modeling
만약 oppenent의 parameter를 볼 수 없다면, agent의 observation을 통해 다른 agent의 parameter 를 추정하게 됩니다. maximum likelihood method를 사용하는데 이 식은 다음과 같습니다.
이 값이 의 자리를 대신하면 됩니다.
Last updated
Was this helpful?
만약 oppenent의 parameter를 볼 수 없다면, agent의 observation을 통해 다른 agent의 parameter 를 추정하게 됩니다. maximum likelihood method를 사용하는데 이 식은 다음과 같습니다.
이 값이 의 자리를 대신하면 됩니다.
Last updated
Was this helpful?