3.6 Conclusions & Future Work

이 chapter에서는 COMA를 자세히 살펴보았습니다. 이는 centralized critic을 사용하고, counterfactual advantage를 통해 agent들을 update합니다. 이를 통해 Multi-agent Credit Assignment Problem를 해결하려 노력했고, 이를 Starcraft unit micromanagement benchmark에서의 비교를 통해 성능을 확인하였습니다.

future work로, 더 많은 agent에 대해 실험해보아야하고, sample-efficience에 대해서도 고민해보야합니다.