Skip to content

loss function in mario_curio.py #25

Description

@osm040836

안녕하세요, mario_curio.py 파일에서 의문점이 들어 issue 남깁니다.
Line 277번째 줄에서 다음과 같이 entropy loss 항이 추가되어 계산되어야 하지 않나요?

기존) loss = (actor_loss + 0.5 * critic_loss) + icm_scale *
((1 - beta) * inverse_loss + beta * forward_loss)

변경) loss = (actor_loss + 0.5 * critic_loss - entropy_coef * entropy) + icm_scale *
((1 - beta) * inverse_loss + beta * forward_loss)'

감사합니다.

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions