现在量化的时候,是可以把lm_head的Linear层替换了
现在量化的时候,是可以把lm_head的Linear层替换了