for fast Pre Training, 더 많은 토큰 고려한 Language Model Context deepmind + anthropicScaling에 대한 실험은 검증하지 못함arxiv.orghttps://arxiv.org/pdf/2404.03626.pdf