의미없으면서 0이 아닌 파라미터 수를 줄여줘서 Model Complexity 줄여줌 L1 Norm but can’t derivative so can not be used in gradient descentL0 Norm l0, l1 정규화는 모델의 손실 함수에 일부 파라미터가 0이 되도록 유도Model Sparsity NotionDropoutStructured sparsity regularizationModel ComplexityAggregated Sparsity SPDF method https://arxiv.org/pdf/2303.10464.pdf