quant: avoid assign empty rowwise layers (#922)

DefTruth · web-flow · commit 99aade74391d · 2026-03-27T11:10:13.000+08:00
diff --git a/src/cache_dit/quantize/torchao/quantize_ao.py b/src/cache_dit/quantize/torchao/quantize_ao.py
@@ -295,12 +295,13 @@ def _maybe_fill_fallback_layers(self):
         if self.module_ref is not None and self.is_float8_dynamic_per_row():
             if not ENV.CACHE_DIT_DISABLE_EXCLUDE_FOR_QUANTIZE_AFTER_TP:
                 rowwise_layers = getattr(self.module_ref, "_rowwise_layers", [])
-                if self.float8_per_tensor_fallback and rowwise_layers:
-                    fallback_layers = fallback_layers + rowwise_layers
-                    logger.info(f"Set float8 per tensor fallback layers: {rowwise_layers}.")
-                else:
-                    exclude_layers = exclude_layers + rowwise_layers
-                    logger.info(f"Add rowwise layers to exclude layers: {rowwise_layers}.")
+                if rowwise_layers:
+                    if self.float8_per_tensor_fallback:
+                        fallback_layers = fallback_layers + rowwise_layers
+                        logger.info(f"Add fallback layers: {rowwise_layers}.")
+                    else:
+                        exclude_layers = exclude_layers + rowwise_layers
+                        logger.info(f"Add exclude layers: {rowwise_layers}.")
         self.rowwise_layers = copy.deepcopy(rowwise_layers)
         # Case 1/2/3/...: Future cases ...
         # We may add more cases in the future where we need to automatically fill the