wsd config

jakep-allenai · jakep-allenai · commit da5f8f2f7815 · 2025-07-10T01:13:54.000Z
diff --git a/olmocr/train/configs/qwen25_vl_b100_x1_day3_json_wsd.yaml b/olmocr/train/configs/qwen25_vl_b100_x1_day3_json_wsd.yaml
@@ -2,7 +2,7 @@
 
 # Project metadata
 project_name: olmocr-qwen-vl-training
-run_name: qwen2.5-vl-7b-finetune-day3-json
+run_name: qwen2.5-vl-7b-finetune-day3-json-wsd
 
 # Model configuration
 model:
@@ -74,7 +74,8 @@ training:
   learning_rate: 2e-5
   lr_scheduler_type: warmup_stable_decay
   lr_scheduler_kwargs:
-    num_stable_steps: 4000
+    num_warmup_steps: 1000
+    num_decay_steps: 2000
   warmup_ratio: 0.1
   
   # Optimization