update multiclass tests

jameslamb · jameslamb · commit 903c0ad6324b · 2022-01-12T21:16:09.000-06:00
diff --git a/tests/python_package_test/test_dask.py b/tests/python_package_test/test_dask.py
@@ -493,15 +493,21 @@ def test_classifier_custom_objective(output, task, cluster):
     with Client(cluster) as client:
         X, y, w, _, dX, dy, dw, _ = _create_data(
             objective=task,
-            output=output
+            output=output,
         )
 
+        # + + + + + + + + + +
+        # + + + + + + + + + +
+        # + + + + + + + + + +
+        # + + + + + + + + + +
+        # + _ _ _ _ _ _ _ _ _
         params = {
             "n_estimators": 50,
             "num_leaves": 31,
-            "min_data": 1,
             "verbose": -1,
-            "learning_rate": 0.01,
+            "seed": 708,
+            "deterministic": True,
+            "force_col_wise": True
         }
 
         if task == 'binary-classification':
@@ -522,25 +528,26 @@ def test_classifier_custom_objective(output, task, cluster):
         )
         dask_classifier = dask_classifier.fit(dX, dy, sample_weight=dw)
         dask_classifier_local = dask_classifier.to_local()
-        p1_proba = dask_classifier.predict_proba(dX).compute()
-        p1_proba_local = dask_classifier_local.predict_proba(X)
+        p1_raw = dask_classifier.predict(dX, raw_score=True).compute()
+        p1_raw_local = dask_classifier_local.predict(X, raw_score=True)
 
         # with a custom objective, prediction result is a raw score instead of predicted class
-        p1_class = (1.0 / (1.0 + np.exp(-p1_proba))) > 0.5
-        p1_class = p1_class.astype(np.int64)
-        p1_class_local = (1.0 / (1.0 + np.exp(-p1_proba_local))) > 0.5
-        p1_class_local = p1_class_local.astype(np.int64)
+        p1_proba = 1.0 / (1.0 + np.exp(-p1_raw))
+        p1_proba_local = 1.0 / (1.0 + np.exp(-p1_raw_local))
 
         local_classifier = lgb.LGBMClassifier(**params)
         local_classifier.fit(X, y, sample_weight=w)
-        p2_proba = local_classifier.predict_proba(X)
-        p2_class = (1.0 / (1.0 + np.exp(-p1_proba))) > 0.5
-        p2_class = p2_class.astype(np.int64)
+        p2_raw = local_classifier.predict(X, raw_score=True)
+        p2_proba = 1.0 / (1.0 + np.exp(-p2_raw))
 
-        if task == 'multiclass-classification':
-            p1_class = p1_class.argmax(axis=1)
-            p1_class_local = p1_class_local.argmax(axis=1)
-            p2_class = p2_class.argmax(axis=1)
+        if task == 'binary-classification':
+            p1_class = (p1_proba > 0.5).astype(np.int64)
+            p1_class_local = (p1_proba_local > 0.5).astype(np.int64)
+            p2_class = (p2_proba > 0.5).astype(np.int64)
+        elif task == 'multiclass-classification':
+            p1_class = p1_proba.argmax(axis=1)
+            p1_class_local = p1_proba_local.argmax(axis=1)
+            p2_class = p2_proba.argmax(axis=1)
 
         # function should have been preserved
         assert callable(dask_classifier.objective_)
@@ -552,7 +559,13 @@ def test_classifier_custom_objective(output, task, cluster):
         assert_eq(p2_class, y)
 
         # probability estimates should be similar
-        assert_eq(p1_proba, p2_proba, atol=0.03)
+        assert_eq(p1_proba, p2_proba, atol=0.04)
+        # try:
+        #     assert_eq(p1_proba, p2_proba, atol=0.04)
+        # except Exception as err:
+        #     max_diff = np.max(np.abs(p1_proba - p2_proba))
+        #     num_samples = np.sum(np.abs(p1_proba - p2_proba) > 0.04)
+        #     raise RuntimeError(f"max diff: {max_diff} | n: {num_samples}")
 
 
 def test_group_workers_by_host():