pytorch · BanzaiTokyo · Apr 24, 2025 · Apr 24, 2025 · Apr 24, 2025 · Apr 24, 2025
diff --git a/tests/ignite/metrics/regression/test_median_absolute_percentage_error.py b/tests/ignite/metrics/regression/test_median_absolute_percentage_error.py
@@ -34,38 +34,42 @@ def test_wrong_input_shapes():
         m.update((torch.rand(4), torch.rand(4, 1, 2)))
 
 
-def test_median_absolute_percentage_error():
+def test_median_absolute_percentage_error(available_device):
     # See https://github.com/torch/torch7/pull/182
     # For even number of elements, PyTorch returns middle element
     # NumPy returns average of middle elements
     # Size of dataset will be odd for these tests
 
     size = 51
-    np_y_pred = np.random.rand(size)
-    np_y = np.random.rand(size)
-    np_median_absolute_percentage_error = 100.0 * np.median(np.abs(np_y - np_y_pred) / np.abs(np_y))
+    y_pred = torch.rand(size)
+    y = torch.rand(size)
 
-    m = MedianAbsolutePercentageError()
-    y_pred = torch.from_numpy(np_y_pred)
-    y = torch.from_numpy(np_y)
+    epsilon = 1e-8
+    expected = torch.median(torch.abs((y - y_pred) / (y + epsilon)).cpu()).item() * 100.0
+
+    m = MedianAbsolutePercentageError(device=available_device)
+    assert m._device == torch.device(available_device)
 
     m.reset()
     m.update((y_pred, y))
 
-    assert np_median_absolute_percentage_error == pytest.approx(m.compute())
+    assert expected == pytest.approx(m.compute())
 
 
-def test_median_absolute_percentage_error_2():
-    np.random.seed(1)
+def test_median_absolute_percentage_error_2(available_device):
     size = 105
-    np_y_pred = np.random.rand(size, 1)
-    np_y = np.random.rand(size, 1)
-    np.random.shuffle(np_y)
-    np_median_absolute_percentage_error = 100.0 * np.median(np.abs(np_y - np_y_pred) / np.abs(np_y))
+    y_pred = torch.rand(size, 1)
+    y = torch.rand(size, 1)
 
-    m = MedianAbsolutePercentageError()
-    y_pred = torch.from_numpy(np_y_pred)
-    y = torch.from_numpy(np_y)
+    indices = torch.randperm(size)
+    y = y[indices]
+
+    epsilon = 1e-8
+    safe_y = torch.where(y == 0, torch.full_like(y, epsilon), y)
+    expected = torch.median(torch.abs((y - y_pred) / safe_y).cpu()).item() * 100.0
+
+    m = MedianAbsolutePercentageError(device=available_device)
+    assert m._device == torch.device(available_device)
 
     m.reset()
     batch_size = 16
@@ -74,34 +78,37 @@ def test_median_absolute_percentage_error_2():
         idx = i * batch_size
         m.update((y_pred[idx : idx + batch_size], y[idx : idx + batch_size]))
 
-    assert np_median_absolute_percentage_error == pytest.approx(m.compute())
+    assert expected == pytest.approx(m.compute())
 
 
-def test_integration_median_absolute_percentage_error():
-    np.random.seed(1)
+def test_integration_median_absolute_percentage_error(available_device):
     size = 105
-    np_y_pred = np.random.rand(size, 1)
-    np_y = np.random.rand(size, 1)
-    np.random.shuffle(np_y)
-    np_median_absolute_percentage_error = 100.0 * np.median(np.abs(np_y - np_y_pred) / np.abs(np_y))
+    y_pred = torch.rand(size, 1)
+    y = torch.rand(size, 1)
+
+    indices = torch.randperm(size)
+    y = y[indices]
+
+    epsilon = 1e-8
+    safe_y = torch.where(y == 0, torch.full_like(y, epsilon), y)
+    expected = torch.median(torch.abs((y - y_pred) / safe_y).cpu()).item() * 100.0
 
     batch_size = 15
 
     def update_fn(engine, batch):
         idx = (engine.state.iteration - 1) * batch_size
-        y_true_batch = np_y[idx : idx + batch_size]
-        y_pred_batch = np_y_pred[idx : idx + batch_size]
-        return torch.from_numpy(y_pred_batch), torch.from_numpy(y_true_batch)
+        return y_pred[idx : idx + batch_size], y[idx : idx + batch_size]
 
     engine = Engine(update_fn)
 
-    m = MedianAbsolutePercentageError()
+    m = MedianAbsolutePercentageError(device=available_device)
+    assert m._device == torch.device(available_device)
     m.attach(engine, "median_absolute_percentage_error")
 
     data = list(range(size // batch_size))
     median_absolute_percentage_error = engine.run(data, max_epochs=1).metrics["median_absolute_percentage_error"]
 
-    assert np_median_absolute_percentage_error == pytest.approx(median_absolute_percentage_error)
+    assert expected == pytest.approx(median_absolute_percentage_error)
 
 
 def _test_distrib_compute(device):

diff --git a/tests/ignite/metrics/regression/test_median_relative_absolute_error.py b/tests/ignite/metrics/regression/test_median_relative_absolute_error.py
@@ -34,38 +34,39 @@ def test_wrong_input_shapes():
         m.update((torch.rand(4), torch.rand(4, 1, 2)))
 
 
-def test_median_relative_absolute_error():
+def test_median_relative_absolute_error(available_device):
     # See https://github.com/torch/torch7/pull/182
     # For even number of elements, PyTorch returns middle element
     # NumPy returns average of middle elements
     # Size of dataset will be odd for these tests
 
     size = 51
-    np_y_pred = np.random.rand(size)
-    np_y = np.random.rand(size)
-    np_median_absolute_relative_error = np.median(np.abs(np_y - np_y_pred) / np.abs(np_y - np_y.mean()))
+    y_pred = torch.rand(size)
+    y = torch.rand(size)
 
-    m = MedianRelativeAbsoluteError()
-    y_pred = torch.from_numpy(np_y_pred)
-    y = torch.from_numpy(np_y)
+    baseline = torch.abs(y - y.mean())
+    expected = torch.median((torch.abs(y - y_pred) / baseline).cpu()).item()
+
+    m = MedianRelativeAbsoluteError(device=available_device)
+    assert m._device == torch.device(available_device)
 
     m.reset()
     m.update((y_pred, y))
 
-    assert np_median_absolute_relative_error == pytest.approx(m.compute())
+    assert expected == pytest.approx(m.compute())
 
 
-def test_median_relative_absolute_error_2():
-    np.random.seed(1)
+def test_median_relative_absolute_error_2(available_device):
     size = 105
-    np_y_pred = np.random.rand(size, 1)
-    np_y = np.random.rand(size, 1)
-    np.random.shuffle(np_y)
-    np_median_absolute_relative_error = np.median(np.abs(np_y - np_y_pred) / np.abs(np_y - np_y.mean()))
+    y_pred = torch.rand(size, 1)
+    y = torch.rand(size, 1)
+    y = y[torch.randperm(size)]
 
-    m = MedianRelativeAbsoluteError()
-    y_pred = torch.from_numpy(np_y_pred)
-    y = torch.from_numpy(np_y)
+    baseline = torch.abs(y - y.mean())
+    expected = torch.median((torch.abs(y - y_pred) / baseline).cpu()).item()
+
+    m = MedianRelativeAbsoluteError(device=available_device)
+    assert m._device == torch.device(available_device)
 
     m.reset()
     batch_size = 16
@@ -74,34 +75,36 @@ def test_median_relative_absolute_error_2():
         idx = i * batch_size
         m.update((y_pred[idx : idx + batch_size], y[idx : idx + batch_size]))
 
-    assert np_median_absolute_relative_error == pytest.approx(m.compute())
+    assert expected == pytest.approx(m.compute())
 
 
-def test_integration_median_relative_absolute_error_with_output_transform():
-    np.random.seed(1)
+def test_integration_median_relative_absolute_error_with_output_transform(available_device):
     size = 105
-    np_y_pred = np.random.rand(size, 1)
-    np_y = np.random.rand(size, 1)
-    np.random.shuffle(np_y)
-    np_median_absolute_relative_error = np.median(np.abs(np_y - np_y_pred) / np.abs(np_y - np_y.mean()))
+    y_pred = torch.rand(size, 1)
+    y = torch.rand(size, 1)
+    y = y[torch.randperm(size)]  # shuffle y
+
+    baseline = torch.abs(y - y.mean())
+    expected = torch.median((torch.abs(y - y_pred) / baseline.cpu()).cpu()).item()
 
     batch_size = 15
 
     def update_fn(engine, batch):
         idx = (engine.state.iteration - 1) * batch_size
-        y_true_batch = np_y[idx : idx + batch_size]
-        y_pred_batch = np_y_pred[idx : idx + batch_size]
-        return torch.from_numpy(y_pred_batch), torch.from_numpy(y_true_batch)
+        y_true_batch = y[idx : idx + batch_size]
+        y_pred_batch = y_pred[idx : idx + batch_size]
+        return y_pred_batch, y_true_batch
 
     engine = Engine(update_fn)
 
-    m = MedianRelativeAbsoluteError()
+    m = MedianRelativeAbsoluteError(device=available_device)
+    assert m._device == torch.device(available_device)
     m.attach(engine, "median_absolute_relative_error")
 
     data = list(range(size // batch_size))
     median_absolute_relative_error = engine.run(data, max_epochs=1).metrics["median_absolute_relative_error"]
 
-    assert np_median_absolute_relative_error == pytest.approx(median_absolute_relative_error)
+    assert expected == pytest.approx(median_absolute_relative_error)
 
 
 def _test_distrib_compute(device):

diff --git a/tests/ignite/metrics/regression/test_pearson_correlation.py b/tests/ignite/metrics/regression/test_pearson_correlation.py
@@ -43,54 +43,57 @@ def test_wrong_input_shapes():
         m.update((torch.rand(4, 1), torch.rand(4)))
 
 
-def test_degenerated_sample():
+def test_degenerated_sample(available_device):
     # one sample
-    m = PearsonCorrelation()
+    m = PearsonCorrelation(device=available_device)
+    assert m._device == torch.device(available_device)
     y_pred = torch.tensor([1.0])
     y = torch.tensor([1.0])
     m.update((y_pred, y))
 
-    np_y_pred = y_pred.numpy()
-    np_y = y_pred.numpy()
-    np_res = np_corr_eps(np_y_pred, np_y)
-    assert pytest.approx(np_res) == m.compute()
+    np_y_pred = y_pred.cpu().numpy()
+    np_y = y_pred.cpu().numpy()
+    expected = np_corr_eps(np_y_pred, np_y)
+    actual = m.compute()
+
+    assert pytest.approx(expected) == actual
 
     # constant samples
     m.reset()
     y_pred = torch.ones(10).float()
     y = torch.zeros(10).float()
     m.update((y_pred, y))
 
-    np_y_pred = y_pred.numpy()
-    np_y = y_pred.numpy()
-    np_res = np_corr_eps(np_y_pred, np_y)
-    assert pytest.approx(np_res) == m.compute()
+    np_y_pred = y_pred.cpu().numpy()
+    np_y = y_pred.cpu().numpy()
+    expected = np_corr_eps(np_y_pred, np_y)
+    actual = m.compute()
 
+    assert pytest.approx(expected) == actual
 
-def test_pearson_correlation():
-    a = np.random.randn(4).astype(np.float32)
-    b = np.random.randn(4).astype(np.float32)
-    c = np.random.randn(4).astype(np.float32)
-    d = np.random.randn(4).astype(np.float32)
-    ground_truth = np.random.randn(4).astype(np.float32)
 
-    m = PearsonCorrelation()
+def test_pearson_correlation(available_device):
+    torch.manual_seed(1)
 
-    m.update((torch.from_numpy(a), torch.from_numpy(ground_truth)))
-    np_ans = scipy_corr(a, ground_truth)
-    assert m.compute() == pytest.approx(np_ans, rel=1e-4)
+    inputs = [torch.randn(4) for _ in range(4)]
+    ground_truth = torch.randn(4)
 
-    m.update((torch.from_numpy(b), torch.from_numpy(ground_truth)))
-    np_ans = scipy_corr(np.concatenate([a, b]), np.concatenate([ground_truth] * 2))
-    assert m.compute() == pytest.approx(np_ans, rel=1e-4)
+    m = PearsonCorrelation(device=available_device)
+    assert m._device == torch.device(available_device)
 
-    m.update((torch.from_numpy(c), torch.from_numpy(ground_truth)))
-    np_ans = scipy_corr(np.concatenate([a, b, c]), np.concatenate([ground_truth] * 3))
-    assert m.compute() == pytest.approx(np_ans, rel=1e-4)
+    all_preds = []
+    all_targets = []
 
-    m.update((torch.from_numpy(d), torch.from_numpy(ground_truth)))
-    np_ans = scipy_corr(np.concatenate([a, b, c, d]), np.concatenate([ground_truth] * 4))
-    assert m.compute() == pytest.approx(np_ans, rel=1e-4)
+    for i, pred in enumerate(inputs, 1):
+        m.update((pred, ground_truth))
+        all_preds.append(pred)
+        all_targets.append(ground_truth)
+
+        pred_concat = torch.cat(all_preds).cpu().numpy()
+        target_concat = torch.cat(all_targets).cpu().numpy()
+        expected = pearsonr(pred_concat, target_concat)[0]
+
+        assert m.compute() == pytest.approx(expected, rel=1e-4)
 
 
 @pytest.fixture(params=list(range(2)))
@@ -106,7 +109,7 @@ def test_case(request):
 
 
 @pytest.mark.parametrize("n_times", range(5))
-def test_integration(n_times, test_case: Tuple[Tensor, Tensor, int]):
+def test_integration_pearson_correlation(n_times, test_case: Tuple[Tensor, Tensor, int], available_device):
     y_pred, y, batch_size = test_case
 
     def update_fn(engine: Engine, batch):
@@ -117,7 +120,8 @@ def update_fn(engine: Engine, batch):
 
     engine = Engine(update_fn)
 
-    m = PearsonCorrelation()
+    m = PearsonCorrelation(device=available_device)
+    assert m._device == torch.device(available_device)
     m.attach(engine, "corr")
 
     np_y = y.numpy().ravel()
@@ -131,8 +135,9 @@ def update_fn(engine: Engine, batch):
     assert pytest.approx(np_ans, rel=2e-4) == corr
 
 
-def test_accumulator_detached():
-    corr = PearsonCorrelation()
+def test_accumulator_detached(available_device):
+    corr = PearsonCorrelation(device=available_device)
+    assert corr._device == torch.device(available_device)
 
     y_pred = torch.tensor([2.0, 3.0], requires_grad=True)
     y = torch.tensor([-2.0, -1.0])