feat: resilient background job retry & monitoring by TallowX92 · Pull Request #401 · rohitdash08/FinMind

TallowX92 · 2026-03-14T16:07:34Z

/claim #130

Demo

demo2026-03-14.19-10-07.mp4

Scheduler started, job firing every 60 seconds, executing successfully with next run scheduled.

Summary

Production-grade background job infrastructure for async reminder dispatch with exponential-backoff retry and a live monitoring API.

What's included

Scheduler — `app/services/scheduler.py`

APScheduler BackgroundScheduler with MemoryJobStore
Runs process_due_reminders() every 60 seconds
Exponential backoff: 5 min → 15 min → 45 min between retries
Permanently marks reminders failed=True after 3 retries, captures last_error
Auto-disabled in test environment (FLASK_ENV=testing)

New fields on `Reminder` model

Field	Type	Purpose
`retry_count`	Integer	Attempts so far
`last_error`	String	Last exception message
`next_retry_at`	DateTime	When to next attempt
`failed`	Boolean	Permanently failed flag

Monitoring endpoints — `GET/POST /jobs`

Method	Endpoint	Description
GET	`/jobs/status`	Scheduler running state + job list
GET	`/jobs/reminders/stats`	Counts: sent / pending / overdue / retrying / permanently_failed
POST	`/jobs/reminders/run`	Manual trigger (admin)

Tests — `tests/test_jobs.py` (17 tests)

Backoff delta (4): 5 min at retry 0, 15 min at retry 1, 45 min at retry 2, capped at max
ProcessDueReminders (8): dispatches due, skips future-dated, increments retry, sets next_retry_at, marks permanently failed, respects retry window, skips sent, skips failed
Endpoints (5): status 200, stats shape, manual trigger, auth required

Note: 5 tests require Redis (auth_header fixture stores refresh token) — same constraint across the whole test suite. Core scheduler logic: 12/17 pass without Redis.

Implements production-grade background job infrastructure for async reminder dispatch with exponential-backoff retry and a monitoring API. Scheduler: - APScheduler (BackgroundScheduler) initialized in create_app(), skipped in TESTING mode to avoid side effects in tests - process_due_reminders() runs every 60 seconds via interval trigger - Graceful shutdown registered via atexit Retry logic: - Failed deliveries are retried up to MAX_RETRIES (3) attempts - Exponential backoff: 5min -> 15min -> 45min between attempts - Reminders exceeding MAX_RETRIES are marked failed=True (no further attempts) - retry_count, last_error, next_retry_at, failed columns added to Reminder model - Schema compat ALTERs added for existing PostgreSQL deployments Monitoring endpoints (JWT-protected): - GET /jobs/status — scheduler health + registered job list - GET /jobs/reminders/stats — sent/pending/retrying/failed counts - POST /jobs/reminders/run — manual trigger for ops/debugging Tests (17 tests, 12 pass without Redis, 5 require Redis for auth): - Backoff delta unit tests - process_due_reminders: success, retry, backoff window, max retries, skip guards - Endpoint auth, stats, manual trigger

TallowX92 requested a review from rohitdash08 as a code owner March 14, 2026 16:07

algora-pbc bot added the 🙋 Bounty claim label Mar 14, 2026

algora-pbc bot mentioned this pull request Mar 14, 2026

Resilient background job retry & monitoring #130

Open

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

feat: resilient background job retry & monitoring#401

feat: resilient background job retry & monitoring#401
TallowX92 wants to merge 1 commit intorohitdash08:mainfrom
TallowX92:feat/background-job-retry-monitoring

TallowX92 commented Mar 14, 2026 •

edited

Loading

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

2 participants

Conversation

TallowX92 commented Mar 14, 2026 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

Demo

Summary

What's included

Scheduler — app/services/scheduler.py

New fields on Reminder model

Monitoring endpoints — GET/POST /jobs

Tests — tests/test_jobs.py (17 tests)

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

2 participants

TallowX92 commented Mar 14, 2026 •

edited

Loading

Scheduler — `app/services/scheduler.py`

New fields on `Reminder` model

Monitoring endpoints — `GET/POST /jobs`

Tests — `tests/test_jobs.py` (17 tests)