Hierarchical Multi-Band LSTM for Ethanol Price Forecasting

Architecture Overview

graph TB
    subgraph "Cloud Infrastructure"
        AML[Azure ML<br/>Training & Deployment]
        WB[Weights & Biases<br/>Experiment Tracking]
        OPT[Optuna<br/>Hyperparameter Optimization]
    end
    
    subgraph "Data Sources"
        D1[Corn Futures<br/>ZC Daily]
        D2[Ethanol D2<br/>Daily Historical]
        D3[WTI Oil<br/>Daily Prices]
        D4[USD/BRL<br/>Exchange Rate]
        D5[PPI<br/>Weekly Data]
    end
    
    subgraph "Data Processing Layer"
        DP[Dataset Preprocessing<br/>Quality Assessment]
        FE[Feature Engineering<br/>Calendar Effects]
        DM[DataModule<br/>Sliding Windows]
    end
    
    subgraph "Model Architecture"
        HM[HierForecastNet<br/>Multi-Band LSTM]
        BM[Baseline Models<br/>ARIMA, LightGBM]
        SM[Stacked Variants<br/>Deep + ARIMA + LGB]
    end
    
    subgraph "Evaluation Framework"
        CV[Cross Validation<br/>Rolling Origin]
        MET[Metrics<br/>RMSSE, MASE]
        ST[Statistical Testing<br/>Diebold-Mariano]
    end
    
    D1 --> DP
    D2 --> DP
    D3 --> DP
    D4 --> DP
    D5 --> DP
    
    DP --> FE
    FE --> DM
    
    DM --> HM
    DM --> BM
    HM --> SM
    BM --> SM
    
    HM --> CV
    BM --> CV
    SM --> CV
    
    CV --> MET
    MET --> ST
    
    AML -.-> HM
    WB -.-> CV
    OPT -.-> HM
    
    style AML fill:#0078d4,stroke:#333,color:#fff
    style WB fill:#ffbe0b,stroke:#333,color:#000
    style OPT fill:#00bcd4,stroke:#333,color:#fff
    style HM fill:#ff6b6b,stroke:#333,color:#fff
    style ST fill:#51cf66,stroke:#333,color:#000

Overview

This repository implements a state-of-the-art Hierarchical Attention Network (HAN) for forecasting European Ethanol T2 prices using multi-band LSTM architecture with cross-attention mechanisms. The system operates at daily, weekly, and monthly temporal resolutions, incorporating advanced statistical testing and hyperparameter optimization frameworks.

Architecture Overview

Raw Data → Preprocessing → Hierarchical Model → Evaluation → Statistical Testing
    ↓              ↓                ↓                  ↓              ↓
   D2 Daily      Feature Eng     Daily LSTM         Bulletproof     Diebold-Mariano
   Corn Prices   Calendar        Weekly LSTM        Metrics         A/B Testing
   WTI Oil       Scaling         Monthly LSTM       Cross-Val       Optuna HPO
   USD/BRL       Windowing       Attention          Reconciliation  W&B Tracking
   PPI                           Mechanisms

Repository Structure

src/
├── models/                  # Neural architectures and baselines
│   ├── model.py               # HierForecastNet (main model)
│   └── baseline_models.py     # Statistical baselines
├── data/                   # Data processing pipeline
│   ├── dataset_preprocessing.py
│   ├── timeseries_datamodule.py
│   └── calendar_engineering.py
├── evaluation/             # Comprehensive evaluation framework
│   ├── evaluation.py          # Main evaluation orchestrator
│   ├── metrics.py             # Competition-grade metrics
│   ├── ts_cross_validation.py # Time series CV
│   └── statistical_testing/   # Statistical significance testing
│       ├── stats_evaluate.py  # High-level interface
│       ├── diebold_mariano.py # DM test implementation
│       └── loss_functions.py  # Loss utilities
├── stacking/               # Model ensembling
│   └── stacked_variants.py    # Deep + ARIMA + LightGBM
├── train/                  # Training pipeline
│   ├── train.py              # Training orchestrator
│   └── loss_functions.py     # Hierarchical loss functions
├── utils/                  # General utilities
│   └── evaluation_utils.py   # Evaluation helpers
└── optimization/           # HPO and experiment tracking
    ├── optuna_optimizer.py    # Bayesian optimization
    ├── wandb_integration.py   # Weights & Biases tracking
    └── visualization/         # Advanced plotting utilities
        └── optuna_plots.py

Quick Start

1. Environment Setup

# Clone repository
git clone https://github.com/felixfaruix/ethanol-hierarchical-multi-band-LSTM.git
cd ethanol-hierarchical-multi-band-LSTM

# Install dependencies
pip install -r requirements.txt

# For Azure ML deployment
pip install azureml-sdk wandb optuna

2. Data Preparation

python -m src.data.dataset_preprocessing --config configs/data_config.yaml

3. Training

# Local training
python -m src.train.train --config configs/train_config.yaml

# Azure ML training
python deploy_azure.py --experiment-name ethanol-forecasting

4. Evaluation & Analysis

# Run comprehensive evaluation
python -m src.evaluation.evaluation --model-path models/best_model.pt

# Statistical testing
python -m src.evaluation.statistical_testing.stats_evaluate --results-path results/

Scientific Notebook

The main research workflow is documented in: notebooks/Scientific_Pipeline_Ethanol_Forecasting.ipynb

This notebook provides:

Methodology: Detailed scientific rationale for each design choice
Data Analysis: Comprehensive exploratory data analysis
Model Architecture: Visual explanations of hierarchical components
Results: Performance analysis with statistical significance testing
Hyperparameter Optimization: Optuna-based Bayesian optimization
A/B Testing: Systematic model comparison framework

Key Features

Advanced Evaluation Framework

Bulletproof Metrics: Competition-grade RMSSE/MASE with proper per-sample scaling
Temporal Cross-Validation: Rolling origin validation preventing data leakage
Statistical Testing: Diebold-Mariano tests with proper horizon handling
Hierarchical Reconciliation: MinT reconciliation for coherent forecasts

Optimization & Tracking

Bayesian HPO: Optuna-based hyperparameter optimization
Experiment Tracking: Weights & Biases integration
Azure ML Deployment: Scalable cloud training infrastructure
A/B Testing Framework: Systematic model comparison with statistical validation

Model Architecture

Hierarchical Design: Daily → Weekly → Monthly temporal aggregation
Dual Attention: Feature-level and temporal attention mechanisms
Sliding Windows: Efficient processing with 1-year lookback memory
Stacked Variants: Deep learning + ARIMA + LightGBM ensembles

Performance Benchmarks

Model	Daily RMSSE	Weekly RMSSE	Monthly RMSSE	DM Test p-value
HierForecastNet	0.847	0.723	0.692	-
Deep + ARIMA	0.865	0.741	0.708	0.032*
LSTM Baseline	0.923	0.812	0.776	<0.001***
ARIMA	1.142	0.987	0.834	<0.001***

*Statistically significant at α=0.05, ***α=0.001

Research Contributions

Hierarchical Multi-Band Architecture: Novel LSTM design operating across multiple temporal resolutions
Bulletproof Evaluation Framework: Competition-grade metrics with proper statistical validation
Cross-Scale Attention Mechanisms: Dynamic feature and temporal attention across hierarchical levels
Comprehensive Statistical Testing: Rigorous model comparison with Diebold-Mariano tests
Production-Ready Pipeline: End-to-end system with Azure ML deployment capabilities

Theoretical Foundations

Our approach builds upon seminal works in hierarchical forecasting:

Cross-Scale Transformers (Rangapuram et al., 2023): Hierarchical attention mechanisms
TimeCNN (Zhou et al., 2025): Dynamic cross-variable interaction modeling
Dual Attention Networks (2024): Multi-scale attention for time series
Statistical Testing (Diebold & Mariano, 1995): Forecast accuracy comparison
Hierarchical Reconciliation (Hyndman et al., 2011): Coherent forecasting frameworks

Citation

If you use this work in your research, please cite:

@article{ethanol_hierarchical_lstm_2025,
  title={Hierarchical Multi-Band LSTM with Cross Attention for Ethanol Price Forecasting},
  author={Your Name},
  journal={Working Paper},
  year={2025},
  url={https://github.com/felixfaruix/ethanol-hierarchical-multi-band-LSTM}
}

License

This project is licensed under the MIT License - see the LICENSE file for details.

Contributing

We welcome contributions! Please see our Contributing Guidelines for details.

Contact

Author: Felix
Email: [Your Email]
Project: Repository Link

Name		Name	Last commit message	Last commit date
Latest commit History 56 Commits
notebooks		notebooks
processed_data		processed_data
raw_data		raw_data
src		src
.env		.env
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
index.html		index.html
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Hierarchical Multi-Band LSTM for Ethanol Price Forecasting

Architecture Overview

Overview

Architecture Overview

Repository Structure

Quick Start

1. Environment Setup

2. Data Preparation

3. Training

4. Evaluation & Analysis

Scientific Notebook

Key Features

Advanced Evaluation Framework

Optimization & Tracking

Model Architecture

Performance Benchmarks

Research Contributions

Theoretical Foundations

Citation

License

Contributing

Contact

About

Uh oh!

Releases

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

Hierarchical Multi-Band LSTM for Ethanol Price Forecasting

Architecture Overview

Overview

Architecture Overview

Repository Structure

Quick Start

1. Environment Setup

2. Data Preparation

3. Training

4. Evaluation & Analysis

Scientific Notebook

Key Features

Advanced Evaluation Framework

Optimization & Tracking

Model Architecture

Performance Benchmarks

Research Contributions

Theoretical Foundations

Citation

License

Contributing

Contact

About

Topics

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Contributors

Uh oh!

Languages