Metodologia dei forecast Energy Index

Documento tecnico pubblico — versione 1.0, pubblicato il 2026-05-15.

1. Obiettivo

Fornire previsioni giornaliere di PUN, PSV e TTF a 7, 30, 90 e 180 giorni con una stima esplicita dell'incertezza, completamente trasparenti e verificabili.

2. Famiglia di modello

Adottiamo Ridge regression (regressione lineare regolarizzata L2) come baseline interpretabile. Rispetto a una semplice OLS, Ridge:

stabilizza i coefficienti in presenza di feature correlate (lag autoregressivi, cross-asset);
permette di mantenere ~35 feature senza overfitting;
produce coefficienti interpretabili → driver attribution naturale.

Il valore di regolarizzazione λ è fissato a 1.0 sulle feature standardizzate. Validato empiricamente su backtesting walk-forward.

3. Feature engineering

Per ogni asset target e ogni orizzonte alleniamo un modello indipendente con le seguenti feature:

Autoregressive: lag 1/7/30 giorni, rolling mean 7/30, rolling std 30.
Cross-asset: lag 1/7 di TTF, Brent, CO2 (e PSV per il modello TTF).
Meteo: Heating Degree Days e Cooling Degree Days derivati dalla temperatura nazionale italiana (media pesata 9 città).
Calendar: giorno della settimana e mese in one-hot encoding; festività italiane via libreria date-holidays.
Stagionalità ciclica: seno/coseno annuali e settimanali per evitare discontinuità al cambio di anno.

4. Banda di confidenza

Usiamo split conformal prediction: i residui assoluti del modello vengono calcolati su un set di calibrazione (ultimi 90 giorni di training). Il quantile 0.9 dei residui assoluti definisce la semibanda q, e la previsione è esposta come [value − q, value + q].

Garanzia teorica: assumendo scambiabilità dei residui, il valore reale cade dentro la banda con probabilità ≥ 90% (distribution-free, no assunzione gaussiana).

5. Driver attribution

Per ogni forecast esposto, calcoliamo la contribuzione di ogni feature come:

contribution_i = coefficient_i × (feature_oggi_i − feature_media_training_i)

Mostriamo i top 3-4 driver per magnitudine assoluta, raggruppando le feature calendar (dow_*, month_*) e seasonal in un'unica voce.

6. Validazione

Il modello è validato in due regimi:

Bootstrap walk-forward (1 volta dopo deploy): per ogni giorno degli ultimi 12 mesi, addestriamo il modello con i dati disponibili a quel giorno (no leakage) e generiamo forecast a 7/30/90/180g. Otteniamo ~4.000 forecast retrospettivi.
Daily rolling (live): ogni giorno emettiamo 12 nuovi forecast (3 asset × 4 horizon), e quando arriva il valore reale ricalcoliamo le metriche aggregate.

Le metriche pubblicate giornalmente sono:

MAPE: errore percentuale assoluto medio
RMSE: errore quadratico medio (radice)
Hit ratio: percentuale di direzioni indovinate (up/down vs spot di ieri)
Coverage 90%: percentuale di osservazioni reali dentro la banda 5–95%

7. Limiti dichiarati

Modello lineare: non cattura non-linearità o regime shifts strutturali (es. crisi 2022).
Univariato di output: ogni asset/orizzonte è un modello indipendente, non c'è coerenza congiunta tra forecast.
Forecast meteo: per orizzonti >16 giorni usiamo l'ultimo valore osservato come proxy (Open-Meteo fornisce solo 16g forecast).
Granularità minima: giornaliera. Forecast intra-day non disponibili.

8. Roadmap upgrade

Il modello sarà aggiornato a uno stack più avanzato (Prophet + XGBoost + ARIMAX in ensemble, deployment Python su FastAPI) al verificarsi di almeno 2 di 3 condizioni:

5+ utenti Pro paganti (149€/mese)
1+ contratto Enterprise firmato
MAPE a 90 giorni > 12% per 4 settimane consecutive su qualunque asset

9. Licenza e citazione

I forecast pubblicati su energyindex.it sono gratuiti per uso informativo, accademico e personale. Sono espressamente vietati uso commerciale e ridistribuzione senza autorizzazione scritta.

Citazione consigliata: «EIDX Research, Metodologia forecast Energy Index v1.0, 2026-05-15, https://energyindex.it/it/forecast/metodologia».

10. Contatti

Per domande tecniche, segnalazioni di bug o richieste di dataset estesi: commerciale@deagroup.biz.