Metodologia dei forecast Energy Index
Documento tecnico pubblico — versione 1.0, pubblicato il 2026-05-15.
1. Obiettivo
Fornire previsioni giornaliere di PUN, PSV e TTF a 7, 30, 90 e 180 giorni con una stima esplicita dell'incertezza, completamente trasparenti e verificabili.
2. Famiglia di modello
Adottiamo Ridge regression (regressione lineare regolarizzata L2) come baseline interpretabile. Rispetto a una semplice OLS, Ridge:
- stabilizza i coefficienti in presenza di feature correlate (lag autoregressivi, cross-asset);
- permette di mantenere ~35 feature senza overfitting;
- produce coefficienti interpretabili → driver attribution naturale.
Il valore di regolarizzazione λ è fissato a 1.0 sulle feature standardizzate. Validato empiricamente su backtesting walk-forward.
3. Feature engineering
Per ogni asset target e ogni orizzonte alleniamo un modello indipendente con le seguenti feature:
- Autoregressive: lag 1/7/30 giorni, rolling mean 7/30, rolling std 30.
- Cross-asset: lag 1/7 di TTF, Brent, CO2 (e PSV per il modello TTF).
- Meteo: Heating Degree Days e Cooling Degree Days derivati dalla temperatura nazionale italiana (media pesata 9 città).
- Calendar: giorno della settimana e mese in one-hot encoding; festività italiane via libreria
date-holidays. - Stagionalità ciclica: seno/coseno annuali e settimanali per evitare discontinuità al cambio di anno.
4. Banda di confidenza
Usiamo split conformal prediction: i residui assoluti del modello vengono calcolati su un set di calibrazione (ultimi 90 giorni di training). Il quantile 0.9 dei residui assoluti definisce la semibanda q, e la previsione è esposta come [value − q, value + q].
Garanzia teorica: assumendo scambiabilità dei residui, il valore reale cade dentro la banda con probabilità ≥ 90% (distribution-free, no assunzione gaussiana).
5. Driver attribution
Per ogni forecast esposto, calcoliamo la contribuzione di ogni feature come:
contribution_i = coefficient_i × (feature_oggi_i − feature_media_training_i)Mostriamo i top 3-4 driver per magnitudine assoluta, raggruppando le feature calendar (dow_*, month_*) e seasonal in un'unica voce.
6. Validazione
Il modello è validato in due regimi:
- Bootstrap walk-forward (1 volta dopo deploy): per ogni giorno degli ultimi 12 mesi, addestriamo il modello con i dati disponibili a quel giorno (no leakage) e generiamo forecast a 7/30/90/180g. Otteniamo ~4.000 forecast retrospettivi.
- Daily rolling (live): ogni giorno emettiamo 12 nuovi forecast (3 asset × 4 horizon), e quando arriva il valore reale ricalcoliamo le metriche aggregate.
Le metriche pubblicate giornalmente sono:
- MAPE: errore percentuale assoluto medio
- RMSE: errore quadratico medio (radice)
- Hit ratio: percentuale di direzioni indovinate (up/down vs spot di ieri)
- Coverage 90%: percentuale di osservazioni reali dentro la banda 5–95%
7. Limiti dichiarati
- Modello lineare: non cattura non-linearità o regime shifts strutturali (es. crisi 2022).
- Univariato di output: ogni asset/orizzonte è un modello indipendente, non c'è coerenza congiunta tra forecast.
- Forecast meteo: per orizzonti >16 giorni usiamo l'ultimo valore osservato come proxy (Open-Meteo fornisce solo 16g forecast).
- Granularità minima: giornaliera. Forecast intra-day non disponibili.
8. Roadmap upgrade
Il modello sarà aggiornato a uno stack più avanzato (Prophet + XGBoost + ARIMAX in ensemble, deployment Python su FastAPI) al verificarsi di almeno 2 di 3 condizioni:
- 5+ utenti Pro paganti (149€/mese)
- 1+ contratto Enterprise firmato
- MAPE a 90 giorni > 12% per 4 settimane consecutive su qualunque asset
9. Licenza e citazione
I forecast pubblicati su energyindex.it sono gratuiti per uso informativo, accademico e personale. Sono espressamente vietati uso commerciale e ridistribuzione senza autorizzazione scritta.
Citazione consigliata: «EIDX Research, Metodologia forecast Energy Index v1.0, 2026-05-15, https://energyindex.it/it/forecast/metodologia».
10. Contatti
Per domande tecniche, segnalazioni di bug o richieste di dataset estesi: commerciale@deagroup.biz.