Clima e Energia

Clima & Energia

Sistemas de clima e energia estão cada vez mais ricos em dados, dinâmicos e fortemente restringidos pela física e pela segurança. A IA é útil aqui não apenas para “previsão”, mas para antecipar futuros incertos, otimizar decisões sob restrições e medir quantidades difíceis de observar como emissões ou perdas do sistema. Este artigo se concentra em três temas centrais:

Previsão: demanda, geração renovável, clima, preços e eventos extremos
Otimização e controle: operação da rede, despacho de armazenamento, planejamento, resposta da demanda
Medição (MRV): detecção e quantificação de emissões, medição de eficiência, monitoramento e verificação

Esses domínios diferem de muitos cenários de aprendizado de máquina (machine learning) voltados ao consumidor porque erros podem ser caros (apagões, equipamentos danificados, emissões reportadas incorretamente), o ambiente é não estacionário (por exemplo, mudança climática e mudanças de política), e os modelos frequentemente precisam respeitar leis físicas e restrições operacionais.

Por que clima & energia é um domínio de “IA + sistemas”

A maioria das implantações reais combina múltiplos componentes:

Sensoriamento e engenharia de dados
- Telemetria SCADA/PMU, medidores inteligentes, estações meteorológicas
- Imagens de satélite e produtos atmosféricos
- Dados de ativos (turbinas, inversores, transformadores)
Previsão com incerteza
- Prever distribuições, não apenas estimativas pontuais, porque operadores precisam mitigar risco.
Tomada de decisão
- Resolver problemas de otimização com restrições (frequentemente em larga escala) usando previsões como entradas.
Monitoramento e verificação
- Detectar anomalias, quantificar emissões, validar economias ou impactos.

Esse pipeline é naturalmente adequado para combinar aprendizado de máquina com Otimização, Quantificação de Incerteza (Uncertainty Quantification) e modelagem de domínio.

Dados e características do problema

Fontes de dados comuns

Tempo & clima
- Saídas de previsão numérica do tempo (numerical weather prediction, NWP), radar, dados de estações
- Produtos de reanálise (por exemplo, conjuntos de dados do tipo ERA5) para campos históricos consistentes
- Conjuntos (ensembles) de modelos climáticos (estilo CMIP) para cenários de longo horizonte
Sistemas de potência
- Séries temporais de carga e geração em múltiplas granularidades
- Topologia da rede (barramentos, linhas), interrupções, contingências
- Lances/ofertas e preços de mercado
Sensoriamento remoto
- Imagens multiespectrais para uso do solo, vegetação, albedo
- Plumas de metano/CO₂, anomalias térmicas (queima em flare, incêndios), luzes noturnas

Principais desafios (e por que importam)

Não estacionariedade e mudança de distribuição: padrões de demanda evoluem; tendências climáticas alteram as estatísticas meteorológicas.
Estrutura espaço-temporal: clima e redes são redes no espaço e no tempo; suposições ingênuas de IID falham.
Restrições físicas: leis de conservação, limites de estabilidade, taxas de rampa, restrições de fluxo de potência.
Extremos raros: a cauda (ondas de calor, tempestades) pode dominar operacionalmente.
Requisitos de latência e confiabilidade: loops de controle da rede podem ser de segundos a minutos; modelos precisam ser robustos.

Esses desafios frequentemente levam profissionais a abordagens híbridas: aprendizado de máquina para aproximação rápida e aprendizado de padrões, além de física e otimização para segurança e viabilidade.

Previsão: de predições pontuais a incerteza pronta para decisão

Previsões orientam muitas decisões em energia: compromisso de unidade, programação de reservas, despacho de baterias e resposta da demanda. Em contextos climáticos, previsões incluem precipitação, temperatura, vento, irradiância solar e riscos derivados (índices meteorológicos de incêndio, risco de inundação).

O que prever em sistemas de energia

Carga (demanda): de minutos a anos à frente (operações intradiárias a planejamento de longo prazo)
Renováveis: potência eólica/solar (nível de usina e agregação regional)
Preços: para negociação e arbitragem de armazenamento
Risco de equipamentos: probabilidade de falha ou redução de capacidade (por exemplo, devido ao calor)

Famílias de modelos (mapeamento prático)

Clássicos + probabilísticos:
- Suavização exponencial, ARIMA, modelos de espaço de estados (ainda fortes linhas de base)
- Modelos bayesianos e Processos Gaussianos (Gaussian Processes) para incerteza calibrada
Aprendizado de máquina supervisionado:
- Árvores com gradiente impulsionado para características tabulares (calendário, clima, demanda defasada)
- Aprendizado profundo (deep learning) para entradas espaço-temporais de alta dimensionalidade:
  - CNN/3D CNN para campos meteorológicos em grade
  - Variantes da Arquitetura Transformer (Transformer Architecture) para séries temporais com longo contexto
  - Redes Neurais em Grafos (Graph Neural Networks) para topologia da rede e dependências espaciais
Física híbrida + aprendizado de máquina:
- Pós-processamento estatístico de NWP (“model output statistics”)
- Emuladores de aprendizado de máquina que aproximam modelos físicos caros preservando restrições-chave

Previsão probabilística (como é o “bom”)

Em operações, você frequentemente precisa de quantis ou de uma distribuição preditiva completa. Duas razões:

Gestão de risco: programar reservas para cumprir metas de confiabilidade.
Entradas para otimização: otimização estocástica ou robusta usa a incerteza explicitamente.

Abordagens comuns:

Regressão quantílica (quantile regression) (prever P10/P50/P90 diretamente)
Modelos distribucionais (distributional models) (por exemplo, redes de densidade de mistura)
Conjuntos (ensembles) (multi-modelo ou multi-inicialização) e calibração

Métricas para avaliar previsões probabilísticas:

Perda pinball (pinball loss) (quantis)
CRPS (acurácia da distribuição)
Pontuação de Brier (Brier score) (probabilidades de eventos, por exemplo, “vento < limiar”)
Curvas de confiabilidade/calibração (“intervalos de 90% contêm ~90% dos resultados?”)

Exemplo prático: previsão quantílica de carga com gradient boosting

Abaixo há um esboço simplificado de como prever carga P10/P50/P90 usando regressão quantílica. Na prática, você adicionaria engenharia cuidadosa de atributos (defasagens, estatísticas móveis, feriados) e validação sensível ao tempo.

import numpy as np
import pandas as pd
from sklearn.ensemble import GradientBoostingRegressor
from sklearn.model_selection import TimeSeriesSplit

# X: features (e.g., hour-of-day, day-of-week, temperature forecast, lagged load)
# y: load
X = ...  # shape (n_samples, n_features)
y = ...  # shape (n_samples,)

qs = [0.1, 0.5, 0.9]
models = {
    q: GradientBoostingRegressor(loss="quantile", alpha=q, random_state=0)
    for q in qs
}

# Time-series CV (avoid leakage)
tscv = TimeSeriesSplit(n_splits=5)
for train_idx, test_idx in tscv.split(X):
    X_train, X_test = X[train_idx], X[test_idx]
    y_train, y_test = y[train_idx], y[test_idx]
    for q, m in models.items():
        m.fit(X_train, y_train)

# Predict prediction interval
pred_p10 = models[0.1].predict(X)
pred_p50 = models[0.5].predict(X)
pred_p90 = models[0.9].predict(X)

# Example: check empirical coverage of the 80% interval [P10, P90]
coverage = np.mean((y >= pred_p10) & (y <= pred_p90))
print("80% interval empirical coverage:", coverage)

Operacionalmente, você também:

Calibraria intervalos (por exemplo, calibração isotônica nos resíduos)
Acompanharia a deriva de cobertura ao longo de estações e mudanças de regime
Preferiria métricas conscientes da decisão (por exemplo, custo esperado sob penalidades de reserva)

Otimização e controle: decisões sob restrições

Uma vez que você consegue prever, o próximo passo é escolher ações: como despachar geradores, carregar baterias, rotear potência ou deslocar demanda flexível.

Problemas típicos de otimização em energia

Compromisso de unidade (unit commitment): quais geradores ligar/desligar (inteiro-misto, multi-período)
Despacho econômico (economic dispatch): quanto cada gerador produz (frequentemente aproximações convexas)
Fluxo de potência ótimo (optimal power flow, OPF): satisfazer restrições de rede (AC é não convexo; DC é simplificado)
Despacho de armazenamento: cronogramas de carga/descarga sob limites de eficiência e potência
Resposta da demanda: selecionar cargas flexíveis (HVAC, recarga de VE) para atender necessidades da rede
Planejamento: onde construir renováveis/transmissão; expansão de capacidade sob incerteza

Esses problemas são comumente resolvidos com:

Otimização Convexa (Convex Optimization) para aproximações tratáveis
Programação Inteira Mista (Mixed-Integer Programming) para decisões liga/desliga
Otimização estocástica/robusta quando a incerteza é central

Onde o aprendizado de máquina se encaixa na otimização

O aprendizado de máquina raramente “substitui” a otimização em sistemas críticos; geralmente ele a complementa:

Previsões como entradas: demanda, produção renovável, preços, falhas
Modelos substitutos (surrogate models): aproximar física ou simulação cara (por exemplo, fluxo de potência) para acelerar a busca
Heurísticas aprendidas / inicializações quentes (warm starts): prever boas soluções iniciais para solucionadores
Aprendizado por reforço (reinforcement learning) para controle: às vezes viável para controle local ou treinamento em simulação, com fortes restrições de segurança (ver Aprendizado por Reforço (Reinforcement Learning))

Um padrão moderno poderoso é prever-e-otimizar (predict-then-optimize) com realimentação:

Treinar previsões → rodar o otimizador → medir custos/violações realizados → melhorar a previsão e a calibração
Para treinamento realmente ponta a ponta, camadas de otimização diferenciáveis às vezes são usadas, mas exigem cuidado: restrições realistas, estabilidade do solucionador e gradientes corretos.

Exemplo prático: despacho de bateria usando previsões (otimização convexa)

Suponha que você tenha previsões de preço de eletricidade e queira programar uma bateria para minimizar custo (ou maximizar receita), respeitando limites de potência e energia. Isso pode ser formulado como um problema convexo.

import cvxpy as cp
import numpy as np

T = 24  # hours
price = np.array(...)  # forecasted price ($/MWh), length T
load  = np.array(...)  # forecasted net load (MW), length T (positive means buy)

P_max = 10.0    # MW
E_max = 40.0    # MWh
eta_c = 0.95
eta_d = 0.95

charge = cp.Variable(T, nonneg=True)
disch  = cp.Variable(T, nonneg=True)
soc    = cp.Variable(T+1)

constraints = [soc[0] == 0.5 * E_max]
for t in range(T):
    constraints += [
        charge[t] <= P_max,
        disch[t]  <= P_max,
        soc[t+1] == soc[t] + eta_c * charge[t] - (1/eta_d) * disch[t],
        soc[t+1] >= 0,
        soc[t+1] <= E_max,
    ]

# Net grid purchase after battery action
grid_purchase = load + charge - disch

# Minimize energy cost
objective = cp.Minimize(price @ grid_purchase)

prob = cp.Problem(objective, constraints)
prob.solve(solver=cp.ECOS)

print("Optimal cost:", prob.value)

Em implantações reais, você estenderia isso com:

Tarifas de demanda, custos de degradação por ciclagem
Restrições de provisão de reserva
Restrições probabilísticas (“chance constraints”) usando incerteza de previsão
Restrições de rede (limites de transformadores locais, restrições de alimentadores)

Controle, segurança e “aprendizado no loop”

Para ambientes rápidos ou incertos, há interesse em aprender controladores. No entanto, infraestrutura de energia é crítica para segurança. Padrões mais seguros comuns incluem:

Treinar em simulação de alta fidelidade + randomização de domínio (domain randomization)
Usar aprendizado por reforço para propor ações, mas impor viabilidade via um otimizador de restrições rígidas (“filtro de segurança”)
Validar contra cenários de pior caso e testes de estresse fora da distribuição (out-of-distribution)

Medição (MRV): tornando emissões e impactos observáveis

“Medição, reporte e verificação” (MRV) é essencial para política climática e responsabilização corporativa. A IA ajuda a traduzir sinais indiretos em quantidades mensuráveis.

O que é medido

Emissões de metano: detecção e quantificação a partir de satélites, aeronaves, drones e sensores em solo
CO₂ e copoluentes: rastreamento de plumas, estimativa por instalação
Impactos de eficiência energética: verificação de economias de retrofits ou programas
Mudança de uso do solo: desmatamento, estimativa de biomassa, mudanças no estoque de carbono
Perdas e furtos na rede: detecção de anomalias em dados de medição e alimentadores

Tarefas comuns de aprendizado de máquina

Visão computacional (computer vision) em imagens de sensoriamento remoto: segmentação/detecção de plumas, instalações, cobertura do solo (ver Visão Computacional (Computer Vision))
Detecção de anomalias (anomaly detection) em séries temporais: vazamentos, medidores defeituosos, consumo incomum (ver Detecção de Anomalias (Anomaly Detection))
Problemas inversos (inverse problems): inferir taxas de emissão a partir de medições de concentração e campos de vento
Fusão de dados (data fusion): combinar satélites + sensores em solo + meteorologia para estimativas robustas

Exemplo prático: pipeline de detecção de vazamento de metano (conceitual)

Um fluxo de trabalho típico ponta a ponta se parece com:

Detecção de candidatos (alta revocação):
- Usar um modelo de visão CNN/Transformer para sinalizar plumas prováveis ou pixels de hotspot.
Filtragem por contexto:
- Remover falsos positivos de nuvens, artefatos de superfície ou interferência conhecida.
Quantificação:
- Estimar a taxa de emissão usando geometria da pluma + campos de vento (frequentemente uma etapa informada pela física).
Relato de incerteza:
- Fornecer intervalos de confiança e limites de detecção.
Loop de verificação:
- Acionar inspeções de acompanhamento (equipes de campo, levantamentos com drones) para confirmar e corrigir.

A etapa de “quantificação” é onde o aprendizado de máquina puro frequentemente tem dificuldade sozinho; combinar um modelo físico de dispersão com detecção baseada em aprendizado de máquina tende a melhorar credibilidade e auditabilidade.

Estimando impactos de programas (eficiência, resposta da demanda)

Ao avaliar intervenções—como enviar um sinal de resposta da demanda ou subsidiar bombas de calor—comparações ingênuas de “antes/depois” podem ser enganosas devido a confundidores (clima, ocupação, sazonalidade). Métodos de Inferência Causal (Causal Inference) são frequentemente usados:

Diferença-em-diferenças com controles pareados
Controles sintéticos
Modelagem de uplift para programas direcionados

Conectando física e aprendizado de máquina

Clima e energia são governados por forte estrutura física. Aproveitá-la melhora generalização e confiança.

Abordagens informadas pela física e híbridas

Funções de perda guiadas pela física: penalizar violações de conservação ou relações conhecidas
Simuladores diferenciáveis: incorporar física simplificada dentro do treinamento de aprendizado de máquina
Redes Neurais Informadas pela Física (Physics-Informed Neural Networks): úteis em alguns cenários tipo EDP (PDE), embora escalabilidade e qualidade dos dados importem
Emuladores: aproximações rápidas via aprendizado de máquina de modelos climáticos ou de engenharia caros (comuns em exploração de cenários)

Uma distinção-chave:

Previsão do tempo frequentemente usa aprendizado de máquina para aproximar a evolução no tempo dos estados atmosféricos (às vezes aprendendo a partir de reanálise e saídas de NWP).
Projeção climática precisa de fidelidade estatística de longo prazo (distribuições, extremos, teleconexões), não apenas acurácia de curto prazo.

Validação e avaliação no mundo real

Avaliação sensível ao tempo

Sempre separe os dados por tempo (e frequentemente por geografia) para evitar vazamento e refletir condições de implantação:

Avaliação com origem rolante (treinar no passado → testar no futuro)
Teste de estresse em períodos extremos (ondas de calor, tempestades)
Segurar regiões específicas (para generalização espacial)

Métricas conscientes da decisão

Métricas de acurácia de previsão (MAE/RMSE) podem estar desalinhadas com custo operacional. Frequentemente você quer:

Custo esperado sob tarifas e penalidades
Métricas de confiabilidade (violações de restrição, probabilidade de perda de carga)
Calibração da incerteza prevista, não apenas nitidez

Monitoramento em implantação

Detecção de deriva (drift): mudanças de demanda, recalibração de sensores, mudanças de regras de mercado
Cronogramas de recalibração: atualizações sazonais, correção pós-evento
Estratégias de contingência: linhas de base simples e caminhos de override do operador

Restrições e riscos de implantação prática

Segurança, confiabilidade e fatores humanos

Controle de rede e industrial exige projeto conservador: padrões à prova de falha, interpretabilidade, testes robustos.
Operadores frequentemente precisam de códigos de motivo (“por que a previsão mudou?”) e ferramentas de cenários.

Governança de dados e privacidade

Dados de medidores inteligentes podem ser sensíveis. Técnicas incluem:

Agregação e controles de acesso
Aprendizado que preserva privacidade (quando apropriado)
Tratamento cuidadoso de dados de localização e padrões em nível domiciliar

Segurança e preocupações adversariais

Sistemas de energia são infraestrutura crítica. Pipelines de modelos podem ser atacados via:

Envenenamento de dados (data poisoning) (adulteração de telemetria)
Falsificação de sensores (sensor spoofing)
Comprometimento de API em cadeias de previsão/despacho
Práticas de segurança de aprendizado de máquina e de engenharia de infraestrutura devem ser aplicadas (ver também Segurança em Aprendizado de Máquina (Machine Learning Security) se disponível no seu wiki).

Direções emergentes

Modelos fundacionais para tempo e clima

Grandes modelos profundos treinados em reanálise e dados do tipo NWP mostraram forte desempenho para previsão global de curto prazo e podem ser mais rápidos que pipelines tradicionais em alguns cenários. Questões de pesquisa em aberto incluem:

Calibração e incerteza
Fidelidade a eventos extremos
Acoplamento com assimilação de dados e observações

Modelagem de rede baseada em grafos

Redes elétricas são naturalmente grafos. Redes Neurais em Grafos são cada vez mais usadas para:

Substitutos (surrogates) de estimação de estado
Triagem de contingências
Previsão sensível à topologia

Otimização consciente de carbono

A IA pode otimizar quando e onde a energia é consumida:

Programação de processos industriais flexíveis
Deslocamento da recarga de VEs
Programação de carga de trabalho de datacenters usando sinais de emissões marginais
Isso combina previsão, otimização e restrições de política em um único problema operacional.

Gêmeos digitais e aprendizado em malha fechada

“Gêmeos digitais” combinam simulação + telemetria ao vivo + aprendizado de máquina para:

Prever falhas e necessidades de manutenção
Rodar cenários operacionais contrafactuais
Apoiar planejamento sob incerteza

Resumo: os padrões centrais para lembrar

Previsão em clima & energia é fundamentalmente probabilística e espaço-temporal.
Otimização geralmente é o motor de decisão; o aprendizado de máquina melhora entradas, velocidade e adaptabilidade, mas restrições e segurança dominam.
Medição (MRV) frequentemente exige fusão de dados e quantificação consciente da física—não apenas detecção.
O sucesso real depende tanto de validação, monitoramento e governança quanto de arquitetura de modelo.

Se você estiver construindo sistemas neste domínio, priorize: avaliação sensível ao tempo, incerteza calibrada, imposição de restrições e caminhos claros de contingência operacional.