Clima e Energia

Clima & Energia

Sistemas de clima e energia estão cada vez mais ricos em dados, dinâmicos e fortemente restringidos pela física e pela segurança. A IA é útil aqui não apenas para “previsão”, mas para antecipar futuros incertos, otimizar decisões sob restrições e medir quantidades difíceis de observar como emissões ou perdas do sistema. Este artigo se concentra em três temas centrais:

  • Previsão: demanda, geração renovável, clima, preços e eventos extremos
  • Otimização e controle: operação da rede, despacho de armazenamento, planejamento, resposta da demanda
  • Medição (MRV): detecção e quantificação de emissões, medição de eficiência, monitoramento e verificação

Esses domínios diferem de muitos cenários de aprendizado de máquina (machine learning) voltados ao consumidor porque erros podem ser caros (apagões, equipamentos danificados, emissões reportadas incorretamente), o ambiente é não estacionário (por exemplo, mudança climática e mudanças de política), e os modelos frequentemente precisam respeitar leis físicas e restrições operacionais.

Por que clima & energia é um domínio de “IA + sistemas”

A maioria das implantações reais combina múltiplos componentes:

  1. Sensoriamento e engenharia de dados

    • Telemetria SCADA/PMU, medidores inteligentes, estações meteorológicas
    • Imagens de satélite e produtos atmosféricos
    • Dados de ativos (turbinas, inversores, transformadores)
  2. Previsão com incerteza

    • Prever distribuições, não apenas estimativas pontuais, porque operadores precisam mitigar risco.
  3. Tomada de decisão

    • Resolver problemas de otimização com restrições (frequentemente em larga escala) usando previsões como entradas.
  4. Monitoramento e verificação

    • Detectar anomalias, quantificar emissões, validar economias ou impactos.

Esse pipeline é naturalmente adequado para combinar aprendizado de máquina com Otimização, Quantificação de Incerteza (Uncertainty Quantification) e modelagem de domínio.

Dados e características do problema

Fontes de dados comuns

  • Tempo & clima
    • Saídas de previsão numérica do tempo (numerical weather prediction, NWP), radar, dados de estações
    • Produtos de reanálise (por exemplo, conjuntos de dados do tipo ERA5) para campos históricos consistentes
    • Conjuntos (ensembles) de modelos climáticos (estilo CMIP) para cenários de longo horizonte
  • Sistemas de potência
    • Séries temporais de carga e geração em múltiplas granularidades
    • Topologia da rede (barramentos, linhas), interrupções, contingências
    • Lances/ofertas e preços de mercado
  • Sensoriamento remoto
    • Imagens multiespectrais para uso do solo, vegetação, albedo
    • Plumas de metano/CO₂, anomalias térmicas (queima em flare, incêndios), luzes noturnas

Principais desafios (e por que importam)

  • Não estacionariedade e mudança de distribuição: padrões de demanda evoluem; tendências climáticas alteram as estatísticas meteorológicas.
  • Estrutura espaço-temporal: clima e redes são redes no espaço e no tempo; suposições ingênuas de IID falham.
  • Restrições físicas: leis de conservação, limites de estabilidade, taxas de rampa, restrições de fluxo de potência.
  • Extremos raros: a cauda (ondas de calor, tempestades) pode dominar operacionalmente.
  • Requisitos de latência e confiabilidade: loops de controle da rede podem ser de segundos a minutos; modelos precisam ser robustos.

Esses desafios frequentemente levam profissionais a abordagens híbridas: aprendizado de máquina para aproximação rápida e aprendizado de padrões, além de física e otimização para segurança e viabilidade.

Previsão: de predições pontuais a incerteza pronta para decisão

Previsões orientam muitas decisões em energia: compromisso de unidade, programação de reservas, despacho de baterias e resposta da demanda. Em contextos climáticos, previsões incluem precipitação, temperatura, vento, irradiância solar e riscos derivados (índices meteorológicos de incêndio, risco de inundação).

O que prever em sistemas de energia

  • Carga (demanda): de minutos a anos à frente (operações intradiárias a planejamento de longo prazo)
  • Renováveis: potência eólica/solar (nível de usina e agregação regional)
  • Preços: para negociação e arbitragem de armazenamento
  • Risco de equipamentos: probabilidade de falha ou redução de capacidade (por exemplo, devido ao calor)

Famílias de modelos (mapeamento prático)

  • Clássicos + probabilísticos:
  • Aprendizado de máquina supervisionado:
  • Física híbrida + aprendizado de máquina:
    • Pós-processamento estatístico de NWP (“model output statistics”)
    • Emuladores de aprendizado de máquina que aproximam modelos físicos caros preservando restrições-chave

Previsão probabilística (como é o “bom”)

Em operações, você frequentemente precisa de quantis ou de uma distribuição preditiva completa. Duas razões:

  • Gestão de risco: programar reservas para cumprir metas de confiabilidade.
  • Entradas para otimização: otimização estocástica ou robusta usa a incerteza explicitamente.

Abordagens comuns:

  • Regressão quantílica (quantile regression) (prever P10/P50/P90 diretamente)
  • Modelos distribucionais (distributional models) (por exemplo, redes de densidade de mistura)
  • Conjuntos (ensembles) (multi-modelo ou multi-inicialização) e calibração

Métricas para avaliar previsões probabilísticas:

  • Perda pinball (pinball loss) (quantis)
  • CRPS (acurácia da distribuição)
  • Pontuação de Brier (Brier score) (probabilidades de eventos, por exemplo, “vento < limiar”)
  • Curvas de confiabilidade/calibração (“intervalos de 90% contêm ~90% dos resultados?”)

Exemplo prático: previsão quantílica de carga com gradient boosting

Abaixo há um esboço simplificado de como prever carga P10/P50/P90 usando regressão quantílica. Na prática, você adicionaria engenharia cuidadosa de atributos (defasagens, estatísticas móveis, feriados) e validação sensível ao tempo.

import numpy as np
import pandas as pd
from sklearn.ensemble import GradientBoostingRegressor
from sklearn.model_selection import TimeSeriesSplit

# X: features (e.g., hour-of-day, day-of-week, temperature forecast, lagged load)
# y: load
X = ...  # shape (n_samples, n_features)
y = ...  # shape (n_samples,)

qs = [0.1, 0.5, 0.9]
models = {
    q: GradientBoostingRegressor(loss="quantile", alpha=q, random_state=0)
    for q in qs
}

# Time-series CV (avoid leakage)
tscv = TimeSeriesSplit(n_splits=5)
for train_idx, test_idx in tscv.split(X):
    X_train, X_test = X[train_idx], X[test_idx]
    y_train, y_test = y[train_idx], y[test_idx]
    for q, m in models.items():
        m.fit(X_train, y_train)

# Predict prediction interval
pred_p10 = models[0.1].predict(X)
pred_p50 = models[0.5].predict(X)
pred_p90 = models[0.9].predict(X)

# Example: check empirical coverage of the 80% interval [P10, P90]
coverage = np.mean((y >= pred_p10) & (y <= pred_p90))
print("80% interval empirical coverage:", coverage)

Operacionalmente, você também:

  • Calibraria intervalos (por exemplo, calibração isotônica nos resíduos)
  • Acompanharia a deriva de cobertura ao longo de estações e mudanças de regime
  • Preferiria métricas conscientes da decisão (por exemplo, custo esperado sob penalidades de reserva)

Otimização e controle: decisões sob restrições

Uma vez que você consegue prever, o próximo passo é escolher ações: como despachar geradores, carregar baterias, rotear potência ou deslocar demanda flexível.

Problemas típicos de otimização em energia

  • Compromisso de unidade (unit commitment): quais geradores ligar/desligar (inteiro-misto, multi-período)
  • Despacho econômico (economic dispatch): quanto cada gerador produz (frequentemente aproximações convexas)
  • Fluxo de potência ótimo (optimal power flow, OPF): satisfazer restrições de rede (AC é não convexo; DC é simplificado)
  • Despacho de armazenamento: cronogramas de carga/descarga sob limites de eficiência e potência
  • Resposta da demanda: selecionar cargas flexíveis (HVAC, recarga de VE) para atender necessidades da rede
  • Planejamento: onde construir renováveis/transmissão; expansão de capacidade sob incerteza

Esses problemas são comumente resolvidos com:

Onde o aprendizado de máquina se encaixa na otimização

O aprendizado de máquina raramente “substitui” a otimização em sistemas críticos; geralmente ele a complementa:

  1. Previsões como entradas: demanda, produção renovável, preços, falhas
  2. Modelos substitutos (surrogate models): aproximar física ou simulação cara (por exemplo, fluxo de potência) para acelerar a busca
  3. Heurísticas aprendidas / inicializações quentes (warm starts): prever boas soluções iniciais para solucionadores
  4. Aprendizado por reforço (reinforcement learning) para controle: às vezes viável para controle local ou treinamento em simulação, com fortes restrições de segurança (ver Aprendizado por Reforço (Reinforcement Learning))

Um padrão moderno poderoso é prever-e-otimizar (predict-then-optimize) com realimentação:

  • Treinar previsões → rodar o otimizador → medir custos/violações realizados → melhorar a previsão e a calibração
    Para treinamento realmente ponta a ponta, camadas de otimização diferenciáveis às vezes são usadas, mas exigem cuidado: restrições realistas, estabilidade do solucionador e gradientes corretos.

Exemplo prático: despacho de bateria usando previsões (otimização convexa)

Suponha que você tenha previsões de preço de eletricidade e queira programar uma bateria para minimizar custo (ou maximizar receita), respeitando limites de potência e energia. Isso pode ser formulado como um problema convexo.

import cvxpy as cp
import numpy as np

T = 24  # hours
price = np.array(...)  # forecasted price ($/MWh), length T
load  = np.array(...)  # forecasted net load (MW), length T (positive means buy)

P_max = 10.0    # MW
E_max = 40.0    # MWh
eta_c = 0.95
eta_d = 0.95

charge = cp.Variable(T, nonneg=True)
disch  = cp.Variable(T, nonneg=True)
soc    = cp.Variable(T+1)

constraints = [soc[0] == 0.5 * E_max]
for t in range(T):
    constraints += [
        charge[t] <= P_max,
        disch[t]  <= P_max,
        soc[t+1] == soc[t] + eta_c * charge[t] - (1/eta_d) * disch[t],
        soc[t+1] >= 0,
        soc[t+1] <= E_max,
    ]

# Net grid purchase after battery action
grid_purchase = load + charge - disch

# Minimize energy cost
objective = cp.Minimize(price @ grid_purchase)

prob = cp.Problem(objective, constraints)
prob.solve(solver=cp.ECOS)

print("Optimal cost:", prob.value)

Em implantações reais, você estenderia isso com:

  • Tarifas de demanda, custos de degradação por ciclagem
  • Restrições de provisão de reserva
  • Restrições probabilísticas (“chance constraints”) usando incerteza de previsão
  • Restrições de rede (limites de transformadores locais, restrições de alimentadores)

Controle, segurança e “aprendizado no loop”

Para ambientes rápidos ou incertos, há interesse em aprender controladores. No entanto, infraestrutura de energia é crítica para segurança. Padrões mais seguros comuns incluem:

  • Treinar em simulação de alta fidelidade + randomização de domínio (domain randomization)
  • Usar aprendizado por reforço para propor ações, mas impor viabilidade via um otimizador de restrições rígidas (“filtro de segurança”)
  • Validar contra cenários de pior caso e testes de estresse fora da distribuição (out-of-distribution)

Medição (MRV): tornando emissões e impactos observáveis

“Medição, reporte e verificação” (MRV) é essencial para política climática e responsabilização corporativa. A IA ajuda a traduzir sinais indiretos em quantidades mensuráveis.

O que é medido

  • Emissões de metano: detecção e quantificação a partir de satélites, aeronaves, drones e sensores em solo
  • CO₂ e copoluentes: rastreamento de plumas, estimativa por instalação
  • Impactos de eficiência energética: verificação de economias de retrofits ou programas
  • Mudança de uso do solo: desmatamento, estimativa de biomassa, mudanças no estoque de carbono
  • Perdas e furtos na rede: detecção de anomalias em dados de medição e alimentadores

Tarefas comuns de aprendizado de máquina

  • Visão computacional (computer vision) em imagens de sensoriamento remoto: segmentação/detecção de plumas, instalações, cobertura do solo (ver Visão Computacional (Computer Vision))
  • Detecção de anomalias (anomaly detection) em séries temporais: vazamentos, medidores defeituosos, consumo incomum (ver Detecção de Anomalias (Anomaly Detection))
  • Problemas inversos (inverse problems): inferir taxas de emissão a partir de medições de concentração e campos de vento
  • Fusão de dados (data fusion): combinar satélites + sensores em solo + meteorologia para estimativas robustas

Exemplo prático: pipeline de detecção de vazamento de metano (conceitual)

Um fluxo de trabalho típico ponta a ponta se parece com:

  1. Detecção de candidatos (alta revocação):
    • Usar um modelo de visão CNN/Transformer para sinalizar plumas prováveis ou pixels de hotspot.
  2. Filtragem por contexto:
    • Remover falsos positivos de nuvens, artefatos de superfície ou interferência conhecida.
  3. Quantificação:
    • Estimar a taxa de emissão usando geometria da pluma + campos de vento (frequentemente uma etapa informada pela física).
  4. Relato de incerteza:
    • Fornecer intervalos de confiança e limites de detecção.
  5. Loop de verificação:
    • Acionar inspeções de acompanhamento (equipes de campo, levantamentos com drones) para confirmar e corrigir.

A etapa de “quantificação” é onde o aprendizado de máquina puro frequentemente tem dificuldade sozinho; combinar um modelo físico de dispersão com detecção baseada em aprendizado de máquina tende a melhorar credibilidade e auditabilidade.

Estimando impactos de programas (eficiência, resposta da demanda)

Ao avaliar intervenções—como enviar um sinal de resposta da demanda ou subsidiar bombas de calor—comparações ingênuas de “antes/depois” podem ser enganosas devido a confundidores (clima, ocupação, sazonalidade). Métodos de Inferência Causal (Causal Inference) são frequentemente usados:

  • Diferença-em-diferenças com controles pareados
  • Controles sintéticos
  • Modelagem de uplift para programas direcionados

Conectando física e aprendizado de máquina

Clima e energia são governados por forte estrutura física. Aproveitá-la melhora generalização e confiança.

Abordagens informadas pela física e híbridas

  • Funções de perda guiadas pela física: penalizar violações de conservação ou relações conhecidas
  • Simuladores diferenciáveis: incorporar física simplificada dentro do treinamento de aprendizado de máquina
  • Redes Neurais Informadas pela Física (Physics-Informed Neural Networks): úteis em alguns cenários tipo EDP (PDE), embora escalabilidade e qualidade dos dados importem
  • Emuladores: aproximações rápidas via aprendizado de máquina de modelos climáticos ou de engenharia caros (comuns em exploração de cenários)

Uma distinção-chave:

  • Previsão do tempo frequentemente usa aprendizado de máquina para aproximar a evolução no tempo dos estados atmosféricos (às vezes aprendendo a partir de reanálise e saídas de NWP).
  • Projeção climática precisa de fidelidade estatística de longo prazo (distribuições, extremos, teleconexões), não apenas acurácia de curto prazo.

Validação e avaliação no mundo real

Avaliação sensível ao tempo

Sempre separe os dados por tempo (e frequentemente por geografia) para evitar vazamento e refletir condições de implantação:

  • Avaliação com origem rolante (treinar no passado → testar no futuro)
  • Teste de estresse em períodos extremos (ondas de calor, tempestades)
  • Segurar regiões específicas (para generalização espacial)

Métricas conscientes da decisão

Métricas de acurácia de previsão (MAE/RMSE) podem estar desalinhadas com custo operacional. Frequentemente você quer:

  • Custo esperado sob tarifas e penalidades
  • Métricas de confiabilidade (violações de restrição, probabilidade de perda de carga)
  • Calibração da incerteza prevista, não apenas nitidez

Monitoramento em implantação

  • Detecção de deriva (drift): mudanças de demanda, recalibração de sensores, mudanças de regras de mercado
  • Cronogramas de recalibração: atualizações sazonais, correção pós-evento
  • Estratégias de contingência: linhas de base simples e caminhos de override do operador

Restrições e riscos de implantação prática

Segurança, confiabilidade e fatores humanos

  • Controle de rede e industrial exige projeto conservador: padrões à prova de falha, interpretabilidade, testes robustos.
  • Operadores frequentemente precisam de códigos de motivo (“por que a previsão mudou?”) e ferramentas de cenários.

Governança de dados e privacidade

Dados de medidores inteligentes podem ser sensíveis. Técnicas incluem:

  • Agregação e controles de acesso
  • Aprendizado que preserva privacidade (quando apropriado)
  • Tratamento cuidadoso de dados de localização e padrões em nível domiciliar

Segurança e preocupações adversariais

Sistemas de energia são infraestrutura crítica. Pipelines de modelos podem ser atacados via:

  • Envenenamento de dados (data poisoning) (adulteração de telemetria)
  • Falsificação de sensores (sensor spoofing)
  • Comprometimento de API em cadeias de previsão/despacho
    Práticas de segurança de aprendizado de máquina e de engenharia de infraestrutura devem ser aplicadas (ver também Segurança em Aprendizado de Máquina (Machine Learning Security) se disponível no seu wiki).

Direções emergentes

Modelos fundacionais para tempo e clima

Grandes modelos profundos treinados em reanálise e dados do tipo NWP mostraram forte desempenho para previsão global de curto prazo e podem ser mais rápidos que pipelines tradicionais em alguns cenários. Questões de pesquisa em aberto incluem:

  • Calibração e incerteza
  • Fidelidade a eventos extremos
  • Acoplamento com assimilação de dados e observações

Modelagem de rede baseada em grafos

Redes elétricas são naturalmente grafos. Redes Neurais em Grafos são cada vez mais usadas para:

  • Substitutos (surrogates) de estimação de estado
  • Triagem de contingências
  • Previsão sensível à topologia

Otimização consciente de carbono

A IA pode otimizar quando e onde a energia é consumida:

  • Programação de processos industriais flexíveis
  • Deslocamento da recarga de VEs
  • Programação de carga de trabalho de datacenters usando sinais de emissões marginais
    Isso combina previsão, otimização e restrições de política em um único problema operacional.

Gêmeos digitais e aprendizado em malha fechada

“Gêmeos digitais” combinam simulação + telemetria ao vivo + aprendizado de máquina para:

  • Prever falhas e necessidades de manutenção
  • Rodar cenários operacionais contrafactuais
  • Apoiar planejamento sob incerteza

Resumo: os padrões centrais para lembrar

  • Previsão em clima & energia é fundamentalmente probabilística e espaço-temporal.
  • Otimização geralmente é o motor de decisão; o aprendizado de máquina melhora entradas, velocidade e adaptabilidade, mas restrições e segurança dominam.
  • Medição (MRV) frequentemente exige fusão de dados e quantificação consciente da física—não apenas detecção.
  • O sucesso real depende tanto de validação, monitoramento e governança quanto de arquitetura de modelo.

Se você estiver construindo sistemas neste domínio, priorize: avaliação sensível ao tempo, incerteza calibrada, imposição de restrições e caminhos claros de contingência operacional.