Modelos e Algoritmos

Como prever onde as plantas podem viver
em um clima que muda?


Disciplina: Mudanças Climáticas

Engenharia Florestal - UDESC

Prof. Pedro Higuchi

Roteiro da aula

  1. O que são modelos e para que servem
  2. O que são algoritmos
  3. Por que modelar onde as espécies vivem?
  4. Como o computador "aprende" padrões
  5. O algoritmo Random Forest (Floresta Aleatória)
  6. Prática no TAIPA

O que é um modelo?

Um modelo é uma versão simplificada do mundo real.

Usamos modelos o tempo todo, mesmo sem perceber!

"Todos os modelos estão errados, mas alguns são úteis."
- George Box, estatístico

Modelos do dia a dia

Mapa ilustrativo

Um mapa é um modelo do território

Planta baixa

Uma planta baixa é um modelo de uma casa

Tipos de modelos

  • Conceitual: desenho que explica um sistema (ex: ciclo da água)
  • Físico: miniatura ou réplica (ex: maquete)
  • Matemático: equações (ex: crescimento de árvore)
  • Computacional: simulações no computador (ex: onde uma planta pode viver)

O que é um algoritmo?

Um algoritmo é um passo a passo para resolver um problema.

Pense como uma receita: você segue as instruções na ordem certa e chega ao resultado.

Algoritmos do dia a dia

Receita de bolo

Uma receita de bolo

Instruções de montagem

Instruções para montar um móvel

Exemplo simples: calcular uma média

Algoritmo: 1) Somar todos os valores → 2) Dividir pela quantidade

Para as notas [7, 8, 6, 9]:

  • Soma: 7 + 8 + 6 + 9 = 30
  • Média: 30 / 4 = 7,5

Algoritmos de computador seguem a mesma lógica, só que com muito mais dados!

Por que modelar onde as espécies vivem?

Cada espécie precisa de condições ambientais específicas: temperatura, chuva, solo...

O problema: com a mudança climática, essas condições estão mudando. Onde a espécie vive hoje pode não ser adequado no futuro!

O que queremos descobrir?

"Este lugar tem as condições certas para esta espécie viver?"

E a pergunta mais importante:

"E no futuro, com o clima diferente, ela ainda vai conseguir viver ali?"

E na prática do engenheiro florestal?

Essas previsões ajudam vocês a tomar decisões reais:

  • Restauração florestal: quais espécies plantar hoje que ainda vão sobreviver daqui a 30 anos?
  • Plantios comerciais: onde plantar Pinus ou Eucalyptus considerando o clima futuro?
  • Conservação: quais áreas proteger para salvar espécies ameaçadas?
  • Manejo florestal: como adaptar planos de manejo se as espécies mudam de lugar?

De onde vêm os dados?

Para criar nosso modelo, precisamos de dois tipos de informação:

1 Onde a espécie foi encontrada

GBIF - banco de dados mundial de biodiversidade

  • Reúne registros de museus, herbários e pesquisas
  • Cada registro tem coordenadas (latitude e longitude)

Um mapa gigante com todos os locais onde alguém já encontrou cada espécie.

2 Condições ambientais de cada lugar

WorldClim - 19 variáveis climáticas globais

  • Temperatura média do ano, do mês mais frio, do mais quente...
  • Chuva total do ano, do mês mais seco, do mais chuvoso...

Com esses dados, sabemos as condições de temperatura e chuva em cada ponto do Brasil.

Analogia: o Detetive Ambiental

Vamos pensar no modelo como um detetive investigando onde uma planta gosta de viver.

1 Coletando pistas

Cientista coletando dados

O detetive visita locais onde a planta foi encontrada e anota:

  • Quanto chove?
  • Qual a temperatura?
  • Qual a altitude?

2 Descobrindo padrões

Análise de padrões

Depois de visitar muitos locais, o detetive percebe:

"Essa planta aparece onde chove entre 1000 e 1500 mm por ano e a temperatura fica entre 18 e 25 graus."

3 Fazendo previsões

Mapa de previsão

Agora, mesmo sem visitar um lugar novo, o detetive consegue dizer:

"Olhando as condições deste lugar, há 80% de chance desta planta viver aqui."

4 Reconhecendo limitações

Representação de incerteza

O detetive sabe que não é perfeito. Ele pode não ter considerado competição entre plantas, tipo de solo, dispersores...

"Todos os modelos estão errados, mas alguns são úteis."

Aprendizado de Máquina

Em vez de nós dizermos as regras ao computador, ele descobre as regras sozinho olhando os dados.

Exemplo: nós não dizemos "a planta gosta de chuva entre 1000-1500 mm". O computador descobre isso sozinho ao analisar centenas de pontos.

Como funciona?

Aprendizado de máquina
  1. Mostramos exemplos:
    locais com e sem a espécie
  2. O computador encontra padrões:
    "nos locais com a espécie, a temperatura era entre X e Y"
  3. Fazemos previsões:
    para lugares novos que ele nunca viu

Árvore de Decisão

Funciona como um jogo de perguntas de sim ou não.

Cada pergunta divide os dados em dois grupos, até chegar a uma resposta.

Exemplo: a planta vive aqui?

Árvore de decisão
Temperatura > 20 graus?
├── SIM: Chove > 1200 mm?
│   ├── SIM: Provavelmente VIVE aqui
│   └── NÃO: Provavelmente NÃO vive
└── NÃO: Altitude > 800 m?
    ├── SIM: Talvez viva aqui
    └── NÃO: Provavelmente NÃO vive
              

Cada "pergunta" usa uma variável ambiental para dividir os dados. É como um fluxograma!

Random Forest

"Floresta Aleatória" - é um algoritmo que cria muitas árvores de decisão e combina os resultados de todas elas.

Por que não usar só uma árvore?

Uma árvore vs. floresta

Uma árvore sozinha pode:

  • "Decorar" os dados em vez de aprender padrões reais
  • Dar respostas muito diferentes se mudarmos poucos dados

Uma floresta de árvores diferentes dá respostas mais confiáveis!

Como funciona

  1. Cria muitas árvores (100+), cada uma um pouco diferente
  2. Cada árvore recebe dados e variáveis diferentes
  3. Cada árvore vota: "a espécie vive aqui? Sim ou não?"
  4. Resultado final: maioria dos votos vence, como numa eleição!

Analogia: equipe de detetives

Random Forest é como ter uma equipe de detetives em vez de só um:

O trabalho da equipe

Equipe de detetives
  • Cada detetive recebe pistas diferentes
  • Cada um investiga do seu jeito
  • Para decidir, fazemos uma votação
  • A resposta do grupo é mais confiável do que a de um só

Por que o Random Forest é bom?

  • Acerta bastante: votação entre árvores dá resultados mais precisos
  • Resiste a erros: a maioria das árvores compensa dados ruins
  • Mostra o que importa: quais variáveis foram mais relevantes
  • Versátil: funciona com diferentes tipos de dados

Ajustes do Random Forest

O algoritmo tem alguns "botões de ajuste" que podemos configurar.

Vamos ver os três mais importantes:

Número de árvores

Poucas vs muitas árvores

"Quantos detetives na equipe?"

  • Mais árvores = resultado mais estável
  • Mais árvores = demora mais para calcular
  • Valor comum: 100 a 500

Profundidade das árvores

Árvore rasa vs profunda

"Quantas perguntas cada detetive pode fazer?"

  • Mais perguntas = mais detalhes
  • Perguntas demais = risco de "decorar" em vez de aprender
  • É preciso encontrar o equilíbrio!

Dados de treino vs. dados de teste

Divisão treino-teste

"Guardar uma prova para ver se o modelo acerta"

  • Usamos 70-80% dos dados para ensinar o modelo
  • Guardamos 20-30% para testar se ele realmente aprendeu
  • Isso evita que o modelo "cole na prova"!

E no trabalho do engenheiro florestal?

Modelagem de distribuição é uma ferramenta profissional real, usada em:

Restauração ecológica

Problema: você precisa restaurar uma área degradada. Quais espécies nativas escolher?
  • O modelo indica quais espécies têm aptidão climática para aquele local
  • Com a projeção futura, evita plantar espécies que vão perder habitat em 30 anos

Ex: se a Araucaria angustifolia vai perder área com o aquecimento, vale considerar espécies complementares.

Silvicultura e plantios

Problema: onde plantar para ter melhor produtividade no futuro?
  • Modelos ajudam a prever aptidão de espécies comerciais em cenários futuros
  • Regiões que hoje são ótimas para Eucalyptus podem não ser em 2050
  • Migração de zonas aptas pode abrir novas oportunidades

Licenciamento e consultoria ambiental

Problema: um empreendimento vai impactar a vegetação. Qual o risco para espécies ameaçadas?
  • Estudos de impacto ambiental (EIA) usam SDM para avaliar riscos
  • Mapas de distribuição potencial embasam planos de compensação
  • Órgãos ambientais cada vez mais exigem esse tipo de análise

Unidades de conservação

Problema: onde criar novas áreas protegidas para maior impacto?
  • Modelos identificam áreas de refúgio climático para espécies ameaçadas
  • Ajudam a planejar corredores ecológicos entre fragmentos
  • Priorizam regiões onde a proteção terá mais resultado a longo prazo

Hora da prática: TAIPA

Agora vamos aplicar tudo isso na plataforma TAIPA!

O que vamos fazer no TAIPA

  1. 1 Buscar espécie - baixar pontos de ocorrência
  2. 2 Pseudo-ausências - pontos onde a espécie NÃO está
  3. 3 Variáveis climáticas - selecionar as mais relevantes
  4. 4 Treinar modelo - ensinar o Random Forest
  5. 5 Mapa atual - onde a espécie pode viver hoje
  6. 6 Projeção futura - e com a mudança climática?

O que aprendemos hoje

  • Modelo = versão simplificada da realidade
  • Algoritmo = passo a passo para resolver um problema
  • Aprendizado de máquina = o computador descobre padrões nos dados
  • Random Forest = muitas árvores de decisão votando juntas
  • Modelagem de distribuição = prever onde uma espécie pode viver, hoje e no futuro

Próximos passos

  • Executar modelos no TAIPA
  • Interpretar os mapas de distribuição
  • Comparar cenários de mudança climática
  • Discutir: o que fazer com esses resultados na prática?

Dúvidas?