11-02-02 — OneLake Mirroring: SharePoint, Databricks, Snowflake, SAP, Oracle
Como o Mirroring funciona
flowchart LR
subgraph Fontes Externas
SNF[Snowflake]
ADB[Azure Databricks]
SAP[SAP S/4HANA]
ORA[Oracle]
SQL[SQL Server / Azure SQL]
COSMOS[Azure Cosmos DB]
end
subgraph Fabric Mirroring
CDC[Change Data Capture
por cada fonte] OL[OneLake
Delta Parquet] end SNF & ADB & SAP & ORA & SQL & COSMOS -->|CDC / log-based| CDC CDC --> OL OL --> LH[Lakehouse / Warehouse] OL --> DA[Data Agents] OL --> PBI[Power BI]
por cada fonte] OL[OneLake
Delta Parquet] end SNF & ADB & SAP & ORA & SQL & COSMOS -->|CDC / log-based| CDC CDC --> OL OL --> LH[Lakehouse / Warehouse] OL --> DA[Data Agents] OL --> PBI[Power BI]
Fontes suportadas em 2025
| Fonte | Mecanismo CDC | Latência | Status |
|---|---|---|---|
| Azure SQL Database | CDC nativo SQL Server | < 1 min | GA |
| SQL Server on-premises | CDC + On-prem Gateway | < 5 min | GA |
| Azure Cosmos DB | Change Feed | < 1 min | GA |
| Snowflake | Snowflake Streams | < 5 min | GA |
| Azure Databricks | Delta Sharing | < 5 min | GA (2025) |
| SAP S/4HANA | ODP / ABAP CDC | < 15 min | Preview 2025 |
| Oracle | Oracle Redo Log CDC | < 15 min | Preview 2025 |
Importante para clientes SAP: O Mirroring para SAP usa o framework ODP (Operational Data Provisioning) — o mesmo usado pelo SAP Data Services. A Microsoft anunciou parceria com a SAP para GA do mirroring em H2 2025. Enquanto isso, a alternativa é usar o SAP JDBC connector no Data Factory.
Configurando Mirroring com Snowflake
O caso mais simples para demonstrar o conceito:
- No Fabric Workspace → New → Mirrored Snowflake
- Configurar connection string do Snowflake (account, database, schema)
- Selecionar tabelas para espelhar
- Iniciar — a sincronização inicial pode levar horas para grandes volumes
- Após initial load, CDC mantém sincronizado continuamente
Mirroring vs Pipelines: quando usar cada
| Critério | Mirroring | Pipeline + Copy |
|---|---|---|
| Latência | Minutos (CDC) | Depende do agendamento |
| Transformação | Nenhuma (raw) | Total controle |
| Custo | Incluído na capacidade Fabric | Compute do Spark |
| Complexidade | Mínima (zero-code) | Alta (dev necessário) |
| Fontes suportadas | Lista limitada | Qualquer via JDBC/API |
| Ideal para | Dados transacionais que mudam frequentemente | ETL complexo, transformações |
Estratégia recomendada: Use Mirroring para fontes suportadas (SQL Server, Snowflake, Cosmos) — você ganha CDC grátis. Para SAP, Oracle e sistemas legados não suportados, use Data Factory Pipelines com schedule adequado (batch vs near-realtime).
Shortcut: alternativa ao Mirroring
Para dados que não precisam de CDC mas precisam estar acessíveis no Fabric sem cópia, use OneLake Shortcuts. Um Shortcut é um ponteiro para dados externos (AWS S3, Azure Data Lake, GCS) que aparecem no Fabric como se fossem locais — sem mover os dados.
Mirroring vs Shortcut: Mirroring copia e mantém sincronizado (CDC). Shortcut apenas aponta para os dados (sem cópia, sem CDC). Use Shortcut quando os dados já estão em S3/ADLS e você não quer duplicar. Use Mirroring quando precisa de latência baixa e transformação posterior.