11-02-02 — OneLake Mirroring: SharePoint, Databricks, Snowflake, SAP, Oracle

⏱ 12 minFontes validadas em: 2026-04-29

TL;DR

OneLake Mirroring replica dados de fontes externas para o OneLake em tempo quase-real usando Change Data Capture (CDC) — sem pipelines ETL. É zero-ETL: você configura a conexão e os dados aparecem no Fabric em minutos, atualizados continuamente. Suporta Azure SQL, SQL Server, Snowflake, Azure Cosmos DB, e em 2025 expandiu para Databricks, SAP e Oracle. Para empresas com dados críticos em SAP ou Oracle, isso elimina projetos de integração de meses.

Como o Mirroring funciona

flowchart LR subgraph Fontes Externas SNF[Snowflake] ADB[Azure Databricks] SAP[SAP S/4HANA] ORA[Oracle] SQL[SQL Server / Azure SQL] COSMOS[Azure Cosmos DB] end subgraph Fabric Mirroring CDC[Change Data Capture
por cada fonte] OL[OneLake
Delta Parquet] end SNF & ADB & SAP & ORA & SQL & COSMOS -->|CDC / log-based| CDC CDC --> OL OL --> LH[Lakehouse / Warehouse] OL --> DA[Data Agents] OL --> PBI[Power BI]

Fontes suportadas em 2025

FonteMecanismo CDCLatênciaStatus
Azure SQL DatabaseCDC nativo SQL Server< 1 minGA
SQL Server on-premisesCDC + On-prem Gateway< 5 minGA
Azure Cosmos DBChange Feed< 1 minGA
SnowflakeSnowflake Streams< 5 minGA
Azure DatabricksDelta Sharing< 5 minGA (2025)
SAP S/4HANAODP / ABAP CDC< 15 minPreview 2025
OracleOracle Redo Log CDC< 15 minPreview 2025
Importante para clientes SAP: O Mirroring para SAP usa o framework ODP (Operational Data Provisioning) — o mesmo usado pelo SAP Data Services. A Microsoft anunciou parceria com a SAP para GA do mirroring em H2 2025. Enquanto isso, a alternativa é usar o SAP JDBC connector no Data Factory.

Configurando Mirroring com Snowflake

O caso mais simples para demonstrar o conceito:

  1. No Fabric Workspace → New → Mirrored Snowflake
  2. Configurar connection string do Snowflake (account, database, schema)
  3. Selecionar tabelas para espelhar
  4. Iniciar — a sincronização inicial pode levar horas para grandes volumes
  5. Após initial load, CDC mantém sincronizado continuamente

Mirroring vs Pipelines: quando usar cada

CritérioMirroringPipeline + Copy
LatênciaMinutos (CDC)Depende do agendamento
TransformaçãoNenhuma (raw)Total controle
CustoIncluído na capacidade FabricCompute do Spark
ComplexidadeMínima (zero-code)Alta (dev necessário)
Fontes suportadasLista limitadaQualquer via JDBC/API
Ideal paraDados transacionais que mudam frequentementeETL complexo, transformações
Estratégia recomendada: Use Mirroring para fontes suportadas (SQL Server, Snowflake, Cosmos) — você ganha CDC grátis. Para SAP, Oracle e sistemas legados não suportados, use Data Factory Pipelines com schedule adequado (batch vs near-realtime).

Shortcut: alternativa ao Mirroring

Para dados que não precisam de CDC mas precisam estar acessíveis no Fabric sem cópia, use OneLake Shortcuts. Um Shortcut é um ponteiro para dados externos (AWS S3, Azure Data Lake, GCS) que aparecem no Fabric como se fossem locais — sem mover os dados.

Mirroring vs Shortcut: Mirroring copia e mantém sincronizado (CDC). Shortcut apenas aponta para os dados (sem cópia, sem CDC). Use Shortcut quando os dados já estão em S3/ADLS e você não quer duplicar. Use Mirroring quando precisa de latência baixa e transformação posterior.

Como isso se conecta

  • 11-01-03 — Dados espelhados chegam na camada Bronze da Medallion
  • 11-03-04 — Dados do Fabric (incluindo espelhados) são acessíveis pelo Azure AI Foundry
  • 11-04-02 — O desafio usa pipeline (SAP ainda em Preview para Mirroring)

Fontes

  1. Microsoft Learn — Mirroring in Microsoft Fabric
  2. Microsoft Learn — Mirror Snowflake in Fabric
  3. Microsoft Learn — OneLake shortcuts