OneLake es el almacenamiento único de tu tenant de Fabric: un solo data lake lógico para toda la organización. Esa es su fuerza y, si no lo ordenas pronto, también su talón de Aquiles. La estructura que decidas el primer día es la que arrastrarás durante años.
Piensa en dominios, no en carpetas
Antes de crear nada, dibuja los dominios de negocio: ventas, finanzas, operaciones. Cada dominio agrupa los workspaces de un área y define quién es dueño de qué. Es la unidad de gobierno, no una carpeta más.
Un workspace por proyecto y entorno
Resiste la tentación de meterlo todo en un workspace gigante. Separa por proyecto y por entorno (dev, test, prod). Así aíslas permisos, despliegues y costes, y el día que conectes Git no tendrás que desenredar nada.
Nombra los workspaces con un prefijo de dominio y entorno: ventas-prod, ventas-dev. El orden alfabético te lo agradecerá cuando tengas cuarenta.
Shortcuts en vez de copias
La mejor copia es la que no existe. Con shortcuts referencias datos que viven en otro lakehouse —o incluso en S3 o ADLS— sin duplicarlos. Una sola fuente de verdad, cero pipelines de copia y menos factura de almacenamiento.
- Usa shortcuts para compartir tablas Gold entre dominios.
- Evita encadenar shortcuts de shortcuts: el linaje se vuelve ilegible.
- Documenta de dónde apunta cada uno; tu yo del futuro no lo recordará.
Lo que no debes hacer
- No mezcles capas (bronze/silver/gold) de proyectos distintos en el mismo lakehouse.
- No uses el workspace personal para nada que tenga que sobrevivir a tu portátil.
- No abras permisos a nivel de tenant “para ir rápido”: es la deuda técnica más cara que existe.
Con dominios claros, workspaces por entorno y shortcuts en lugar de copias, tu OneLake escala sin convertirse en un pantano. En el siguiente artículo automatizamos la ingesta con pipelines incrementales.
Kilian Baccaro Salinas
Arquitecto de Datos especializado en Microsoft Fabric.