1. Introduction
1. Introducción
Understand the foundation: what a data catalog is, why it matters, and the business value it delivers.
Comprende las bases: qué es un catálogo de datos, por qué importa y el valor de negocio que entrega.
1.1 What is a Data Catalog?
1.1 ¿Qué es un catálogo de datos?
A data catalog is an organized inventory of all the information assets inside an organization — tables, views, dashboards, KPIs, reports, and datasets. It acts as a single source of truth that answers the most common data questions: What data do we have? What does this field mean? Who owns it? Where does it come from?
Un catálogo de datos es un inventario organizado de todos los activos de información de una organización: tablas, vistas, dashboards, KPIs, reportes y datasets. Funciona como fuente única de verdad que responde las preguntas más frecuentes sobre datos: ¿Qué datos tenemos? ¿Qué significa este campo? ¿Quién lo posee? ¿De dónde viene?
1.2 Why Organizations Need a Data Catalog
1.2 Por qué las organizaciones necesitan un catálogo de datos
As organizations grow, data becomes scattered across dozens of databases, dashboards, and tools. Without a catalog, teams face recurring problems:
A medida que las organizaciones crecen, los datos se dispersan en decenas de bases de datos, dashboards y herramientas. Sin un catálogo, los equipos enfrentan problemas recurrentes:
- Data silos: each team keeps its own private copy of information.
- Duplicated effort: analysts spend 60–80% of their time finding and cleaning data instead of analyzing it.
- Broken trust: inconsistent definitions generate conflicting reports.
- Compliance risk: no visibility over sensitive data or who accesses it.
- Slow onboarding: new team members need weeks to understand the data landscape.
- Silos de datos: cada equipo mantiene su propia copia privada de la información.
- Esfuerzo duplicado: los analistas gastan el 60–80% de su tiempo buscando y limpiando datos en vez de analizarlos.
- Pérdida de confianza: definiciones inconsistentes generan reportes contradictorios.
- Riesgo de compliance: sin visibilidad sobre datos sensibles ni quién los accede.
- Onboarding lento: los nuevos integrantes tardan semanas en entender el ecosistema de datos.
1.3 Benefits of Centralized Metadata Management
1.3 Beneficios de la gestión centralizada de metadatos
| Benefit | Impact | Beneficio | Impacto |
|---|---|---|---|
| Discoverability | Anyone can find any data asset in seconds using search and filters. | Descubribilidad | Cualquier persona puede encontrar cualquier activo en segundos con búsqueda y filtros. |
| Shared definitions | Business glossaries align teams on what each term means. | Definiciones compartidas | Los glosarios de negocio alinean a los equipos sobre qué significa cada término. |
| Governance | Ownership, sensitivity, and audit logs create accountability. | Gobernanza | La propiedad, sensibilidad e historial de auditoría crean responsabilidad. |
| Lineage visibility | Understand the full journey of data from source to report. | Visibilidad de linaje | Entiende el recorrido completo de los datos desde el origen hasta el reporte. |
| Quality awareness | Data Quality Scores highlight which assets need attention. | Conciencia de calidad | Los scores de calidad destacan qué activos necesitan atención. |
2. What is Metaustral?
2. ¿Qué es Metaustral?
Enterprise-grade data governance — without the enterprise price tag or months of implementation.
Gobernanza de datos de nivel enterprise — sin el precio enterprise ni meses de implementación.
2.1 The Problem We Solve
2.1 El problema que resolvemos
Traditional data catalog tools were built for large enterprises with dedicated data engineering teams, six-figure budgets, and months to spare for implementation. The result: most mid-sized companies simply go without — their data remains undocumented, ungoverned, and inaccessible to the people who need it most.
Las herramientas tradicionales de catálogo de datos fueron construidas para grandes empresas con equipos de ingeniería de datos dedicados, presupuestos de seis cifras y meses disponibles para la implementación. El resultado: la mayoría de las empresas medianas simplemente prescinden de ellas — sus datos quedan sin documentar, sin gobernar e inaccesibles para quienes más los necesitan.
Metaustral changes that equation. It delivers the same capabilities — automated discovery, lineage mapping, data quality scoring, audit trails, AI-powered search — in a product you can set up in minutes and that your entire team can use on day one without training.
Metaustral cambia esa ecuación. Entrega las mismas capacidades — descubrimiento automatizado, mapeo de linaje, scoring de calidad, historial de auditoría, búsqueda con IA — en un producto que puedes configurar en minutos y que todo tu equipo puede usar desde el primer día sin necesidad de capacitación.
2.2 Why Metaustral?
2.2 ¿Por qué Metaustral?
| What others charge for | Lo que otros cobran | How Metaustral delivers it | Cómo lo entrega Metaustral |
|---|---|---|---|
| 6–12 months of implementation | 6–12 meses de implementación | Operational in minutes — no professional services required | Operativo en minutos — sin servicios profesionales |
| Dedicated data engineering team to maintain it | Equipo de ingeniería de datos dedicado para mantenerlo | Any admin can manage it from a single web panel | Cualquier administrador lo gestiona desde un panel web |
| Enterprise licenses starting at $50,000/year | Licencias enterprise desde $50,000/año | Plans starting free — scale as you grow | Planes desde gratuito — escala a medida que creces |
| Complex integrations and vendor lock-in | Integraciones complejas y dependencia del proveedor | Connect to your existing databases in one click | Conecta tus bases de datos existentes en un clic |
| Months of user training | Meses de capacitación de usuarios | Intuitive UI — analysts are productive on day one | UI intuitiva — los analistas son productivos desde el día uno |
2.3 Plans & Limits
2.3 Planes y límites
| Plan | Data Assets | Activos de datos | DB Connections | Conexiones BD | Users | Usuarios |
|---|---|---|---|---|---|---|
| Free Free | Up to 20 | Hasta 20 | None | Ninguna | 1 admin | 1 admin |
| Starter Starter | Up to 300 | Hasta 300 | 1 | 1 | Up to 3 | Hasta 3 |
| Pro Pro | Up to 5,000 | Hasta 5.000 | Unlimited | Ilimitadas | Up to 30 | Hasta 30 |
| Enterprise Enterprise | Unlimited + AI + On-Premise Agent | Ilimitados + IA + Agente on-premise | Unlimited | Ilimitadas | Unlimited | Ilimitados |
2.4 Typical Use Cases
2.4 Casos de uso típicos
- Data governance programs: assign owners, stewards, and sensitivity to every asset — without a dedicated data governance tool costing six figures.
- Self-service analytics: enable analysts to find and understand datasets without asking the data team, reducing back-and-forth by hours each week.
- Regulatory compliance: track sensitive PII columns and audit every change with a full log — ready for SOX, GDPR, or HIPAA reviews.
- Onboarding acceleration: new team members explore the catalog to understand the data landscape in hours, not weeks — saving days of senior engineer time.
- Impact analysis: use data lineage to understand which reports break when a source table changes, before making the change.
- Metadata synchronization: keep the catalog up to date automatically with scheduled imports — no manual work required.
- Programas de gobernanza de datos: asigna propietarios, administradores y sensibilidad a cada activo — sin una herramienta de gobernanza dedicada que cueste seis cifras.
- Analytics de autoservicio: permite que los analistas encuentren y entiendan datasets sin preguntarle al equipo de datos, reduciendo el intercambio de mensajes en horas por semana.
- Compliance regulatorio: rastrea columnas PII sensibles y audita cada cambio con un registro completo — listo para revisiones SOX, GDPR o HIPAA.
- Aceleración del onboarding: los nuevos integrantes exploran el catálogo para entender el ecosistema en horas, no semanas — ahorrando días de tiempo de ingenieros senior.
- Análisis de impacto: usa el linaje de datos para entender qué reportes se rompen cuando cambia una tabla de origen, antes de hacer el cambio.
- Sincronización de metadatos: mantén el catálogo actualizado automáticamente con importaciones programadas — sin trabajo manual.
3. Getting Started
3. Primeros pasos
Go from zero to your first documented data asset in under 5 minutes.
De cero a tu primer activo de datos documentado en menos de 5 minutos.
3.1 Create Your Account
3.1 Crea tu cuenta
Go to the registration page
Entra a la página de registro
Visit /register and fill in your company name, email, and password. Each registration creates an isolated workspace (tenant) for your organization.
Visita /register y completa tu nombre de empresa, correo y contraseña. Cada registro crea un espacio de trabajo aislado (tenant) para tu organización.
Sign in
Inicia sesión
Use your email and password at /login. The platform issues a 30-minute access token (auto-refreshed) and a 7-day refresh token stored locally.
Usa tu correo y contraseña en /login. La plataforma emite un token de acceso de 30 minutos (auto-renovado) y un token de refresco de 7 días almacenado localmente.
Access the Admin panel
Accede al panel de administración
As the account creator, you have the Admin role. Navigate to /admin to manage users, connections, and catalog settings.
Como creador de la cuenta, tienes el rol de Admin. Navega a /admin para gestionar usuarios, conexiones y configuración del catálogo.
3.2 Create Your First Data Asset
3.2 Crea tu primer activo de datos
From the catalog view (/app), click + New. Choose an asset type (Table, Dashboard, KPI, etc.), fill in the name, description, owner, domain, and tags, then save. Your first asset is now in the catalog.
Desde la vista del catálogo (/app), haz clic en + Nuevo. Elige un tipo de activo (Tabla, Dashboard, KPI, etc.), completa el nombre, descripción, propietario, dominio y etiquetas, y guarda. Tu primer activo ya está en el catálogo.
3.3 Invite Users
3.3 Invita usuarios
From the Admin panel, go to the Users tab. Enter an email, choose a role (Admin, Editor, or Viewer) and send the invite. User limits depend on your plan (3 on Starter, 30 on Pro, unlimited on Enterprise).
Desde el panel de administración, ve a la pestaña Usuarios. Ingresa un correo, elige un rol (Admin, Editor o Viewer) y envía la invitación. Los límites de usuarios dependen de tu plan (3 en Starter, 30 en Pro, ilimitados en Enterprise).
3.4 Explore the Catalog
3.4 Explora el catálogo
The catalog view (/app) lets you search by name, filter by asset type, status, domain, or tag. Click any asset to open its detail page with full metadata, column documentation, lineage graph, and quality score.
La vista del catálogo (/app) te permite buscar por nombre, filtrar por tipo de activo, estado, dominio o etiqueta. Haz clic en cualquier activo para abrir su página de detalle con metadatos completos, documentación de columnas, grafo de linaje y score de calidad.
4. Data Assets
4. Activos de datos
The core objects of the catalog — everything you document, discover, and govern.
Los objetos centrales del catálogo — todo lo que documentas, descubres y gobiernas.
4.1 Asset Types
4.1 Tipos de activos
| Type | Tipo | Description | Descripción | Has columns | Tiene columnas |
|---|---|---|---|---|---|
TABLE | TABLE |
Database table | Tabla de base de datos | Yes | Sí |
VIEW | VIEW |
Database view | Vista de base de datos | Yes | Sí |
DASHBOARD | DASHBOARD |
BI visualization panel | Panel de visualización BI | No | No |
KPI | KPI |
Key performance indicator | Indicador clave de rendimiento | No | No |
REPORT | REPORT |
Report or document | Reporte o documento | No | No |
DATASET | DATASET |
Generic dataset (file, API, etc.) | Dataset genérico (archivo, API, etc.) | No | No |
4.2 Asset Lifecycle
4.2 Ciclo de vida del activo
Asset lifecycle: draft → active → deprecated → archived
Ciclo de vida: borrador → activo → deprecado → archivado
4.3 Asset Ownership
4.3 Propiedad del activo
- Owner: the person (or team) responsible for producing and maintaining the data.
- Steward: the person responsible for ensuring metadata quality and documentation accuracy.
- Propietario (Owner): la persona (o equipo) responsable de producir y mantener el dato.
- Administrador de datos (Steward): la persona responsable de asegurar la calidad de los metadatos y la exactitud de la documentación.
4.4 Tags, Domain & Classification
4.4 Etiquetas, dominio y clasificación
- Tags: free-form labels for filtering (e.g.
finance,pii). - Domain: the business area the asset belongs to (e.g. Sales, Marketing, HR).
- Category: a sub-grouping within a domain.
- Sensitivity: one of
public,internal,confidential, orrestricted.
- Etiquetas (Tags): etiquetas de forma libre para filtrado (ej:
finanzas,pii). - Dominio: el área de negocio a la que pertenece el activo (ej: Ventas, Marketing, RRHH).
- Categoría: una sub-agrupación dentro de un dominio.
- Sensibilidad: una de
public,internal,confidentialorestricted.
5. Import Wizard
5. Import Wizard
Bulk-create or update assets, columns, lineage, and ERD relationships in one step — from a single Excel file.
Crea o actualiza activos, columnas, linaje y relaciones ERD en un solo paso — desde un único archivo Excel.
5.1 What is the Import Wizard?
5.1 ¿Qué es el Import Wizard?
The Import Wizard lets you populate your data catalog in bulk using a structured Excel template (.xlsx). Instead of creating assets one by one through the UI, you can prepare hundreds of records in a spreadsheet and import them in a single operation. It is available to all plans — no database connection required.
El Import Wizard te permite poblar tu catálogo de datos de forma masiva usando una plantilla Excel estructurada (.xlsx). En lugar de crear activos uno por uno desde la interfaz, puedes preparar cientos de registros en una hoja de cálculo e importarlos en una sola operación. Está disponible para todos los planes — sin necesidad de conexión a base de datos.
5.2 Excel Template Structure
5.2 Estructura de la plantilla Excel
Download the template from the Import Wizard tab ( in the sidebar). It contains five sheets:
Descarga la plantilla desde la pestaña Import Wizard ( en el menú lateral). Contiene cinco hojas:
- Assets — required fields:
asset_name,asset_type. Supports all 6 asset types: TABLE, VIEW, DASHBOARD, KPI, REPORT, DATASET. - Columns — required fields:
asset_name,asset_type,column_name. Documents schema columns for TABLE and VIEW assets. - Lineage — required fields:
source_asset,target_asset. Usesource_type/source_databasewhen asset names are ambiguous. - ERD — required fields:
source_table,target_table. Defines foreign-key relationships between tables. - Instructions (EN / ES) — embedded reference guide with field descriptions and examples.
- Assets — campos requeridos:
asset_name,asset_type. Soporta los 6 tipos de activo: TABLE, VIEW, DASHBOARD, KPI, REPORT, DATASET. - Columns — campos requeridos:
asset_name,asset_type,column_name. Documenta las columnas de esquema de activos TABLE y VIEW. - Lineage — campos requeridos:
source_asset,target_asset. Usasource_type/source_databasecuando los nombres de activos sean ambiguos. - ERD — campos requeridos:
source_table,target_table. Define relaciones de clave foránea entre tablas. - Instrucciones (EN / ES) — guía de referencia embebida con descripción de campos y ejemplos.
5.3 Preview & Validation
5.3 Previsualización y validación
After uploading, the wizard shows a preview before any data is written to the catalog. The preview screen displays:
Tras subir el archivo, el wizard muestra una previsualización antes de escribir ningún dato en el catálogo. La pantalla de previsualización muestra:
- A summary count of new assets to create, assets to update, columns, lineage rows, ERD rows, and errors.
- A table of assets to create (green) and assets to update (blue), with the affected fields listed.
- Any row-level errors that must be fixed before the import can run — for example, an invalid asset type, a missing required field, or an ambiguous asset name.
- Un resumen con el conteo de activos nuevos a crear, activos a actualizar, columnas, filas de linaje, filas de ERD y errores.
- Una tabla de activos a crear (verde) y activos a actualizar (azul), con los campos afectados listados.
- Cualquier error a nivel de fila que deba corregirse antes de ejecutar la importación — por ejemplo, tipo de activo inválido, campo requerido faltante o nombre de activo ambiguo.
5.4 Merge Rules
5.4 Reglas de fusión
- Match logic: an asset is matched by
name+type. For TABLE and VIEW,database_nameis an additional tie-breaker. - Update, never overwrite with blank: if a cell in the Excel is empty, the existing catalog value is kept. Only non-blank cells update the catalog.
- Ambiguity error: if two assets share the same name and type and no
database_nameis provided, the wizard raises an error — adddatabase_nameto disambiguate. - Lineage & ERD deduplication: rows that already exist in the catalog are silently skipped — no duplicates are created.
- Same-file dependencies: you can import columns, lineage, and ERD for assets being created in the same Excel file — the wizard resolves them in the correct order.
- Lógica de coincidencia: un activo se identifica por
nombre+tipo. Para TABLE y VIEW,database_namees un desempate adicional. - Actualizar, nunca sobreescribir con vacío: si una celda en el Excel está vacía, se conserva el valor existente en el catálogo. Solo las celdas no vacías actualizan el catálogo.
- Error de ambigüedad: si dos activos comparten nombre y tipo y no se provee
database_name, el wizard genera un error — agregadatabase_namepara desambiguar. - Deduplicación de Lineage y ERD: las filas que ya existen en el catálogo se omiten silenciosamente — no se crean duplicados.
- Dependencias en el mismo archivo: puedes importar columnas, linaje y ERD para activos que se crean en el mismo Excel — el wizard los resuelve en el orden correcto.
5.5 Audit Log
5.5 Registro de auditoría
Every Import Wizard execution is recorded in the audit log. Each created or updated asset generates an individual CREATE or UPDATE entry, and a single IMPORT batch summary entry captures the full operation totals. This lets administrators trace exactly what was imported, by whom, and when.
Cada ejecución del Import Wizard queda registrada en el historial de auditoría. Cada activo creado o actualizado genera una entrada individual de CREATE o UPDATE, y una entrada resumen de tipo IMPORT captura los totales de la operación completa. Esto permite a los administradores rastrear exactamente qué se importó, quién lo hizo y cuándo.
6. Metadata Discovery
6. Descubrimiento de metadatos
Connect your databases and let Metaustral automatically discover tables, views, and columns.
Conecta tus bases de datos y deja que Metaustral descubra automáticamente tablas, vistas y columnas.
5.1 Supported Data Sources
5.1 Fuentes de datos soportadas
| Engine | Motor | Default port | Puerto | Auth method | Autenticación |
|---|---|---|---|---|---|
| SQL Server | SQL Server | 1433 | 1433 | Username + Password | Usuario + Contraseña |
| MySQL | MySQL | 3306 | 3306 | Username + Password | Usuario + Contraseña |
| PostgreSQL | PostgreSQL | 5432 | 5432 | Username + Password | Usuario + Contraseña |
| Snowflake | Snowflake | 443 | 443 | Username + Password + Warehouse + Role | Usuario + Contraseña + Warehouse + Rol |
| BigQuery | BigQuery | — | — | Service Account JSON key | JSON de cuenta de servicio |
| Databricks | Databricks | 443 | 443 | Host + HTTP Path + Personal Access Token | Host + HTTP Path + Token de acceso personal |
5.2 Connecting a Database
5.2 Conectar una base de datos
Open Connections
Abre Conexiones
In the Admin panel (/admin), go to Connections → New connection.
En el panel de administración (/admin), ve a Conexiones → Nueva conexión.
Fill in credentials
Completa las credenciales
Select the engine type and enter host, port, database, and credentials. Passwords are encrypted with Fernet symmetric encryption before being saved — never stored in plain text.
Selecciona el tipo de motor e ingresa host, puerto, base de datos y credenciales. Las contraseñas se cifran con Fernet antes de guardarse — nunca en texto plano.
Test the connection
Prueba la conexión
Click Test connection. Metaustral runs a SELECT 1 query and reports success or the error detail.
Haz clic en Probar conexión. Metaustral ejecuta una consulta SELECT 1 e informa el resultado o el detalle del error.
Discover and import
Descubre e importa
Use Discovery to browse schemas → tables → columns. Select what to import and click Import to catalog.
Usa Descubrimiento para navegar esquemas → tablas → columnas. Selecciona qué importar y haz clic en Importar al catálogo.
Discovery flow: your database → Metaustral engine → catalog assets
Flujo de descubrimiento: tu base de datos → motor Metaustral → activos del catálogo
5.3 Automatic Metadata Discovery
5.3 Descubrimiento automático de metadatos
Metaustral reads the INFORMATION_SCHEMA of your database to discover tables, views, and their columns. For Databricks, it supports both Unity Catalog (3-level namespace: catalog.schema.table) and the legacy Hive metastore. No data is ever read from your tables — only schema definitions.
Metaustral lee el INFORMATION_SCHEMA de tu base de datos para descubrir tablas, vistas y sus columnas. Para Databricks, soporta tanto Unity Catalog (espacio de nombres de 3 niveles: catalog.schema.table) como el metastore Hive legacy. Nunca se leen datos de tus tablas — solo definiciones de esquema.
5.4 Scheduled Synchronization
5.4 Sincronización programada
Create import schedules to keep your catalog synchronized automatically. Each run uses a smart merge: new tables are created, existing ones updated, and tables no longer present in the source are marked inactive (not deleted). Available frequencies: Daily, Weekly (selected day), Monthly (selected day).
Crea programaciones de importación para mantener tu catálogo sincronizado automáticamente. Cada ejecución usa una estrategia de fusión inteligente (smart merge): las tablas nuevas se crean, las existentes se actualizan, y las tablas que ya no están en el origen se marcan inactivas (no se eliminan). Frecuencias disponibles: Diaria, Semanal (día seleccionado), Mensual (día seleccionado).
6. Data Lineage
6. Linaje de datos
Trace data as it flows from source tables to dashboards and reports.
Rastrea los datos a medida que fluyen desde las tablas de origen hasta dashboards y reportes.
6.1 What is Data Lineage?
6.1 ¿Qué es el linaje de datos?
Data lineage is the documented history of how data moves and transforms across systems. It answers: "This KPI is broken — which upstream table did it come from?" or "If I change this table, which dashboards will be affected?"
El linaje de datos es el historial documentado de cómo los datos se mueven y transforman a través de los sistemas. Responde: "Este KPI está roto — ¿de qué tabla upstream proviene?" o "Si cambio esta tabla, ¿qué dashboards se verán afectados?"
6.2 How Lineage Works in Metaustral
6.2 Cómo funciona el linaje en Metaustral
Lineage is expressed as directed edges between catalog assets. Each edge has a source, a target, an optional transformation type (e.g. "ETL", "SQL view", "dbt model"), and a free-text description. From any asset's detail page, you can view both upstream and downstream dependencies. Editors and above can create or delete lineage edges.
El linaje se expresa como aristas dirigidas entre activos del catálogo. Cada arista tiene un origen, un destino, un tipo de transformación opcional (ej: "ETL", "SQL view", "dbt model") y una descripción de texto libre. Desde la página de detalle de cualquier activo, puedes ver tanto las dependencias upstream como downstream. Los editores y superiores pueden crear o eliminar aristas de linaje.
Example: raw table → aggregated view → KPI and dashboard → report
Ejemplo: tabla cruda → vista agregada → KPI y dashboard → reporte
6.3 Business Benefits
6.3 Beneficios de negocio
- Impact analysis: before changing a table, see which downstream assets depend on it.
- Root cause analysis: when a report breaks, trace the data pipeline upstream to find the issue.
- Compliance: demonstrate the full chain of data movement for sensitive datasets.
- Trust: analysts understand where their numbers come from.
- Análisis de impacto: antes de cambiar una tabla, ve qué activos downstream dependen de ella.
- Análisis de causa raíz: cuando un reporte falla, rastrea el pipeline de datos upstream para encontrar el origen del problema.
- Compliance: demuestra la cadena completa de movimiento de datos para datasets sensibles.
- Confianza: los analistas entienden de dónde vienen sus números.
7. ERD Diagrams
7. Diagramas ERD
Visualize foreign-key relationships between tables as auto-generated entity-relationship diagrams.
Visualiza relaciones de clave foránea entre tablas como diagramas entidad-relación generados automáticamente.
7.1 What is an ERD?
7.1 ¿Qué es un ERD?
An Entity Relationship Diagram (ERD) shows how database tables are connected through foreign-key constraints. It answers questions like "Which tables reference the customers table?" or "What does the orders schema look like structurally?" An ERD is the fastest way to onboard new team members on a database schema and to document the data model for compliance or architecture review.
Un Diagrama Entidad-Relación (ERD) muestra cómo las tablas de base de datos están conectadas a través de restricciones de clave foránea. Responde preguntas como "¿Qué tablas referencian la tabla customers?" o "¿Cómo es la estructura del esquema de orders?" Un ERD es la forma más rápida de incorporar nuevos miembros del equipo a un esquema de base de datos y documentar el modelo de datos para compliance o revisión arquitectónica.
7.2 ERDs in Metaustral
7.2 ERDs en Metaustral
ERD diagrams appear on the detail page of TABLE assets only — as a dedicated ERD tab between Lineage and Glossary. Relations are stored in a separate erd_relations table, independent of the lineage graph, so adding or deleting ERD edges never affects your lineage data.
Los diagramas ERD aparecen en la página de detalle de activos tipo TABLE únicamente — como una pestaña ERD dedicada entre Linaje y Glosario. Las relaciones se almacenan en una tabla separada erd_relations, independiente del grafo de linaje, de modo que agregar o eliminar aristas ERD nunca afecta los datos de linaje.
Example ERD: customers → orders → order_items ← products
Ejemplo de ERD: customers → orders → order_items ← products
7.3 Automatic FK Detection
7.3 Detección automática de FK
When you import tables from a connected database, Metaustral automatically detects foreign-key constraints and creates ERD relations for them. Detected relations are marked with an AUTO badge. Detection is supported for:
Al importar tablas desde una base de datos conectada, Metaustral detecta automáticamente las restricciones de clave foránea y crea relaciones ERD para ellas. Las relaciones detectadas se marcan con un badge AUTO. La detección es compatible con:
- SQL Server — via
sys.foreign_key_columns - MySQL — via
INFORMATION_SCHEMA.KEY_COLUMN_USAGE - PostgreSQL — via
information_schema.table_constraints
- SQL Server — vía
sys.foreign_key_columns - MySQL — vía
INFORMATION_SCHEMA.KEY_COLUMN_USAGE - PostgreSQL — vía
information_schema.table_constraints
7.4 Manual Relations
7.4 Relaciones manuales
Editors and admins can add relations manually from the ERD tab. Click + Add relation, search for the related table, optionally specify the FK and PK column names, choose a cardinality type (many-to-one, one-to-many, one-to-one, many-to-many), and optionally add a label. Manually added relations are marked with a MANUAL badge and can be deleted at any time.
Los editores y administradores pueden agregar relaciones manualmente desde la pestaña ERD. Haz clic en + Agregar relación, busca la tabla relacionada, especifica opcionalmente los nombres de las columnas FK y PK, elige un tipo de cardinalidad (muchos a uno, uno a muchos, uno a uno, muchos a muchos) y agrega opcionalmente una etiqueta. Las relaciones agregadas manualmente se marcan con un badge MANUAL y pueden eliminarse en cualquier momento.
8. Glossaries
8. Glosarios
Define shared business terminology and link it directly to catalog assets.
Define la terminología de negocio compartida y vincúlala directamente a los activos del catálogo.
8.1 What are Glossaries?
8.1 ¿Qué son los glosarios?
A business glossary is a collection of standardized term definitions used across your organization. Without one, the same concept can mean different things to different teams — "active customer" might be defined differently by Marketing, Sales, and Finance, leading to conflicting reports.
Un glosario de negocio es una colección de definiciones estandarizadas de términos usados en toda la organización. Sin uno, el mismo concepto puede significar cosas diferentes para distintos equipos — "cliente activo" puede estar definido de manera diferente por Marketing, Ventas y Finanzas, generando reportes contradictorios.
8.2 How Glossaries Work in Metaustral
8.2 Cómo funcionan los glosarios en Metaustral
Each glossary has a name, an optional description, and a list of terms — each term has a name and a definition. Glossaries are created and managed from the Admin panel. Any catalog asset can be linked to a glossary, so its terms appear directly on the asset's detail page.
Cada glosario tiene un nombre, una descripción opcional y una lista de términos — cada término tiene un nombre y una definición. Los glosarios se crean y gestionan desde el panel de administración. Cualquier activo del catálogo puede vincularse a un glosario, y sus términos aparecen directamente en la página de detalle del activo.
9. Data Quality Score
9. Score de calidad de datos
An automatic completeness score that shows how well each asset is documented.
Un score de completitud automático que muestra qué tan bien está documentado cada activo.
9.1 Why It Matters
9.1 Por qué importa
A catalog with undocumented assets provides little value. The Data Quality Score gives every asset a 0–100 score based on metadata completeness, making it easy to prioritize documentation efforts and surface assets that need attention. The Admin dashboard shows the overall tenant quality score — the average across all assets in your workspace.
Un catálogo con activos sin documentar aporta poco valor. El Score de calidad asigna a cada activo un score de 0 a 100 basado en la completitud de sus metadatos, facilitando la priorización del esfuerzo de documentación. El dashboard de administración muestra el score general del tenant — el promedio de todos los activos en tu espacio de trabajo.
9.2 Score Calculation
9.2 Cálculo del score
| Field | Campo | Points | Puntos | Condition | Condición |
|---|---|---|---|---|---|
| Description | Descripción | 25 | 25 | Present and >10 characters | Presente y de más de 10 caracteres |
| Owner name | Nombre del propietario | 20 | 20 | Not empty | No vacío |
| Domain | Dominio | 15 | 15 | Not empty | No vacío |
| Column documentation (TABLE / VIEW only) |
Documentación de columnas (solo TABLE / VIEW) |
15 | 15 | Proportional to % of columns with descriptions | Proporcional al % de columnas con descripción |
| Steward name | Nombre del steward | 10 | 10 | Not empty | No vacío |
| Category | Categoría | 10 | 10 | Not empty | No vacío |
| Tags | Etiquetas | 5 | 5 | At least one tag | Al menos una etiqueta |
10. Audit History Pro Enterprise
10. Historial de auditoría Pro Enterprise
A complete log of every write action in your workspace.
Un registro completo de cada acción de escritura en tu espacio de trabajo.
10.1 What is Tracked
10.1 Qué se registra
Every create, update, and delete action on catalog assets is recorded with: action type (e.g. create_item, update_item), resource type and ID, the user email who performed it, a JSON payload with field values, and an exact UTC timestamp. Logs are filterable by action and resource type and paginated up to 200 records per request.
Cada acción de creación, actualización y eliminación en los activos del catálogo se registra con: tipo de acción (ej: create_item, update_item), tipo de recurso e ID, el correo del usuario que la realizó, un payload JSON con los valores de campo, y un timestamp UTC exacto. Los logs se pueden filtrar por acción y tipo de recurso, paginados hasta 200 registros por solicitud.
10.2 How Audit Logs Help Governance
10.2 Cómo los logs de auditoría ayudan a la gobernanza
- Accountability: every change has a named actor and timestamp — no anonymous modifications.
- Regulatory compliance: demonstrate to auditors (SOX, GDPR, HIPAA) that changes to sensitive data assets are tracked.
- Incident investigation: the audit log tells you exactly who changed what and when.
- Responsabilidad: cada cambio tiene un actor identificado y un timestamp — sin modificaciones anónimas.
- Compliance regulatorio: demuestra a los auditores (SOX, GDPR, HIPAA) que los cambios en activos sensibles están rastreados.
- Investigación de incidentes: el log de auditoría dice exactamente quién cambió qué y cuándo.
11. User Roles & Permissions
11. Roles de usuario y permisos
Control who can see, edit, and manage data in your workspace.
Controla quién puede ver, editar y gestionar datos en tu espacio de trabajo.
- Browse catalog
- Search assets
- View asset details
- View lineage
- View glossaries
- Explorar catálogo
- Buscar activos
- Ver detalles del activo
- Ver linaje
- Ver glosarios
- All Viewer actions
- Create / edit assets
- Manage columns
- Create lineage edges
- Manage glossaries
- Todo lo de Viewer
- Crear / editar activos
- Gestionar columnas
- Crear aristas de linaje
- Gestionar glosarios
- All Editor actions
- Delete assets
- Manage users
- Manage DB connections
- View audit logs
- Configure discovery
- Todo lo de Editor
- Eliminar activos
- Gestionar usuarios
- Gestionar conexiones
- Ver logs de auditoría
- Configurar descubrimiento
| Action | Acción | Viewer | Editor | Admin |
|---|---|---|---|---|
| Browse catalog | Explorar catálogo | |||
| Create / edit assets | Crear / editar activos | |||
| Delete assets | Eliminar activos | |||
| Manage lineage | Gestionar linaje | |||
| Manage glossaries | Gestionar glosarios | |||
| Manage users | Gestionar usuarios | |||
| Configure connections | Configurar conexiones | |||
| View audit logs | Ver logs de auditoría | |||
| Use AI module | Usar módulo de IA | Enterprise | ||
12. AI Module Enterprise
12. Módulo de IA Enterprise
Ask questions about your catalog in natural language and get instant, context-aware answers.
Haz preguntas sobre tu catálogo en lenguaje natural y obtén respuestas instantáneas con contexto.
12.1 Natural Language Search
12.1 Búsqueda en lenguaje natural
Instead of navigating filters, you can ask the AI assistant questions like you would ask a colleague. The assistant has full context of your catalog — all asset names, types, descriptions, owners, tags, and glossary terms — and answers based on what is actually documented in your workspace.
En vez de navegar filtros, puedes hacerle preguntas al asistente de IA como se las harías a un colega. El asistente tiene contexto completo de tu catálogo — todos los nombres de activos, tipos, descripciones, propietarios, etiquetas y términos del glosario — y responde basándose en lo que está realmente documentado en tu espacio de trabajo.
"Which tables contain customer data?"
"What is the source of the Monthly Revenue KPI?"
"Show me all assets owned by the Finance team."
"Which tables are marked as confidential?"
"¿Qué tablas contienen datos de clientes?"
"¿Cuál es el origen del KPI de Ingresos Mensuales?"
"Muéstrame todos los activos del equipo de Finanzas."
"¿Qué tablas están marcadas como confidenciales?"
12.2 How it Works
12.2 Cómo funciona
When you submit a question, Metaustral builds a context snapshot of your catalog and sends it along with your question to Claude Haiku (Anthropic). The model returns a natural language answer displayed in the chat interface. No raw data from your databases is ever sent — only catalog metadata.
Cuando envías una pregunta, Metaustral construye un snapshot del contexto de tu catálogo y lo envía junto con tu pregunta a Claude Haiku (Anthropic). El modelo devuelve una respuesta en lenguaje natural mostrada en la interfaz de chat. Nunca se envían datos reales de tus bases de datos — solo metadatos del catálogo.
AI module: user question → catalog context → Claude Haiku → answer
Módulo IA: pregunta del usuario → contexto del catálogo → Claude Haiku → respuesta
13. On-Premise Agent Enterprise
13. Agente on-premise Enterprise
Discover metadata from databases that cannot be accessed directly from the cloud.
Descubre metadatos de bases de datos que no pueden ser accedidas directamente desde la nube.
13.1 Why Organizations Need It
13.1 Por qué las organizaciones lo necesitan
Many organizations operate databases inside private networks that cannot be reached from the cloud. The on-premise agent solves this by running inside the private network: it connects to the local database, discovers the metadata, and pushes it to Metaustral's cloud API — without ever exposing the database to the internet.
Muchas organizaciones operan bases de datos dentro de redes privadas que no pueden ser alcanzadas desde la nube. El agente on-premise resuelve esto ejecutándose dentro de la red privada: se conecta a la base de datos local, descubre los metadatos y los envía a la API en la nube de Metaustral — sin exponer nunca la base de datos a internet.
13.2 Security Considerations
13.2 Consideraciones de seguridad
- Outbound-only: the agent initiates outbound HTTPS requests to Metaustral's API. No inbound firewall ports need to be opened.
- Metadata-only: the agent reads only schema definitions (table names, column names, data types) — never actual row data.
- Credential isolation: database credentials are stored in a local
.envfile and are never transmitted to the cloud.
- Solo tráfico saliente: el agente inicia solicitudes HTTPS salientes a la API de Metaustral. No es necesario abrir puertos de firewall entrantes.
- Solo metadatos: el agente lee únicamente definiciones de esquema — nunca datos reales de filas.
- Aislamiento de credenciales: las credenciales se almacenan en un archivo
.envlocal y nunca se transmiten a la nube.
13.3 Architecture Overview
13.3 Resumen de arquitectura
On-premise agent: inside private network → outbound HTTPS → Metaustral cloud API
Agente on-premise: dentro de la red privada → HTTPS saliente → API en la nube de Metaustral
The agent can run once (on-demand) or on a recurring interval (e.g. every hour). Each run syncs the metadata and reports the result to the platform's run history.
El agente puede ejecutarse una vez (bajo demanda) o en un intervalo recurrente (ej: cada hora). Cada ejecución sincroniza los metadatos e informa el resultado al historial de ejecuciones de la plataforma.
Excel / Import Wizard
Excel / Import Wizard
Populate your catalog in bulk — assets, columns, lineage, and ERD relationships — from a single structured Excel file.
Llena tu catálogo en masa — activos, columnas, linaje y relaciones ERD — desde un único archivo Excel estructurado.
Overview
Descripción general
The Import Wizard lets you create or update hundreds of catalog entries at once using a pre-structured .xlsx template. It is ideal for initial migrations, bulk documentation sprints, and keeping the catalog in sync with a master spreadsheet maintained by your data team.
El Import Wizard permite crear o actualizar cientos de entradas del catálogo a la vez usando una plantilla .xlsx pre-estructurada. Es ideal para migraciones iniciales, sprints de documentación masiva y para mantener el catálogo sincronizado con una hoja maestra gestionada por tu equipo de datos.
Step 1 — Download the template and upload your file
Paso 1 — Descarga la plantilla y sube tu archivo
Navigate to Data Management → Import Wizard. Click Download template to get the official .xlsx file, fill in your data across its four sheets (Assets, Columns, Lineage, ERD), then drag and drop the completed file into the upload area.
Navega a Data Management → Import Wizard. Haz clic en Download template para obtener el archivo .xlsx oficial, completa los datos en sus cuatro hojas (Assets, Columns, Lineage, ERD) y arrastra el archivo completado al área de carga.
Step 2 — Preview and execute
Paso 2 — Vista previa y ejecución
After upload, Metaustral parses the file and shows a preview of what will be created or updated — broken down by new assets, updates, columns, lineage links, and ERD relations. Review the summary and click Execute import to apply the changes.
Tras la carga, Metaustral analiza el archivo y muestra una vista previa de lo que se creará o actualizará — desglosado por nuevos activos, actualizaciones, columnas, vínculos de linaje y relaciones ERD. Revisa el resumen y haz clic en Execute import para aplicar los cambios.
Excel template sheets
Hojas de la plantilla Excel
| Sheet | Sheet | What it contains | Qué contiene |
|---|---|---|---|
Assets | Assets |
One row per data asset. Required: name, type. Optional: description, owner, domain, status, sensitivity, tags, database_name, schema_name. | Una fila por activo. Obligatorio: nombre, tipo. Opcional: descripción, propietario, dominio, estado, sensibilidad, etiquetas, database_name, schema_name. |
Columns | Columns |
Column-level metadata for TABLE and VIEW assets. Required: asset_name, column_name, data_type. Optional: description, is_pk, is_nullable. | Metadatos de columnas para activos TABLE y VIEW. Obligatorio: asset_name, column_name, data_type. Opcional: description, is_pk, is_nullable. |
Lineage | Lineage |
Data flow relationships. Required: source_name, target_name. Optional: transformation notes. | Relaciones de flujo de datos. Obligatorio: source_name, target_name. Opcional: notas de transformación. |
ERD | ERD |
Foreign-key style relationships. Required: from_asset, from_column, to_asset, to_column, cardinality. | Relaciones estilo clave foránea. Obligatorio: from_asset, from_column, to_asset, to_column, cardinality. |
SQL Server Integration
Integración con SQL Server
Connect a Microsoft SQL Server instance to Metaustral and automatically discover tables, views, columns, and foreign keys.
Conecta una instancia de Microsoft SQL Server a Metaustral y descubre automáticamente tablas, vistas, columnas y claves foráneas.
Prerequisites
Requisitos previos
- A SQL Server instance (2012 or later) reachable from the Metaustral cloud — or use the On-Premise Agent for private networks.
- A SQL login with at least
VIEW DEFINITIONandSELECTonINFORMATION_SCHEMA. - TCP/IP enabled on port
1433(or a custom port) and allowed through any network firewalls. - Starter, Pro, or Enterprise plan (database connections are not available on the Free plan).
- Una instancia de SQL Server (2012 o superior) accesible desde la nube de Metaustral — o usa el Agente on-premise para redes privadas.
- Un login SQL con al menos
VIEW DEFINITIONySELECTsobreINFORMATION_SCHEMA. - TCP/IP habilitado en el puerto
1433(o un puerto personalizado) y permitido a través de firewalls de red. - Plan Starter, Pro o Enterprise (las conexiones a bases de datos no están disponibles en el plan Free).
How to connect
Cómo conectar
Open DB Connections
Abre DB Connections
From the Data Management menu, select DB Connections and click + New connection.
Desde el menú Data Management, selecciona DB Connections y haz clic en + New connection.
Select SQL Server as the type
Selecciona SQL Server como tipo
Choose SQL Server from the Type dropdown. The form will update to show the required fields.
Elige SQL Server en el desplegable Type. El formulario mostrará los campos requeridos.
Fill in the connection details
Completa los detalles de conexión
Enter the connection name, host/server, port (default 1433), database name, username, password, and an optional schema filter (e.g. dbo, sales). Click Save.
Ingresa el nombre de conexión, host/servidor, puerto (por defecto 1433), nombre de base de datos, usuario, contraseña y un filtro de esquema opcional (ej. dbo, ventas). Haz clic en Save.
Run discovery
Ejecuta el descubrimiento
Go to Discovery, select your new connection, and click Connect. Metaustral will introspect the database and list all available tables and views for import.
Ve a Discovery, selecciona tu nueva conexión y haz clic en Connect. Metaustral inspeccionará la base de datos y listará todas las tablas y vistas disponibles para importar.
Connection fields
Campos de conexión
| Field | Campo | Required | Requerido | Notes | Notas |
|---|---|---|---|---|---|
| Connection name | Nombre de conexión | Yes | Sí | A label for this connection in the catalog. | Etiqueta para esta conexión en el catálogo. |
| Host / Server | Host / Servidor | Yes | Sí | IP address or hostname of your SQL Server. | Dirección IP o hostname de tu SQL Server. |
| Port | Puerto | Yes | Sí | Default: 1433. | Por defecto: 1433. |
| Database | Base de datos | Yes | Sí | The database to introspect. | La base de datos a inspeccionar. |
| Username | Usuario | Yes | Sí | SQL login with VIEW DEFINITION rights. | Login SQL con derechos de VIEW DEFINITION. |
| Password | Contraseña | Yes | Sí | Stored encrypted with Fernet — never readable in plain text. | Almacenada cifrada con Fernet — nunca legible en texto plano. |
| Schema filter | Filtro de esquema | No | No | Comma-separated list. If blank, all schemas are shown. | Lista separada por comas. Si está vacío, se muestran todos los esquemas. |
INFORMATION_SCHEMA and never accesses row data.
INFORMATION_SCHEMA y nunca accede a datos de filas.
MySQL Integration
Integración con MySQL
Connect a MySQL or MariaDB database to Metaustral and automatically discover tables, views, columns, and foreign-key relationships.
Conecta una base de datos MySQL o MariaDB a Metaustral y descubre automáticamente tablas, vistas, columnas y relaciones de clave foránea.
Prerequisites
Requisitos previos
- MySQL 5.7+ or MariaDB 10.3+ reachable from the Metaustral cloud — or use the On-Premise Agent for private networks.
- A MySQL user with
SELECToninformation_schemafor the target database. - Port
3306open to inbound connections from Metaustral's IP ranges. - Starter, Pro, or Enterprise plan.
- MySQL 5.7+ o MariaDB 10.3+ accesible desde la nube de Metaustral — o usa el Agente on-premise para redes privadas.
- Un usuario MySQL con
SELECTeninformation_schemapara la base de datos objetivo. - Puerto
3306abierto para conexiones entrantes desde los rangos IP de Metaustral. - Plan Starter, Pro o Enterprise.
How to connect
Cómo conectar
Open DB Connections and click + New connection
Abre DB Connections y haz clic en + New connection
Select MySQL as the type
Selecciona MySQL como tipo
The form shows: host, database, username, and password. No port field is shown (MySQL always uses 3306).
El formulario muestra: host, base de datos, usuario y contraseña. No se muestra campo de puerto (MySQL siempre usa el 3306).
Fill in credentials and save
Completa las credenciales y guarda
Enter the connection name, host, database name, username, and password. Click Save.
Ingresa el nombre de conexión, host, nombre de base de datos, usuario y contraseña. Haz clic en Save.
Run discovery from the Discovery page
Ejecuta el descubrimiento desde la página Discovery
GRANT SELECT ON information_schema.* TO 'metaustral_ro'@'%';
GRANT SELECT ON information_schema.* TO 'metaustral_ro'@'%';
PostgreSQL Integration
Integración con PostgreSQL
Connect a PostgreSQL database to Metaustral and automatically catalog its tables, views, columns, and foreign-key relationships.
Conecta una base de datos PostgreSQL a Metaustral y cataloga automáticamente sus tablas, vistas, columnas y relaciones de clave foránea.
Prerequisites
Requisitos previos
- PostgreSQL 11+ reachable from the Metaustral cloud — or use the On-Premise Agent for private networks.
- A PostgreSQL user with
CONNECTon the target database andUSAGEon the schema(s) to introspect. - Port
5432accessible from Metaustral. - Starter, Pro, or Enterprise plan.
- PostgreSQL 11+ accesible desde la nube de Metaustral — o usa el Agente on-premise para redes privadas.
- Un usuario PostgreSQL con
CONNECTen la base de datos objetivo yUSAGEen los esquemas a inspeccionar. - Puerto
5432accesible desde Metaustral. - Plan Starter, Pro o Enterprise.
How to connect
Cómo conectar
Open DB Connections and click + New connection
Abre DB Connections y haz clic en + New connection
Select PostgreSQL as the type
Selecciona PostgreSQL como tipo
Fill in the connection details
Completa los detalles de conexión
Enter the host, database name, username, and password. Click Save.
Ingresa el host, nombre de base de datos, usuario y contraseña. Haz clic en Save.
Go to Discovery, select the connection, and click Connect
Ve a Discovery, selecciona la conexión y haz clic en Connect
GRANT CONNECT ON DATABASE mydb TO metaustral_ro; GRANT USAGE ON SCHEMA public TO metaustral_ro;
GRANT CONNECT ON DATABASE mydb TO metaustral_ro; GRANT USAGE ON SCHEMA public TO metaustral_ro;
Snowflake Integration
Integración con Snowflake
Connect your Snowflake data warehouse to Metaustral and automatically discover databases, schemas, tables, and views.
Conecta tu data warehouse de Snowflake a Metaustral y descubre automáticamente bases de datos, esquemas, tablas y vistas.
Prerequisites
Requisitos previos
- An active Snowflake account with a running virtual warehouse.
- A Snowflake user with
USAGEon the warehouse andREFERENCES(or higher) on the target database and schemas. - Starter, Pro, or Enterprise plan.
- Una cuenta activa de Snowflake con un virtual warehouse en ejecución.
- Un usuario Snowflake con
USAGEen el warehouse yREFERENCES(o superior) en la base de datos y esquemas objetivo. - Plan Starter, Pro o Enterprise.
How to connect
Cómo conectar
Open DB Connections and click + New connection
Abre DB Connections y haz clic en + New connection
Select Snowflake as the type
Selecciona Snowflake como tipo
Fill in the Snowflake-specific fields
Completa los campos específicos de Snowflake
Enter your Account Identifier (e.g. xy12345.us-east-1), Database, Warehouse, an optional Role, and your Username and Password.
Ingresa tu Account Identifier (ej. xy12345.us-east-1), Database, Warehouse, un Role opcional, y tu Username y Password.
Save and run discovery
Guarda y ejecuta el descubrimiento
Connection fields
Campos de conexión
| Field | Campo | Notes | Notas |
|---|---|---|---|
| Account Identifier | Account Identifier | Found in Snowflake under Admin → Accounts. Format: orgname-accountname or locator.region. | Encuéntralo en Snowflake en Admin → Accounts. Formato: orgname-accountname o locator.region. |
| Database | Database | The Snowflake database to introspect. | La base de datos Snowflake a inspeccionar. |
| Warehouse | Warehouse | Virtual warehouse used to run the introspection queries. | Virtual warehouse utilizado para ejecutar las consultas de introspección. |
| Role (optional) | Role (opcional) | Overrides the default role for this session. Use if your user needs a specific role to access the target database. | Sobreescribe el rol por defecto para esta sesión. Úsalo si tu usuario necesita un rol específico para acceder a la base de datos objetivo. |
GRANT USAGE ON WAREHOUSE my_wh TO ROLE metaustral_ro; GRANT REFERENCES ON ALL TABLES IN DATABASE mydb TO ROLE metaustral_ro;
GRANT USAGE ON WAREHOUSE my_wh TO ROLE metaustral_ro; GRANT REFERENCES ON ALL TABLES IN DATABASE mydb TO ROLE metaustral_ro;
Databricks Integration
Integración con Databricks
Connect a Databricks workspace to Metaustral using a personal access token and discover Unity Catalog tables, schemas, and metadata.
Conecta un workspace de Databricks a Metaustral usando un token de acceso personal y descubre tablas, esquemas y metadatos del Unity Catalog.
Prerequisites
Requisitos previos
- A Databricks workspace (AWS, Azure, or GCP) with Unity Catalog or Hive Metastore enabled.
- A Personal Access Token — generate one in Databricks under User Settings → Developer → Access Tokens.
- An HTTP Path for a running SQL Warehouse — found under SQL Warehouses → Connection details.
- Starter, Pro, or Enterprise plan.
- Un workspace de Databricks (AWS, Azure o GCP) con Unity Catalog o Hive Metastore habilitado.
- Un Personal Access Token — genéralo en Databricks en User Settings → Developer → Access Tokens.
- Un HTTP Path de un SQL Warehouse en ejecución — encuéntralo en SQL Warehouses → Connection details.
- Plan Starter, Pro o Enterprise.
How to connect
Cómo conectar
Open DB Connections and click + New connection
Abre DB Connections y haz clic en + New connection
Select Databricks as the type
Selecciona Databricks como tipo
Fill in the connection details
Completa los detalles de conexión
Enter your workspace Host (e.g. adb-1234567890.azuredatabricks.net), Port (default 443), Catalog, HTTP Path, and your Personal Access Token.
Ingresa el Host de tu workspace (ej. adb-1234567890.azuredatabricks.net), Port (por defecto 443), Catalog, HTTP Path y tu Personal Access Token.
Save and run discovery
Guarda y ejecuta el descubrimiento
Connection fields
Campos de conexión
| Field | Campo | Where to find it | Dónde encontrarlo |
|---|---|---|---|
| Host | Host | Your Databricks workspace URL without https://. | La URL de tu workspace Databricks sin https://. |
| Port | Puerto | Always 443 for HTTPS. | Siempre 443 para HTTPS. |
| Catalog | Catalog | Unity Catalog name (e.g. main) or hive_metastore. | Nombre del Unity Catalog (ej. main) o hive_metastore. |
| HTTP Path | HTTP Path | Found in SQL Warehouses → your warehouse → Connection details. Format: /sql/1.0/warehouses/abc123. | En SQL Warehouses → tu warehouse → Connection details. Formato: /sql/1.0/warehouses/abc123. |
| Access Token | Access Token | User Settings → Developer → Access Tokens → Generate new token. | User Settings → Developer → Access Tokens → Generate new token. |
On-Premise Databases Enterprise
Bases de datos on-premise Enterprise
Connect SQL Server, MySQL, or PostgreSQL databases running inside private corporate networks — without opening inbound firewall ports.
Conecta bases de datos SQL Server, MySQL o PostgreSQL que corren dentro de redes corporativas privadas — sin abrir puertos de firewall entrantes.
Why can't I connect directly?
¿Por qué no puedo conectar directamente?
Cloud-hosted databases (RDS, Azure SQL, Cloud SQL) are reachable by IP from Metaustral. But databases running inside a private corporate network are typically blocked by firewalls and have no public IP. The On-Premise Agent solves this: a lightweight Python script runs inside your network, connects to the database locally, and pushes metadata to Metaustral over outbound HTTPS — the only direction that firewalls usually allow by default.
Las bases de datos en la nube (RDS, Azure SQL, Cloud SQL) son accesibles por IP desde Metaustral. Pero las bases de datos en redes corporativas privadas suelen estar bloqueadas por firewalls y no tienen IP pública. El Agente on-premise resuelve esto: un script Python liviano corre dentro de tu red, se conecta a la base de datos localmente y envía los metadatos a Metaustral por HTTPS saliente — la única dirección que los firewalls suelen permitir por defecto.
Architecture
Arquitectura
Agent runs inside the private network → outbound HTTPS only → no inbound firewall rules needed.
El agente corre dentro de la red privada → solo HTTPS saliente → no se necesitan reglas de firewall entrantes.
Supported databases (on-premise)
Bases de datos soportadas (on-premise)
Security highlights
Aspectos de seguridad
- Outbound-only traffic: the agent makes HTTPS requests to
api.metaustral.com. No inbound ports need to be opened. - Metadata only: the agent reads schema definitions from
INFORMATION_SCHEMAonly — it never reads actual row data. - Credentials stay on-premise: database credentials are stored in a local
.envfile and are never sent to the cloud. - Encrypted transport: all communication between the agent and Metaustral uses TLS 1.2+.
- Solo tráfico saliente: el agente realiza solicitudes HTTPS a
api.metaustral.com. No se necesitan abrir puertos entrantes. - Solo metadatos: el agente lee definiciones de esquema desde
INFORMATION_SCHEMAúnicamente — nunca lee datos reales de filas. - Credenciales permanecen on-premise: las credenciales de la base de datos se almacenan en un archivo
.envlocal y nunca se envían a la nube. - Transporte cifrado: toda la comunicación entre el agente y Metaustral usa TLS 1.2+.
For full setup instructions, see the On-Premise Agent documentation →
Para instrucciones completas de configuración, consulta la documentación del Agente on-premise →
FAQ
Common questions about Metaustral.
Preguntas comunes sobre Metaustral.