Jeder Data Engineer, der mit Unity
Catalog arbeitet, steht vor einer grundlegenden Entscheidung beim Einrichten neuer Tabellen. Diese Wahl hat weitreichende Auswirkungen auf Governance, Performance und langfristige Verwaltbarkeit:
Sollten Sie eine MANAGED oder eine EXTERNAL Table verwenden?
Die Unterscheidung kann manchmal unklar erscheinen, deshalb lassen Sie uns genau aufschlüsseln, wann und warum Sie welchen Ansatz wählen sollten.
✓ EMPFOHLENER STANDARD Managed TablesDer vollständig verwaltete „All-in“-Ansatz mit der engsten Plattform-Integration. Vollständige Lifecycle-GovernanceUnity Catalog kontrolliert sowohl die Metadaten als auch die zugrunde liegenden Datendateien und vereinfacht so die Governance über Ihre gesamte Datenlandschaft erheblich. Automatisierte LeistungDatabricks übernimmt automatisch OPTIMIZE- und VACUUM-Operationen. Diese Automatisierung ist erforderlich für erweiterte Funktionen wie Predictive Optimization und Liquid Clustering. Sicherer & EinfacherDas Löschen einer Tabelle entfernt auch ihre Daten, verhindert verwaiste Dateien und optimiert die Bereinigung in CI/CD- und Daten-Lifecycle-Workflows. | ⚠ SPEZIFISCHE ANWENDUNGSFÄLLE External TablesSie verwalten die Datendateien (im Storage), während Databricks die Tabellen-Metadaten im Unity Catalog verwaltet. Sie kontrollieren den DatenpfadDirekte Kontrolle über den physischen Speicher, wobei die Daten auch nach DROP TABLE-Operationen erhalten bleiben. Geteilte VerantwortungFlexibilität bringt Verantwortung mit sich – Sie verwalten Daten-Lifecycle, Bereinigung und Sicherheit außerhalb von Databricks. Wann External Tables verwendet werden sollten
|
Beginnen Sie mit Managed Tables als Standardwahl. Die Kombination aus Einfachheit, automatisierter Performance-Optimierung und robuster Governance macht sie zum optimalen Weg für die meisten modernen Daten-Workloads.
Reservieren Sie External Tables für bewusste, gezielte Anwendungsfälle, bei denen Sie spezifische Anforderungen haben, die sie notwendig machen. Wählen Sie External Tables nicht standardmäßig oder aus Gewohnheit – machen Sie es zu einer bewussten Architektur-Entscheidung.
Wie geht Ihr Team vor?
Setzen Sie standardmäßig auf Managed Tables, oder haben Sie überzeugende Gründe gefunden, häufiger External Tables zu verwenden?
©2025 Data Insight Consulting GmbH
Jetzt abonnieren, um weiterzulesen und auf das gesamte Archiv zuzugreifen.