Im IIoT-Umfeld müssen massive Datenmengen erfasst und in Echtzeit ausgewertet werden. Klassische SQL-Datenbanken geraten da schnell an ihre Grenzen. Eine Alternative bieten verteilt arbeitende SQL-Datenbanken, die den dokumentbasierten Shared-Nothing-Ansatz unterstützen und so ihren ursprünglichen Performance-Nachteil gegenüber NoSQL-Datenbanken mehr als ausgleichen.
(Quelle: Blue Planet Studio/shutterstock)
Shared-Nothing als Lösung? Tagtäglich senden tausende Sensoren Daten im Sekunden- oder Millisekunden-Takt. Ein einzelner Messfühler erzeugt bereits eine Vielzahl an Megabytes, eine Fertigungsanlage mehrere Gigabytes. Manche Unternehmen unterhalten hunderte solcher Fabriken und vernetzen sie miteinander. So entstehen massive Datenmengen in großer Vielfalt.
Datenbanken müssen viel leisten
Datenbanken müssen diese Daten nicht nur erfassen, sondern auch mit relationalen Informationen aus dem ERP, dem MES und anderen Quellen zusammenbringen und in Echtzeit auswerten. Dabei entstehen große Zeitreihen an Daten, die unterschiedlich in Relation zueinander stehen und komplexe Analysen erlauben. Für diese Mischung aus relationalen und Sensor-Daten ist eine spezifische Datenbank gefragt.
Konventionelle Technologien und ihre Schwächen
Viele Unternehmen verwenden klassische relational Database Management Systeme (RDBMS), die meist die Sprache SQL (Structured Query Language) nutzen und Daten über Spalten und Zeilen organisieren. Die Implementierung dieser Systeme erfolgte jedoch lange bevor das IIoT entstand. So eignen sie sich zwar bestens für die Verwaltung von kaufmännischen Daten, stoßen im Industrial IoT mit Milliarden von Sensordaten (JSON) aber an ihre Grenzen, da sie kaum skalierbar und kombinierbar sind.
Eine andere Option sind NoSQL-Datenbanken. Sie können eine hohe Performance bei großen Datenmengen erreichen, auch mit Sensordaten. Sie verzichten auf relationale Modelle und verfügen über flexible Schemata. Die Organisation der Daten erfolgt über Wertepaare oder Objekte. Damit werden sie bei der Transaktionsbearbeitung performant und lassen sich auf verteilten Systemen einsetzen.
Dennoch sollte ihr Einsatz für Anwendungen des industriellen IoT überdacht werden, denn Zeitreihendaten (Timeseries) haben immer die Anforderung, den Kontext über relationale Daten herzustellen. Im IIoT geht es jedoch nicht nur um das Abspeichern von großen Datenmengen und die Umsetzung von linearen Befehlen. Hier kommt es vielmehr darauf an, große Mengen an Timeseries-Daten mit relationalen Daten, Geo-Daten oder nur Text zu verknüpfen, und dann durch Joins, Aggregationen und individuell definierte, analytische Funktionen gemeinsam auszuwerten. Relationale Daten zusammen mit Produktions-/Sensordaten erhalten eine sehr große Bedeutung im industriellen IoT.
(Crate DB läuft auf Microsoft Azure, AWS oder anderen Clouds sowie im eigenen Datencenter. Bild: Crate.io)
Anfragen auf verfügbare Knoten verteilt
Verteilt arbeitende SQL-Datenbanken mit einem dokumentbasierten, Shared-Nothing-Ansatz kombinieren die relationale SQL-Arbeitsweise mit der Performance, Einfachheit und Skalierbarkeit von reinen NoSQL-Document-Systemen. Sie ermöglichen zudem, das vorhandene SQL-Know-how und auch SQL-Applikationen anzuwenden.
Beim Shared-Nothing-Ansatz werden die Anfragen auf die verfügbaren Knoten verteilt und können parallel abgearbeitet werden. Die Knoten arbeiten autonom und greifen auf die ihnen zur Verfügung stehenden Ressourcen wie Prozessorleistung, Betriebssystem und Arbeitsspeicher zu. Das Ausbalancieren der Workloads geschieht automatisch durch die Datenbank. Diese Parallelisierung ermöglicht eine schnelle, ausfallsichere und einfache Skalierung – bei Bedarf an mehr Rechenleistung werden im Betrieb einfach weitere Knoten hinzugefügt, ohne Aufwand oder Wartezeiten.
Performance-Nachteil ausgleichen durch Shared-Nothing
Durch den Shared-Nothing-Ansatz können SQL-Systeme ihren ursprünglichen Performance-Nachteil gegenüber NoSQL-Datenbanken ausgleichen und übertreffen, und weiterhin mit Relationen und JSON-Dokumenten in einer Tabelle arbeiten: SQL-typische Joins (liefern eine Ergebnistabelle, die Datensätze und Attribute zweier oder mehrerer Ausgangstabellen enthält), Aggregationen (Konsolidierung oder Verdichtung von Werten), Unter-Abfragen (Subselects) und ähnliches lassen sich performant und parallel ausführen.
Deutlich geringere Kosten
Datenbanken, die speziell für den Einsatz in bestimmten Anwendungen entwickelt wurden, bieten neben technischen auch finanzielle Vorteile. Durch die gewählte Architektur, die Indexierung und die Optimierung des Speichermanagements für Maschinen- beziehungsweise IIoT-Daten lassen sich Anwendungen oft mit deutlich geringeren Cloud-Kosten betreiben. Mit CrateDB verringern sich die Kosten häufig um 50-70 Prozent TCO (Total Cost of Ownership), speziell in großer Skalierung (Datenmenge oder Abfragelast). Dies ergibt sich dadurch, dass man nur mehr eine statt zwei bis drei Datenbanken betreiben, warten und sichern muss.
IIoT-Technologie muss jedoch nicht nur hoch performant sein, sondern auch zuverlässig arbeiten. Deswegen sollte auch die Datenbank entsprechende Features bereitstellen, etwa eine automatische Replikation von Daten im Cluster, Selbstheilung bei Server-Ausfall und rollierende Updates der Software.
Shared-Nothing: Spezielle Datenstrukturen bei IIoT-Projekten
Darüber hinaus muss die Datenbank-Technologie mit den Besonderheiten von IIoT-Projekten umgehen können, denn die Struktur der Datenmengen und deren Analyse unterscheidet sich deutlich von gewöhnlichen Anwendungen. Typisch sind Zeitreihenanalysen, die die Entwicklung bestimmter Werte während eines zeitlichen Verlaufs betrachten. Deswegen ist es für die performante Analyse sinnvoll, die Datenbank-Tabellen automatisch nach Zeitintervallen zu aufzuteilen. So kann eine Tabelle auch unlimitiert groß werden, und trotzdem performant reagieren.
Stand: 16.12.2025
Es ist für uns eine Selbstverständlichkeit, dass wir verantwortungsvoll mit Ihren personenbezogenen Daten umgehen. Sofern wir personenbezogene Daten von Ihnen erheben, verarbeiten wir diese unter Beachtung der geltenden Datenschutzvorschriften. Detaillierte Informationen finden Sie in unserer Datenschutzerklärung.
Einwilligung in die Verwendung von Daten zu Werbezwecken
Ich bin damit einverstanden, dass die WIN-Verlag GmbH & Co. KG, Chiemgaustraße 148, 81549 München einschließlich aller mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen (im weiteren: Vogel Communications Group) meine E-Mail-Adresse für die Zusendung von redaktionellen Newslettern nutzt. Auflistungen der jeweils zugehörigen Unternehmen können hier abgerufen werden.
Der Newsletterinhalt erstreckt sich dabei auf Produkte und Dienstleistungen aller zuvor genannten Unternehmen, darunter beispielsweise Fachzeitschriften und Fachbücher, Veranstaltungen und Messen sowie veranstaltungsbezogene Produkte und Dienstleistungen, Print- und Digital-Mediaangebote und Services wie weitere (redaktionelle) Newsletter, Gewinnspiele, Lead-Kampagnen, Marktforschung im Online- und Offline-Bereich, fachspezifische Webportale und E-Learning-Angebote. Wenn auch meine persönliche Telefonnummer erhoben wurde, darf diese für die Unterbreitung von Angeboten der vorgenannten Produkte und Dienstleistungen der vorgenannten Unternehmen und Marktforschung genutzt werden.
Meine Einwilligung umfasst zudem die Verarbeitung meiner E-Mail-Adresse und Telefonnummer für den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern wie z.B. LinkedIN, Google und Meta. Hierfür darf die Vogel Communications Group die genannten Daten gehasht an Werbepartner übermitteln, die diese Daten dann nutzen, um feststellen zu können, ob ich ebenfalls Mitglied auf den besagten Werbepartnerportalen bin. Die Vogel Communications Group nutzt diese Funktion zu Zwecken des Retargeting (Upselling, Crossselling und Kundenbindung), der Generierung von sog. Lookalike Audiences zur Neukundengewinnung und als Ausschlussgrundlage für laufende Werbekampagnen. Weitere Informationen kann ich dem Abschnitt „Datenabgleich zu Marketingzwecken“ in der Datenschutzerklärung entnehmen.
Falls ich im Internet auf Portalen der Vogel Communications Group einschließlich deren mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen geschützte Inhalte abrufe, muss ich mich mit weiteren Daten für den Zugang zu diesen Inhalten registrieren. Im Gegenzug für diesen gebührenlosen Zugang zu redaktionellen Inhalten dürfen meine Daten im Sinne dieser Einwilligung für die hier genannten Zwecke verwendet werden.
Recht auf Widerruf
Mir ist bewusst, dass ich diese Einwilligung jederzeit für die Zukunft widerrufen kann. Durch meinen Widerruf wird die Rechtmäßigkeit der aufgrund meiner Einwilligung bis zum Widerruf erfolgten Verarbeitung nicht berührt. Um meinen Widerruf zu erklären, kann ich als eine Möglichkeit das unter https://kontakt.vogel.de/de/win abrufbare Kontaktformular nutzen. Sofern ich einzelne von mir abonnierte Newsletter nicht mehr erhalten möchte, kann ich darüber hinaus auch den am Ende eines Newsletters eingebundenen Abmeldelink anklicken. Weitere Informationen zu meinem Widerrufsrecht und dessen Ausübung sowie zu den Folgen meines Widerrufs finde ich in der Datenschutzerklärung, Abschnitt Redaktionelle Newsletter.
Eine weitere Besonderheit bei IoT-Projekten in industriellen Prozessen ist die Bedeutung des Standortes der Gerätschaften, vor allem wenn sich diese bewegen. Dies wird in speziellen Geo-Datentypen (geo_point und geo_shape) gespeichert. Nur wenn die Datenbank für den Umgang mit diesen geeignet ist, sind skalare Funktionen möglich. Für die Ablage großer unstrukturierter Daten, wie Bild- und Audiodateien, ist wiederum die Anbindung von BLOB-Speichern (Binary Large Objects) vorteilhaft.
Auch muss das System die oft in Stapeln gelieferten Analysedaten in Echtzeit aufnehmen können. Die CrateDB löst dies, indem es den Sperr-Overheads von Stapel-Dateien für den Schreibvorgang entfernt. So ist sie eine interessante Alternative für “IIoT at scale”, also im Einsatz des industriellen IoT in hoher Skalierung.
Der Autor Christian Lutz ist Mitgründer und Geschäftsführer von Crate.io.