Zum Hauptinhalt springen

Kriterien und Anforderungen

Die Bewertung der Datenformate berücksichtigt die folgenden Hauptkriterien:

  1. Anwendungsgebiet: Wie gut passt das Datenformat zu den spezifischen Anforderungen des Schienenverkehrs, einschließlich der Erfassung und Archivierung von Mess- und Diagnosedaten.
  2. Performance: Effizienz des Formats bei der Verarbeitung großer Datenmengen.
  3. Packungsdichte: Effizienz der Datenkompression und die resultierende Dateigröße.
  4. Metadaten: Unterstützung und Flexibilität der Metadatenstruktur.
  5. Einfachheit und Komplexität: Aufwand bei der Implementierung und Nutzung des Formats.
  6. Robustheit: Resilienz des Formats bei Unterbrechungen wie Stromausfällen.
  7. Tool-Unterstützung: Verfügbarkeit und Qualität der Tools zur Verarbeitung und Analyse der Daten.
  8. Dokumentation: Vollständigkeit und Verständlichkeit der Formatdokumentation.
  9. Verbreitung: Akzeptanz und Nutzung des Formats in der Branche.
  10. Menschliche Lesbarkeit: Lesbarkeit des Formats für Entwickler und Techniker.
  11. Erweiterbarkeit und Langlebigkeit: Fähigkeit des Formats, zukünftige Anforderungen und Änderungen zu integrieren.

Rangliste der Datenformate

  1. OSF4 (optiMEAS Streaming Format)
    1. Anwendungsgebiet: Sehr gut geeignet für Mess- und Automatisierungsdaten.
    2. Performance: Hoch, effizient in der Datenverarbeitung.
    3. Packungsdichte: Geringer Speicherbedarf, komprimierbar.
    4. Metadaten: Flexibel und umfangreich unterstützt.
    5. Einfachheit: Vergleichsweise einfach zu implementieren.
    6. Robustheit: Extrem robust gegenüber Unterbrechungen.
    7. Tool-Unterstützung: Verfügbarkeit von Tools noch ausbaufähig.
    8. Dokumentation: Gut dokumentiert.
    9. Verbreitung: Aktuell noch gering, aber wachsend.
    10. Menschliche Lesbarkeit: Akzeptabel.
    11. Erweiterbarkeit: Sehr gut erweiterbar und zukunftssicher.
  2. MDF4 (Measurement Data Format)
    1. Anwendungsgebiet: Speziell für Messdaten in der Automobilindustrie, gut anpassbar.
    2. Performance: Sehr hoch.
    3. Packungsdichte: Gut.
    4. Metadaten: Umfangreich und detailliert.
    5. Einfachheit: Komplexer als OSF4.
    6. Robustheit: Weniger robust gegen Ausschalten.
    7. Tool-Unterstützung: Weit verbreitet und gut unterstützt.
    8. Dokumentation: Sehr gut.
    9. Verbreitung: Weit verbreitet in der Automobilindustrie.
    10. Menschliche Lesbarkeit: Gering.
    11. Erweiterbarkeit: Gut erweiterbar.
  3. HDF5 (Hierarchical Data Format)
    1. Anwendungsgebiet: Breite Anwendung, besonders in der Wissenschaft.
    2. Performance: Gut, aber nicht führend.
    3. Packungsdichte: Gut.
    4. Metadaten: Sehr gut unterstützt.
    5. Einfachheit: Komplex in der Implementierung.
    6. Robustheit: Nicht sehr robust gegen Ausschalten.
    7. Tool-Unterstützung: Sehr gut in der Wissenschafts- und Forschungsgemeinschaft.
    8. Dokumentation: Ausgezeichnet.
    9. Verbreitung: Sehr verbreitet im wissenschaftlichen Bereich.
    10. Menschliche Lesbarkeit: Gering.
    11. Erweiterbarkeit: Sehr gut erweiterbar.
  4. PARQUET
    1. Anwendungsgebiet: Gut für tabellarische und strukturierte Daten.
    2. Performance: Gut für große, dichte Tabellen.
    3. Packungsdichte: Effizient bei großen Dateien.
    4. Metadaten: Unterstützt, aber weniger flexibel.
    5. Einfachheit: Vergleichsweise einfach.
    6. Robustheit: Weniger robust für kontinuierliche Datenströme.
    7. Tool-Unterstützung: Sehr gut im Hadoop-Ökosystem.
    8. Dokumentation: Gut.
    9. Verbreitung: Weit verbreitet im Big-Data-Bereich.
    10. Menschliche Lesbarkeit: Mittel.
    11. Erweiterbarkeit: Gut, aber mit Einschränkungen bei dünn besetzten Tabellen.
  5. CSV/TSV
    1. Anwendungsgebiet: Grundlegend und breit einsetzbar.
    2. Performance: Niedrig.
    3. Packungsdichte: Sehr schlecht.
    4. Metadaten: Sehr eingeschränkt.
    5. Einfachheit: Sehr einfach.
    6. Robustheit: Nicht robust.
    7. Tool-Unterstützung: Sehr weit verbreitet.
    8. Dokumentation: Einfach und weit verbreitet.
    9. Verbreitung: Sehr weit verbreitet.
    10. Menschliche Lesbarkeit: Sehr hoch.
    11. Erweiterbarkeit: Sehr eingeschränkt.