„Du bist, was Du isst“

Unternehmen reden viel über die möglichen Auswirkungen von KI- und ML-Anwendungen, aber oft wenig über deren Qualität. Und die hängt in erster Linie vom Dateninput ab. Der Datenspezialist Aparavi erklärt, wieso ein hochwertiges Dateninventar die Voraussetzung für eine sinn- und wertvolle KI- oder ML-Lösung ist.

Allgemein

Big data and artificial intelligence concept. Machine learning a

Der Hype rund um generative AI konzentriert sich in erster Linie auf ethisch-moralische und sicherheitstechnische Aspekte. Doch das greift zu kurz. Beide drehen sich um Probleme der richtigen Anwendung von KI- und ML-Apps, unterschlagen dabei aber die Frage ihrer Qualität. Und die wiederum hängt von der Qualität der Daten ab, mit denen die Algorithmen gefüttert und trainiert werden. Doch genau daran hapert es oft, weil üblicherweise bis zu 80 Prozent der dafür in Frage kommenden Daten unstrukturiert sind. Dort verstecken sich nicht nur veraltete Dokumente oder risikobehaftete Daten, sondern eben auch wichtige, hochwertige Informationen. Daher ist es sinnvoll, diese Datenbestände vorab zu klassifizieren, zu bereinigen und zu strukturieren. Aparavi erklärt, warum eine saubere Data Collection (Clean & Lean Data) für die Entwicklung von KI-Apps essenziell ist:

Schlechter Input – schlechter Output: Die Qualität des Outputs hängt, wie so oft, auch bei der KI-Entwicklung von der Qualität des Inputs ab. Je gepflegter also die Trainingsdaten, desto höher der Anwendungsnutzen. Ideal sind transparente, klassifizierte, strukturierte und priorisierte Daten (und auch Metadaten!), frei von Dubletten.
Ausgefilterte Risiken – weniger Fallstricke: In jedem Datenbestand lauern kritische Daten und Dokumente, die aus diversen rechtlichen Gründen nicht verwendet werden dürfen, wie etwa personenbezogene Daten. Diese müssen vorab herausgefiltert werden, um Verfälschungen, Risiken und Strafzahlungen von vorneherein zu vermeiden.
Synthetische Daten – echte Daten: Die Unzufriedenheit von Data Scientists mit dem Datenmaterial zeigt sich oft an der wachsenden Nutzung synthetischer Daten. Mit Originaldaten können Algorithmen und Anwendungen in der Praxis jedoch schneller und effizienter entwickelt werden.
Lange Entwicklungszeiten – hohe Kosten: KI-Entwicklung ist ein iterativer Prozess mit hohem Ressourcenbedarf – und damit ein teures Geschäft. Je schlechter der Dateninput ist, desto länger und kostenintensiver ist die Entwicklungszeit. Ein sauberer Datenbestand beschleunigt die Anwendungsentwicklung, reduziert so die Kosten und ermöglicht zudem eine kürzere Time-to-Market.

„Clean and Lean Data spielen bei der Entwicklung von KI- und ML-Apps eine überragende Rolle“, erklärt Adrian Knapp, CEO bei Aparavi. „Du bist, was Du isst: Der erste Schritt muss es daher sein, die wirklich relevanten Daten herauszufiltern und zu strukturieren, die Datenqualität zu steigern und so das perfekte Futter für das Training der Algorithmen zu liefern. An dieser Stelle entscheidet sich, ob eine KI-Anwendung erfolgreich wird.“ Aparavi Software Europe GmbH

Thematik: Allgemein Ausgabe: INDUSTRIE 4.0 & IIoT Newsletter 16 2023

APARAVI Software Europe GmbH

Zur Firmenwebsite

MEHR ZUM THEMA

Bild: Infineon Technologies AG

Infineon und Nvidia bauen Zusammenarbeit aus

Bild: Colnago

Rapid.Tech 3D zeigt Anwendungen für die Mobilitätsbranche

Bild: Industrial Digital Twin Association e.V.

IDTA und IDSA arbeiten zusammen

Bild: ©Gorodenkoff/stock.adobe.com

Schwingungen sensorgestützt überwachen

Retrofit mit LoRaWAN

Früher erfassten Mitarbeitende in monatlichen Vor-Ort-Begehungen Anlagen-Schwingungen mit Handmessgeräten. Heute liefern batteriebetriebene Sensoren von Kiotera diese Daten über ein Gateway an eine Datenplattform. Der Return on Investment ist…

Weiterlesen: Retrofit mit LoRaWAN
Anzeige

Bild: LMI Technologies GmbH

Präzise 2D-Inspektion mit nativer Edge-Intelligenz

In der industriellen Bildverarbeitung stellen PC-basierte Systeme oft eine technische Hürde dar. Die Trennung von Bildaufnahme und Datenverarbeitung führt häufig zu Latenzen, erhöhtem Platzbedarf und einem komplexen Wartungsaufwand.…

Weiterlesen: Präzise 2D-Inspektion mit nativer Edge-Intelligenz
Bild: Easyfairs GmbH

Zuwächse für die All About Automation Friedrichshafen

Persönliche Gespräche, kurze Wege, konkrete Lösungen und eine gute Messeatmosphäre prägten die All About Automation in Friedrichshafen am 10. und 11. März.

Weiterlesen: Zuwächse für die All About Automation Friedrichshafen
Bild: COSCOM Computer GmbH

Grob-Werke und Coscom mit Partnerschaft im Tool-Management

Im Institut für Produktionstechnik und CIMTT (CIM-Technologie-Transfer) in Kiel oder in Unternehmen wie der Franz Xaver Meiller Fahrzeug- und Maschinenfabrik kommen Grob-Bearbeitungszentren zum Einsatz.

Weiterlesen: Grob-Werke und Coscom mit Partnerschaft im Tool-Management
Bild: Wireless Logic mdex GmbH

Raspberry Pi IoT-Kit für den industriellen Einsatz

Astradis Elektronik kündigt das Raspberry Pi IoT-Kit an, das professionelle Entwickler dabei unterstützt, Raspberry Pi in M2M-Projekten einzusetzen.

Weiterlesen: Raspberry Pi IoT-Kit für den industriellen Einsatz

Digitalisierungstechnologien und ihre Bedeutung für die Wirtschaft

Laut einer repräsentativen Bitkom-Befragung von 604 Unternehmen ab 20 Beschäftigten gehen 86% davon aus, dass…

Weiterlesen: Digitalisierungstechnologien und ihre Bedeutung für die Wirtschaft
Anzeige

Präzise 2D-Inspektion mit nativer Edge-Intelligenz

In der industriellen Bildverarbeitung stellen PC-basierte Systeme oft eine technische Hürde dar. Die Trennung von…

Weiterlesen: Präzise 2D-Inspektion mit nativer Edge-Intelligenz

Siemens errichtet neue Produktionsstätte in Amberg

Siemens plant eine Erneuerung am Produktions- und Entwicklungsstandort Amberg.

Weiterlesen: Siemens errichtet neue Produktionsstätte in Amberg
Glasfaser-Verfügbarkeit verbessert

Die Verfügbarkeit von Glasfaser verbessert sich laut einer Untersuchung von 1&1 Versatel: Noch 25% der für eine Untersuchung befragten 533 Unternehmen bemängelt…

Weiterlesen: Glasfaser-Verfügbarkeit verbessert

Abschluss des Projekts ‚Nalyses‘

Scheinwerfer CO2-optimiert

Wie der ökologische Fußabdruck mechatronischer Produkte reduziert werden kann, haben die Beteiligten im Forschungsprojekt ‚Nalyses‘ erprobt. Dabei entstand ein neuartiger Scheinwerfer für…

Weiterlesen: Scheinwerfer CO2-optimiert
Die Nominierten für den Hermes Award stehen fest

Eine unabhängige Jury hat unter den zahlreichen Einreichungen drei Unternehmen für den Hermes Award nominiert: Festo, Schaeffler und Ziehl-Abegg.

Weiterlesen: Die Nominierten für den Hermes Award stehen fest

VDI-Studie zu Qualifizierung und Re-Skilling

Ingenieure sehen hohen Qualifizierungsbedarf wegen KI

Eine aktuelle VDI-Studie zeigt, dass Qualifizierung und Re-Skilling in technischen Berufen keine Randthemen sind, sondern ein Schlüssel, um Fachkräfte gezielt in neue…

Weiterlesen: Ingenieure sehen hohen Qualifizierungsbedarf wegen KI
Ergebnisse aus dem Industrie-4.0-Barometer von MHP und LMU

DACH-Region optimiert Kosten, China baut Fabrik der Zukunft

Das Industrie-4.0-Barometer von MHP und der LMU zeigt: Industrieunternehmen setzen international immer mehr Industrie-4.0-Technologien ein. China und die USA bauen ihren Vorsprung…

Weiterlesen: DACH-Region optimiert Kosten, China baut Fabrik der Zukunft
Projektstart auf der Light + Building

Mit CraftForward zum digitalen Produktpass für Handwerksbetriebe

Im neuen Forschungsprojekt ‚CraftForward‘ entwickelt das Fraunhofer IPK gemeinsam mit vier Partnern aus Industrie und Handwerk einen digitalen Produktpass, der zirkuläre Geschäftsmodelle…

Weiterlesen: Mit CraftForward zum digitalen Produktpass für Handwerksbetriebe
Ein Lernzentrum für Roboter entsteht

Das Munich Institute of Robotics and Machine Intelligence (Mirmi) der Technischen Universität München (TUM) und das Unternehmen Neura Robotics planen ein Forschungs-…

Weiterlesen: Ein Lernzentrum für Roboter entsteht

Anlagenbauer Martin setzt auf Stackable

Abfall wird zu Daten

Seit mehr 100 Jahren baut die Firma Martin thermische Abfallbehandlungsanlagen zur Energiegewinnung. Neuerdings setzt das Unternehmen dabei auf IoT-Datenauswertung. Um etwa den…

Weiterlesen: Abfall wird zu Daten
Praxistest von Comcast, Classiq und AMD

Netzoptimierung per Quantencomputing

In einem gemeinsamen Test von Comcast, Classiq und AMD haben die Beteiligten die Ausfallsicherheit von Internetdiensten durch die Kombination von Quantenalgorithmen und…

Weiterlesen: Netzoptimierung per Quantencomputing
Partnerschaft zwischen NTT Data und Ericsson

NTT Data und Ericsson gehen eine mehrjährige strategische Partnerschaft ein.

Weiterlesen: Partnerschaft zwischen NTT Data und Ericsson
VDMA-Fachverband erwartet Umsatzrückgang

Für 2026 erwartet der Fachverband VDMA Robotik + Automation einen Umsatzrückgang von 5% auf 14,1Mrd.€.

Weiterlesen: VDMA-Fachverband erwartet Umsatzrückgang
Wettbewerbsfähigkeit der Industrie zeigt Abwärtstrend

Knapp jedes dritte Industrieunternehmen berichtet in einer Untersuchung des Ifo Instituts von einem Rückgang seiner Wettbewerbsfähigkeit.

Weiterlesen: Wettbewerbsfähigkeit der Industrie zeigt Abwärtstrend
Hannover Messe: Neue Aussteller und viel KI

Die Hannover Messe 2026 (20. bis 24. April) stellt künstliche Intelligenz in der Industrie in den Mittelpunkt und zeigt den praxisnahen und…

Weiterlesen: Hannover Messe: Neue Aussteller und viel KI
Von AI und Data Science bis Robotik

Wie werden aus Innovationen insbesondere in der KI konkrete Anwendungen mit Mehrwert?

Weiterlesen: Von AI und Data Science bis Robotik
AAS-Anwendertreffen in Kaiserslautern

Die Asset Administration Shell (AAS) ist bereit für den industriellen Einsatz.

Weiterlesen: AAS-Anwendertreffen in Kaiserslautern