/
Lerneinheit: Big Data

Lerneinheit: Big Data

Der aus dem englischen Sprachraum stammende Begriff Big Data [ˈbɪɡ ˈdeɪtə] (von englisch big ‚groß‘ und data ‚Daten‘, deutsch auch Massendaten) bezeichnet Datenmengen, welche beispielsweise zu groß, zu komplex, zu schnelllebig oder zu schwach strukturiert sind, um sie mit manuellen und herkömmlichen Methoden der Datenverarbeitung auszuwerten.[1]

„Big Data“ wird häufig als Sammelbegriff für digitale Technologien verwendet, die in technischer Hinsicht für eine neue Ära digitaler Kommunikation und Verarbeitung und in sozialer Hinsicht für einen gesellschaftlichen Umbruch verantwortlich gemacht werden.[2] Dabei unterliegt der Begriff als Schlagwort einem kontinuierlichen Wandel; so wird damit ergänzend auch oft der Komplex der Technologien beschrieben, die zum Sammeln und Auswerten dieser Datenmengen verwendet werden.

https://studyflix.de/informatik/big-data-4250?topic_id=590
image-20240227-084800.png

Big Data bezieht sich auf große Mengen von strukturierten und unstrukturierten Daten, die aufgrund ihrer Größe, Komplexität und Geschwindigkeit der Generierung schwer mit traditionellen Datenverarbeitungsmethoden verarbeitet werden können. Diese Datenmengen können aus verschiedenen Quellen stammen, darunter soziale Medien, Unternehmensanwendungen, Sensoren, Maschinenprotokolle und mehr.

Es gibt drei Hauptmerkmale, die Big Data charakterisieren, oft als die "3 Vs" bezeichnet:

  1. Volumen: Es bezieht sich auf die enorme Menge an Daten, die erzeugt oder gesammelt werden. Diese Daten können im Terabyte-, Petabyte- oder sogar Exabyte-Bereich liegen.

  2. Vielfalt: Es beschreibt die verschiedenen Arten von Daten, die in Big Data-Sets enthalten sein können. Dies schließt strukturierte Daten (z.B., Datenbanken), unstrukturierte Daten (z.B., Text, Bilder, Videos) und halbstrukturierte Daten (z.B., JSON, XML) ein.

  3. Geschwindigkeit: Es bezieht sich auf die Geschwindigkeit, mit der Daten generiert, gesammelt und verarbeitet werden müssen. In einigen Anwendungen müssen Daten in Echtzeit analysiert werden, um schnell auf sich ändernde Bedingungen oder Muster zu reagieren.

Zusätzlich zu den "3 Vs" werden manchmal auch andere Merkmale wie Veracity (Genauigkeit der Daten), Variability (Variabilität der Daten) und Value (Wert der Daten) als wichtige Aspekte von Big Data betrachtet.

Die Verarbeitung und Analyse von Big Data erfordern spezielle Technologien und Tools, da herkömmliche Datenbanken und Analysesoftware oft an ihre Grenzen stoßen. Technologien wie Hadoop, Apache Spark, NoSQL-Datenbanken und Cloud-Computing-Plattformen werden häufig eingesetzt, um mit den Herausforderungen von Big Data umzugehen und wertvolle Erkenntnisse aus diesen Daten zu gewinnen. Unternehmen nutzen Big Data, um Muster zu identifizieren, Entscheidungen zu optimieren, die Effizienz zu verbessern und innovative Produkte und Dienstleistungen zu entwickeln.

 

 

Related content

Lerneinheit: Aktuelle Megatrends in der Informatik
Lerneinheit: Aktuelle Megatrends in der Informatik
More like this
Data-Mining
Data-Mining
More like this
Lerneinheiten Betriebswirtschaft
Lerneinheiten Betriebswirtschaft
Read with this
Lerneinheit: Daten-Mart
Lerneinheit: Daten-Mart
More like this