/
Datenquellen

Datenquellen

Eine Datenquelle ist wie der Name schon sagt der Ursprungsort an den Daten generiert werden, also der Teil der Daten an einen Übermittlungsabschnitt liefert. Sie stellen für eine Anwendung die verfügbaren Daten bereit, mit denen die Anwendung arbeiten möchte. Eine Datenquelle besitzt eine Übertragungsschnittstelle mithilfe dieser Daten an eine Empfangsstelle (Datensenke) übertragen werden.

Datenquellen können Daten z.B. aus Datenbanken von der eigenen Festplatte oder einem Server, aus Anwendungen, Excel, CSV, XML oder jeder anderen Datei bereitstellen.

In einem Data Warehouse z.B. gibt es viele verschiedene Arten von Datenquellen, da eines der wichtigsten Ziele ist, Daten aus verschiedenen Quelle und Datenbanken miteinander zu verknüpfen um Reporting-Anforderungen und wichtige Entscheidungen zu unterstützen. Datenquellen sind allerdings nur Lieferanten von Daten für ein Data Warehouse und gehören nicht direkt dazu.

Datenquellen können interne Quellen (SAP oder andere operative Anwendungssysteme) oder externe Datenquellen wie z.B. öffentliche Datenbanken. Es wird bei Datenquellen außerdem noch zwischen Primär- und Sekundärdaten unterschieden.

 

Primärdaten werden eigens für den Zweck der Verwendung in dem Data Warehouse erhoben wobei Sekundärdaten bereits vorliegen, da sie für einen anderen Zweck genutzt werden. Sekundärdaten können Unternehmensinterne Daten sowie Daten aus öffentlichen Datenbanken sein. Diese Daten sind schnell verfügbar und kostengünstig zu erwerben. Allerdings können diese Daten nicht immer geeignet sein, da möglicherweise andere Formate oder andere Maßeinheiten verwendet wurden.

Zugriffsformen auf Datenquellen

Um auf Datenquellen zugreifen zu können, werden verschiedene Zugriffsformen benötigt. ODBC (Open Database Connectivity) 2) definiert, wie ein Client unabhängig vom Datenbankmanagementsystem 3) auf relationale und nicht-relationale Datenbanken zugreifen kann. Der Zugriff hierbei erfolgt über eine ODBC-Schnittstelle und nicht direkt auf die Datenbank.

JDBC (Java Database Connectivity) ist eine generische Java-Schnittstelle für Datenbanken, welche unabhängig von anderen Datenbankarchitekturen ist. Über die Schnittstelle kann mit SQL Datenbanken kommuniziert werden und SQL-Befehle können ausgeführt werden. Java Programme können über diese Schnittstelle auf Datenbanken zugreifen.

Echtzeit Datenquellen

Echtzeit Datenströme generieren durchgehend Daten von tausenden verschiedenen Datenquellen, welche simultan und in kleinen Datenblöcken aufgezeichnet werden. Zu den Daten gehören Protokolldateien welche von Webanwendungen generiert werden, Spielaktivitäten, verschiedene Informationen von sozialen Netzwerken, Börsen- oder auch Wetterdaten sowie E-Commerce Käufe, Telemetrie Daten von Geräten in Rechenzentren, Standortverfolgungsereignissen oder finanziellen Transaktionen.

Informationen aus diesen Echtzeit Datenquellen ermöglichen Unternehmen viele Einblicke in Kundenaktivitäten zu erhalten. Zum Beispiel können Medienunternehmen anhand von Auswertungen über die Playlisten der Benutzer die Platzierung von Inhalten optimieren, um interessantere Informationen für die Benutzer bereitzustellen und so ein besseres Benutzererlebnis zu ermöglichen.

Quellen

https://www.techopedia.com/definition/30323/data-source
https://msdn.microsoft.com/en-us/library/ms711688%28v=vs.85%29.aspx
http://www.learn.geekinterview.com/data-warehouse/data-types/what-is-data-source.html
https://aws.amazon.com/de/streaming-data/
http://www.itwissen.info/definition/lexikon/open-database-connectivity-ODBC.html
http://www.itwissen.info/definition/lexikon/Java-database-connectivity-JDBC.html

Related content

Lerneinheit: Daten-Mart
Lerneinheit: Daten-Mart
More like this
Lerneinheit Datenmapping
Lerneinheit Datenmapping
More like this
Datenflussdiagramm
Datenflussdiagramm
More like this
Datenmodelle
Datenmodelle
More like this
Lerneinheit: Datenarchitektur
Lerneinheit: Datenarchitektur
More like this
3-Schichten-Architektur von Datenbanksystemen
3-Schichten-Architektur von Datenbanksystemen
More like this