Datenvisualisierung

Aus induux Wiki
Datenvisualisierung bringt präsentationsneutrale Daten in eine grafische Präsentationsform, damit der Mensch Muster, Korrelationen und Trends schneller verstehen oder gar überhaupt erkennen kann. Die Datenvisualisierung wird oftmals durch Skalen, Infografiken, Heatmaps, Diagramme und geografische Karten realisiert. Das Sammeln, Interpretieren aus Daten und das Gewinnen von Daten wird als Data Science bezeichnet.



Die Datenvisualisierung ist Teil von Unternehmenssoftware, wie z. B. der Condition Monitoring Software.

Datenquellen

Generell kann jeder Datensatz eine Basis für einen Visualisierung darstellen. In Abhängigkeit vom Datensatz können unterschiedliche Visualisierungsmethoden angewendet und neue Erkenntnisse gewonnen werden.

Datenquelle Eigenschaften der Datentypen
Tabellen Objekte mit Attributen
Graphen Objekte mit Relationen, möglicherweise mit Attributen
Mediadaten Objekte mit Attributen, teilweise auch Relationen
Prozesse

Taxonomie

Eine Taxonomie hat das Ziel, Objekte klassifizieren zu können. Als Objekte betrachten wir den Prozess der Informationsvisualisierung, um Fragen nach Datentyp und Visualisierungstechnik beantworten zu können.

Im folgenden die Taxonomie orientiert an „A Task by Data Type Taxonomie for Information Visualizations (TTT) von Ben Shneidermann.

Bei der TTT werden 7 Datentypen und 7 Aufgaben unterschieden (Die englische Bezeichnung soll jeweils beibehalten werden).


Die 7 Datentypen:

  1. 1-dimensional Wie z.B. ein Textdokument (Zeile für Zeile) und eine alphabetische Namensliste.
  2. 2-dimensional Wie z.B. eine geographische Karte, ein Zeitungslayout.
  3. 3-dimensional 3D-Objekte, wie z.B. chemische Moleküle, Gebäude.
  4. Temporal Zeitlinien, z.B. in medizinischen Datensätzen oder Projektmanagementsystemen.
  5. multi-dimensional Meist bei relationalen Datenbanken.
  6. Tree Eine Hierarchie bzw. Tree Struktur ist eine Menge, in der jedes einen Vater besitzt, mit Ausnahme des Vater-Knotens (root). Die einzelnen als auch die Verbindungen zwischen ihnen besitzen Attribute.
  7. Network Strukturen, die nicht die Tree Bedingung erfüllen.

Die TTT-Datentypen stellen einen gewissen Abstraktionsgrad dar, so dass spezielle Datentypen unterzuordnen sind.


Die 7 Aufgaben:

  1. Overview Überblick über einen IR. Strategien dafür sind z.B. Zoom out und Fisheye View.
  2. Zoom Vergrößerung des Details von Interesse.
  3. Filter Ausfiltern von uninteressanten Informationen.
  4. Details-on-demand Detailliertere Information wird dargestellt, wenn der Nutzer es anfordert. Dies reduziert die kognitive Last des Nutzers und die Belastung der Rechnerressourcen.
  5. Relate Darstellung von Beziehungen zwischen den Informationen.
  6. History Speicherung der Nutzeraktionen, so dass Aktionen wie Undo oder Redo möglich sind.
  7. Extract Extraktion gewisser Bereiche des dargestellten IR, um diesen Bereich z.B. in ein File zu speichern, per Email (z. B. via Gmail (E-Mail-Lösung von Google)) zu versenden, zu drucken oder in eine andere Applikation zu integrieren.

Der Begriff Focus+Context lässt sich nach der TTT als Kombination von Overview, Relate und Zoom definieren, d.h. der vom Nutzer selektierte Bereich wird vergrößert und detaillierter dargestellt, während der Kontext (die Struktur) verkleinert und weniger detailliert sichtbar bleibt.

Chris North pflegt am Human-Computer Interaction Laboratory der Universität zu Maryland eine Online-Listehttp://www.cs.umd.edu/ north/infoviz.html der publizierten IVis-Applikationen und Visualisierungstechniken, die in die TTT eingeordnet wurden.

Webbasierte Datenvisualisierung

Die Webbasierte Datenvisualisierung ist die Visualisierung von Daten und Informationen mittels Web-Technologie und besteht aus drei Komponenten:

  1. Backend : hier werden Daten gespeichert und verarbeitet, z. B. werden Daten von Daten bzw. Informationen aus Daten abgeleitet.
  2. Frontend: hier werden die Daten dargestellt.
  3. Visualisierungs-Pipeline hier erfolgt das Mapping der (in der Regel präsentationsneutralen) Daten in eine Datenstruktur für die jeweilige grafische Visualisierungs-Methode.

Anwendungsbereiche sind z. B. Condition Monitoring Software

Frontend-Technologie

Bei der webbasierten Datenvisualisierung werden Web-Technologien verwendet, die Daten direkt oder ggf. mittels eines Plugins in einem Web-Browser laden, interpretieren und darstellen.


  • HTML (Hypertext Markup Language) ist die Markup-Sprache des Webs. Vor allem textuelle Informationen werden damit dargestellt bzw. grafische Darstellungsformen eingebettet.
  • Mit CSS (Cascading Style Sheets) werden textuell Layout-Informationen der mit HTML beschriebenen Dokumente definiert, z. B. welche Schriftart verwendet wird, wie groß ein Text ist und welche Farbe er hat.
  • JavaScript

Grafiken

Grafiken sind ein Bild (Frame) oder mehrere Bilder in einer Datei, die direkt von einem Web-Browser angezeigt werden können.

Rastergrafik

Vektorgrafik

Mit SVG (Scalable Vector Graphics) lassen sich - wie der Name schon sagt, vektororientiert Grafiken beschreiben. Mit SVG wird das "Zeichnen" durch den Browser beschrieben. Dies bietet zwei Vorteile:

  • Die "Grafik" (es ist ja nur ein Textfile) ist sehr klein
  • Die Darstellung ist optimal für das jeweilige Display, da das Zeichnen am jeweiligen Gerät erfolgt. Somit entfallen z. B. Aliasing-Effekte.

3D-Grafik

  • Apples WebKit „GPU for the Web“
  • WebGL
  • Direct3D

Software

Im Folgenden liegt der Fokus auf Open-Source-Software, die für die Daten- bzw. Informations-Visualisierung im Web geeignet ist.

  • Camunda ist ein BPM-System mit dem Geschäftsprozesse als BPMN modelliert und als PNG, JPEG, SVG export werden können.
  • Gephi ist eine Software zur Visualisierung und Exploration von Graphen sowie Netzwerke. Open-source.
  • Für 3D-Modell und fotorealistisches Rendering
  • GNU Octave ist eine mathematisch orientierte Umgebung mit Zeichen- und Visualisierungs-Tools.
  • Das R Project ist für statistische Berechnung von Daten mit grafischer Darstellung.
  • Web-Frameworks sind fester Bestandteil einer Web-Applikation, die in der Regel das Lesen der Daten vom Server oder einer andern Quelle (z. B. via RSS) sowie das Rendern im Browser übernehmen.
  • Bootstrap ist ein populäres HTML, CSS, und JS Framework zur Entwicklung von responsive Websites; also Gerüst für Websites mit Grafiken.
  • An open-source JavaScript library for world-class 3D globes and maps
  • Chart.js: Simple yet flexible JavaScript charting for designers & developers
  • WebGL-powered Framework für die visuelle Exploration zur Datenanalyse von großen Datensets.
  • D3.js ist eine JavaScript Bibliothek zur datenbasierten Erstellung von Dokumenten. D3 bringt Leben in die Website mit HTML, SVG und CSS. D3 setzt auf Web-Standards mit hoher * * dygraphs ist eine schnelle und flexible open source JavaScript charting library.
  • Shiny: A web application framework for R. Turn your analyses into interactive web applications. No HTML, CSS, or JavaScript knowledge required.
  • JavaScript InfoVis Toolkit: JavaScript Framework für Interaktive Datenvisualisierung im Web.

Kostenfreier Download. Spende erbeten.

  • OpenLayers: A high-performance, feature-packed library for all your mapping needs.
  • Leaflet: an open-source JavaScript library for mobile-friendly interactive maps
  • Plotly's Python graphing library makes interactive, publication-quality graphs online. Examples of how to make line plots, scatter plots, area charts, bar charts, error bars, box plots, histograms, heatmaps, subplots, multiple-axes, polar charts, and bubble charts.
  • pygal: Sexy python charting. Generiert SVG.
  • Matplotlib is a Python 2D plotting library which produces publication quality figures in a variety of hardcopy formats and interactive environments across platforms. Matplotlib can be used in Python scripts, the Python and IPython shell, the jupyter notebook, web application servers, and four graphical user interface toolkits.
  • The Jupyter Notebook is an open-source web application that allows you to create and share documents that contain live code, equations, visualizations and explanatory text. Uses include: data cleaning and transformation, numerical simulation, statistical modeling, machine learning and much more.

Nicht Open Source

  • fusioncharts: The most comprehensive JavaScript charting library, with over 90+ charts and 1000+ maps.

Loved by 27,000 customers in 118 countries.

  • Highcharts makes it easy for developers to set up interactive charts in their web pages.

Highcharts is a JavaScript charting library with a huge range of chart options available. The output is rendered using SVG in modern browsers and VML in Internet Explorer.

  • Elastic Kibana: cool, aber nicht Open-Source.

Quellen


Du hast Feedback zur Wiki-Seite?