große Daten

Big Data [1] [2] ist ein Begriff in der Informatik , die auf die Sammlung, Speicherung bezieht sich breit, [3] Analyse, [4] Verarbeitung und Interpretation der großen Mengen von Daten . Wie viele andere IT-Wort hat große Daten keine dänische Übersetzung.

Der Rahmen für große Datenmengen im Laufe der Jahre stark verschoben. Es wurde von einer Wahrnehmung von bewegten Gigabyte Daten als große Mengen von Daten, einem im Jahr 2012 darüber gesprochen Petabyte und Exabyte als großen Mengen. [5] [6] Der Trend zu größeren Datenmengen hat , die Grundlage für die Fähigkeit , aus der Analyse eines einzelnen Satzes von vielen zusammenhängenden Daten zusätzliche Informationen zu ziehen, im Vergleich zu getrennten, kleinerem Satz mit der gleichen Gesamtdatenmenge , die ermöglicht , für Verbindungen , so dass Sie können „Spot Business – Trends , ermitteln Forschung Qualität, verhindern Krankheiten , vergleichen Sie die rechtlichen Zitate, zu bekämpfen Kriminalität und halten ein Auge auf Verkehrsbedingungen in Echtzeit.“ [7] [8]

Wissenschaftler stehen oft Einschränkungen aufgrund großer Datenmengen; solche Bereiche könnten Meteorologie , Genetik , [9] komplexe physikalische Simulationen [10] , und biologische und Umweltforschung . [11]

Im Jahr 2012 produziert auf dem Internet große Mengen an Daten, zum Beispiel über soziale Dienste wie Facebook und Flickr .

Big – Daten in Echtzeit, zum Beispiel oft produziert. GPS – Geräte und digitale Sensoren in Autos eingebettet, Krankenhausausrüstung, etc .. Man kann auch große Datenmengen haben , die nicht einmal eine Kopie, sondern einfach zugegriffen durch haben API ‚s.

Merkmale

Da die „Big Data“ bedeutet „Big Data“ ist es verlockend , große Daten wie die Fläche zu charakterisieren mit großen Datenmengen zu tun hat. Allerdings gibt es einige Experten , die behaupten , dass es nicht nur die Größe der Datenmenge, die auf das Paradigma um große Datenmengen wesentlich sind. Viktor Mayer-Schönberger und Kenneth Cukier zitiert drei Merkmale: der Lage gewesen , um große Datenmengen zu analysieren und nicht nur eine Probe ; dass Daten bereit ist , zu behandeln , die unordentlich und nicht notwendigerweise genau; und dass sie aussehen Korrelation nicht Kausalität . [12] Andere haben gekennzeichnet große Daten auf drei Vs: „Velocity“ (Geschwindigkeit bei der Verarbeitung von Daten), „Lautstärke“ (Datenmenge) und „Sorte“ (Diversität in den Daten). [13]

Verwalten große Daten

Bei großen Mengen heterogener Daten (Big Data) arbeitet, ist es oft , dass das traditionelle SQL – Datenbank – Paradigma der Aufgabe nicht lösen kann. Teilweise , weil man kann nicht ein Modell machen , die alle Daten Merkmale aufnehmen und skaliert auch die nicht für die große Menge an Daten. Deshalb übernimmt oft große Datenmengen in NoSQL – Datenbanken. Im Grunde eine Art von Datenbank wählen , die Analyse von Daten in einer bestimmten Art und Weise unterstützt. Zum Beispiel. wählen soziale Netzwerke speichern oft Informationen darüber , wer ist „Freunde“ mit wem, in den so genannten Graph – Datenbanken. Wenn Sie viele semi-strukturierte Informationen haben, wählen Sie eine oft eine Dokumentendatenbank genannt.

Referenzen

  1. Aufspringen^ (Englisch) Weiß, Tom (10 Mai 2012). Hadoop: The Definitive Guide . O’Reilly Media. p. 3. ISBN 978-1-4493-3877-0 .
  2. Aufspringen^ (Englisch) MIKE2.0, Big Data Definition .
  3. Aufspringen^ (Englisch) Kusnetzky, Dan. Was ist „Big Data?“ . ZDNet.
  4. Aufspringen^ (Englisch) Vance, Ashley (22. April 2010). “ Start-Up geht nach Big Data Mit Hadoop Helper „. New York Times Blog .
  5. Aufspringen^ (Englisch) Francis, Matthew (2012-04-02). Zukunft Teleskop – Array Entwicklung von Exabyte Verarbeitung angetrieben . Abgerufen 2012.10.24 .
  6. Aufspringen^ (Englisch) Watters, Audrey (2010) (Webseite / Slide). Das Zeitalter der Exabyte: Werkzeuge und Ansätze für Big Data Verwalten . Hewlett-Packard Development Company . Abgerufen 2012.10.24 .
  7. Aufspringen^ (Englisch) E-Discovery – Sonderbericht: The Rising Tide of Nonlinear Bewertung . Hudson Globale . 1. August 2012 abgerufen . von Cat Casey und Alejandra Perez
  8. Aufspringen^ (Englisch) Welche Technologie-Assisted Electronic Discovery lehrt sie über die Rolle des Menschen in der Technik – Re-Humanisierung Technologie-Assisted Bewertung . Forbes . 1. August 2012 abgerufen .
  9. Aufspringen^ (English) „ Gemeinschaft Klugheit erforderlich “. Nature 455 (7209): 1. 4 September 2008. doi : 10.1038 / 455001a .
  10. Aufspringen^ (Englisch) „ Sandia Datenmanagement Spirale Herausforderungen sieht “. HPC – Projekte . 4. August 2009.
  11. Aufspringen^ (Englisch) Reichman, ABl; Jones, MB; Schildhauer, MP (2011). „Herausforderungen und Chancen von Open Data in Ecology“. Science 331 (6018): 703-5. doi : 10.1126 / science.1197962 .
  12. Aufspringen^ Viktor Mayer-Schönberger und Kenneth Cukier (2013). Big Daten . ISBN 978-1-84854-791-9 .
  13. Aufspringen^ Anders Lisdorf (18. August 2014). Big Data? Vergiss es . Version2 .