Data-Mining und Petaelektronenvolt: Unterschied zwischen den Seiten

Aus AnthroWiki
(Unterschied zwischen Seiten)
imported>Odyssee
Keine Bearbeitungszusammenfassung
 
imported>Odyssee
(Weiterleitung nach Elektronenvolt erstellt)
 
Zeile 1: Zeile 1:
Unter '''Data-Mining''' [{{IPA|ˈdeɪtə ˈmaɪnɪŋ}}] (von {{enS|data mining}}, aus {{enS|data}} ‚Daten‘ und {{enS|mine}} ‚graben‘, ‚abbauen‘, ‚fördern‘)<ref>{{Internetquelle |url=http://www.duden.de/rechtschreibung/Data_Mining |titel=Eintrag Data-Mining |werk=duden.de |zugriff=2016-12-18}}</ref> versteht man die systematische Anwendung statistischer Methoden auf große Datenbestände (insbesondere „[[Big Data]]“ bzw. Massendaten) mit dem Ziel, neue [[Mustererkennung|Querverbindungen und Trends]] zu erkennen. Solche Datenbestände werden aufgrund ihrer Größe mittels computergestützter Methoden verarbeitet. In der Praxis wurde der Unterbegriff ''Data-Mining'' auf den gesamten Prozess der sogenannten „[[Knowledge Discovery in Databases]]“ ({{enS}} für Wissensentdeckung in Datenbanken; KDD) übertragen, der auch Schritte wie die Vorverarbeitung und Auswertung beinhaltet, während Data-Mining im engeren Sinne nur den eigentlichen Verarbeitungsschritt des Prozesses bezeichnet.<ref name="fayyad" />
#WEITERLEITUNG [[Elektronenvolt]]
 
Die Bezeichnung ''Data-Mining'' (eigentlich etwa „Abbau von Daten“) ist etwas irreführend, denn es geht um die Gewinnung von Wissen aus bereits vorhandenen Daten und nicht um die Generierung von Daten selbst.<ref name="han-kamber-dm">{{Literatur |Autor=Jiawei Han, Micheline Kamber |Titel=Data mining: concepts and techniques |Auflage=1 |Verlag=Morgan Kaufmann |Datum=2001 |ISBN=978-1-55860-489-6 |Seiten=5 |Kommentar=Thus, data mining should habe been more appropriately named „knowledge mining from data,“ which is unfortunately somewhat long}}</ref> Die prägnante Bezeichnung hat sich dennoch durchgesetzt.
Die reine [[Datenerfassung|Erfassung]], Speicherung und [[Datenverarbeitung|Verarbeitung]] von großen Datenmengen wird gelegentlich ebenfalls mit dem [[Schlagwort (Linguistik)|Buzzword]] Data-Mining bezeichnet. Im wissenschaftlichen Kontext bezeichnet es primär die Extraktion von [[Wissen#Organisationstheoretischer Ansatz|Wissen]], das „[[Validität|gültig]] (im statistischen Sinne), bisher unbekannt und potentiell nützlich“<ref name="ester-sander">{{Literatur |Autor=Martin Ester, Jörg Sander |Titel=Knowledge Discovery in Databases. Techniken und Anwendungen |Verlag=[[Springer Science+Business Media|Springer]] |Ort=Berlin |Datum=2000 |ISBN=3-540-67328-8}}</ref> ist „zur Bestimmung bestimmter Regelmäßigkeiten, Gesetzmäßigkeiten und verborgener Zusammenhänge“.<ref name="duden">{{Internetquelle |url=http://www.duden.de/rechtschreibung/Data_Mining#block_2 |titel=Duden: Data-Mining: Bedeutung, Rechtschreibung, Grammatik, Herkunft |zugriff=2011-08-09 |autor=[[Duden]] online |hrsg=[[Bibliographisches Institut]]}}</ref> Fayyad definiert es als „ein[en] Schritt des [[Knowledge Discovery in Databases|KDD-Prozesses]], der darin besteht, Datenanalyse- und Entdeckungsalgorithmen anzuwenden, die unter akzeptablen Effizienzbegrenzungen eine spezielle Auflistung von Mustern (oder Modellen) der Daten liefern“.<ref name="fayyad">{{Literatur |Autor=Usama M. Fayyad, Gregory Piatetsky-Shapiro, Padhraic Smyth |Titel=From Data Mining to Knowledge Discovery in Databases |Sammelwerk=AI Magazine |Band=17 |Nummer=3 |Datum=1996 |Seiten=37–54 |Online=[http://www.kdnuggets.com/gpspubs/aimag-kdd-overview-1996-Fayyad.pdf als PDF] auf: ''kdnuggets.com''}}</ref>
 
== Knowledge Discovery in Databases ==
 
'''Knowledge Discovery in Databases''' ('''KDD'''), auf Deutsch '''Wissensentdeckung in Datenbanken''' umfasst die Vorbereitung der Daten und die Analyse der Ergebnisse des Data-Minings und gliedert sich in folgende Schritte, die in der Regel mehrmals durchlaufen werden:
 
# Bereitstellung von ''[[Hintergrundwissen]]'' für den jeweiligen Fachbereich
# Definition der ''Ziele'' der Wissensfindung
# Datenauswahl
# [[w:Datenbereinigung|Datenbereinigung]]
# Datenreduktion (z.&nbsp;B. durch [[w:Konvertierung (Informatik)|Transformationen]])
# Auswahl eines ''Modells'', in dem das gefundene [[Wissen]] repräsentiert werden soll
# '''Data-Mining''', die eigentliche Datenanalyse
# [[Interpretation]] der gewonnenen [[Erkenntnis]]se
 
== Data-Mining-Prozess ==
{{Hauptartikel|Knowledge Discovery in Databases}}
 
Data-Mining ist der eigentliche Analyseschritt des '''Knowledge Discovery in Databases''' Prozesses. Die Schritte des iterativen Prozesses sind grob umrissen:<ref name="ester-sander" />
* Fokussieren: die [[w:Datenerhebung|Datenerhebung]] und Selektion, aber auch das Bestimmen bereits vorhandenen Wissens
* Vorverarbeitung: die [[w:Datenbereinigung|Datenbereinigung]], bei der Quellen integriert und Inkonsistenzen beseitigt werden, beispielsweise durch Entfernen oder [[w:Imputation (Statistik)|Ergänzen]] von unvollständigen Datensätzen.
* Transformation in das passende Format für den Analyseschritt, beispielsweise durch [[w:Selektion (Informatik)|Selektion]] von Attributen oder [[Diskretisierung]] der Werte
* Data-Mining, der eigentliche Analyseschritt
* Evaluation der gefundenen Muster durch den Experten und Kontrolle der erreichten Ziele
In weiteren [[Iteration]]en kann nun bereits gefundenes Wissen verwendet („in den Prozess integriert“) werden um in einem erneuten Durchlauf zusätzliche oder genauere Ergebnisse zu erhalten.
 
== Siehe auch ==
 
*{{WikipediaDE|Data-Mining}}
 
== Literatur ==
 
* {{Literatur
  |Autor=Martin Ester, Jörg Sander
  |Titel=Knowledge Discovery in Databases. Techniken und Anwendungen
  |Verlag=[[Springer Science+Business Media|Springer]]
  |Ort=Berlin
  |Datum=2000
  |ISBN=3-540-67328-8}}
* {{Literatur
  |Autor=Ian H. Witten, Eibe Frank, Mark A. Hall
  |Titel=Data Mining: Practical Machine Learning Tools and Techniques
  |Auflage=3
  |Verlag=Morgan Kaufmann
  |Ort=Burlington, MA
  |Datum=2011
  |ISBN=978-0-12-374856-0
  |Kommentar=auf Englisch, Software zum Buch: [[Waikato Environment for Knowledge Analysis|WEKA]]
  |Online=http://www.cs.waikato.ac.nz/~ml/weka/book.html}}
* {{Literatur
  |Autor=Sholom M. Weiss, Nitin Indurkhya
  |Titel=Predictive Data Mining. A Practical Guide
  |Verlag=Morgan Kaufmann
  |Ort=Burlington, MA
  |Datum=1997
  |ISBN=1-55860-403-0
  |Kommentar=auf Englisch}}
* {{Literatur
  |Autor=Jiawei Han, Micheline Kamber, Jian Pei
  |Titel=Data Mining: Concepts and Techniques
  |Verlag=Morgan Kaufmann
  |Ort=Burlington, MA
  |Datum=2011
  |ISBN=978-0-12-381479-1
  |Kommentar=auf Englisch}}
* {{Literatur
  |Autor=Usama M. Fayyad, Gregory Piatetsky-Shapiro, Padhraic Smyth
  |Titel=From Data Mining to Knowledge Discovery in Databases
  |Sammelwerk=AI Magazine
  |Band=17
  |Nummer=3
  |Datum=1996
  |Seiten=37–54
  |Kommentar=auf Englisch
  |Online=http://www.kdnuggets.com/gpspubs/aimag-kdd-overview-1996-Fayyad.pdf}}
 
== Einzelnachweise ==
<references />
 
{{Normdaten|TYP=s|GND=4428654-5}}
 
[[Kategorie:Informatik]]
 
{{Wikipedia}}

Aktuelle Version vom 8. Februar 2020, 11:49 Uhr

Weiterleitung nach: