Kategorie

Data Mining

Data-Mining für wissenschaftliche Bibliotheken

Wir leben in einer Zeit, in der immer mehr Daten erzeugt und gesammelt werden. Und dieses Datenwachstum wird sich in den nächsten Jahren und Jahrzehnten noch weiter beschleunigen. Es entstehen aber nicht nur einfach immer größere Datenmengen, sondern diese Datenberge sind einzigartige Quellen und Möglichkeiten, um mit der Hilfe verschiedener Analyseverfahren wie Data Mining, Big Data etc. völlig neue Erkenntnisse zu jedem Thema oder Fachgebiet zu gewinnen. Große Tech-Unternehmen wie Amazon,...

mehr lesen

Datengestützte Analyse zur Erforschung von Trends in der Bibliothekswissenschaft

Wie hat sich die Bibliothekswissenschaft in den letzten 20 Jahren entwickelt? Welche Trends sind gekommen und wieder gegangen? Diese Fragen sind elementar, wenn es um die Weiterentwicklung der Bibliothekswissenschaft als gesamte wissenschaftliche Fachdisziplin geht. Frühere Studien in diesem Bereich haben für diesen Zweck nur eine einzige Analysemethode eingesetzt. Damit ergibt sich aber kein umfassendes Bild der Veränderungen der Wissenstrends in der Bibliothekswissenschaft. In der...

mehr lesen

Text und Data Mining – in Recht, Wissenschaft und Gesellschaft

Am 21. und 22. Juni 2018 findet in Trier eine Tagung zum aktuellen und spannenden Thema Text und Data Mining (TDM) statt. Organisiert wird diese Veranstaltung von der Universität Trier sowie dem dort ansässigen Kompetenzzentrum für elektronische Erschließungs- und Publikationsverfahren in den Geisteswissenschaften. Neben grundlegenden Einführungen in das TDM stehen auch die mit diesen automatischen Analyseverfahren verbundenen rechtlichen Anforderungen im Mittelpunkt der Veranstaltung. Bei dem...

mehr lesen

DGI-Praxistage 2016

Am 10. und 11. November 2016 finden in Frankfurt am Main die "DGI-Praxistage 2016" statt. Das Veranstaltungsmotto der von der Deutsche Gesellschaft für Information und Wissen e.V. (DGI) organisierten Tagung lautet "Predictive Analytics – Blick in die Glaskugel oder glasklare Prognose?". Inhaltlich beschäftigt sich der Anlass mit Big Data und Predictive Analytics, also Themen, die aktuell in den Unternehmen heiß diskutiert werden. Grundsätzlich verspricht Predictive...

mehr lesen

Fortschritte in der Computer- und Informationstechnologie aufnehmen und integrieren

In den kommenden Jahren sind Bibliotheken gezwungen, sich neu zu erfinden, indem sie zu ihren Wurzeln zurückkehren. Aber nicht als eine Art Museum von physischen Gegenständen, die sie an ihre Benutzer ausleihen. Sondern vielmehr als Organisatoren von Information und wertvollen Ressourcen, indem sie in der Lage sind, diese Informationen an die Bedürfnisse einer innovativen, digitalen Welt anzupassen. Diese Vision bildet die Ausgangslage des folgenden Beitrags. Basierend auf den 20-jährigen...

mehr lesen

Wettbewerbsanalyse mit sozialen Medien

Viele Unternehmen und Organisationen haben längst erkannt, welche wichtige Rolle soziale Medien im Leben von vielen Usern einnehmen. Immer öfter nutzen sie daher Social Media-Plattformen wie Facebook und Twitter, um ihre Produkte und Dienstleistungen anzubieten oder um mit ihren Kunden zu kommunizieren. Folge davon ist, dass große Mengen der von diesen Usern generierten Inhalte frei zugänglich auf solchen sozialen Medien-Websites verfügbar sind. Um einen Wettbewerbsvorteil zu erhalten sowie die geschäftlichen Rahmenbedingungen beurteilen zu können, ist es nötig nicht nur die auf den eigenen Social Media-Websites befindlichen Inhalte zu analysieren, sondern auch die auf den Seiten der Konkurrenten enthaltenen Inhalte zu beobachten und auszuwerten. Wie man konkret eine Wettbewerbsanalyse auf sozialen Medien-Plattformen durchführt und die sozialen Medien-Daten in Wissen für die Entscheidungsträger umwandelt, wird in diesem Beitrag erläutert. Anhand eines Fallbeispiels aus der Pizza-Branche wird gezeigt, wie aus unstrukturierten Textinformationen auf Facebook- und Twitter-Seiten mittels Text-Mining nützliches Wissen extrahiert werden kann.

Als Anschauungsbeispiel in diesem Artikel dienen die Facebook- und Twitter-Seiten der drei größten Pizza-Ketten Pizza Hut, Domino’s Pizza und Papa John’s Pizza. Zuerst eine kurze Erläuterung zu Text Mining: Text Mining ist ein auf Algorithmen basierendes Analyseverfahren. Mittels Text Mining-Software ist es möglich, aus großen Mengen an unstrukturierten, textuellen Daten, wie man sie z.B. auf Webseiten oder sozialen Netzwerken findet, entscheidungsrelevante Informationen herauszufiltern. So können durch Text Mining-Analyseverfahren aus HTML-Seiten oder E-Mails z.B. Muster, Korrelationen, Trends oder Regeln identifiziert und extrahiert werden. Studien gehen davon aus, dass 80% aller in einem Unternehmen vorhanden Informationen in unstrukturierten, textuellen Daten vorliegen. Text Mining-Techniken werden aber nicht nur unternehmensintern eingesetzt, sondern sind von Forschern bereits erfolgreich für eine Vielzahl von Themenbereichen wie Wirtschaft, Medizin oder im Bildungsbereich eingesetzt worden. Mit Text Mining können Texte zusammengefasst, klassifiziert oder mit Metadaten automatisch angereichert werden.

Für die hier vorgestellte Fallstudie sollen die folgenden grundlegenden Fragen beantwortet werden:

Welche Muster lassen sich auf den Facebook-Seiten dieser drei Pizza-Ketten finden?
Welche Muster lassen sich auf den jeweiligen Twitter-Seiten finden?
Was sind die größten Unterschiede in Bezug auf ihre Facebook- und Twitter-Muster?
Um diese Fragen zu beantworten, wird eine soziale Medien-Wettbewerbsanalyse von diesen drei Unternehmen in einem 2-stufigen Verfahren durchgeführt. Zuerst werden manuell von ihren sozialen Medien-Auftritten verschiedene quantitative Daten wie die Anzahl der Fans/Follower, Anzahl der Postings, Kommentare, Shares und Likes etc. gesammelt. In der 2. Phase werden Text Mining-Auswertungen von den auf diesen sozialen Medien-Seiten veröffentlichten Text-Nachrichten durchgeführt. Hierbei erhält man Muster und Erkenntnisse, wie diese Unternehmen soziale Medien in der Praxis einsetzen. Als Stichprobe für das Text Mining dienen alle …

mehr lesen