Video: Nicholas Christakis: The hidden influence of social networks 2024
Menschen dazu neigen, Gemeinschaften zu bilden - Cluster von anderen Menschen, die Ideen und Gefühle haben. Durch die Untersuchung dieser Cluster wird es einfacher, bestimmte Verhaltensweisen der Gruppe insgesamt zuzuordnen (obwohl die Zuordnung des Verhaltens zu einem Individuum sowohl gefährlich als auch unzuverlässig ist).
Die Idee hinter dem Studium von Clustern ist, dass, wenn eine Verbindung zwischen Menschen existiert, sie oft gemeinsame Ideen und Ziele haben. Indem Sie Cluster finden, können Sie diese Ideen ermitteln, indem Sie die Gruppenmitgliedschaft überprüfen. Zum Beispiel ist es üblich, Gruppen von Menschen in der Erkennung von Versicherungsbetrug und Steuerinspektionen zu finden. Unerwartete Gruppen von Menschen könnten den Verdacht aufkommen lassen, dass sie Teil einer Gruppe von Betrügern oder Steuerhinterziehern sind, weil ihnen die üblichen Gründe fehlen, sich unter solchen Umständen zu versammeln.
Freundschaftsgrafiken können darstellen, wie sich Menschen miteinander verbinden. Die Scheitel stellen Individuen dar und die Kanten stellen ihre Verbindungen dar, wie Familienbeziehungen, Geschäftskontakte oder Freundschaftsbande. Typischerweise sind Freundschaftsgraphen ungerichtet, weil sie gegenseitige Beziehungen darstellen, und manchmal werden sie gewichtet, um die Stärke der Bindung zwischen zwei Personen darzustellen.
Viele Studien konzentrieren sich auf ungerichtete Graphen, die sich ausschließlich auf Assoziationen konzentrieren. Sie können auch gerichtete Graphen verwenden, um zu zeigen, dass Person A die Person B kennt, aber Person B nicht einmal weiß, dass Person A existiert. In diesem Fall müssen Sie tatsächlich 16 verschiedene Triadenarten berücksichtigen.
Bei der Suche nach Clustern in einem Freundschaftsgraphen hängen die Verbindungen zwischen Knoten in diesen Clustern von Dreikreisen ab - im Wesentlichen von speziellen Arten von Dreiecken. Verbindungen zwischen drei Personen können in diese Kategorien fallen:
- Geschlossen: Alle drei kennen sich. Denken Sie in diesem Fall an eine familiäre Umgebung, in der jeder jeden kennt.
- Offen: Eine Person kennt zwei andere Menschen, aber die beiden anderen kennen sich nicht. Denken Sie an eine Person, die ein Individuum bei der Arbeit und ein anderes Individuum zu Hause kennt, aber das Individuum bei der Arbeit weiß nichts über das Individuum zu Hause.
- Verbundenes Paar: Eine Person kennt eine der anderen Personen in einer Triade, kennt aber die dritte Person nicht. Diese Situation beinhaltet zwei Personen, die etwas darüber wissen, dass sie jemandem begegnen - jemand, der potenziell Teil der Gruppe sein möchte.
- Unverbunden: Der Dreiklang bildet eine Gruppe, aber niemand in der Gruppe kennt sich. Das letzte mag etwas merkwürdig erscheinen, aber denk an eine Tagung oder ein Seminar.Die Leute bei diesen Ereignissen bilden eine Gruppe, aber sie wissen vielleicht nichts voneinander. Da sie jedoch ähnliche Interessen haben, können Sie Clustering verwenden, um das Verhalten der Gruppe zu verstehen.
Triaden treten natürlich in Beziehungen auf, und viele soziale Netzwerke im Internet haben diese Idee genutzt, um die Verbindungen zwischen den Teilnehmern zu beschleunigen. Die Dichte der Verbindungen ist für jede Art von sozialem Netzwerk wichtig, da ein verbundenes Netzwerk Informationen leichter verbreiten und Inhalte teilen kann. Als beispielsweise LinkedIn, das professionelle soziale Netzwerk, beschloss, die Verbindungsdichte seines Netzwerks zu erhöhen, suchte es nach offenen Triaden und versuchte sie zu schließen, indem es Leute einlud, sich zu verbinden. Das Schließen von Dreiklängen bildet die Grundlage des Verbindungsvorschlagsalgorithmus von LinkedIn. Sie können mehr darüber erfahren, wie es funktioniert, indem Sie die Antwort der Quora lesen.
Das Beispiel hier basiert auf dem Beispielgraphen des Zachary's Karate Club. Es ist ein kleines Diagramm, mit dem Sie sehen können, wie Netzwerke funktionieren, ohne viel Zeit mit dem Laden eines großen Datensatzes zu verbringen. Glücklicherweise erscheint dieser Datensatz als Teil des
networkx
-Pakets. Das Zachary's Karate Club Netzwerk repräsentiert die Freundschaftsbeziehungen zwischen 34 Mitgliedern eines Karate Clubs von 1970 bis 1972. Der Soziologe Wayne W. Zachary nutzte es als Studienobjekt. Er schrieb einen Artikel mit dem Titel "Ein Informationsflussmodell für Konflikt und Spaltung in kleinen Gruppen". "Interessant an diesem Diagramm und seiner Arbeit ist, dass in diesen Jahren im Club ein Konflikt zwischen einem der Karatelehrer (Knotennummer 0) und dem Präsidenten des Klubs (Knotennummer 33) entstand. Indem Sie die Grafik gruppieren, können Sie die Aufteilung des Clubs in zwei Gruppen kurz nach dem Auftreten fast perfekt vorhersagen.
Da dieses Beispiel auch einen Graphen zeigt, der die Gruppen anzeigt (damit Sie sie leichter visualisieren können), müssen Sie auch das
matplotlib
-Paket verwenden. Der folgende Code zeigt, wie die Knoten und Kanten des Datasets dargestellt werden.
importiere networkx als nx
importiere matplotlib. pyplot als plt
% matplotlib inline
graph = nx. karate_club_graph ()
pos = nx. spring_layout (Grafik)
nx. zeichnen (graph, pos, with_labels = True)
plt. show ()
Um die Grafik auf dem Bildschirm anzuzeigen, müssen Sie auch ein Layout bereitstellen, das bestimmt, wie die Knoten auf dem Bildschirm positioniert werden. In diesem Beispiel wird der kraftgerichtete Algorithmus von Fruchterman-Reingold verwendet (der Aufruf von
nx. Spring_layout
). Die Abbildung zeigt die Ausgabe des Beispiels. (Ihre Ausgabe kann etwas anders aussehen.)
Der kraftgesteuerte Algorithmus von Fruchterman-Reingold zum Erzeugen automatischer Layouts von Graphen erzeugt verständliche Layouts mit getrennten Knoten und Kanten, die sich nicht kreuzen, indem sie nachahmen, was in der Physik zwischen elektrisch geladenen Teilchen oder Magneten mit demselben Vorzeichen passiert. Wenn Sie sich die Grafikausgabe ansehen, können Sie sehen, dass einige Knoten nur eine Verbindung haben, einige zwei und einige mehr als zwei.Die Kanten bilden, wie bereits erwähnt, Triaden. Die wichtigste Überlegung ist jedoch, dass die Abbildung deutlich die Clusterbildung zeigt, die in einem sozialen Netzwerk auftritt.