Zum Inhalt

Vorbereitung

Einstieg in die Programmierung

Lege als Erstes eine Python-Datei an und importiere dsstools. Zusätzlich importieren wir networkx, da wir ab und an auf Funktionen dieses Packages zurückgreifen:

import dsstools
import networkx as nx

Das Package NetworkX wird im Import innerhalb python immer als networkx geschrieben und für gewöhnlich mit einem Alias nx versehen, um die Schreibweise abzukürzen.

Import eines Graphen

Zuerst muss ein Graph importiert werden. Das kann über eine sog. Schnittstelle des Lehrstuhls oder aber über eine Datei geschehen. Für Letzteres gibt es mehrere Datenformate wie das sog. Pajek-Format oder das von Gephi verwendete gexf-Format. Für diese Formen von Textdateien bietet NetworkX selbst Funktionen an, die die Dateninhalte in einen Graphen im richtigen Format überführen können.:

  • read_pajek für Pajek-Dateien
  • read_gexf für Graph Exchange XML Format
  • Ein Überblick über alle kompatiblen Formate ist hier zu finden.

Falls du alternativ die Schnittstelle nutzen willst, lies bitte hier weiter.

Hinweis

Wir empfehlen für den Anfang, die Daten als networkx.DiGraph zu importieren.

Bereinigung (optional)

Manchmal müssen Kanten, deren Ursprungs- und Endknoten identisch ist, aus dem Netzwerk entfernt werden. Das lässt sich mittels networkx erledigen:

graph.remove_edges_from(nx.selfloop_edges(graph))

In diesem Fall werden Selfloops entfernt, also Kanten, deren Start- und Endknoten der gleiche ist. Das kommt bisweilen bei gecrawlten Netzwerken vor.