Email Network of KIT Informatics
Download
The dataset can be downloaded from Tübingen's Graph Database: GraphDB
Description
(The following description is also enclosed in the download)
Each line represents an email contact and looks similar to the following example: 2006-09-13 07:39:32;11;5;12;8;92530801
Each line is separated by semicolons (;) into 6 cells. These carry the following information:
1: timestamp of the email in the format “yyyy-mm-dd hh:mm:ss” (example: 2006-09-13 07:39:32)
2: id of sender as a nonnegative integer (example: 11)
3: id of sender's chair as a nonnegative integer (example: 5)
4: id of recipient as a nonnegative integer (example: 12)
5: id of recipient's chair as a nonnegative integer (example: 8)
6: id of the email as a nonnegative integer (example: 92530801)
Details:
1: Lines are ordered by timestamp
2+4: Ids of persons (i.e., senders and recipients) are unique among all persons. The set of ids used for persons is consecutive.
3+5: Likewise, ids of chairs are unique among all chairs. For a basic graph this information is not necessary, however it serves, e.g., as a ground-truth clustering of the persons. The set of ids used for chairs is consecutive, starting at 0.
6: Ids of emails are unique for each email sent. These ids can help to identify sets of sender-receiver pairs which in fact constitute emails sent to multiple recipients. Matching timestamps need not suffice for this purpose. These sets always appear consecutively. Note that the set of ids used for emails is not consecutive.
If you use this data, or parts of it, in publications, please cite the following:
“
Dynamic network of email communication at the Department of Informatics at Karlsruhe Institute of Technology (KIT). Data collected, compiled and provided by Robert Görke and Martin Holzer of ITI Wagner and by Olaf Hopp, Johannes Theuerkorn and Klaus Scheibenberger of ATIS, all at KIT. 2011.
i11www.iti.kit.edu/projects/spp1307/emaildata
”
Feel free to look for news and further details or to report back to us at i11www.iti.kit.edu/projects/spp1307/emaildata or per email to mailto:robert [dot] goerke [at] kit [dot] edu
License
(The following license is also enclosed in the download)
Weitergabe anonymisierter Maildaten für Forschungszwecke
Verpflichtung auf das Datengeheimnis (§ 6 LDSG)
Ich (wie in der Registrierung dieser Graphdatenbank angegeben) wurde heute
1. auf die Wahrung des Datengeheimnisses nach § 6 Landesdatenschutzgesetz i.d.F. vom 27. Mai 1991 (GBl. S. 277), geänd. durch Art. 2 G zum SWR-Staatsvertrag vom 21. Juli 1997 (GBl. S. 297) verpflichtet;
2. darauf hingewiesen, dass es untersagt ist, geschützte personenbezogene Daten unbefugt zu einem anderen als dem zur jeweiligen rechtmäßigen Aufgabenerfüllung gehörenden Zweck zu verarbeiten, bekanntzugeben, zugänglich zu machen oder sonst zu nutzen und dass diese Pflichten auch nach Beendigung der Tätigkeit fortbestehen;
3. darüber belehrt, dass Verstöße gegen das Datengeheimnis ggf. nach §§ 33, 34 LDSG und anderen einschlägigen Rechtvorschriften mit Freiheits- oder Geldstrafen geahndet werden können; eine disziplinarrechtliche Verfolgung wird dadurch nicht ausgeschlossen;
4. darüber belehrt, dass eine Verletzung des Datengeheimnisses in den meisten Fällen gleichzeitig eine Verletzung der Amtsverschwiegenheit bzw. einen Verstoß gegen die arbeitsvertragliche Schweigepflicht darstellen und arbeitsrechtliche Maßnahmen zur Folge haben kann.
5. informiert, dass er die ihm von der ATIS überlassenen anonymisierten Daten in keinem Fall rekonstruieren darf, so dass Rückschlüsse auf einzelne Personen oder Institute gezogen werden können. Er verpflichtet sich die Daten nach Möglichkeit weiter zu verfremden, damit eine Rekonstruktion der realen Informationen nicht , oder nur mit erheblichem Aufwand möglich ist.
6. verpflicht zu akzeptieren, dass die Weitergabe der Daten nur über die hierfür bereitgestellte Webseite http://i11www.iti.kit.edu/projects/spp1307/emaildata und über die Datenbank https://kandinsky.informatik.uni-tuebingen.de/forschung/graphdb erlaubt ist. Die vorliegende Erklärung muss akzeptiert und eingehalten werden. Werden die Daten auf anderem Wege weitergegeben, ist die vorliegende Verpflichtung vom Empfänger ebenfalls zu akzeptieren und unterschrieben an die untenstehende Adresse des Lehrstuhl für Algorithmik einzusenden.
Karlsruher Institut für Technologie (KIT)
Institut für Theoretische Informatik
Lehrstuhl für Algorithmik I
Postfach 6980
76128 Karlsruhe
Sie / Er bestätigt /bestätigen den Empfang einer Abschrift dieser Niederschrift.
………………, den
(Ort)
………………………………………………..
(Unterschrift der/des Verpflichteten)