Atomare Datenkrake - Die Datenschleuder - CCC
Atomare Datenkrake - Die Datenschleuder - CCC
Atomare Datenkrake - Die Datenschleuder - CCC
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
Auf „atomarer Ebene“ enthält eine PlusGut-<br />
Datei zwei Hauptzweige: eine Audio-Spur mit<br />
den AAC-Daten sowie einen applikationsspezifischen<br />
„UserData“-Zweig, welcher die Metadaten<br />
enthält. In den Metadaten lassen sich relativ<br />
leicht Atome identifizieren, welche direkt<br />
oder indirekt auf den Käufer verweisen; bei den<br />
untersuchten Vergleichsdateien (gleiche Songs,<br />
unterschiedliche Käufer) unterscheiden sich<br />
die Werte der Atome apID und purd.<br />
Ersteres enthält den iTMS-Accountnamen im<br />
Klartext, letzteres das sekundengenaue Kaufdatum.<br />
<strong>Die</strong>se Daten sind auch in den kopiergeschützten<br />
iTunes-Dateien enthalten und werden<br />
von iTunes im Info-Bereich angezeigt. <strong>Die</strong><br />
PlusGut-Dateien unterscheiden sich aber auch<br />
in dem der AAC-Spur zugeordneten Bereich<br />
der Datei. Apple bettet hier relativ tief in die<br />
Atom-Hierarchie ein proprietäres, undokumentiertes<br />
Atom ein, das den Typ pinf hat und bei<br />
allen untersuchten Dateien exakt 32 KB groß<br />
ist. Unspezifizierte Atome sind für Player kein<br />
Problem, solange sie keine für die Wiedergabe<br />
benötigten Daten enthalten; durch die Längen-<br />
und Typangaben im Header können sie beim<br />
Parsen übersprungen werden.<br />
Der Datenteil des pinf-Atoms ist zwar (afaik)<br />
nicht öffentlich dokumentiert, ein Blick auf die<br />
Binärdaten legt aber die Vermutung nahe, daß<br />
es sich wiederum um eine Atom-Struktur handelt.<br />
Folgt man dieser Hypothese, ergibt sich<br />
die in der Abbildung dargestellte Struktur von<br />
Kind-Atomen.<br />
Der Datenteil des righ-Atoms scheint keine vollwertigen<br />
Atome zu enthalten, es fehlt jeweils<br />
die Längenangabe. Stattdessen scheint es sich<br />
um bis zu zehn „Pseudoatom“-Paare aus einer<br />
FourCC-Feldbezeichnung und einen 32-Bit-<br />
Datenteil zu handeln. Nicht alle dieser Pseudo-Atome<br />
sind immer vorhanden; das mode-<br />
Pseudoatom findet sich beispielsweise nur bei<br />
bestimmten Werten des tool-Pseudoatoms. Der<br />
nicht benutzte Rest der 80 zur Verfügung stehenden<br />
Bytes ist mit Nullen aufgefüllt.<br />
Bei allen untersuchten Dateien war der Datenteil<br />
der frma, schm, cert, veID, plat, aver, medi und<br />
48 48<br />
apple Music inc.<br />
ggf. mode-(Pseudo-)Atome mit den in der Abbildung<br />
gezeigten Werten belegt; aus Sicht der<br />
Frage, welche käuferspezifischen Daten eingebettet<br />
werden, sollten sie folglich nicht weiter<br />
interessant sein. Über den Inhalt einiger anderer<br />
Atome lassen sich – auch durch die Art, wie<br />
sie variieren – zumindest qualifizierte Vermutungen<br />
anstellen:<br />
user: Ist bei allen mit einem bestimmten<br />
Account erworbenen Dateien identisch, variiert<br />
aber von Account zu Account; scheint eine eindeutige<br />
Benutzer-ID zu sein,<br />
tran: Ist identisch für alle zusammen gekauften<br />
Dateien, auch für unterschiedliche Alben/<br />
Künstler; wahrscheinlich eine Transaktions-ID,<br />
song: Ist jeweils für einen bestimmten Song<br />
identisch, auch über verschiedene Käufer hinweg,<br />
und entspricht dem Inhalt des cnID-Atoms<br />
im Metadatenzweig. Möglicherweise eine eindeutige<br />
ID des Musikstücks,<br />
tool: Enthält offenbar einen FourCC, typischerweise<br />
der Form Pxxx, wobei xxx eine dreistellige<br />
Nummer ist. Könnte eine Art Versionsnummer<br />
der erzeugenden Software sein,<br />
name: Enthält den Namen des Käufers im Klartext,<br />
der Rest der 256 Bytes ist mit Nullen gefüllt,<br />
sign: Enthält zufällig aussehende Binärdaten,<br />
die in jeder Datei – also auch bei gleichem Käufer,<br />
Kauf, Künstler, Album etc. – unterschiedlich<br />
sind. Der FourCC und die Länge legen<br />
nahe, daß es sich um eine Signatur handelt.<br />
<strong>Die</strong> große Unbekannte ist das chtb-Atom; der<br />
FourCC entzieht sich einer naheliegenden<br />
Interpretation. Der Datenteil ist bei allen untersuchten<br />
Dateien ähnlich dem sign-Atom mit<br />
zufällig wirkenden Binärdaten gefüllt, die sich,<br />
ebenso wie beim sign-Atom, von Datei zu Datei<br />
unterscheiden.<br />
Neben diesen „direkt“ personenbezogenen<br />
Daten gibt es ein weiteres Merkmal, welches<br />
zumindest indirekt auf den Käufer einer Datei<br />
weist. In verschiedenen Atomen sind Zeitstem-<br />
die datenschleuder. #93 / 2008