Dein wichtigster Touchpoint zur Digitalbranche.
Dein wichtigster Touchpoint zur Digitalbranche.
Technologie
Bad Scraping: Hat Google Lyrics von Genius.com kopiert?
Screenshot YouTube, © Google

Bad Scraping: Hat Google Lyrics von Genius.com kopiert?

Niklas Lewanczik | 17.06.19

Genius.com hat Google vorgeworfen, deren Songtexte ohne Hinweis auf die Quelle für sich zu nutzen. Mit einem Trick wurde die Anschuldigung untermauert.

Die Website Genius.com fokussiert sich auf Musik und stellt unter anderem Songtexte zur Verfügung. Diese sind allerdings von Google gescraped und den Nutzern der Suchmaschine gezeigt worden, ohne dass auf Genius als Quelle verwiesen wurde. Der Vorwurf steht schon länger im Raum. Doch nun hat Genius die eigenen Songtexte markiert, um nachzuweisen, dass sie für Google unrechtmäßig kopiert wurden.

Der clevere Zusatz für die Lyrics

Schon seit einiger Zeit hatte Genius.com Google vorgeworfen, dass die Lyrics der Seite bei der Suchmaschine eingesetzt werden, ohne eine Lizenz dafür erstanden zu haben oder auf die Website als Quelle zu verweisen. Also hat man sich bei Genius etwas einfallen lassen, um aufzuzeigen, dass die bei Google gefundenen Songtexte tatsächlich von der eigenen Seite stammen. Beim Wall Street Journal wurde ein Video veröffentlicht, das zeigt, wie die Texte von Genius.com letztlich bei Google landen. Doch wie wird das nachgewiesen und wer ist eigentlich für dieses Scraping verantwortlich?

Im Video wird zunächst erklärt, wie Genius bei bestimmten Lyrics zwei verschiedene Apostroph-Typen eingesetzt hat: einen geraden und einen geschwungenen. Diese wurden beispielsweise bei dem Songtext zu Alessia Caras Not Today unterschiedlich integriert. In der Folge konnte bei einer Googlesuche nach den Lyrics zum Song festgestellt werden, dass in den von Google bereitgestellten Lyrics – allerdings mit Copyright-Angabe für Sony/ATV Music Publishing LLC – die exakt gleichen unterschiedlichen Apostrophe zu finden waren. Damit zeigte sich, dass dieser Songtext von Genius.com gescraped wurde. Darüber hinaus hat die Musik-Website somit aber ein klares Statement abgegeben. Denn die Anordnung der Apostrophe war nicht wahllos. Vielmehr wurde ein Morse-Code verwendet, der letztlich die Worte „Red Handed“ hervorbrachte, was soviel bedeutet wie „auf frischer Tat [erwischt]“.

© Wall Street Journal, Genius.com

Der Genius CSO Ben Gross hatte gegenüber dem WSJ bereits erklärt, man habe seit zwei Jahren Beweise bei Google vorgelegt, die die Kopien von Songtexten belegen sollten. Nun ist ein weiteres Dementi von Google kaum möglich. Gegenüber The Verge erklärte ein Googlesprecher:

[We are] investigating this issue with our data partners and if we find that partners are not upholding good practices we will end our agreements.

Wer ist für die Kopien verantwortlich?

Das zitierte Google-Statement weist bereits darauf hin, dass Google bei der Generierung von Songtexten für die Suchergebnisse auf einen externen Partner vertraut. Diesen hätte man womöglich schon genauer unter die Lupe nehmen können, als Genius damit begann dem Unternehmen Vorwürfe wegen der kopierten Lyrics zu machen. Jedenfalls wird eine Untersuchung nun eingeleitet. Zudem wird in den digitalen Medien spekuliert, dass der Partner LyricFind für die Bereitstellung der Songtexte verantwortlich ist.

Durch die exakten Kopien der Songtexte hatte Genius.com zuletzt auch weniger Traffic über die Suchmaschine erhalten, weil die Seite als Quelle nicht aufgeführt wurde. Ob das in Zukunft anders sein wird, ist noch nicht bestätigt. Zumindest aber ist klar, dass das Scraping der Lyrics nun, da es publik und kaum widerlegbar ist, in dieser Form beendet werden dürfte. Viele User fragen sich indes, welche Inhalte Google außerdem für die Suchergebnisseiten heranzieht und ob hierbei immer die Urheberschaft ersichtlich wird. Die Frage nach dieser wird auch für Google wichtiger werden. Andernfalls könnten Nutzer, gerade jüngere, die Google als allwissenden Informations-Keeper kennengelernt haben, den Eindruck erhalten, dass die Suchmaschine eigens all die Inhalte bereitstellt, die auch bei No Click-Suchen relevant werden. Die clevere Idee von Genius.com schiebt diesem Irrglauben jedoch immerhin in Sachen Songtexte einen Riegel vor.

Kommentare aus der Community

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

*
*