So, dieses Plagiat hat er jetzt nicht gefunden. Er hat die Quelle nicht gefunden. Und er schreibt: "ein Prozent übereinstimmende Wörter gefunden".
Ein Fehlschlag für diese Software. Debora Weber-Wulff blickt auf die Suchmaske auf ihrem Bildschirm. Die Professorin für Informatik an der Berliner Fachhochschule für Technik und Wirtschaft hat neun Plagiatsuchprogramme getestet. Solch eine Software soll Texte erkennen, die ohne Kennzeichnung der Autorenschaft ganz oder teilweise aus dem Internet kopiert worden sind. Die Informatikerin hat für den Test zehn Texte vorbereitet: acht Plagiate und zwei Texte, die keine Plagiate sind. Dieses Test-Material hat sie von den Suchprogrammen überprüfen lassen:
Die suchen die längste übereinstimmende Zeichenreihe. Das hat ein Problem im Deutschen, weil die meisten haben die Waffen gestreckt, als ein Umlaut aufgetaucht ist. Die konnten also nur eine Zeichenreihe finden von Umlaut zu Umlaut und haben durchaus gesagt: "Dieser Aufsatz stimmt nur mit 18 Prozent überein mit einer Quelle‘, wo es eigentlich zu 85 bis 90 Prozent übereinstimmen müsste.
Andere Programme erzeugten ständig Fehlermeldungen. Nur drei frei verkäufliche Programme bewertet Debora Weber-Wulff als gut: das britische CopyCatchGold, der in Paderborn programmierte PlagiarismFinder und, mit Einschränkung, die US-Software turnitin. Sie erkannten bei mindestens 7 von 10 Texten, ob es sich um ein Plagiat handelt oder nicht. Der Marktführer turnitin speichert die überprüften Texte anschließend dauerhaft in der Firmen-Datenbank. Das kollidiert mit europäischen Datenschutz- und Copyrightstandards. In Großbritannien, wo die meisten Universitäten Kunden von turnitin sind, muss deshalb jeder Student eine Einverständniserklärung unterschreiben. PlagiarismFinder und CopyCatchGold speichern die überprüften Texte nicht ab. Bei CopyCatchGold würde das auch keinen Sinn machen. David Woolls vom Birminghamer Unternehmen CFL Software hat das Programm so entwickelt, dass zuerst der fragliche Text allein analysiert wird:
Ich versuche, einen Stilbruch im Text nachzuweisen. Das Programm analysiert unter anderem die Länge von Sätzen und die Häufigkeit und den Typ bestimmter Wörter, außerdem – und da gibt die Anzahl der Kommata einen Hinweis – die Häufigkeit von Nebensätzen. Mit Hilfe solcher Kriterien errechnet die Software einen stilistischen Wert für jeden einzelnen Satz und vergleicht ihn mit den Werten der Umgebung. Sätze mit sehr hohen Werten werden als verdächtig markiert und können dann mit dem Internet verglichen werden.
... oder mit einem gewöhnlichen Buch, aus dem der Dozent den Satz zu kennen glaubt. Der Stil verrät den unerfahrenen Plagiator, weiß auch Debora Weber-Wulff. Sie hat eine simple Methode entwickelt, um mit Verstand, aber ohne teure Software Plagiate aufzudecken:
Man sucht sich für meine Begriffe drei bis fünf Substantive raus. Damit habe ich relativ viel Erfolg. Substantive sind eher die Teile, die die Schüler und Schülerinnen nicht verändern. Gerade eine Suchmaschine wie Google hat keine Schwierigkeiten damit, wenn die Substantive nicht ganz nah beieinander sind, so ein bisschen weiter weg voneinander sind oder irgendein Halbsatz dazwischengeschoben worden ist. Ja, und dann hat man durch die Eingabe von diesen Wörtern oft tatsächlich einen Hit.
Vorsichtigen Schülern und Studenten gelingt es zwar meist, Verben oder Adjektive durch Synonyme zu ersetzen, zum Beispiel das Wort "gewaltig" durch "enorm". Bei Substantiven, besonders Fremdwörtern, wie "Authentizität" oder "Forensik", kapitulieren sie aber in der Regel. Laut Debora Weber-Wulff erzielt ein Computer-Kenner mit einer gewöhnlichen Suchmaschine genauso gute Ergebnisse wie mit der Spezial-Software. Für unerfahrene Benutzer ist aber ein solches Hilfsprogramm sinnvoll. Allerdings werden auch Software und Suchmaschinen den Text-Raub aus dem Internet wohl nicht beenden. David Woolls:
Das Dilemma ist: Es gibt so viel Material im Internet, an das man nicht unmittelbar heran kommt, das man nur herunterladen kann. Außerdem wird es Studenten immer an Zeit und Kreativität mangeln. Deshalb ist die Software nur ein Baustein im Kampf gegen das Problem. Studenten wissen jetzt, dass ihre Professoren Quellen, die aus dem Internet stammen, sehr wohl identifizieren können.
Abschreckung lautet die Devise. Und Aufklärung. Deshalb hat David Woolls auch ein Programm entwickelt, mit dem Schüler und Studenten den richtigen Umgang mit fremden Texten lernen sollen.
Ein Fehlschlag für diese Software. Debora Weber-Wulff blickt auf die Suchmaske auf ihrem Bildschirm. Die Professorin für Informatik an der Berliner Fachhochschule für Technik und Wirtschaft hat neun Plagiatsuchprogramme getestet. Solch eine Software soll Texte erkennen, die ohne Kennzeichnung der Autorenschaft ganz oder teilweise aus dem Internet kopiert worden sind. Die Informatikerin hat für den Test zehn Texte vorbereitet: acht Plagiate und zwei Texte, die keine Plagiate sind. Dieses Test-Material hat sie von den Suchprogrammen überprüfen lassen:
Die suchen die längste übereinstimmende Zeichenreihe. Das hat ein Problem im Deutschen, weil die meisten haben die Waffen gestreckt, als ein Umlaut aufgetaucht ist. Die konnten also nur eine Zeichenreihe finden von Umlaut zu Umlaut und haben durchaus gesagt: "Dieser Aufsatz stimmt nur mit 18 Prozent überein mit einer Quelle‘, wo es eigentlich zu 85 bis 90 Prozent übereinstimmen müsste.
Andere Programme erzeugten ständig Fehlermeldungen. Nur drei frei verkäufliche Programme bewertet Debora Weber-Wulff als gut: das britische CopyCatchGold, der in Paderborn programmierte PlagiarismFinder und, mit Einschränkung, die US-Software turnitin. Sie erkannten bei mindestens 7 von 10 Texten, ob es sich um ein Plagiat handelt oder nicht. Der Marktführer turnitin speichert die überprüften Texte anschließend dauerhaft in der Firmen-Datenbank. Das kollidiert mit europäischen Datenschutz- und Copyrightstandards. In Großbritannien, wo die meisten Universitäten Kunden von turnitin sind, muss deshalb jeder Student eine Einverständniserklärung unterschreiben. PlagiarismFinder und CopyCatchGold speichern die überprüften Texte nicht ab. Bei CopyCatchGold würde das auch keinen Sinn machen. David Woolls vom Birminghamer Unternehmen CFL Software hat das Programm so entwickelt, dass zuerst der fragliche Text allein analysiert wird:
Ich versuche, einen Stilbruch im Text nachzuweisen. Das Programm analysiert unter anderem die Länge von Sätzen und die Häufigkeit und den Typ bestimmter Wörter, außerdem – und da gibt die Anzahl der Kommata einen Hinweis – die Häufigkeit von Nebensätzen. Mit Hilfe solcher Kriterien errechnet die Software einen stilistischen Wert für jeden einzelnen Satz und vergleicht ihn mit den Werten der Umgebung. Sätze mit sehr hohen Werten werden als verdächtig markiert und können dann mit dem Internet verglichen werden.
... oder mit einem gewöhnlichen Buch, aus dem der Dozent den Satz zu kennen glaubt. Der Stil verrät den unerfahrenen Plagiator, weiß auch Debora Weber-Wulff. Sie hat eine simple Methode entwickelt, um mit Verstand, aber ohne teure Software Plagiate aufzudecken:
Man sucht sich für meine Begriffe drei bis fünf Substantive raus. Damit habe ich relativ viel Erfolg. Substantive sind eher die Teile, die die Schüler und Schülerinnen nicht verändern. Gerade eine Suchmaschine wie Google hat keine Schwierigkeiten damit, wenn die Substantive nicht ganz nah beieinander sind, so ein bisschen weiter weg voneinander sind oder irgendein Halbsatz dazwischengeschoben worden ist. Ja, und dann hat man durch die Eingabe von diesen Wörtern oft tatsächlich einen Hit.
Vorsichtigen Schülern und Studenten gelingt es zwar meist, Verben oder Adjektive durch Synonyme zu ersetzen, zum Beispiel das Wort "gewaltig" durch "enorm". Bei Substantiven, besonders Fremdwörtern, wie "Authentizität" oder "Forensik", kapitulieren sie aber in der Regel. Laut Debora Weber-Wulff erzielt ein Computer-Kenner mit einer gewöhnlichen Suchmaschine genauso gute Ergebnisse wie mit der Spezial-Software. Für unerfahrene Benutzer ist aber ein solches Hilfsprogramm sinnvoll. Allerdings werden auch Software und Suchmaschinen den Text-Raub aus dem Internet wohl nicht beenden. David Woolls:
Das Dilemma ist: Es gibt so viel Material im Internet, an das man nicht unmittelbar heran kommt, das man nur herunterladen kann. Außerdem wird es Studenten immer an Zeit und Kreativität mangeln. Deshalb ist die Software nur ein Baustein im Kampf gegen das Problem. Studenten wissen jetzt, dass ihre Professoren Quellen, die aus dem Internet stammen, sehr wohl identifizieren können.
Abschreckung lautet die Devise. Und Aufklärung. Deshalb hat David Woolls auch ein Programm entwickelt, mit dem Schüler und Studenten den richtigen Umgang mit fremden Texten lernen sollen.