VOR EINIGER Zeit habe ich mal von reCAPTCHA geschrieben, kurz bevor Google es aufgekauft hat.
Damals fand ich es ja grandios, dass die Computeruser Wort für Wort Bücher auf diese Weise übersetzen. Ist von der Grundidee immer noch wahnsinnig toll, nur ist die Lesbarkeit der Worte in letzter Zeit drastisch gesunken.
Mittlerweile wird reCAPTCHA ja schon überall verwendet, vielleicht ist das der Grund warum die Worte unleserlicher geworden sind, weil immer mehr Programme sich darauf stürzen, ebendiese Captchas zu lösen und daher die Buchstaben immer mehr verstümmelt werden müssen.
Erste Zweifel kamen mir, als ich sah, dass die Typografie ignoriert wird. Eindeutig als Kapitälchen geschriebener Text wird von den Usern natürlich in reinen Großbuchstaben geschrieben, wodurch eine Auszeichnungsart wegfällt. Überhaupt habe ich die Erfahrung gemacht, dass Groß- und Kleinschreibung scheinbar generell egal ist.
Außerdem werden scheinbar nicht nur englischsprachige Texte übersetzt, ich habe auch schon deutsche Worte gefunden, auch welche mit Umlauten. Wie viele Leute können auf ihrer Tastatur überhaupt Umlaute eingeben? Die wenigsten. Und so habe ich auch schon Worte, bei denen verschiedene Akzente verwendet wurden ohne diese geschrieben, und sie wurden akzeptiert. Wenn genug Leute (und das trifft auf die Mehrzahl der Benutzer zu) die Worte ohne Akzente eingeben, werden sie so übernommen.
Es kommt auch vor, dass ein Wortende und ein Wortanfang als ein Vorschlag präsentiert werden, zusammen mit einem dritten, vollständigen Wort. Da ist man gezwungen, die zwei halben Wörter als eines zusammenzuschreiben, denn ein Leerzeichen trennt ja die 2 Vorschläge, also kann man für einen Vorschlag ja kein Leerzeichen verwenden.
Dann gibt es die unleserlichen Dinge. Manchmal möchte ich schon 1:1 das eingeben, was zu sehen ist, bis ich draufkomme, dass es ein bestimmtes Wort sein kann, obwohl nicht alle Buchstaben passen.
Letztlich sind dann noch die Worte, die in keiner Sprache vorkommen können, und keinen Sinn ergeben, wo drei „c“ hintereinander stehen oder überhaupt unerkennbarer Kauderwelsch. Bei diesen Dingen schaue ich dann nur noch auf das lesbare Wort, für das zweite gebe ich Zufallsbuchstaben ein, und es funktioniert. Leider kommt es in letzter Zeit sogar vor, dass zwei unleserliche Worte erscheinen, wovon eines scheinbar von einigen Leuten erkannt wurde, da eines der beiden Worte ja immer ein erkanntes Wort darstellt.
Anfangs habe ich es toll gefunden, und habe mir Mühe gegeben das Richtige einzugeben, da ich das Projekt unterstützenswert fand, aber jetzt ist es nur noch lästig, und ich drücke immer öfter auf den „weiter“ Knopf, um andere, hoffentlich lesbare Vorschläge zu bekommen.
Ganz ehrlich? Ich möchte kein Buch lesen, dass auf diese Weise digitalisiert wurde. Ich ärgere mich ja schon bei normalen Büchern über Rechtschreibfehler.