Welcome!

By registering with us, you'll be able to discuss, share and private message with other members of our community.

SignUp Now!

Google liest den Text aus Bilder aus (impressum.gif) ??

omc

New member
Registriert
14. Nov. 2010
Beiträge
579
Reaktionspunkte
0
Liest und indexiert Google nun Texte aus Bildern? Wie ich darauf komme:

Google Alert: Google

Verlinkt ist nur das PDF. Im PDF ist der Scan NUR ALS Bild vorhanden. Keine Metainfos im PDF oder so....
und nun guckt euch die Description bei Google an. Sie findet sich wieder als Text im BILD des PDF.
Erstaunlich, erschreckend, zu erwarten.

Alle mit Bild im Impressum.... die Tage sind wohl gezählt :beer:

Oder jemand ne plausible Erklärung?
Gruss Ric
 
Die OCR-Bearbeitung von Bildern durch Sumas war ja schon lange zu erwarten bzw. zu befürchten.

Themen wie impressum.gif werden damit natürlich aktuell, da man die Daten so nicht mehr schützen kann.

Ich werfe dazu jetzt mal ein paar Stichpunkte ins Rennen. Den Rest seiner Strategie sollte sich jeder selbst erarbeiten können:
  • Impressum durch Zugriff von Sumas ausschließen / schützen
  • extra Verzeichnis für Impressumsdaten
  • Daten-Grafiken teilen
 
Zuletzt bearbeitet:
Daten-Grafiken teilen

Wie ist das zu verstehen? Gehst Du davon aus, dass Google die Daten nicht zusammenfügen kann wenn es statt einem Bild zwei hintereinanderliegende sind? Mit anderen Worten also: Name auf zwei Bilder verteilen und nebeneinander setzen und schon wird es nicht mehr als ein Wort erkannt?
 
Gehst Du davon aus, dass Google die Daten nicht zusammenfügen kann wenn es statt einem Bild zwei hintereinanderliegende sind? Mit anderen Worten also: Name auf zwei Bilder verteilen und nebeneinander setzen und schon wird es nicht mehr als ein Wort erkannt?
Es gibt sehr viele Möglichkeiten. Ziehe z.B. mal deine Schnittlinie nicht vertikal, sondern horizontal.
 
ihr macht es nur sehbehinderten Menschen schwerer...

Gruesse
Holger
 
Zuletzt bearbeitet:
Es gibt sehr viele Möglichkeiten. Ziehe z.B. mal deine Schnittlinie nicht vertikal, sondern horizontal.

ok der Gedanke ist interesant. Um zu wissen ob das wirkt muss man aber wissen ob die Suma jedes Bild einzeln ausliest oder in der Lage ist trotz diverser Bilder alles als Ganzes zu sehen.

Wenn ich Max Mustermann in vier Teile schneide und in der richtigen Reihenfolge zusammensetze kommt erst die obere Hälfte von Max dann die obere Hälfte von Mustermann und dann die untere Hälfte von Max - in der Seitenreihenfolge.

Ist die Frage ob das so gelesen wird oder ob die Technik das so sieht wie ein menschliches Auge.
 
ok der Gedanke ist interesant. Um zu wissen ob das wirkt muss man aber wissen ob die Suma jedes Bild einzeln ausliest oder in der Lage ist trotz diverser Bilder alles als Ganzes zu sehen.

Wenn ich Max Mustermann in vier Teile schneide und in der richtigen Reihenfolge zusammensetze kommt erst die obere Hälfte von Max dann die obere Hälfte von Mustermann und dann die untere Hälfte von Max - in der Seitenreihenfolge.

Ist die Frage ob das so gelesen wird oder ob die Technik das so sieht wie ein menschliches Auge.

Und wie die Tante reagiert wenn du den Namen Christoph Grill als 2 Bilder speicherst aber beim Einbau im Impressum andere Tags vergibst :)

Und als title / Alt Tag beim Bild Max / Mustermann anstelle von Christoph / Grill nimmst. Was hierbei Priorität hat und was eher gelistet wird ;-)
 
Wäre interessant zu wissen, wie sich das auf Bilder SEO auswirkt. Vielleicht kann sollte man ja neben dem alt Tag noch das Keyword mit ins Bild reinnehmen ;)
 
Wäre interessant zu wissen, wie sich das auf Bilder SEO auswirkt. Vielleicht kann sollte man ja neben dem alt Tag noch das Keyword mit ins Bild reinnehmen ;)
Die Impressumsseite sollte mit noindex im Header markiert sein, sowie mit nofollow verlinkt sein. Zusätzlich, falls möglich, in einem per robots.txt gesperrten Unterverzeichnis liegen. Da spielt SEO keine Rolle mehr. Sinn und Zweck ist es ja, dass der Name, Adresse, Rufnummer etc. nicht über Google und Co. zu finden sind.

Ist die Frage ob das so gelesen wird oder ob die Technik das so sieht wie ein menschliches Auge.
Um den aus dem Weg zu gehen, kann man mit dem Aufbau, Zwischengrafiken, Alt-Tags und Texten für "Verwirrung" sorgen.

ihr macht es nur sehbehinderten Menschen schwerer.
Nicht unbedingt. Erstens gibt es einen Weg sehbehinderten Menschen den Zugang zu ermöglichen und gleichzeitig seine Daten vor dem Bot von Sumas zu schützen, zweitens gäbe es noch den Weg die Daten per Audiodaten dem sehbehinderten Menschen zur Verfügung zu stellen.

Es gibt mit ein wenig Phantasie genug Möglichkeiten um das Indexieren der Daten aus dem Impressum zu verhindern. Da muss jeder seinen Weg finden.
 
Aus SEO-Sicht ist es vielleicht durchaus hilfreich die eigenen Daten eher im Verborgenen zu behalten. Allerdings möchte ich hier dennoch auf die Impressumpflicht hinweisen, die für alle euere Seiten gilt. Mir ist zwar keine gerichtliche Entscheidung bekannt, die sich explizit gegen die Grafik im Impressum ausspricht, aber eine Entscheidungen zum ähnlichen Thema Widerrufsbelehrung als Grafik [auf ebay] ist eindeutig.

Hier wurde das wunderbar zusammen gefasst.

Ein Spam-Bot wird meist nicht durch die robots.txt, sowie "no index" Attribute abgeschreckt. Auch erkennt er die typischen "Verschleierungspraktiken" bei E-Mail-Adressen, von wegen "max[at]muster.de", "max(at)muster.de" oder "[email protected]".

Ich persönlich habe gute Erfahrungen mit einer Mischung aus Plain, und ASCII-Zeichen (Dec- und Hex-Codes) gemacht. Zeigt jeder Browser an, ist barrierefrei und entspricht der Impressumpflicht.
 
Zurück
Oben