Welcome!

By registering with us, you'll be able to discuss, share and private message with other members of our community.

SignUp Now!

Fragen zu Double Content

piti66

New member
Registriert
18. Apr. 2006
Beiträge
72
Reaktionspunkte
0
Hey,

ich habe mal ne Frage zu doppel Content!
Wir haben gerade unsere Domain relauncht. Dadurch leiten wir alte News auf einen andere Datei und neue per rewrite auf eine Datei.
Bei den neuen sind die News im endeffekt auf 2 wegen erreichbar:
einmal: http://www.dcrs.de/n/7/Rosl-ist-Deutschlands-aeltestes-Flusspferd.html
und: http://www.dcrs.de/content/news.php?id=7
In der Mod_rewirte Datei steht folgendes:

RewriteRule ^n/([0-9]+)/([^\_]+)\.html(.*)$ content/news.php?id=$1 [NC]

Ist denn sowas doppelter Content? Meine wie soll man dass denn anders lösen?
Doppelt rewriten geht ja nicht?

mfg

Sebastian
 
Das content Verzeichnis per Robots.txt sperren.
 
Problem da sind noch andere wichtige Dateien drin.
Wie soll dass denn aussehen?
 
Das ist normalerweise kein Problem.
Lege eine Sitemap.xml in Schema 0.90 an.
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
Google, MSN und Yahoo haben sich auf ein einheitliches Sitemap-Format geeinigt und diesen xml-Feed schreibst Du in Deine Robots.txt rein.

Der Eintrag in der Robots.txt schaut dann so aus:
User-agent: *
Disallow: /admin/
Disallow: /contrib/
Disallow: /doc/
Disallow: /lib/
Disallow: /modules/
Disallow: /plugins/
Disallow: /scripts/
Disallow: /tmp/
Sitemap: http://www.DEINEDOMAIN.tld/sitemap.xml

Alle 3 Suchmaschinen beachten diesen Hinweis und folgen dieser URLliste in der Sitemap und das wars.

Grüssle Heiko
 
Also müßte ich dynamisch alle Nachrichten in ein Sitemap einbinden?
Dann gehen die Suchmaschinen auch nur noch über diesen Link?

mfg

Sebastian
 
Damit Gurgel es auch wirklich schluckt ist folgendes empfehlenswert:

Code:
User-agent: Googlebot
Disallow: /content/
Disallow: /content/*
 
Doppelter Content meint eigentlich etwas anderes. Die allergische Reaktion tritt auf wenn der Content 1:1 ist jedoch über zwei verschiedene Source Adressen zu erreichen ist. In deinem Falle ist die Source die Gleiche...

Nicht desto trotz solltest du schauen das du das einigermaßen sauber ziehst. Auf Dauer sehen es Sumas natürlich nicht so gerne...
 
@ piti,
nein, die Suchmaschinen kommen natürlich nach wie vor über Deine Seite. Nur mit dem Unterschied, dass die Sumas nun bei Crawlschwierigkeiten oder Unstimmigkeiten ins eigene Archiv schaut und dann die Sitemap.xml zu Rate zieht.

In der Regel wird die auch beachtet und dann ist Ruhe.

Björn hat aber sicher auch Recht, wenn er sagt, dass die Vorarbeit, also sauberes mod_rewriten im Vorfeld von Dir geschehen sollte. Um so leichter Du es dem Suchmaschinenbot machst, Deinen Inhalt zu spidern, desto besser und einfacher klappts nachher auch mim Ranken ;)

Grüssle Heiko
 
Danke an alle. Habe es anders gelößt! ;)

mfg

Sebastian
 
Zurück
Oben