Gedanken zu SEO, Stichwort: Doppelter Content

Ein CMSimple Support Forum für deutsch sprechende Nutzer und Entwickler
olape
Posts: 1575
Joined: Fri Mar 13, 2015 8:47 am
Contact:

Gedanken zu SEO, Stichwort: Doppelter Content

Post by olape » Thu Feb 11, 2016 9:43 am

Da ich immer wieder Fragen zu diesem Thema bekomme, hier mal mein persönlicher Lösungsweg.
Das Problem stellt sich ja nicht nur bei CMSimple. Das ist bei vielen anderen Systemen fast identisch.

Wenn man CMSimple in der Grundinstallation betreibt, kann man alle Seiten unter 2 verschiedenen URLs aufrufen.
Die Startseite sogar unter 4 verschiednen URLs.

normale Seite:

Code: Select all

domain.tld/?irgendeine-seite
domain.tld/index.php?irgendeine-seite
Als konkretes Beispiel:
http://www.cmsimple-xh.org/de/?CMSimple
http://www.cmsimple-xh.org/de/index.php?CMSimple

Startseite:

Code: Select all

domain.tld/
domain.tld/index.php
domain.tld/?eureStartseite
domain.tld/index.php?eureStartseite
Als konkretes Beispiel:
http://www.cmsimple-xh.org
http://www.cmsimple-xh.org/index.php
http://www.cmsimple-xh.org/?Home
http://www.cmsimple-xh.org/index.php?Home

Wenn der Webserver oder auch nur das Hostingpaket ungünstig konfiguriert ist, dann ist der Aufruf mit und ohne www. möglich und das Ganze verdoppelt sich sogar noch.
Dann sind Seiten unter 4 bzw. die Startseite unter 8 verschiedenen URLs erreichbar.

normale Seite:

Code: Select all

domain.tld/?irgendeine-seite
domain.tld/index.php?irgendeine-seite
http://www.domain.tld/?irgendeine-seite
http://www.domain.tld/index.php?irgendeine-seite
Startseite:

Code: Select all

domain.tld/
domain.tld/index.php
domain.tld/?eureStartseite
domain.tld/index.php?eureStartseite
http://www.domain.tld/
http://www.domain.tld/index.php
http://www.domain.tld/?eureStartseite
http://www.domain.tld/index.php?eureStartseite
Also sollte man auf jeden Fall darauf achten, dass entweder die Einträge im Hostingpaket schon so vorgenommen werden, dass die Seite entweder nur ohne oder nur mit www. zu erreichen ist,
oder eine entsprechende Regel in der eigenen .htaccess einrichten, die sich darum kümmert.
Wobei ich mit der Weile dafür bin, das www. wegzulassen.

Als Regel für die .htaccess (jeweils die zweite Zeile für http bzw. die dritte für https, entsprechend die # entfernen!)

Code: Select all

# Umleitung auf www.
  RewriteCond %{HTTP_HOST} !^www\. [NC]
  #RewriteRule ^(.*)$ http://www\.%{HTTP_HOST}/$1 [R=301,L]
  #RewriteRule ^(.*)$ https://www\.%{HTTP_HOST}/$1 [R=301,L]
# Ende Umleitung auf www.
oder

Code: Select all

# Umleitung ohne www.
  RewriteCond %{HTTP_HOST} ^www\.(.*) [NC]
  #RewriteRule ^(.*)$ http://%1/$1 [R=301,L]
  #RewriteRule ^(.*)$ https://%1/$1 [R=301,L]
# Ende Umleitung ohne www.
Dann haben wir also nur noch den ersten Fall übrig (doppelt bzw. 4-fach).

Wer auf SSL setzt, der sollte jetzt noch dafür sorgen, dass wirklich alle Aufrufe auf https umgeleitet werden.
Ich habe robots.txt und die Ausgaben von Sitemapper_XH noch ausgenommen. Das könnt ihr also durchaus auch weglassen.
Ob das sinnvoll/nötig ist? Es kann nicht schaden denke ich.
Die letzte Zeile ist auch nicht zwingend notwendig.

Code: Select all

# SSL ein
  RewriteCond %{HTTPS} =off
  RewriteCond %{REQUEST_URI} !^/(robots\.txt) [NC]
  RewriteCond %{query_STRING} !^(sitemapper_index|sitemapper_sitemap)(.*)$ [NC]
  #
  RewriteRule ^(.*)$ https://%{HTTP_HOST}/$1 [R=301,L]
  Header set Strict-Transport-Security "max-age=604800" env=HTTPS
# Ende SSL ein
Wie problematisch das mit index.php ist, kann ich nicht einschätzen. Aber auf jeden Fall ist es möglich und es sollte daher, aus meiner Sicht, ausgeschlossen werden.

Mit einer weiteren Regel in der htaccess kann man index.php aus der URL entfernen. (auch hier wieder der Unterschied http oder https, entsprechend die # entfernen!)

Code: Select all

# index.php wir aus URL entfernt
  #RewriteRule ^([a-z]?[a-z]?/?)index\.php$ http://%{HTTP_HOST}/$1 [R=301]
  #RewriteRule ^([a-z]?[a-z]?/?)index\.php$ https://%{HTTP_HOST}/$1 [R=301]
# Ende index.php wir aus URL entfernt
Alle Regeln funktionieren natürlich nur, wenn der Server mod_rewrite unterstützt.
Vor diesen Regeln, wenn nicht schon vorhanden muss:

Code: Select all

<IfModule mod_rewrite.c>
RewriteEngine On
RewriteBase /
und nach diesen Regeln, wenn nicht schon vorhanden:

Code: Select all

</IfModule>
Damit bleibt nur noch der doppelte Aufruf der Startseite übrig.

Das habe ich bisher mit einem Kanonischen Link gelöst.
Also die seite domain.tld/?eureStartseite bekommt einen Kanonischen Link auf domain.tld/

Code: Select all

<link rel="canonical" href="http://domain.tld/">
Ich nutze dazu im Moment das Plugin xlang. (https://olaf.penschke.net/?CMSimple_XH--Plugins)
Das war ursprünglich für einen anderen Zweck gedacht, aber der kanonische Link bei der Startseite wird auch erzeugt.
Sollte allerdings nicht eingesetzt werden, wenn ihr Polyglott_XH (http://3-magi.net/de/?CMSimple_XH/Polyglott_XH) verwendet, da dann die hreflang Links schon erzeugt werden.


Auf die Spitze kann man das treiben, wenn man die Seite unter mehreren Domains aufrufen kann.
Auch hier sollte man sich für eine Domain entscheiden und die anderen nur weiterleiten (301 !), wenn es denn schon mehrer sein müssen.

Gruss Olaf
Last edited by olape on Thu Feb 11, 2016 11:31 am, edited 1 time in total.

cmb
Posts: 13465
Joined: Tue Jun 21, 2011 11:04 am
Location: Mü-Sa, RLP, DE
Contact:

Re: Gedanken zu SEO, Stichwort: Doppelter Content

Post by cmb » Thu Feb 11, 2016 10:51 am

Danke für die sehr gelungene Zusammenfassung, Olaf! Bisher gibt es nur ein paar einzelne Anleitungen zu diesem Themenkomplex im Wiki und auf svastis Site, wenn ich nicht irre, und evtl. auch in der Dokumentation, die Hartmut erstellt (hat).
olape wrote:Wenn man CMSimple in der Grundinstallation betreibt, kann man alle Seiten unter 2 verschiedenen URLs aufrufen.
Kleine Korrektur: bei aktuellen CMSimple_XH Versionen sind es sind 4 verschiedene URLs, da auch ein `selected` Parameter unterstützt wird, also rufen z.B. folgende URLs die gleiche Seite auf:
http://example.com/?Seite
http://example.com/?selected=Seite
Warum das mittlerweile so möglich ist, siehe http://cmsimpleforum.com/viewtopic.php?f=29&t=5702
Christoph M. Becker – Plugins for CMSimple_XH

olape
Posts: 1575
Joined: Fri Mar 13, 2015 8:47 am
Contact:

Re: Gedanken zu SEO, Stichwort: Doppelter Content

Post by olape » Thu Feb 11, 2016 11:30 am

Hallo Christoph,
selected
kannte ich noch nicht.
Wieder was dazu gelernt.

Gruss Olaf

Hartmut
Posts: 536
Joined: Sat Nov 05, 2011 6:13 pm
Location: Butzbach, Deutschland
Contact:

Re: Gedanken zu SEO, Stichwort: Doppelter Content

Post by Hartmut » Thu Feb 11, 2016 7:26 pm

Hallo

im Wiki gibt es mit dem Suchbegriff "duplicate content" einige Treffer zu diesem Thema.
Bei svasti bin ich auf http://svasti.de/en/?Tutorials/Search-E ... timization zu "SEO" fündig geworden, allerdings habe ich dort nichts zu "duplicate content" gefunden.
In meinen Dokumentationen sieht es Ähnlich wie bei svasti aus.
In der "CMSimple_XH (1.6.X) Dokumentation" (http://cmsimplexh-doku016.keil-portal.d ... ion=search) gibt es "nur" ein paar allgemeine bzw. ergänzende Informationen.
In meiner "übergeordneten" CMSimple_XH Dokumentation" http://cmsimplexh.webdesign-keil.de gibt es zu diesem Thema einen Link zu svasties Website und ein Hinweis zu Gerds Plugin Canonical, welches in der Version 1.2 auch unter CMSimple_XH funktionieren dürfte, aber nur das Problem "mit / ohne www" behandelt.

Aus meiner Sicht würde es Sinn machen auf Grundlage von Olafs bemerkenswerter Ausarbeitung ein Tutorial zu erstellen.
Da ich gerade ein paar andere CMSimple_XH Baustellen bearbeite, werde ich zu dem Thema "SEO - duplicate content" bestenfalls einen "3-Zeiler" mit den relevanten Links für die Dokumentation in den nächsten Wochen verfassen können. :-(
Vielleicht gibt es aber einen Freiwilligen? ;-)

Viele Grüße
Hartmut

olape
Posts: 1575
Joined: Fri Mar 13, 2015 8:47 am
Contact:

Re: Gedanken zu SEO, Stichwort: Doppelter Content

Post by olape » Fri Feb 12, 2016 7:02 pm

Was schwebt dir denn vor, als "freiwilliger Helfer"?

.htaccess und das Umschreiben der Überschriften, damit die Struktur H1 bis H4 stimmt (da gibt es schon eine Anleitung).
Dann hatte ich kürzlich noch das erweiterte Plugin Meta-Tags angespochen.
Das wäre das, was mir auf Anhieb einfällt.

Ausser natürlich viel und guter Content.
Gut strukturiert, alt-Tags zu Bilden, Titel-Tags, Bildernamen, usw..
Die allgemeinen Dinge eben.

Gruss Olaf

Hartmut
Posts: 536
Joined: Sat Nov 05, 2011 6:13 pm
Location: Butzbach, Deutschland
Contact:

Re: Gedanken zu SEO, Stichwort: Doppelter Content

Post by Hartmut » Fri Feb 12, 2016 8:44 pm

Hallo Olaf,

Du hast es (aus meiner Sicht) in deinen Threads sehr gut dokumentiert bzw. erwähnt und ich denke einmal wenn die "allgemeinen Dinge" noch in einige (viele) Zeilen aufgeführt werden, ist dieses Tutorial eine richtig gute und runde Sache.
Alternativ könnte diese Ausarbeitung auch kompakter ausfallen, wenn man auf die ursprünglichen Beiträge verweist. Ich würde allerdings die "große Lösung" vorziehen, da der Leser es dann in einer einheitlichen Aufmachung lesen und anwenden kann.

Inhaltlich fällt mir spontan nicht mehr viel Neues / unerwähntes dazu ein.
Sinnvolle Verlinkungen intern und auf thematisch ähnliche Seiten, Hinweis auf die Blacklisten und Tools der Suchmaschinen, inhaltlich passende Metaangaben zum Content, Keyworddichte, ...

Viele Grüße
Hartmut

olape
Posts: 1575
Joined: Fri Mar 13, 2015 8:47 am
Contact:

Re: Gedanken zu SEO, Stichwort: Doppelter Content

Post by olape » Sat Feb 13, 2016 6:12 am

Hallo,

ein, meiner Meinung sehr wichtiges, habe vergessen --> Christophs Sitemapper.

Mal sehen, was die nächste Woche bringt, vielleicht findet sich die Zeit und ich versuche das mal in eine Übersicht zu bekommen.

Gruss Olaf

svasti
Posts: 1651
Joined: Wed Dec 17, 2008 5:08 pm

Re: Gedanken zu SEO, Stichwort: Doppelter Content

Post by svasti » Sun Feb 14, 2016 6:24 pm

Zum Thema "Doppelter Content" möchte ich einen interessanten Bug berichten, den ich gerade auf cmsimple-xh.org korrigiert habe, und der jahrelang unbemerkt blieb. :oops:

Ein Nutzer eines meiner Templates teilte mir mit, dass Googles Webmastertools seiner Website Fehler unterstellen, und er begann daraufhin geduldig, nach dem Fehler zu suchen.

Ergebnis: Er fand den Bug. Ich nutze nämlich ein buttonloses Suchfeld mit Lupensymbol und Text "Suchen" im Eingabefeld entsprechend dem Vorschlag von Holger vor langer Zeit. Es beginnt mit folgendem Code

Code: Select all

<form method="get" action="index.php">
und das hat die Auswirkung, dass man bei Nutzung der Suche auf die Seite
meineWebsite/index.php?search=irgendwas&function=search
kommt und dann, solange man sich auf der Website bewegt, immer auf meineWebsite/index.php? bleibt.
Tja, das ist dann wohl doppelter Content, den Google nicht mag.

Die Lösung ist glücklicherweise einfach: die Anweisung

Code: Select all

action="index.php"
aus dem Code löschen.

Hartmut
Posts: 536
Joined: Sat Nov 05, 2011 6:13 pm
Location: Butzbach, Deutschland
Contact:

Re: Gedanken zu SEO, Stichwort: Doppelter Content

Post by Hartmut » Sun Feb 14, 2016 7:29 pm

Hallo,
olape wrote: ein, meiner Meinung sehr wichtiges, habe vergessen --> Christophs Sitemapper.

Mal sehen, was die nächste Woche bringt, vielleicht findet sich die Zeit und ich versuche das mal in eine Übersicht zu bekommen.
Richtig, den Sitemapper hatte ich ganz übersehen.
Es würde mich freuen wenn Du die Zeit dazu findest, denn dann hätten wir eine weitere Lücke in der Dokumentation geschlossen. :-)
svasti wrote:Zum Thema "Doppelter Content" möchte ich einen interessanten Bug berichten, den ich gerade auf cmsimple-xh.org korrigiert habe, und der jahrelang unbemerkt blieb. :oops:
...
Es beginnt mit folgendem Code

Code: Select all

<form method="get" action="index.php"> 
und das hat die Auswirkung, dass man bei Nutzung der Suche auf die Seite
meineWebsite/index.php?search=irgendwas&function=search
kommt und dann, solange man sich auf der Website bewegt, immer auf meineWebsite/index.php? bleibt.
Tja, das ist dann wohl doppelter Content, den Google nicht mag.
Die Lösung ist glücklicherweise einfach: die Anweisung

Code: Select all

action="index.php" 
aus dem Code löschen.
Danke für den Hinweis und ich habe den Bug in den von mir verwendeten ORG-Templates gefixt.

Viele Grüße
Hartmut

cmb
Posts: 13465
Joined: Tue Jun 21, 2011 11:04 am
Location: Mü-Sa, RLP, DE
Contact:

Re: Gedanken zu SEO, Stichwort: Doppelter Content

Post by cmb » Mon Feb 15, 2016 10:44 am

svasti wrote:Die Lösung ist glücklicherweise einfach: die Anweisung

Code: Select all

action="index.php"
aus dem Code löschen.
Bei Templates, die noch HTML4 oder XHTML Doctypes verwenden, dürfte das einen Validierungsfehler ergeben, da unter HTML4 das action Attribut erforderlich ist. Bei solchen Templates sollte es ein leerer Attributwert tun:

Code: Select all

action=""
Besser ist aber wohl, solche Templates auf den HTML5-Doctype umzustellen.
Christoph M. Becker – Plugins for CMSimple_XH

Post Reply