Gedanken zu SEO, Stichwort: Doppelter Content

Ein CMSimple Support Forum für deutsch sprechende Nutzer und Entwickler
Post Reply
olape
Posts: 2745
Joined: Fri Mar 13, 2015 8:47 am
Contact:

Re: Gedanken zu SEO, Stichwort: Doppelter Content

Post by olape » Mon Mar 07, 2016 10:04 am

Hi,
Was pdf, Microsoft Office- doc oder ppt Versionen einer Seite , die in die gleiche Seite als Download Element platziert werden ? Haben sie doppelte Probleme verursachen ?
i dont know, but i have found this:
You generally do not need to worry about duplicate content in a situation like this, even if you decide to mirror the content of your PDFs on HTML pages. If we recognize the URLs as containing duplicate content, we’ll just show one of them to users when they search; your site generally wouldn’t have any disadvantage by doing this.
– John Mueller, Webmaster Trends Analyst, Google Switzerland
regards Olaf
Gruß Olaf, Plugins for CMSimple_XH

Ich habe schon lange den Verdacht, dass so viele so eifrig auf Gender, Trans und Queer machen:
Weil sie für das Fachliche ganz einfach zu doof sind.

Hartmut
Posts: 553
Joined: Sat Nov 05, 2011 6:13 pm
Location: Butzbach, Deutschland
Contact:

Re: Gedanken zu SEO, Stichwort: Doppelter Content

Post by Hartmut » Mon Mar 07, 2016 3:37 pm

Hallo,

Olaf hat eine sehr ausführliche SEO Ausarbeitung zur Verfügung gestellt, die in ihren Ausführungen auch den "doppelten Content" berücksichtigt. (Danke)
Sie ist in vielen Bereichen direkt für CMSimple_XH nutzbar, da beispielsweise auch vorhandene CMSimple_XH Plugins in dieser Ausarbeitung berücksichtigt werden.

SEO ist über die URL http://cmsimplexh.webdesign-keil.de/?Fachthemen/SEO erreichbar.

Hintergrundinformationen:
Die beiden SEO Seiten befinden sich "unsichtbar" (nicht öffentlich zugänglich) in der Domain https://olaf.penschke.net/ und werden von ihm gepflegt.
Sie sind auf http://cmsimplexh.webdesign-keil.de mit seinem CMSimple_XH Plugin "Remotecontent_XH" im Menü "Fachthemen" eingebunden und ihr Inhalt ist auch mit der CMSimple_XH Onlinesuche auffindbar.

Viele Grüße
Hartmut

olape
Posts: 2745
Joined: Fri Mar 13, 2015 8:47 am
Contact:

Re: Gedanken zu SEO, Stichwort: Doppelter Content

Post by olape » Mon Mar 07, 2016 5:09 pm

Hallo,

Vorsicht!
Die Regeln für die .htaccess sind unvollständig.

Da habe ich es mit einem Filter wohl zu gut gemeint. :oops:

Ich werde Hartmut gleich eine aktualisierte Version von Remotecontent_XH zusenden.

Gruss Olaf
Gruß Olaf, Plugins for CMSimple_XH

Ich habe schon lange den Verdacht, dass so viele so eifrig auf Gender, Trans und Queer machen:
Weil sie für das Fachliche ganz einfach zu doof sind.

Holger
Site Admin
Posts: 3470
Joined: Mon May 19, 2008 7:10 pm
Location: Hessen, Germany

Re: Gedanken zu SEO, Stichwort: Doppelter Content

Post by Holger » Mon Mar 07, 2016 9:51 pm

Nochmal eine kurze Frage:
cmb wrote:Kleine Korrektur: bei aktuellen CMSimple_XH Versionen sind es sind 4 verschiedene URLs, da auch ein `selected` Parameter unterstützt wird, also rufen z.B. folgende URLs die gleiche Seite auf:
http://example.com/?Seite
http://example.com/?selected=Seite
Warum das mittlerweile so möglich ist, siehe http://cmsimpleforum.com/viewtopic.php?f=29&t=5702
Der Sinn hinter "?selected=Seite" ist klar, aber wie geht man damit nun korrekt im Bezug auf DC um? Eine 301-Umleitung macht ja keinen Sinn. Also einfach einen kanonischen Link zu "?seite" setzen?
Das mag auf den ersten Blick ja richtig aussehen. Aber der Selected-Parameter dient ja, kurz gesagt, der Ermöglichung von $_GET - Formularen. Was also, wenn z.B.: mittels "?selected=Seite&p=1" die Paginierung eines Plugins realisiert wird?
In Abhängigkeit des zweiten Parameters erzeugt das CMS ja immer einen anderen Seiteninhalt. Wird dann ein interessanter Inhalt, der vielleicht auf der 4. Seite steht (&p=3), überhaupt noch beachtet / indexiert, wenn ein kanonischer Link zu "?seite" gesetzt wurde?

Ich glaube, ich hab' da irgendwie ein Verständnisproblem... :?

Hartmut
Posts: 553
Joined: Sat Nov 05, 2011 6:13 pm
Location: Butzbach, Deutschland
Contact:

Re: Gedanken zu SEO, Stichwort: Doppelter Content

Post by Hartmut » Tue Mar 08, 2016 7:47 am

Hallo,
olape wrote: Vorsicht!
Die Regeln für die .htaccess sind unvollständig.
...
Ich werde Hartmut gleich eine aktualisierte Version von Remotecontent_XH zusenden.
Remotecontent_XH ist wieder aktuell.

Viele Grüße
Hartmut

cmb
Posts: 14225
Joined: Tue Jun 21, 2011 11:04 am
Location: Bingen, RLP, DE
Contact:

Re: Gedanken zu SEO, Stichwort: Doppelter Content

Post by cmb » Tue Mar 08, 2016 8:16 am

Holger wrote:Der Sinn hinter "?selected=Seite" ist klar, aber wie geht man damit nun korrekt im Bezug auf DC um? Eine 301-Umleitung macht ja keinen Sinn. Also einfach einen kanonischen Link zu "?seite" setzen?
Das mag auf den ersten Blick ja richtig aussehen. Aber der Selected-Parameter dient ja, kurz gesagt, der Ermöglichung von $_GET - Formularen. Was also, wenn z.B.: mittels "?selected=Seite&p=1" die Paginierung eines Plugins realisiert wird?
In Abhängigkeit des zweiten Parameters erzeugt das CMS ja immer einen anderen Seiteninhalt. Wird dann ein interessanter Inhalt, der vielleicht auf der 4. Seite steht (&p=3), überhaupt noch beachtet / indexiert, wenn ein kanonischer Link zu "?seite" gesetzt wurde?
Nein (zumindest gehe ich davon aus). Daher sollte meiner Meinung nach ein kanonischer Link idealerweise nicht grundsätzlich alle (anderen) Query-Parameter ignorieren, sondern nur bestimmte. Eine (zu) einfache Lösung hatte ich unter http://cmsimpleforum.com/viewtopic.php? ... =20#p51358 gepostet. Bei dieser Variante würde man "p" eben nicht im $ignore_params Argument übergeben.
Christoph M. Becker – Plugins for CMSimple_XH

olape
Posts: 2745
Joined: Fri Mar 13, 2015 8:47 am
Contact:

Re: Gedanken zu SEO, Stichwort: Doppelter Content

Post by olape » Tue Mar 08, 2016 1:56 pm

Hallo,

ich habe mal ein wenig dazu gelesen.
Im Falle von paginierten Seiten, sollten Sie entweder den Canonical-Tag auf eine URL zeigen lassen, auf der alle Produkte gelistet sind, oder die paginierten Seiten mit rel=”prev” und rel=”next” Markup auszuzeichnen und dabei alle Seiten ab der zweiten mit den Robots-Tag auf noindex von der Indexierung auszuschließen.
Grundvoraussetzung für Paginationsseiten, deren Inhalte (z. B. die daraufbefindlichen Links) indexiert werden sollen, ist, dass die jeweiligen URLs nicht via robots.txt-Datei blockiert werden. Wichtig ist weiterhin, dass die Seite entweder kein Canonical-Tag enthält oder dieses korrekt konfiguriert ist. Korrekt ist ein Canonical-Tag auf einer paginierten Seite dann konfiguriert, wenn es auf die jeweilige Paginationsseite selbst verweist - dies gilt auch für Unterseiten. Das Canonical-Tag von Paginationsseiten darf also keinesfalls auf eine andere Seite (z. B. die erste Paginationsseite) verweisen, sondern wenn dann nur auf sich selbst.
Der Einsatz von rel="prev" und rel="next" reicht aus, damit Google die Seite als paginierte Seite erkennt.
Gruss Olaf
Gruß Olaf, Plugins for CMSimple_XH

Ich habe schon lange den Verdacht, dass so viele so eifrig auf Gender, Trans und Queer machen:
Weil sie für das Fachliche ganz einfach zu doof sind.

cmb
Posts: 14225
Joined: Tue Jun 21, 2011 11:04 am
Location: Bingen, RLP, DE
Contact:

Re: Gedanken zu SEO, Stichwort: Doppelter Content

Post by cmb » Tue Mar 08, 2016 6:25 pm

olape wrote:ich habe mal ein wenig dazu gelesen.
Danke, Olaf!
olape wrote:
Der Einsatz von rel="prev" und rel="next" reicht aus, damit Google die Seite als paginierte Seite erkennt.
Hierbei gibt es das Problem, das CMSimple_XH bereits rel="prev" und rel="next" Links für die Seitennavigation erzeugt, was ich im Allgemeinen auch recht sinnvoll finde, da ja viele Templates auch die previouspage() und nextpage() Funktion verwenden.
olape wrote:Korrekt ist ein Canonical-Tag auf einer paginierten Seite dann konfiguriert, wenn es auf die jeweilige Paginationsseite selbst verweist - dies gilt auch für Unterseiten.
Das erscheint mir für CMSimple(_XH)-Sites die richtige Variante zu sein. Und das Problem mit den kanonischen Links betrifft ja nicht nur Paginierung im engeren Sinne, sondern auch Plugins wie Forum_XH, wo auf der gleichen CMSimple-Seite ein ganzes Forum mit mehren Threads abgerufen wird, oder auch Realblog_XH, wo auf der gleichen CMSimple-Seite alle Blogartikel abzurufen sind. In solchen Fällen würden "einfache" kanonische Links den Suchmaschinen falsche Informationen bieten.
Christoph M. Becker – Plugins for CMSimple_XH

Holger
Site Admin
Posts: 3470
Joined: Mon May 19, 2008 7:10 pm
Location: Hessen, Germany

Re: Gedanken zu SEO, Stichwort: Doppelter Content

Post by Holger » Tue Mar 08, 2016 8:55 pm

Ja, danke Olaf & Christoph.
cmb wrote: Nein (zumindest gehe ich davon aus). Daher sollte meiner Meinung nach ein kanonischer Link idealerweise nicht grundsätzlich alle (anderen) Query-Parameter ignorieren, sondern nur bestimmte. Eine (zu) einfache Lösung hatte ich unter http://cmsimpleforum.com/viewtopic.php? ... =20#p51358 gepostet. Bei dieser Variante würde man "p" eben nicht im $ignore_params Argument übergeben.
Also mal angenommen, die DC-Probleme bzgl. index.php, mit/ohne "www" bzw. http/https wären per 301-Umleitung gelöst. Und auch ein passender kanonischer Link für erste Seite ist vorhanden.
Was bleibt dann noch? Wo wären noch kanonische Links nötig?
Für den Fall "?selected=Seite&param=1" könnte man das eigentlich ganz entspannt sehen, finde ich. Solch ein Request würde ja IMO nur dann generiert, wenn auch weitere Parameter nötig wären, zum Beispiel bei einem Formularversand per $_GET. Damit - und wenn natürlich alle Annahmen von oben zutreffen - wäre solch ein Request aber doch auch eindeutig und ein kanonischer Link wäre unnötig.
Der theoretisch mögliche Fall eines "normalen" Seitenaufruf mittels "?selected=Seite" kommt doch in der Praxis überhaupt nicht vor, oder?

Ein anders Thema wäre noch die Druckfunktion. Olaf schrieb, dass dort ein "rel=nofollow" generiert wird. Dem scheint aber nicht so zu sein. Wenn man das aber nachbessert, sehe ich für diese Fälle dann auch keinen Grund mehr für kanonische Links. Nebenbei könnte man dem Login-Link vielleicht auch gleich noch ein "rel=nofollow" mitgeben - einfach nur um den Index zu schonen...
Fehlt ansonsten noch etwas?
Mir geht es darum eine möglichst vollständige und simple Lösung ohne .htaccess - also per Plugin - zu realisieren. Auch wenn das nicht ganz so elegant ist, wird es sicher für manch einen User eher zu verwenden sein und die Hemmschwelle, sich überhaupt mit dem DC-Problem auseinander zu setzen, wird dadurch vielleicht etwas herab gesetzt.
cmb wrote:Hierbei gibt es das Problem, das CMSimple_XH bereits rel="prev" und rel="next" Links für die Seitennavigation erzeugt, was ich im Allgemeinen auch recht sinnvoll finde, da ja viele Templates auch die previouspage() und nextpage() Funktion verwenden.
Na ja, darüber kann man streiten. Die Funktionen bilden ja eine Verkettung über alle Seiten vom Anfang bis zum Ende der kompletten Webseite. Eine thematisch richtige Paginierung, die rel="prev" und rel="next" verdient, ist das IMO nicht. "Richtiger" wäre es in den meisten Fällen, wenn die Links nur jeweils für einen Ast innerhalb der Seitenstruktur (mit anderen Worten ein Thema) gebildet werden würden. Aber natürlich kann es auch Projekte geben, bei denen wirklich alle Unterseiten durchgehend thematisch echte Unterseiten der Startseite sind :? .

LG,
Holger

olape
Posts: 2745
Joined: Fri Mar 13, 2015 8:47 am
Contact:

Re: Gedanken zu SEO, Stichwort: Doppelter Content

Post by olape » Tue Mar 08, 2016 9:41 pm

Hallo,

Ich denke auch, das mit dem Festlegen ob www. oder nicht, http oder https und ohne index.php der grösste Teil abgedeckt ist.

Aber:
Der theoretisch mögliche Fall eines "normalen" Seitenaufruf mittels "?selected=Seite" kommt doch in der Praxis überhaupt nicht vor, oder?
Hm, ... wie wahrscheinlich das ist, kann ich nicht beantworten.
Aber das es funktioniert ist eben, in diesem Bezug jedenfalls, schlecht.
Es funktioniert übrigens mit jedem erfundenen Parameter und man landet immer auf der Startseite.
Wenn das wenigstens eine 404 gäbe.

Christoph hatte einen Lösungsansatz gepostet, mit einer Art Blacklist. Jedenfalls habe ich es so verstanden.
Ich finde, man müsste es genau andersherum machen, eine Whitelist.
Alles was nicht auf der Liste ist, bekommt einen Kanonischen Link.
Olaf schrieb, dass dort ein "rel=nofollow" generiert wird. Dem scheint aber nicht so zu sein
Also, wenn ich mir den Quelltext der Druckansicht ansehe, dann gibt es dort aber, glaube ich ein noindex.
Bin i.M. leider nicht am Rechner. Aber ich denke es ist noindex und das sollte hier eigentlich reichen.
Selbst wenn man den Links folgt, würde man ja nicht in der Druckvorschau bleiben. Von daher wäre das doch ok.
Wobei der Kanonische Link in der Vorschau deswegen nicht schaden würde, denke ich.
Gruß Olaf, Plugins for CMSimple_XH

Ich habe schon lange den Verdacht, dass so viele so eifrig auf Gender, Trans und Queer machen:
Weil sie für das Fachliche ganz einfach zu doof sind.

Post Reply