Calendar_XH: Text vor Google verschleiern

Ein CMSimple Support Forum für deutsch sprechende Nutzer und Entwickler
Post Reply
ojay
Posts: 60
Joined: Sun Nov 09, 2014 10:24 am
Location: da, wo die Zeit entsteht

Calendar_XH: Text vor Google verschleiern

Post by ojay » Thu Jan 03, 2019 8:44 pm

Hallo,
ich nutze die Text2Image-Funktion, die Christoph für mich mal erstellt hat und die auf CMSimple und CMSimple_XH gut funktioniert.

Kann man auch im Kalender (Calendar_XH) Einträge vor Google schützen?

Es wäre super, wenn es die (cmb)-"Text2Image"-Funktion auch als Plugin gäbe, dann könnte man sie weitergeben.

Danke!

cmb
Posts: 13227
Joined: Tue Jun 21, 2011 11:04 am
Location: Mü-Sa, RLP, DE
Contact:

Re: Calendar_XH: Text vor Google verschleiern

Post by cmb » Fri Jan 04, 2019 11:15 pm

ojay wrote:
Thu Jan 03, 2019 8:44 pm
ich nutze die Text2Image-Funktion, die Christoph für mich mal erstellt hat und die auf CMSimple und CMSimple_XH gut funktioniert.

Kann man auch im Kalender (Calendar_XH) Einträge vor Google schützen?
Ich denke nicht, dass man so oder ähnlich ganze Einträge schützen kann. Eventuell kann man aber in Beschreibungen text2image() als Pluginaufruf verwenden? Kommt möglicherweise auf die genaue Version von Calendar_XH an.

Aber warum willst du denn überhaupt Einträge vor Google (und vermutlich anderen Suchmaschinen) verstecken? Wenn es um private Termine geht, dann sollte diese vermutlich auch kein „unbefugter“ Mensch sehen können. Bei Calendar_XH 1.4 könnte man dafür einen zweiten Kalender nutzen, der eben nur auf einer mit Memberpages_XH oder Register_XH geschützten Seite angezeigt wird.
ojay wrote:
Thu Jan 03, 2019 8:44 pm
Es wäre super, wenn es die (cmb)-"Text2Image"-Funktion auch als Plugin gäbe, dann könnte man sie weitergeben.
In aller Regel kann man aus einer Funktion in userfuncs.php leicht ein Plugin machen. Dazu einfach unter plugins/ einen Ordner mit dem Namen der Funktion (eigentlich kann ein beliebiger Name verwendet werden) anlegen, dort eine index.php erstellen, und in diese die Funktion verschieben (dabei muss index.php mit <?php beginnen). Also hier: plugins/text2image/index.php:

Code: Select all

<?php

/**
 * Copyright (C) 2016 Christoph M. Becker
 *
 * This program is free software: you can redistribute it and/or modify
 * it under the terms of the GNU General Public License as published by
 * the Free Software Foundation, either version 3 of the License, or
 * (at your option) any later version.
 */

function text2image($text, $alt = null)
{
    global $pth;

    // configure the following variables:
    $fontfile = "{$pth['folder']['userfiles']}PTC55F.ttf";
    $fontsize = 18; // in pt
    $padding = 3; // too small values may cause truncation of the text
    $color = array(0, 0, 0); // an RGB triple

    $angle = 0;
    extract(text2image_rectangle($text, $fontsize, $angle, $fontfile, $padding));

    $image = imagecreatetruecolor($width, $height);
    imagealphablending($image, false);
    imagesavealpha($image, true);
    $background = imagecolorallocatealpha($image, 0, 0, 0, 127);
    imagefilledrectangle($image, 0, 0, $width - 1, $height - 1, $background);
    $foreground = imagecolorallocate($image, $color[0], $color[1], $color[2]);
    imagettftext($image, $fontsize, $angle, $x, $y, $foreground, $fontfile, $text);
    ob_start();
    imagepng($image);
    $data = ob_get_clean();
    imagedestroy($image);
    return sprintf(
        '<img class="image2text" src="data:image/png;base64,%s" alt="%s">',
        base64_encode($data),
        htmlspecialchars(isset($alt) ? $alt : $text, ENT_COMPAT, 'UTF-8')
    );
}

function text2image_rectangle($text, $fontsize, $angle, $fontfile, $padding)
{
    $bbox = imagettfbbox($fontsize, $angle, $fontfile, $text);
    $xs = array($bbox[0], $bbox[2], $bbox[4], $bbox[6]);
    $ys = array($bbox[1], $bbox[3], $bbox[5], $bbox[7]);
    $xmin = min($xs);
    $xmax = max($xs);
    $ymin = min($ys);
    $ymax = max($ys);
    $x = -$xmin + $padding;
    $y = -$ymin + $padding;
    $width = $xmax - $xmin + 1 + 2 * $padding;
    $height = $ymax - $ymin + 1 + 2 * $padding;
    return compact('x', 'y', 'width', 'height');
}
Man hat dann zwar noch keine Pluginadministration, aber im Prinzip ist es ein Plugin. Und natürlich kann man auch einfach die userfuncs.php weitergeben; sollte schon eine vorhanden sein, dann muss man die beiden Dateien eben zusammenfassen.
Christoph M. Becker – Plugins for CMSimple_XH

ojay
Posts: 60
Joined: Sun Nov 09, 2014 10:24 am
Location: da, wo die Zeit entsteht

Re: Calendar_XH: Text vor Google verschleiern

Post by ojay » Sat Jan 05, 2019 6:22 pm

cmb wrote:
Fri Jan 04, 2019 11:15 pm
ojay wrote:
Thu Jan 03, 2019 8:44 pm
Kann man auch im Kalender (Calendar_XH) Einträge vor Google schützen?
Ich denke nicht, dass man so oder ähnlich ganze Einträge schützen kann. Eventuell kann man aber in Beschreibungen text2image() als Pluginaufruf verwenden? Kommt möglicherweise auf die genaue Version von Calendar_XH an.
es ist eh ein Versuch Einträge vor Google (und vermutlich anderen Suchmaschinen) zu verstecken oder auszutrixen, denn die OCR-Funktion beherrscht Google schon. Aber vielleicht kann man die Suchmaschinen mit dem alt-Tag wie in der "text2image()"-Funktion täuschen, das es ein Bild ist. ;)
cmb wrote:
Fri Jan 04, 2019 11:15 pm
Aber warum willst du denn überhaupt Einträge vor Google (und vermutlich anderen Suchmaschinen) verstecken? Wenn es um private Termine geht, dann sollte diese vermutlich auch kein „unbefugter“ Mensch sehen können. Bei Calendar_XH 1.4 könnte man dafür einen zweiten Kalender nutzen, der eben nur auf einer mit Memberpages_XH oder Register_XH geschützten Seite angezeigt wird.
Ich bin ja schon froh, das die Benutzer so klar kommen und möchte es nicht komplizierter machen. Vermutlich werde ich dann im Kalender auf eine statische oder Realblog-Seite verweisen, wo dann die Namen mit text2image geschützt sind.

cmb wrote:
Fri Jan 04, 2019 11:15 pm
ojay wrote:
Thu Jan 03, 2019 8:44 pm
Es wäre super, wenn es die (cmb)-"Text2Image"-Funktion auch als Plugin gäbe, dann könnte man sie weitergeben.
In aller Regel kann man aus einer Funktion in userfuncs.php leicht ein Plugin machen. Dazu einfach unter plugins/ einen Ordner mit dem Namen der Funktion (eigentlich kann ein beliebiger Name verwendet werden) anlegen, dort eine index.php erstellen, und in diese die Funktion verschieben (dabei muss index.php mit <?php beginnen).
Leider wissen die CMSimple und CMSimple_XH-Benutzer von der "text2image()"-Funktion nichts oder haben keinen Wunsch nach dem Schutz von Text.

cmb
Posts: 13227
Joined: Tue Jun 21, 2011 11:04 am
Location: Mü-Sa, RLP, DE
Contact:

Re: Calendar_XH: Text vor Google verschleiern

Post by cmb » Sat Jan 05, 2019 11:38 pm

ojay wrote:
Sat Jan 05, 2019 6:22 pm
es ist eh ein Versuch Einträge vor Google (und vermutlich anderen Suchmaschinen) zu verstecken oder auszutrixen, denn die OCR-Funktion beherrscht Google schon. Aber vielleicht kann man die Suchmaschinen mit dem alt-Tag wie in der "text2image()"-Funktion täuschen, das es ein Bild ist. ;)
Wenn es tatsächlich nur um Google und andere Suchmaschinen geht, dann wäre es hier vielleicht das Beste, wenn du das Crawlen der Seite per robots.txt verbietest, und sie zusätzlich noch per noindex aus den Suchergebnissen fernhältst. Soweit ich weiß kann man in robots.txt aber keine Query-Strings angeben, und „Clean-URLs“ sind noch nicht wirklich für CMSimple_XH verfügbar. Weiß da ein anderer mehr?
ojay wrote:
Sat Jan 05, 2019 6:22 pm
Leider wissen die CMSimple und CMSimple_XH-Benutzer von der "text2image()"-Funktion nichts oder haben keinen Wunsch nach dem Schutz von Text.
Du kannst das Plugin gerne selbst zusammenstellen, und wenn du magst, auch die Lizenz ändern und das Copyright entfernen (ist ohnehin fraglich, ob auf diese paar Zeilen wirklich ein Urheberrechtsanspruch geltend gemacht werden kann).
Christoph M. Becker – Plugins for CMSimple_XH

meltemi
Posts: 162
Joined: Sat Feb 22, 2014 10:11 pm
Location: Franken (Deutschland)
Contact:

Re: Calendar_XH: Text vor Google verschleiern

Post by meltemi » Sun Jan 06, 2019 12:16 am

cmb wrote:wäre es hier vielleicht das Beste, wenn du das Crawlen der Seite per robots.txt verbietest, und sie zusätzlich noch per noindex aus den Suchergebnissen fernhältst
Denkfehler! Oder liest Du zuviel Wikipedia?

Wenn man "das Crawlen der Seite per robots.txt verbietet", erkennt Google das noindex doch gar nicht!

olape
Posts: 844
Joined: Fri Mar 13, 2015 8:47 am
Contact:

Re: Calendar_XH: Text vor Google verschleiern

Post by olape » Sun Jan 06, 2019 10:10 am

cmb wrote:
Sat Jan 05, 2019 11:38 pm
Soweit ich weiß kann man in robots.txt aber keine Query-Strings angeben, und „Clean-URLs“ sind noch nicht wirklich für CMSimple_XH verfügbar. Weiß da ein anderer mehr?
viewtopic.php?f=16&t=9986&hilit=robots. ... =80#p51659

Kleiner Nachtrag, wie es Google selbst nutzt
https://olaf.penschke.net/?CMSimple_XH/ ... -Textdatei

meltemi wrote:
Sun Jan 06, 2019 12:16 am
cmb wrote:wäre es hier vielleicht das Beste, wenn du das Crawlen der Seite per robots.txt verbietest, und sie zusätzlich noch per noindex aus den Suchergebnissen fernhältst
Denkfehler! Oder liest Du zuviel Wikipedia?

Wenn man "das Crawlen der Seite per robots.txt verbietet", erkennt Google das noindex doch gar nicht!
Theoretisch richtig, praktisch ist Christophs Empfehlung aber wahrscheinlich der sicherere Weg. Es geht ja vielleicht eben nicht nur um Google. Es gibt Unmengen an Bots, nicht nur für die grossen Suchmaschinen. Und nicht alle halten sich an die RICHTLINIE robots.txt. Ob diese sich dann an noindex halten würden, ist natürlich auch keineswegs sicher.

Ein anderer Weg wäre vielleicht eine Regel in der .htaccess, bestimmte Bots für bestimmte URLs.

Fakt ist aber, es gibt auf die Art keinen absolut sicheren Weg.
Informationen, die man nicht finden soll, sollte man nicht veröffentlichen.

cmb
Posts: 13227
Joined: Tue Jun 21, 2011 11:04 am
Location: Mü-Sa, RLP, DE
Contact:

Re: Calendar_XH: Text vor Google verschleiern

Post by cmb » Sun Jan 06, 2019 10:01 pm

meltemi wrote:
Sun Jan 06, 2019 12:16 am
Wenn man "das Crawlen der Seite per robots.txt verbietet", erkennt Google das noindex doch gar nicht!
Das stimmt wohl. Aber was soll der Blödsinn: ich kann per robots.txt einem Bot mitteilen, dass er die Seite nicht crawlen soll, aber dann darf die Suchmaschinen dennoch einen sehr fraglichen Verweis in den Suchergebnissen anzeigen. Will ich der Suchmaschine aber klar machen, dass sie sich diesen fraglichen Verweis schenken soll, dann muss ich das Crawlen der Seite zulassen?
Christoph M. Becker – Plugins for CMSimple_XH

ojay
Posts: 60
Joined: Sun Nov 09, 2014 10:24 am
Location: da, wo die Zeit entsteht

Re: Calendar_XH: Text vor Google verschleiern

Post by ojay » Sun Jan 06, 2019 11:22 pm

Zusätzlich zu NOINDEX für die Kalender-Seite
benutze ich noch robots.txt :

Code: Select all

User-agent: *
Disallow: /?Kalender
olape wrote:
Sun Jan 06, 2019 10:10 am
Theoretisch richtig, praktisch ist Christophs Empfehlung aber wahrscheinlich der sicherere Weg. Es geht ja vielleicht eben nicht nur um Google. Es gibt Unmengen an Bots, nicht nur für die grossen Suchmaschinen. Und nicht alle halten sich an die RICHTLINIE robots.txt. Ob diese sich dann an noindex halten würden, ist natürlich auch keineswegs sicher.

Ein anderer Weg wäre vielleicht eine Regel in der .htaccess, bestimmte Bots für bestimmte URLs.

Fakt ist aber, es gibt auf die Art keinen absolut sicheren Weg.
Informationen, die man nicht finden soll, sollte man nicht veröffentlichen.
Das müssen sich aber die vergegenwärtigen, die manchen Content veröffentlichen und sich nachher wundern, das es im Internet so konsistent bleibt.

olape
Posts: 844
Joined: Fri Mar 13, 2015 8:47 am
Contact:

Re: Calendar_XH: Text vor Google verschleiern

Post by olape » Mon Jan 07, 2019 9:37 am

cmb wrote:
Sun Jan 06, 2019 10:01 pm
Aber was soll der Blödsinn: ich kann per robots.txt einem Bot mitteilen, dass er die Seite nicht crawlen soll, aber dann darf die Suchmaschinen dennoch einen sehr fraglichen Verweis in den Suchergebnissen anzeigen. Will ich der Suchmaschine aber klar machen, dass sie sich diesen fraglichen Verweis schenken soll, dann muss ich das Crawlen der Seite zulassen?
Genau so ist es aber.
https://olaf.penschke.net/?CMSimple_XH/Plugins/xlang_XH unter Zusätzliche Erläuterungen.

Schöner wäre, man könnte für diesen Fall das noindex auch per robots.txt vergeben.
Aber so etwas ist, meines Wissens nach, nicht offiziell vorgesehen.

Kleiner Nachtrag:

https://www.seo-book.de/onpage/noindex- ... eichzeitig

https://nextlevelseo.de/seo-test-was-no ... irkt-8194/

cmb
Posts: 13227
Joined: Tue Jun 21, 2011 11:04 am
Location: Mü-Sa, RLP, DE
Contact:

Re: Calendar_XH: Text vor Google verschleiern

Post by cmb » Mon Jan 07, 2019 2:18 pm

Wäre schön gewesen. Oder auch die Unterstützung des Automated Content Access Protocol. Na ja.
Christoph M. Becker – Plugins for CMSimple_XH

Post Reply