Partager à toutes et tous (enfin ceux que ça intéresse) ce que je note sur le net

Aller au contenu | Aller au menu | Aller à la recherche

Question GoogleBot et mon error.log (apache)

Ça fait des jours que j'ai des crawl-<ip>.googlebot.com qui remplissent mes error.log en essayant de charger des images "au mauvais endroit".

Genre des

[Sat Mar 09 07:51:36 2019] [error] [client <ip>] File does not exist: /var/...dotclear/fructane.jpg
[Sat Mar 09 07:52:14 2019] [error] [client <ip>] File does not exist: /var/...dotclear/C'est comme \xc3\xa7a ep. 29 par Evidence Based Bonne Humeur.jpg
[Sat Mar 09 07:52:51 2019] [error] [client <ip>] File does not exist: /var/...dotclear/formlabs.com request-sample-part.jpg
[Sat Mar 09 07:53:26 2019] [error] [client <ip>] File does not exist: /var/...dotclear/Hypervsn 3D Hologram Player.jpg
[Sat Mar 09 07:54:02 2019] [error] [client <ip>] File does not exist: /var/...dotclear/EncyclopedieSavoirWells.jpg

toutes les minutes.

L'image existe mais est pas dans le sous rep dotclear.
Si je vais sur la page web où sont ces images la page s'affiche correctement.  Bref, bug chez moi quelque part ?  Pas l'impression...  Mais après avoir cherché, sisi, c'est bien MA faute, enfin en partie.

Je suppose que c'est dans le head de mon site, dans la partie générée pour les rezo soooo scie haut.  Plus précisément :

<meta name="twitter:image:alt" content="iflscience.com technology scientists-use-nanotechnology-to-give-mice-temporary-night-vision.jpg">

Le image:alt est censé contenir un descriptif de l'image et de base dotclear y insère par défaut le nom du fichier de l'image.  Et je suppose que le GoogleBot voyant que ça se termine par .jpg veut essayer d'aller le télécharger.
Bon j'avoue que je ne vais pas aller changer les milliers d'ALT des zimages de mon blog.

C'était juste pour demander si quelqu'un sait où signaler le "problème".  Pas grand-chose du côté de google: "Googlebot"

Commentaires

1. Le samedi, 9. mars 2019, 13:16 par le hollandais volant

Dans ton robots.txt, il te suffirait d’ajouter « /var/...dotclear/* » comme chemin à ignorer, non ?

Sinon tu peux aller sur les Google Webmaster Tools, qui te permettent de faire ça et plein d’autres trucs (faut un compte google).

2. Le samedi, 9. mars 2019, 16:06 par Arfy

Le problème c'est que le crawler cherche l'image à la racine de arfy.fr alors

  • que c'est un ALT text
  • que toutes les images sont dans /public chez moi

C'est juste pour dire à "Google" que son bot il fait un truc de travers.

Je vais aller voir Google Webmaster Tools merci