Question GoogleBot et mon error.log (apache)

Ça fait des jours que j'ai des crawl-<ip>.googlebot.com qui remplissent mes error.log en essayant de charger des images "au mauvais endroit".

Genre des

[Sat Mar 09 07:51:36 2019] [error] [client <ip>] File does not exist: /var/...dotclear/fructane.jpg
[Sat Mar 09 07:52:14 2019] [error] [client <ip>] File does not exist: /var/...dotclear/C'est comme \xc3\xa7a ep. 29 par Evidence Based Bonne Humeur.jpg
[Sat Mar 09 07:52:51 2019] [error] [client <ip>] File does not exist: /var/...dotclear/formlabs.com request-sample-part.jpg
[Sat Mar 09 07:53:26 2019] [error] [client <ip>] File does not exist: /var/...dotclear/Hypervsn 3D Hologram Player.jpg
[Sat Mar 09 07:54:02 2019] [error] [client <ip>] File does not exist: /var/...dotclear/EncyclopedieSavoirWells.jpg

toutes les minutes.

L'image existe mais est pas dans le sous rep dotclear.
Si je vais sur la page web où sont ces images la page s'affiche correctement. Bref, bug chez moi quelque part ? Pas l'impression... Mais après avoir cherché, sisi, c'est bien MA faute, enfin en partie.

Je suppose que c'est dans le head de mon site, dans la partie générée pour les rezo soooo scie haut. Plus précisément :

<meta name="twitter:image:alt" content="iflscience.com technology scientists-use-nanotechnology-to-give-mice-temporary-night-vision.jpg">

Le image:alt est censé contenir un descriptif de l'image et de base dotclear y insère par défaut le nom du fichier de l'image. Et je suppose que le GoogleBot voyant que ça se termine par .jpg veut essayer d'aller le télécharger.
Bon j'avoue que je ne vais pas aller changer les milliers d'ALT des zimages de mon blog.

C'était juste pour demander si quelqu'un sait où signaler le "problème". Pas grand-chose du côté de google: "Googlebot"

2 réactions

1 De le hollandais volant - 09/03/2019, 1h16

Dans ton robots.txt, il te suffirait d’ajouter « /var/...dotclear/* » comme chemin à ignorer, non ?

Sinon tu peux aller sur les Google Webmaster Tools, qui te permettent de faire ça et plein d’autres trucs (faut un compte google).
2 De Arfy - 09/03/2019, 4h06
Le problème c'est que le crawler cherche l'image à la racine de arfy.fr alors
- que c'est un ALT text
- que toutes les images sont dans /public chez moi
C'est juste pour dire à "Google" que son bot il fait un truc de travers.

Je vais aller voir Google Webmaster Tools merci