Triste découverte ce week-end sur le blog Coolz0r: après une tentative malencontreuse de mise à jour de Wordpress, son auteur découvre que ses sauvegardes sont corrompues...
Résultat: il laisse tomber et son excellent blog Coolz0r disparaît !
Celà est d'autant plus dommage que tout n'est pas perdu, bien au contraire ! Il existe des techniques pour récupérer le contenu de ses articles, des billets publiés sur son blog, et ce, malgré un plantage, une mauvaise mise à jour ou même un piratage de votre blog chéri !
Je vous propose donc 2 méthodes concrètes pour pouvoir récupérer le contenu intégral des textes de votre blog grâce à Google et un peu d'astuce !
Court Rappel sur les Bonnes Pratiques:
Bien entendu, le meilleur moyen d'éviter ce type de désagrément, est de faire une sauvegarde complète (Fichiers et Base de Donnée) avant toute mise à jour, ainsi que de manière régulière...
Je vous conseille d'ailleurs à ce propos un petit tour sur mon billet: "Boite à Outils Pour Sécuriser son Wordpress" (dont les principes pourront néanmoins servir si vous utiliser une autre plateforme !).
Mais ce n'est pas pour vous faire ce rappel que j'ai décidé d'écrire cet article...non, l'idée est plutôt de vous proposer une solution alternative quand vous avez véritablement tout perdu ! Et oui...la solution existe ! Il va vous falloir un peu de courage, mais ne désespérez plus !
Google Cache Joue les Super Man !
La solution est d'utiliser le fait que Google indexe et met en cache l'intégralité de nos pages webs...et donc de vos précieux articles et billets que vous avez pris le temps de publier avec amour depuis des semaines, des mois ou des années...
Pour voir le résultat il suffit d'ouvrir une adresse du type:
http://www.google.com/search?q=cache:www.business-garden.com
Évidemment, il y a de fortes chances pour que vos tout derniers billets n'aient pas encore été indexés et sauvegardés par Google...mais les autres oui...et c'est déjà un soulagement de constater jusqu'où Google aura pu enregistrer les précieuses pages de votre blog disparu !
Comment publiez-vous vos billets ?
Les plateformes de blogs (que ce soit Wordpress, Dotclear, b2evolution ou autres) publient nos articles avec l'année et le mois sous la forme suivant:
http://www.example.com/année/mois/titre-de-l-article
ou http://www.example.com/index.php/année/mois/titre-de-l-article
Cela peut-être bien pratique pour retrouver l'historique des billets dans le cache de Google...
Mais que faire si vous n'utilisez pas la publications des billets avec la date dans l'URL (l'addresse de chaque article sur votre blog) ?
http://www.example.com/index.php?id=numéro
ou simplement http://www.example.com/catégorie/titre-de-l-article
Rassurez-vous, quelque soit le type d'adresse que vous aurez choisi, la solution fonctionne de la même manière ! (J'en vois déjà qui soupirent de soulagement...)
Une fonctionnalité salvatrice des plateformes de blog:
En fait, il existe une fonctionnalité pour accéder de manière simple aux archives de votre blog !
Ainsi il est normalement possible d'afficher sur une page l'intégralité des billets publiés au cours d'un mois en précisant ce mois et l'année qui vous intéresse !
En fonction de votre blog, celà peut être:
http://www.example.com/année/mois/
ou http://www.example.com/index.php/année/mois/
ou http://www.example.com/index.php?/année/mois/
ou même encore http://www.example.com/?/année/mois/
Partant de ce principe, vous comprendez facilement que Google indexe également ces pages, et qu'il vous est possible d'y accéder dans le cache de Google... Prenons un exemple:
http://www.google.com/search?q=cache:www.business-garden.com/index.php/2006/10/
Création d'un script pour automatiser la récupération de ses pages:
Il vous reste à créer un script avec une double boucle qui automatisera la copie de ces pages.
Pour i de 2005 à 2008 Faire
Pour j de 1 à 12 Faire
Récupérer la page http://www.google.com/search?q=cache:mo-blog.com/i/j/
Si l'un de vous développe un script ou un programme permettant de le faire, n'hésitez pas à en parler et à mettre le lien en commentaires...
Problématique Supplémentaire:
Cette méthode est intéressante, mais il reste une problématique importante !
En effet, souvent, nous ne publions pas l'intégralité d'un article sur la première page, mais seulement un extrait, avec la possibilité de lire le billet complet en cliquant sur un lien "Lire La Suite".
Si vous ne faites pas celà, aucun problème, la méthode exposée fonctionnera et vous permettra de recopier l'intégralité de vos précieux textes !
Par contre, si comme moi, vous ne publier parfois qu'un extrait en première page, la méthode exposé permettant de lire le contenu de vos archives dans le cache de Google, ne vous permettra que de récupérer ces extraits...
Mais rassurez-vous, Google a réponse à tout ! Et je vous propose donc la solution:
Méthode Ultime de Récupération d'Articles Tronqués :
Pour récupérer dans le cache de Google les billets de votre blog, même lorsque vous n'en publier qu'un extrait tronqué, il faut vous y prendre en deux étapes !
La première est de lister toutes les URLS (toutes les adresses de vos billets) classés par années et par mois. Pour celà, vous devez commencer par rechercher dans Google tous les liens de votre blog contenant le bon mois et la bonne année, récupérer tous les résultats, puis balayer tous les liens de manière chronologique grâce à un script qui interrogera Google de cette façon (il s'agit de la requête Google à saisir dans le champ de recherche de Google...):
site:www.business-garden.com +inurl:"/2007/12/"
Votre super script de balayage devra ensuite parcourir le cache de Google, avec la méthode exposée avant mais avec cette fois-ci les liens directs vers tous vos billets, et ce pour aller repêcher le texte intégral des précieux articles de votre blog.
Encore une fois, je n'ai pas le temps de développer un tel script, mais si vous en avez le coeur, n'hésitez pas à m'en informer...je suis même prêt à le diffuser ici même :)
Si vous avez d'autres astuces ou si vous voulez partager votre (heureuse ou malheureuse) expérience à ce sujet, n'hésitez pas à laisser un commentaire...
Les commentaires sont fermés pour cet article.