Outils de contrôle des liens d'un site
Cet article a été réalisé avec le coucours de Jean-Claude Michel que vous pouvez retrouver sur les forums de MémoClic
Quoi de plus agaçant pour le visiteur d'un site qu'un lien brisé ? Il convient donc d'effectuer régulièrement une vérification de la validité des liens externes vers d'autres sites, des liens internes, des ancres et des liens de type mailto: tâche ô combien fastidieuse. Heureusement des outils existent, à commencer par ceux, internes, contenus dans les grands applicatifs professionnels de développement de sites (Adobe Golive et DreamWaver). Mais pour ceux qui ne peuvent accéder à ces poids lourds honéreux il y a des solutions gratuites, en ligne ou à télécharger. Et pour ceux qui ont besoin d'outils encore plus pointus, il y a des solutions de validation ultra professionnelles plus coûteuses à elles seules que les packs complets Golive ou DreamWaver. La plupart des outils recherche et signale également les liens redirigés qu'il convient de mettre à jour.
Signification des codes que ces outils utilisent:
Les codes lorsque tout est Ok
200 Ok
201 Crée
202 Accepted
203 Partial Information
204 No Response
Les codes lorsque rien ne va plus
-1 Could not lookup server
-2 Could not open socket
-3 Could not bind socket
-4 Could not connect
-5 Malformed URL must be http://something
The data requested has been assigned a new URI, the change is permanent
301 Found, but moved
The data requested actually resides under a different URL
302 Found, but redirected e.g., add a '/' to URL suffix
303 Method
304 Not Modified
The request had bad syntax or was inherently impossible to be satisfied
400 Bad request
The client should retry the request with a suitable Authorization header
401 Unauthorized
The client may retry the request with a suitable ChargeTo header
402 PaymentRequired
The request is for something forbidden. Authorization will not help
403 Forbidden
The server has not found anything matching the URI given
404 Not found
The server encountered an unexpected condition
500 Internal Error
The server does not support the facility required
501 not implemented
502 Service temporarily overloaded
503 Gateway timeout
600 Bad request
601 Not implemented
602 Connection failed (host not found?)
603 Timed out
LinkChecker du W3C
Gratuit. En anglais. La validation des liens s'effectue en ligne, à partir de la saisie de l'URL de la page à vérifier, sans avoir à télécharger ou installer le moindre utilitaire. Les résultats sont affichés directement mais ne peuvent être récupérés par e-mail, contrairement à d'autres outils de ce type. La vérification peut s'effectuer de manière récursive de pages en pages, permettant la validation des liens d'un site entier en une seule opération. LinkChecker est proposé par le World Wide Web Consortium (W3C).
- Note 1 - Le lien vers LinkChecker est http://validator.w3.org/checklink et, bien que celà ne soit pas documenté, il peut être suivi d'une url. Ainsi, http://validator.w3.org/checklink?uri=http://terroirs.denfrance.free.fr/index.html&recursive=on&depth=&sub lance la validation des liens du site Terroirs d'en France à partir de sa page d'accueil.
- Note 2 - La validation récursive est limitée à 150 pages.
- Note 3 - Des liens tout à fait valides avec un "?" suivi de plusieurs paramètres sortent tous en liens brisés, ce qui est faux
- Note 4 - Des liens tout à fait valides et sans problème de timeout ni d'accès sortent en erreur 403 (accès interdit !)
- Note 5 - Des liens tout à fait valides sortent en erreur 404 (liens brisé !)
- Note 4 - ATTENTION DANGER : SpyBlocker signale des problèmes de confidentialité sur le site du W3C et en interdit l'accès. La plupart des listes hosts filtrent ce site.
Link Valet
Gratuit. En anglais. Allez sur le site et entrez une url. La récursivité n'est assurée que pour les liens internes et de même niveau de hiérarchie (même directory). Un outil minimaliste assez lent. Link Valet.
Doctor Html
Gratuit pour une analyse d'une page à la fois, on-line, mais on peut sauter de page en page. En anglais. Un outil de validation de sites (et de pages individuelles) dont la validation des liens n'est qu'une des activités (correcteur orthographique anglais, problèmes de compatibilité avec les divers navigateurs, mise en évidence des liens images dont les balises height width et alt manquent, syntaxe des meta tags, optimisation du code, analyse du code, analyse de structure, analyse de taille et temps de chargement, analyse de structure des tableaux, analyse de structure des formulaires, analyse des jeux de polices de caractères, contenu des cookies de la page). L'outil génère un rapport très détaillé et très lisible avec une mise en page soignée. Bref un outil très professionnel dont la licence pour le produit complet permettant l'analyse de sites entiers est de 350 US$ (novembre 2002). Analyse on-line d'une page.
Check Web Links (également appelé CheckWeb)
Gratuit. En français. Développé par Philippe DUBY (France). Il s'agit d'un tout petit (69,1 KO zippé, 136 KO après installation) utilitaire très simple téléchargeable. S'exécute localement sur votre ordinateur. Ecrit en C++ (n'est plus maintenu depuis 1999 mais les sources sont téléchargeables également). Permet la validation des liens internes et externes d'un site déjà téléchargé chez l'hébergeur comme d'un site encore sur votre disque dur, avant l'upload. Bien entendu, validation uniquement des liens internes si exécution en mode local sans connexion Internet. Met en évidence les liens images dont les balises height et width manquent (pas de recherche sur le manque de renseignement de la balise alt). Accepte un login et un mot de passe au cas ou le site à analyser est à accès restreint. Le rapport peut ne contenir que la liste des erreurs ou contenir la liste complète des liens mais, dommage, elle n'est pas exportable (ce qui aurrait permi de créer une page d'inventaire des liens). Un rapport, dans un fichier nommé chekweb.log, reprend, page par page, les liens rencontrés, les erreurs trouvées, la taille totale de la page et son temps de chargement à 28kbs. L'outil permet également de fixer un timeout avant de déclarer le lien en erreur. Utilitaire assez lent mais, en fin de compte, le plus simple pour valider uniquement les liens d'un site. Signale également les liens redirigés ce qui permet d'optimiser le site testé. Disponible en téléchargement à : Check Web Links.
Weblint
Gratuit en version lite. Anglais. Dernière mise à jour du produit en septembre 97. Pas de récursivité. Limité à 2048 caractères par page. Autrement-dit, totalement inexploitable et inutile en sus de sembler ne pas fonctionner du tout. C'est à Weblint.
Webxref Link Checker
Gratuit. Anglais. Ecrit en 1995 par Rick Jansen. Dernière modif du mode d'emploi, en anglais, en août 2002 à http://webmaster.indiana.edu/tool_guide_info/webxref.shtml. Il s'agit d'un script en Perl disponible à http://ednet.gsfc.nasa.gov/Mathews/webtools/webxref.txt et dont la dernière modification remonte à mai 1996
InfoLink Link Checker
Payant (49.95 US$). Anglais. Permet la validation des liens de plusieurs sites à partir d'une liste de sites. Il est possible de l'utiliser 50 fois gratuitement, à titre d'évaluation. Dernière mise à jour en avril 1998. Téléchargement à http://www.biggbyte.com/infolink/download/download.html.
- Site List wizard to help you build a list of all sites that need to be verified
- Verification of all the popular HTML link types, including full FTP verification
- Visual Frame Support
- Internal Browser - There is no need to open results in an external browser.
- New Interface - Incorporates the latest Windows interface features. New ways to get around InfoLink make verifying a single page, an entire site, or even ten sites as easy as simply opening a file.
- Detailed Tree View - Lists each page verified, each link in each page, and each link's parent or parents to help track down problem areas
- Page List Manager - Allows you to manage many different Page Lists rather than just one. Use it to manage many different Page List Files, each containing any number of Page Lists.
- Site List Manager - If you have ten sites to maintain, you can add them to the Site List Manager or break them down into separate Site List Files and manage each site separately. Then, in just two clicks, you can verify any one of the sites.
- Check only one link if needed
- Check one page at a time
- Browsing Capabilities
- Comma-delimited information stored in results for database use
- More ways to control how links are verified
- New ways to filter links being verified, downloaded, or both
- Netiquette - To relieve strain on your server
- New Page Links - Get quick verification information about your links as they are being verified. Lists about six different statistics for each link.
- New Link Information - Get detailed information about each link that was verified.
- New Page Information - Get information about the parent of any link that has been verified.
- New Report Generator - Build reports for both Page List and Site List. As many as twenty different reports can be built.
- Some Reports Include:
- Image view report (shows all images in your site)
- Image statistics report
- Image information and reference reports that can help you discover and correct any problems with your images
- Link information and reference reports that can help discover and correct any problems with your links
- Link reports for finding possible problems in your site
- Reports that show information about the servers that your site links to
- Page reports about all pages found in your site and any problems that occurred while trying to verify them
- Download reports that show which pages are slow, fast, and average
- Broken Link Reports
- Report that shows what links have changed since your last verification
- Verification Detail Report, this report contains all the verification information you need to fix your links.
- Summary Report
- New Report Viewer - View all reports from within InfoLink or in an external browser.
- Editor Enhancements - The new editor makes it simple to locate broken links and correct them.
- Correct and recheck links - After you have corrected any broken links in the InfoLink Editor, just click the Check Links option from the menu.
- Proxy Support
- DNS Lookup features
- Wide range of errors detected
- Verify files from disk or the Internet
- Password Protect Page Support - Password protect pages can be accessed from both the InfoLink Main screen or the InfoLink Editor.
- All around enhancements - Every feature of InfoLink has been upgraded to be more user friendly and powerful.
404 Hunter
Gratuit. Français. Ecrit par Hervé Inisan. Application Java - s'exécute seule, hors de votre navigateur. C'est à télécharger à 404 Hunter. Vérifie les liens internes et externes. Vérifie l'usage stricte des minuscules dans les URL.. Vérifie les :
Liens vers des pages HTML
Liens vers des images (image simple, fond de page, fond de tableau...)
Liens vers des sons
Liens vers des frames
Liens définis dans des image-maps HTML
Liens vers des applets Java
Retrieve
Gratuit. Anglais. Application Java. C'est un moteur de recherches, écrit par un russe, Vadim Motorine, dont le premier but est de parcourir et indexer le contenu d'un site Web et d'y faire des recherches aussi bien que de valider ses liens. Le site, personnel et non, peut se trouver sur un ordinateur local, un Intranet ou l'Internet. C'est téléchargeable à Retrieve.
Xenu's Link Sleuth
Gratuit. Anglais. Le produit, écrit par Tilman Hausherr, semble "vivant" (mise à jour du 14 septembre 2002). Xenu's Link Sleuth valide les liens d'un site. Les liens analysés sont les liens "normaux", images, frames, plug-ins, backgrounds, local image maps, feuilles de style, scripts et applets java. Il affiche une liste d'URLs constament mise à jour que vous pouvez trier sur divers critères. Un rapport peut être produit à tout moment. Simple d'emploi. Peut re-tester uniquement les liens brisés (erreurs temporaires du réseau, timeout...). Format simple du rapport qui peut être expédié par e-mail. Taille inférieure à 500K. Supporte les sites en SSL ("https:// "). Teste partiellement Ftp et Gopher. Détecte et signale les URLs redirigées. Elabore un plan du site. Xenu's Link Sleuth
WebAnalyser
Semble ne plus exister
WebQa - anciennement Linkbot
Payant - 1.495 US$ (période d'évaluation gratuite de 15 jours). Anglais. Outil de classe professionnelle. Limité à 10.000 URLs. En plus de rechercher les défauts de contenu (liens brisés etc. ...), il analyse la facilité d'usage, vérifie l'adéquation avec les spiders des moteurs de recherche, fait l'inventaire du site, vérifie l'accessibilité (aux mal voyants, handicapés etc. ...), améliore la maintenance d'un site, valide un site par rapport aux standards et chartes d'une société.
WebQa - Linkbot
LinkScan
LinkScan WorkStation (500 documents) - 750 US$
LinkScan Server (5000 documents) - 1500 US$
LinkScan ServerPro (15000 documents) - 4000 US$
LinkScan Enterprise (50000 documents) - 7500 US$
Période d'essai gratuite de 15 jours. Anglais. Produit de classe industrielle dont la validation des liens d'un site n'est qu'une infime partie de son travail.
LinkScan
LinkAlarm
Payant : 0,01 US$ la page. Anglais. Validation des liens on-line. Un test d'évaluation gratuite du produit après s'ètre identifié. Paiement à la page. Par exemple, pour un site de 1000 documents html et 1 analyse par semaine, le prix de revient est déjà de 520 US$.
LinkAlarm
Web Link Validator
Payant : de 27 à 495 US$ selon la licence. Anglais.
Web Link Validator