Nous avons mis une sécurité afin que le javascript ne mette pas en erreur le navigateur, je viens de rehausser celle-ci et de la positionner à 250 au préalable elle était à 50. Pmartin (d) 21 août 2008 à 08:51 (CEST)[répondre]
Le problème est corrigé pour le premier lien, pour le second, c'est plus complexe : c'est une des (innombrables) pages qui détectent si elles sont ouvertes dans un cadre et le font "sauter". Il faut que je trouve un moyen sur de faire sauter le javascript des pages pour le résoudre. Guillaumito (d) 21 août 2008 à 14:53 (CEST)[répondre]
J'aurais aimé avoir des stats précises sur les temps d'exécution du script
La page d'aide dit Il y a la possibilité de désactiver le cache en ajoutant no_external_cache = true; à votre monobook.. Il serait normal que ça soit le fonctionnement inverse, ie par défaut c'est normal, et si le lecteur le souhaite, il a accès à cette fonctionnalité.
Pour la deuxième question : actuellement c'est ainsi. Seulement, il convient de savoir quelle utilité on veut donner au cache, et les conditions dans lesquelles il arrive.
Le nombre de liens morts est très importants(environ 5% ), là je ne t'apprends rien.
Par contre quelle est la réaction des gens devant un lien mort? Eh bien ils l'enlèvent, tout simplement, même si il s'agit d'une source. La plupart ne connaissent pas internet archive et encore moins savent ce que l'on peut en faire. Ce n'est pas parce qu'il existe un gadget qui ajoute une fonction obscure que cela va changer grand chose.
Vu que les gens ne savent que faire, et que le nombre de liens à corriger est énorme et pratiquement impossible à robotiser, il faut leur donner un cache qui rends les liens valides.
Il y a une autre éventualité à laquelle je viens de penser. On peut demander à un robot de poser le modèle ((lien brisé)) à côté de chaque lien mort. Ce modèle renvoie à un mode d'emploi. On peut ajouter au mode d'emploi la possibilité d'ajouter le js cache au monobook, voir la page en cache par wikiwix, et corriger le lien en liant à wikiwix. Par contre il faut avoir bonne foi en la main d'œuvre qui va s'atteler aux 20'000 liens morts. Amicalement, Dodoïste[réveille-moi]23 août 2008 à 17:20 (CEST)[répondre]
Qu'entends tu par des stats précises sur les temps d'exécution du script Maloq ?
Quant à ta deuxième question, un outil comme le cache est un outil justement pour les lecteurs de Wikipedia.fr qui eux n'ont pas nécessairement de compte utilisateurs. Il me semble donc important que celui-ci s'affiche par défaut mais que les utilisateurs puissent le désactiver. En effet, le cache permet de rendre accessible les sources qui le tolère, de wikipedia.fr et par là même que les lecteurs puissent vérifier l'information produite sur WP. Je pourrai me renseigner sur le nombre de compte utilisateurs Wikipedia et ainsi avoir un ratio lecteur utilisateurs // non utilisateurs si celà t'intéresse. Pmartin (d) 24 août 2008 à 11:23 (CEST)[répondre]
Bon, je suis opposé à son intégration par défaut sans prise de décision (désolé, c'est un peu lourd comme procédure, mais le changement n'est pas mineure). Pour une intégration en gadget, je ne voit pas de probleme, tant qu'on est sur quil n'y a pas de probleme de compatibilité avec les autres.
Pour les stats, sur un PC moyen ,le chargement d'une grosse page peut occasionner entre 500ms et 1500ms d'éxécution de scripts, ce qui est bcp trop. Il faudrait donc avoir des chiffres sur l'impact au chargement de ce script. Maloqcauser24 août 2008 à 19:22 (CEST)[répondre]
Mais, moi aussi je suis opposé à son intégration par défaut sans prise de décision, même si les modifications ne s'effectuent que sur le fichier common.js, elles restent suffisament importantes à mes yeux pour qu'il y ai une consultation de la communauté.
Le script détecte les liens externes et ajoutent un lien vers le cache, nous avons mis en place une sécurité afin que celui-ci ne s'exécute pas sur les pages contenant plus de 250 liens. Mais je fournirai un benchmark de l'execution du temps des scripts, qui comme tu l'as bien fait remarqué dépende de la machine de l'utilisateur. Pmartin (d) 24 août 2008 à 20:13 (CEST)[répondre]
Il me semble temps de créer une FaQ, et une page où reporter les bugs. Sur cette page-ci si tu veux, et je veux bien me charger de rédiger tout cela. Je propose d'afficher sur le iframe (c'est bien cela non ?) :
« Vous pouvez obtenir plus d'informations sur la FAQ et reporter un bug ou nous donner votre avis sur cette page. »
Oui Dodoïste, pardon j'avais pas compris ta requête , oui pas de soucis si tu veux la rédiger, pourquoi dans un iframe et pas dans la page directement ? Pmartin (d) 20 novembre 2008 à 19:33 (CET)[répondre]
Ah c'était donc un malentendu ^_^
Pardon, j'ai pas dû m'exprimer clairement. En fait je propose juste de modifier le texte affiché en haut des pages en cache.
Actuellement, le texte affiché est : « Vous pouvez obtenir plus d'informations et nous donner votre avis sur le cache sur cette page. »
J'aimerais qu'il soit changé en : « Vous pouvez obtenir plus d'informations sur la foire aux questions et reporter un bug ou nous donner votre avis sur cette page. »
Comment purger le cache pour avoir la dernière version du site ?
Les MaJ du cache sont effectués a quel rythme ?
Slts
Bonjour, actuellement aucun système "automatique" n'a été mis afin de gérer les mise à jours du cache. Car celui-ci est prévu pour stoker la version originelle des liens sources de Wikipédia. Crodialement Pmartin (d) 18 novembre 2008 à 11:57 (CET)[répondre]
Vous utilisez le principe de cache de Google ou d'Heritrix ? (Si google cache, pour ne plus avoir tjrs la même critique (voir plus bas) sur la vétusté des pages sauvegardées, vous devriez prévoir un mécanisme de mise a jour automatique ou la possibilité de le mettre à jour manuellement.) Olive028 (d) 20 novembre 2008 à 10:02 (CET) Slts.[répondre]
la possibilité de le mettre à jour manuellement ==> on y pense mais ce n'est pas aussi évident qu'il n'y parait, si on part du principe que des sites par exemple peuvent être mis en parking http://www.cezac.com/ ou bien que le contenu ne correspondent plus du tout à la source qui avait été linké. J'écarte par la même toute mise à jours automatique, mais plutôt un outil manuel, que nous disposons en interne. Après je ne pense pas que la communauté puisse gérer ce travail de mise à jours. Je réfléchis mais tant que je n'ai pas The solution ... Pmartin (d) 20 novembre 2008 à 17:24 (CET)[répondre]
Non en effet, mettre à jour manuellement les je-ne-sais-combien de millions de liens externes que nous avons me paraît inconcevable. Autant revenir à un système de détection manuel des liens morts. Et pour la fiabilité des sources, il est essentiel d'avoir la version originale, et volontairement celle qui date.
Je ne comprends pas le souci du webmaster ci-dessous, il me semble être complètement infondé. Personne ne va regarder la version archivée d'une page web si la version courante est disponible. En refusant l'archivage, il risque uniquement de perdre des lecteurs : à chaque fois que son site sera en erreur (404 par exemple), les lecteurs ne pourront pas accéder à son site. Donc refuser l'archivage me semble desservir les intérêts de ce webmaster.
@Pmartin : Tu veux vraiment pas me répondre au sujet de la FAQ ? Juste un oui ou un non que je sois fixé. Sache que cela permettrait de renseigner les lecteurs et d'éviter que tous posent la même question, ou ne comprennent pas bien le but et les intérêts du fonctionnement actuel de l'archive. À long terme, une telle attitude ne peut que nous desservir. Bien à toi, Dodoïste[réveille-moi]20 novembre 2008 à 17:47 (CET)[répondre]
Je comprends l'utilité du cache mais je vais prendre un cas précis. Sur l'article Gabriel Viardot le lien externe est mis en cache et c'est parfait sauf que depuis il y a un copyright sur l'image du site mais pas sur l'image du cache wikipedia. Une MàJ manuelle m'aurais permis de recharger le cache avec la bonne image. La seule solution est de supprimer le lien et de le replacer plus tard. Olive028 (d) 22 novembre 2008 à 16:51 (CET)[répondre]
Encore un fois, tous les liens de Gabriel Viardot sont valides. Si on veut la bonne version de l'image il suffit d'aller faire un tour sur le site.
Ensuite, je serais favorable moi aussi à un système d'archivage doté de plusieurs versions. Par contre je suis contre la mise à jour de la page. Une archive est une archive, pas un cache. Or la prise de décision a aboutit au choix d'une archive (voir les discussions). Bien à toi, Dodoïste[réveille-moi]22 novembre 2008 à 17:16 (CET)[répondre]
C'est un dialogue de "sourd" ce n'est pas un pb de lien ou de mise en cache ou d'utilité du cache, mais un pb de mise a jour de contenu du cache. Il faut implémenter une mise a jour du cache. En votre qualité de lecteur d'un article sur wikipeia vous lisez la dernière version de l'article mais certainement pas la première version de l'article qui date de 2004. En quoi cela vous gêne t'il de mettre a jour le cache avec le dernier contenu du site pointé ? Olive028 (d) 23 novembre 2008 à 15:50 (CET)[répondre]
Si une mise à jour automatique du cache pourrait avoir des avantages, ne pense-tu pas qu'elle pourrait également avoir des désavantages ? Si un site peut s'améliorer, il peut aussi décider d'enlever la partie qui sert de source à l'article qui l'utilise. C'est pourquoi le cache n'est pas mis à jour par défaut. La date du cache est la date où le lien a été inséré dans Wikipédia : ainsi on est sûr que la source remplit son rôle premier. Amicalement, Dodoïste[réveille-moi]23 novembre 2008 à 18:43 (CET)[répondre]
Voir plus bas
Olive028, il ne faut surtout pas que le cache soit vu comme un système de contrainte pour la communauté. Il est parfaitement possible de mener un projet cache sans que qui ce soit se sentent léser. Il est parfaitement légitime que le cache puisse se mettre à jours en fonction de vos souhaits. C'est le but de passer par nous, car nous sommes disponibles pour pouvoir améliorer celui-ci. Il est tout à fait envisageable que la communauté puisse avoir des actions de type administrations sur cette outil , qui pourrait être forcé les mises à jours, régler certains sites en mise à jours automatique, ... C'est pour cela qu'il serait intéressant de monter un projet "Archive liens externes" afin de mettre en centraliser un peu toutes les demandes, et qui du même coup pourrait contenir la FAQ que rédige Dodoïste.Pmartin (d) 22 novembre 2008 à 19:29 (CET)[répondre]
Je suis d'accord moi aussi pour mettre en place un tel système. Il faut de toute façon une page pour reporter certains bugs, c'est l'occasion de faire d'une pierre deux coups.
Je pense que sa meilleure place serait : Wikipédia:Archive des liens externes (FAQ, discussions générales, reports de bugs) et Wikipédia:Demande de mise à jour d'une archive (un requête à ajouter aux 9 requêtes aux administrateurs existantes). Est-ce bien comme cela que vous le voyez aussi ? Bien à vous, Dodoïste[réveille-moi]23 novembre 2008 à 18:43 (CET)[répondre]
Ok, comme vous le signalez une mise a jour auto pose des pbs, mais une MàJ par un admin pose un peu le même pb dans la mesure ou un "admin bêta" en charge de la MàJ peut très bien ne pas avoir les connaissances nécessaires pour évaluer la pertinence de la MàJ du contenu. Mais ajouter une 10 requête sécurise le processus, je ne sais plus quoi penser. La nuit porte conseil...Olive028 (d) 23 novembre 2008 à 22:39 (CET)[répondre]
C'est bien ce que je dis il va falloir se creuser la tête pour trouver une bonne formule. Dodoiste ca ne serait pas mieux un projet ?? Pmartin (d) 23 novembre 2008 à 23:02 (CET)[répondre]
Pourquoi veux-tu un projet ? Pour qu'il y ait une demande aux admins il faut une page à cet effet. Par souci d'organisation et de participation de la part des admins il vaudrait mieux qu'elle soit identique aux autres requêtes aux admins : n'étant pas admin, je ne pourrai accéder aux requêtes en question. Un projet ne suscite pas souvent une énorme participation de contributeurs...
Il me semble que concernant le cache lui-même (et la FAQ qui va avec), il ne s'agit plus d'un projet, suite à notre PDD et son application. Donc je pense que l'espace Wikipédia est maintenant approprié. Amicalement, Dodoïste[réveille-moi]24 novembre 2008 à 02:13 (CET)[répondre]
J'émettais juste une hypothèse afin de ne pas écarter un espace d'emblée une solution. Si tu estimes que c'est la meilleure solution est de gérer cela dans l'espace wikipedia, je n'y vois aucun soucis. Pmartin (d) 24 novembre 2008 à 09:15 (CET)[répondre]
Une solution intermédiaire serait un outil en javascript; seul un utilisateur inscrit et vérifié pouvant l'installer et l'utiliser; Il faut laisser la possibilité aux contributeurs de modifier une archive les seuls a avoir les "compétences nécéssaires" sur un l'article. Olive028 (d) 25 novembre 2008 à 14:58 (CET)[répondre]
Oui j'y ai pensé mais comment déterminer les seuls a avoir les "compétences nécéssaires" sur un l'article d'un autre coté je ne sais pas si en terme de sécurité c'est possible de passer par un javascript, car cela voudrait dire que les paramètres du type nom d'utilisateur serait facilement falsifiable. Pmartin (d) 25 novembre 2008 à 16:12 (CET)[répondre]
"les compétences nécéssaires" : Aucune c'est le principe même de WP, quand vous modifiez un article vous ne demmandez d'autorisation à personne et un reverse est tjrs possible. Dans votre base vous devez prévoir un historique.
"Sécurité Javascript" : Le liveRC marche comment pour révoquer une modif par exemple ? Dansl'historique de la page le pseudo apparaît; Il y a bien interaction entre Java et la session d'identification du compte en php. Slts Olive028 (d) 25 novembre 2008 à 18:41 (CET)[répondre]
Le liveRC peut récupérer la session car tous les deux sont sur le même serveur. Il n'est pas possible pour nous de récupérer une session sur Wikiwix qui a été initialisé sur le site de Wikipedia. Par contre on peut monter cette interface d'administration au sein de Wikipedia, comme cela le problème est résolu. Pmartin (d) 26 novembre 2008 à 11:01 (CET)[répondre]
Non je n'ai aucune réticence à créer une interface d'admin pour la communauté. Le tout c'est que nous trouvions un peu de temps pour le faire. Cordialement Pmartin (d) 30 novembre 2008 à 13:48 (CET)[répondre]
Bonjour,
je voudrais vraiment supprimer cet ignoble cache qui aboutit à une très vieille version toute pourrie de la page d'accueil de mon site, mais comment faire ? merci de me l'expliquer en langage normal, pas en jargonaute technico-informatique à deux balles.Mais qui donc a eu l'idée de mettre en place un truc pareil ????
pour ne plus voir "l'ignoble cache", il faut ajouter "no_external_cache = true;" dans un fichier javascript en sous-page de votre page utilisateur (oui, il faudra créer un compte pour cela)
pour la "vieille version toute pourrie", j'ai corrigé quelques problèmes d'affichage (notamment du aux commentaires html dans la balise style) et j'en ai profité pour mettre à jour le cache de la page (cf http://wikiwix.com/cache/?url=http://www.shellerophile.fr/ )
la décision de mise en place du cache a été communautaire et est passée par un processus appelé "prise de décision", processus auquel tout contributeur de Wikipédia peut participer.
La question ne portait pas sur la suppression des liens « archives » dans l'interface wikipédia, mais sur la suppression de la mise en cache d'un site par wikiwix.
Si une FAQ est mise en place, elle devrait d'ailleurs donner les éléments de base de réponse (fichier robots.txt, meta robots), et renvoyer pour plus d'informations sur robotstxt.org qui est ce qui se rapproche le plus d'une référence normative dans ce domaine.
Bonjour, J'aimerais savoir à quel moment la sauvergarde en cache se fait? Régulièrement? Au moment de l'insertion du lien? À la suite d'une modification de l'article? Merci. --Riba-- (d) 29 décembre 2008 à 22:09 (CET)[répondre]
Je cherche à visualiser une page et les photos n'apparaissent pas. Comme visualiser les images sur une page avec fonction cache? Merci de me répondre si quelqu'un sait.
La référence 19 sur l'effet placebo dans l'article homéopathie possède une lien archive dont la page cible ne comporte aucune information pertinente. Il faudrait peut être supprimer cette référence faute de pouvoir l'évaluer.
Cordialement Pr Helianthus(d)23 août 2019 à 22:55 (CEST)[répondre]
Certains contenus de ce site sont disponibles gratuitement, et celui-ci l'a sûrement été puisqu'il a été mis en lien sur Wikipedia, mais le cache de cette page a été mis à jour aujourd'hui, date à laquelle la page n'est plus accessible que pour les abonnés du site.
J'aurais bien aimé (et je pensais que c'était l'utilité du cache mais je me trompe peut-être) que la page gardée en archive soit celle que pouvait voir Speculos le 19 mars en rajoutant ce lien.
C'est délicat. Il arrive régulièrement qu'une personne désire retirer du net des informations personnelles. Dans ce cas, elle dispose de plusieurs méthodes pour demander aux moteurs de recherche et aux archives Web d'ignorer son site (en ne l'indexant pas), et donc de la faire "disparaître" de la toile. Voir la documentation en anglais sur searchengineland.com : Meta Robots Tag 101: Blocking Spiders, Cached Pages & More. Ce qu'il faut comprendre, c'est que copier et diffuser un document sous copyright n'est pas légal. Sur le net, tant que l'archivage respecte la volonté de l'auteur du site, soit la diffusion de l'information, cela ne pose pas de problème. Mais si l'auteur d'un site a décidé de rendre son site payant, alors l'archive se doit de respecter ce souhait. Du moins c'est là mon avis. Bonne continuation ! Dodoïste[ dring-dring ]9 juillet 2009 à 01:40 (CEST)[répondre]
Bonjour,
J'ai mis un lien vers la notice autorité d'un auteur sur le catalogue de la BNF (cf. Antoine Caillot), à partir de l'adresse permanente de la notice, mais le lien "cache" renvoie vers une page de recherche vide. Y a-t-il quelque chose à faire ? Cordialement, Acélan (d) 12 juillet 2009 à 10:52 (CEST)[répondre]
Quand j'essaie d'ouvrir la page en question (Antoine Caillot sur le catalogue BNF), j'obtiens une page vide un peu semblable à celle du cache (archive). Le site m'indique également : « Un incident technique (14) est survenu pendant votre navigation. Veuillez renouveler votre demande. » Je ne suis pas sûr que le cache soit en cause ici ? Amicalement, Dodoïste[ dring-dring ]13 juillet 2009 à 04:06 (CEST)[répondre]
Ce matin, ça fonctionne normalement. Il faut dire que le serveur de la BNF est coutumier des "incidents techniques". Toujours est-il qu'il y a des moments où le lien direct fonctionne correctement, mais le cache ne fonctionne jamais pour cette page. Amicalement, Acélan (d) 13 juillet 2009 à 09:42 (CEST)[répondre]
Wikiwix, comme toute archive web, met une page en cache à un moment donné. Donc au moment de la mise en cache, le lien ne fonctionnait pas. Il faut demander à Pmartin d'actualiser le cache au bon moment, si il lit cette discussion il le fera probablement. :-) Dodoïste[ dring-dring ]13 juillet 2009 à 14:03 (CEST)[répondre]
Sur l'article René-Louis Baron que je documente, les archives wikipédia fonctionnent très bien avec les pages web contenant du texte et des images. Exemple : http://wikiwix.com/cache/?url=http://www.realcomposer.com/Medal%20-%20RevuePresse2.htm
Cependant, quand il s'agit d'une page « précise » sur Youtube, le robot mémorise bizarrement la page d'accueil de Youtube et affiche un bandeau rose : « L'URL contient un ID vidéo incorrect » ? Exemple : http://wikiwix.com/cache/?url=http://www.youtube.com/watch?v=PuST5RWalhY
au lieu de : http://www.youtube.com/watch?v=PuST5RWalhY
Je comprends qu'il serait délicat de mémoriser des vidéos, le robot ne pouvant certainement pas encore savoir s'il s'agit d'une oeuvre libre de droit ou non. Ne pensez-vous pas qu'il serait peut-être intéressant de pouvoir d'ors et déjà, mémoriser la page exacte sans la vidéo c.a.d. avec le titre, la desciption de l'oeuvre (« plus d'info » en haut à droite) et les commentaires inscrits ??? Etant wikiphile débutante , je ne peux malheureusement pas vous aider. Cordialement. --JCAILLAT (d) 24 août 2009 à 22:37 (CEST)[répondre]
Je reviens vers vous pour éclaircir ma faible lanterne. Dans l'article René-Louis Baron j'avais un lien vers un ouvrage de Gabriel Cousin qui fonctionnait très bien (ci-dessous j'enlève les balises 'ref' sinon rien ne s'affiche mais vous pouvez vérifier le lien de la référence n°3 (lire en ligne) de l'article sur Gabriel Cousin :
Je ne sais pas par quelle manipulation extérieure (robotique ou non), il était devenu corrompu suite à un changement de code devenu :
« Gabriel Cousin, dramaturge et poète contemporain, Université de Saint-Étienne, 1983, (ISBN978-2901559030) p. 140, [lire en ligne (page consultée le 19 août 2009)]. »
Ci-dessus, j'ai mis en gras le changement de code que j'ai trouvé : Plus de point d'interrogation derrière « ... books.google.fr/books »...
Je viens de m'en apercevoir en créant l'article Gabiel Cousin où j'utilise ce même lien. Je vous écris aussi parceque la page du lien en question n'est plus en mémoire (quand on clique sur archive). Je vous demande de m'excuser pour tant de dérangement. Cordialement.--JCAILLAT (d) 17 octobre 2009 à 15:19 (CEST)[répondre]
Il semble en effet y avoir un problème avec la mise en archive de ce lien, mais dans tous les cas nous prenons maintenant en compte le tag meta noarchive (qui permet à un site d'interdire l'archivage de ses pages) et Google Books utilise ce tag, nous ne pouvons donc pas la mettre en cache. Guillaumito (d) 22 octobre 2009 à 09:23 (CEST)[répondre]
Bonjour,
Le cache n'a pas fonctionné correctement sur le résultat de calcul statistique de l'Index Translationum. Il me semble que la séparation des arguments d'URL n'a pas fonctionné correctement.
R. Zaharia (http://fr.wikipedia.org/wiki/Utilisateur:Zaharia) 30/01/2010 J'ignore si cela a déjà été documenté sur cette page: dans l'article sur André Gorz la note 12 renvoie a un article du Journal Le Monde (cet article n'est bien sur plus disponible gratuitement). La page en cache ne montre pas davantage l'article en question, mais donne la procédure (et le tarif) pour se le procurer... Il se trouve qu'étant abonné au Monde... je peux accéder a cet article (je pourrais même vous le communiquer). J'ignore evidemment s'il serait possible /légal de remplacer l'actuel contenu en cache par le veritable contenu relatif a André Gorz ...
Bonjour. Tout petit problème : Sur la référence n°1 de l'article Gabriel Cousin le lien ci-dessous fonctionne (bon affichage de la biographie de l'auteur) cependant, l'archive (bouton adjacent) affiche autre chose ? Comment peut-on corriger celà ? Est-ce encore le résultat du fameux « tag meta noarchive » inscrit sur certains sites ? Biographie de Gabriel Cousin Cordialement. --JCAILLAT (d) 10 novembre 2009 à 16:36 (CET)[répondre]
Bonjour, le problème dans ce cas vient de l'url dans l'url :)
D'un coté notre code le gérait mal et je viens de le corriger
Suite et fin : la modification du javascript vient d'être effectuée par un administrateur du wiki et le lien est maintenant correct. Il peut s'avérer nécessaire de vider le cache de son navigateur pour que la modification soit prise en compte. Guillaumito (d) 16 novembre 2009 à 10:59 (CET)[répondre]
Ça fait environ 2 liens morts sur 13. Cela correspond à ce que j'ai observé sur le terrain. Au début aussi, je croyais que c'était beaucoup. Puis je me suis rendu compte que je ne regardais pas souvent les longues listes de liens en références. Et en fouillant parmi ceux-ci, j'arrivais souvent à un ratio proche de 15% de liens morts.
Il ne faut pas oublier non plus que, sur chacun des 36 000 articles des communes de France, il y a un lien mort. Et vu l'énorme travail que les robots abattaient auparavant, je ne suis pas surpris de l'ampleur de l'affaire. Dodoïste[ dring-dring ]14 janvier 2010 à 20:44 (CET)[répondre]
Ok, as tu déjà vu le nombre total de liens rouges, il est pas mal non plus... Tant qu'on reste dans les stats, as tu le pourcentage de liens morts dans les autres wikipédias ? et dans certains sites importants ? --Manu1400 (d) 14 janvier 2010 à 22:35 (CET)[répondre]
Je n'ai pas vu l'ombre d'une trace de ce genre de stats. Peut-être que des gros moteurs de recherche pourraient donner des stats à ce sujet, ou Internet Archive, par exemple. Mais ça doit être difficile d'avoir des stats fiables à ce sujet. Dodoïste[ dring-dring ]15 janvier 2010 à 01:22 (CET)[répondre]
J'ai vu une situation assez gênante. Dans une page, on indique mon site comme la source d'une information et c'est mis en cache, mais dans les liens externes, on donne un lien vers un autre site (quelqu'un dont le travail est en général de mauvaise qualité et en partie copié du mien), mais pas le lien vers ma page qui est la source originale. D'ailleurs, je note qu'on n'a pas demandé l'avis à ceux dont les pages sont ainsi pillées (appelons les choses par leur nom) mais à ceux qui pillent les pages (même si c'est légal quand on rephrase, ce que ne fait pas le cache).
Soit une page web X sur un site. Page avec de la pub et qu'on pille (parce que votre histoire de cache, c'est du pillage et rien d'autre). Cette page est indiquée comme la source d'une information wikipedia. Cette page est citée comme source de l'information, mais au lieu d'un lien vers cette page au bas de l'article, on trouve des liens vers d'autres sites.
De toutes façons, c'est écrit au bas de la présente page "Ne copiez pas de texte, ni d'une page web, ni d'un autre support : respectez le droit d'auteur" alors que le cache, c'est exactement cela. Soyons logique. Si la page est déplacée, c'est souvent parce que ce n'était pas la source de l'information. Placer en cache, c'est donc rendre crédible une information qui n'a aucune valeur. C'est démontrer que wikipedia est mauvais. Mettez vos efforts ailleurs que dans ce cache.
Pour terminer, il faudrait indiquer le nom du moteur à ajouter au robots.txt si on veut interdire le plagiat par wikipedia. no-cache, c'est demander à google de ne pas indexer un site (ce qu'on veut souvent éviter), et c'est très différent d'interdire à wiki de plagier notre travail. Un lien à la limite, mais pas de cache ou du moins une façon simple et directe d'interdire la mise en cache par wiki.
Bonjour, vous faîtes au moins deux amalgames le premier étant que le système de cache qui est proposé n'est nullement attaché à Wikipedia, il est développé par ma société Linterweb, le deuxième il ne s'agit pas de positionner le paramètre no-cache mais plutôt le no-archive avec le robot wikiwix-bot. Concernant vos propos sur le soit disant pillage, je vous invite à prendre contact avec mon cabinet d'avocat qui vous répondra sur la légalité de cet outil. Cordialement Pmartin (d) 19 janvier 2010 à 08:02 (CET)[répondre]
Que le robot soit dans wikipedia ou ailleurs, cela ne change rien. Vous ne faites que détourner la conversation pour éviter le vrai problème, soit comment bloquer votre cache sans affecter les autres moteurs. Bon, je vais tout bonnement interdire à wikiwix-bot d'indexer quoique ce soit dans mon site et l'affaire sera terminée (et vous devriez indiquer plus précisément cette information). Quant à votre avocat, il doit sans doute utiliser l'espace "sans loi" qu'est Internet pour beaucoup. Que pense-t-il de sites comme 123people.com ou webmii.fr qui créent artificiellement des millions de pages en pillant d'autres sites via Yahoo API et qui ainsi devancent dans les moteurs de recherche les sites qu'ils ont pillés ?
Pour les caractères "&" dans les URL, où es ce que c'est précisé qu'il faut les transformer pour que le lien vers le cache fonctionne ? J'ai une idée au sujet du cache : Il pourrait retourner des pages archivées uniquement quand elles seraient plus disponible. --Manu1400 (d) 20 janvier 2010 à 13:18 (CET)[répondre]
Mais... grrrrr ! Donne plus de détails, répéter la même chose ne sert à rien ! Le lien "[archive]" est fonctionnel. Pourquoi as-ton besoin de changer quoique ce soit ?
Concernant ton idée, c'est plus complexe qu'il n'y paraît. Et là aussi, trop peu de détails font qu'ils y a de nombreuses manières de procéder, et je ne sais pas ce que tu as en tête. Quoiqu'il en soit, le statut des pages — « fonctionnel » ou « lien mort » — est extrêmement variable, et peut changer durant une journée, une heure, ou indéfiniment. Le contenu des pages peut aussi changer du tout au tout, et ne plus comporter les informations qui servaient de source. Une copie statique est donc la solution la plus sûre et pérenne que l'on puisse choisir. Amicalement, Dodoïste[ dring-dring ]21 janvier 2010 à 02:49 (CET)[répondre]
Pour le problème du "&" j'ai du mal à comprendre que le problème soit pas compris, passons pour le moment.
Oui, c'est bon j'ai compris, le problème venait de la partie javascript qui est en fonctionnement sur le site wikipedia, qui nous renvoyait des mauvaises urls. Mais ce problème a été résolu. Pmartin (d) 25 janvier 2010 à 08:08 (CET)[répondre]
Concernant mon idée, il suffirai de tester la présence de la page et si le serveur répond par exemple par une erreur 404, d'afficher la page stockée dans le cache.
et quid des pages qui ont été modifié, la solution retenue lors de la PDD étaient que les nouveaux liens devait être enregistrés sans tenir compte des mises à jours. Ce qui a été retenue , c'est que si une source est jugé comme telle par un membre de la communauté, c'est au moment de son insertion dans wikipedia. Pmartin (d) 25 janvier 2010 à 08:08 (CET)[répondre]
Peux-t-on avoir des statistiques sur le cache ? (Combien de pages contient-t-ils ? par exemple mais aussi "quelles sont les pages du cache les plus demandés ?").
Ok ! Combien de pages contient le cache ? Quelles sont les pages du cache les plus demandés ? (Ça peut servir pour détecter des liens morts.) --Manu1400 (d) 1 février 2010 à 19:12 (CET)[répondre]
Pardon, nous étions en plein chantier et du coup j'avais oublié ta demande, on est entrain d'installer un awstats ( logiciel de visualisation de log ), cela va permettre de connaître l'activité au niveau du cache. Si tu as d'autres demandes n'hésites pas, on a un peu de disponibilité les semaines à venir. Cordialement Pmartin (d) 17 juin 2010 à 12:00 (CEST)[répondre]
J'ai copié ces lignes dans mon fichier robots.txt, puis demander le rafraîchessement du cache et la page est toujours affichée. Le fichier robots.txt a pourtant été lu, mais la page en question n'a pas été relue (et pour cause, sa lecture par un robot est maintenant interdite). Alors, comment bloquer votre cache ???
Mon fichier robots.txt contient :
User-agent: wikiwix-bot
Disallow: /
Pourriez vous m'indiquer l'URI (ou le nom d'hôte) dont vous souhaitez désactiver la mise en cache afin que je puisse diagnostiquer le problème ? Guillaumito (d) 25 janvier 2010 à 10:04 (CET)[répondre]
Je viens d'ajouter un entête "Content-Disposition" pour certains types mimes (notamment les fichiers Excel), qui ce qui devrait corriger le problème. Guillaumito (d) 25 février 2010 à 11:16 (CET)[répondre]
Je vois pas où est le problème :( Sur mon firefox j'ai bien le fichier qui s'ouvre dans la page, ou alors je n'ai pas compris. Cordialement Pmartin (d) 31 août 2010 à 14:17 (CEST)[répondre]
Tu "n'as pas" le problème car tu as une visualisation PDF dans ton navigateur, ce qui n'est pas le cas de tous. Un fichier au format PDF mais avec l'extension .php PEUT poser divers problèmes, de plus le nom du fichier n'étant pas garder ce qui est dommage (lors d'un enregistrement du fichier, le nom "display.php" est "généralement" utilisé. --Manu1400 (d) 1 septembre 2010 à 21:35 (CEST)[répondre]
[Résolu] Désactiver la mise en cache (reloaded)[modifier le code]
bonjour,
J'ai essayé de faire comme le message plus haut et ça ne fonctionne pas. Peut-être que "wikiwix-bot" n'est pas le bon nom de robot ?
À la base, le problème était pour un autre domaine que je ne veux pas citer ici. Le problème est aussi résolu pour cet autre domaine donc cela est très bien. Bon courage pour votre travail sur cet outil. --Blablou (d) 4 mars 2010 à 14:05 (CET)[répondre]
Pas de cache des images <TABLE BACKGROUND="...">[modifier le code]
L'image indiquée par une URL dans l'attribut BACKGROUND du tag TABLE n'est pas archivé.
Voici un exemple :
En l'occurrence, l'archivage est particulièrement important car :
le lien dans la page d'origine n'est valide que temporairement (l'image est probablement extraite d'une base de données, puis supprimée après un délai)
l'image manquante n'est pas qu'un fond de table : il s'agit d'une information fondamentale de la page ; le créateur de la page semble utiliser cette astuce comme mécanisme anti-copie
Supprimer les protections anti-copie (attributs de <body>)[modifier le code]
La page [1] contient des dispositifs "anti-copie" qu'il serait utile de supprimer lors de l'archivage car ils empêchent l'extraction du texte.
Ce dispositif capture par JavaScript les évènements liés à l'activation du menu contextuel ou à la sélection de texte. Ce sont les attributs suivants du tag <BODY> :
Bonjour, dans l'article SoudFonts, nous n'avons pas de mise en archive des pages de deux liens externes vers « www.syntfont.com » (Notes et références). Pourriez-vous nous aider s'il vous plait ? --JCaillat > M'écrire 27 juin 2010 à 22:33 (CEST)[répondre]
Le système de cache est-il compatible avec les mises à jour des pages de références codées en lien ?
A titre d'exemple une des pages de référence liées à un article auquel je contribue est "bloquée" sur son état courant 2009, alors que depuis cette date cette page a été enrichie. L'appel de notes de l'article renvoie systématiquement à l'ancienne version de la page, ce qui est dommage... Comment dois-je faire ?
Je ne conteste pas l'utilité de l'outil. Webmestre moi-même, je râle contre les liens brisés irrécupérables -au point de bricoler des copies de sauvegarde. Mais ici le dispositif fige le système de références dans un état passé, et je ne sais comment le court-circuiter... Merci. Cordialement. Adamantane[m'écrire]12 juillet 2010 à 17:37 (CEST)[répondre]
Oui le système ne se met pas à jour automatiquement, car c'était la décision de la communauté cf la PDD. Mais effectivement, nous pouvons tout à fait faire évoluer le système de manière de façon à ce que certains liens soit mis à jours automatiquement. Cordialement Pmartin (d) 15 juillet 2010 à 12:25 (CEST)[répondre]
Merci. En fait, la mise à jour automatique serait un plus. La décision de la communauté cf la PDD a certainement son bien-fondé mais elle implique quelques inconvénients qu'il faut bien contourner. En l'absence, et en l'attente, comment faire ? Dans le cas qui m'intéresse, je suis allé faire un "annule et remplace" sur le lien, mais sans résultat. S'il faut que je change l'URL de la cible, quelle complication...Je viens en fait de découvrir l'existence d'une disposition qui, en ce cas spécifique, car rien n'est parfait en ce bas monde :-)) se retourne contre le lecteur. Merci de m'indiquer une procédure, même manuelle, qui puisse servir d'échappatoire. Adamantane[m'écrire]15 juillet 2010 à 15:05 (CEST)[répondre]
Nous avons réfléchi à votre problème, la solution consiste à ajouter un paramètre ("&nosave" ) dans les liens que vous estimez à avoir un rafraichissement régulièrement. Nous traiterons ce paramètre dès le mois de Septembre. Cordialement Pmartin (d) 3 août 2010 à 10:41 (CEST)[répondre]
J'ai une ressource (liens externe) qui vient d'être dépubliée, et archive.org et wikiwix.com n'en ont pas copie. Cependant google.com l'a encore en cache. Est-il possible de demander à wikiwix.com d'aller chercher l'archive de google ? Visite fortuitement prolongée (d) 5 août 2010 à 21:34 (CEST)[répondre]
Oui tout à fait wikiwix.com est capable de récupérer les pages du cache de google.com , et d'archive.org. Corddialement Pmartin (d) 9 août 2010 à 10:16 (CEST)[répondre]
Mon robot n'est apparemment pas utile ici grâce au système "cache", en attendant que quelqu'un rédige sa page d'aide, Dodoiste me renvoie vers toi pour que ce projet remplace mon robot sur les projets frères (vu tout ce que j'ai nettoyé sur Wikilivres je suis sûr que Wikiquote est truffé d'URL en erreur 404). JackPotte ($♠) 16 août 2010 à 00:55 (CEST)[répondre]
Commençons par tous les projets francophones (je venais d'y proposer mon robot mais si ce système est mieux autant rebondir dessus). JackPotte ($♠) 16 août 2010 à 21:10 (CEST)[répondre]
Je supporte cette bonne initiative. Attention sur la méthode toutefois: il faut s'assurer que les communautés des autres projets comprennent l'intérêt d'adopter ce cache. Peut-être en leur montrant Wikipédia:Prise de décision/Système de cache. D'abord s'assurer qu'ils sont d'accord ou qu'ils ne s'opposent pas, et ensuite mettre en place ce cache. Bien à toi, Dodoïste[ dring-dring ]16 août 2010 à 21:21 (CEST)[répondre]
en fait une fois que ce js est implanté soit en gadget comme pour les hongrois [2] soit dans le Common [3] les liens apparaissent. Après si tu veux lancer la sauvegarde en temps réel , c'est à dire dès qu'un lien est ajouté sur wikipedia on le sauvegarde, ou bien qu'on préremplisse le cache avec les liens externes déjà présent, je peux le faire dès demain sur l'ensemble des projets francophone ( ou autres ). Cordialement Pmartin (d) 16 août 2010 à 22:01 (CEST)[répondre]
Je ne comprends pas quel(s) paramètre(s) doit être modifié (en plus du chemin.indexOf("wikipedia.org")) :
addOnloadHook(function(){if(wgNamespaceNumber==0){if((typeofno_external_cache!="undefined")&&(no_external_cache))return;addcache();}functionaddcache(){varexternal_links;if(document.getElementsByClassName){external_links=document.getElementsByClassName('external');}else{external_links=getElementsByClass('external',document.getElementById("bodyContent"),'a');}for(i=0;i<external_links.length;i++){varchemin=external_links[i].href;if(chemin.indexOf("http://wikiwix.com/cache/")==-1&&chemin.indexOf("http://web.archive.org/web/*/")==-1&&chemin.indexOf("wikipedia.org")==-1&&chemin.indexOf("wikimedia.org")==-1&&chemin.indexOf("stable.toolserver.org")==-1){varli=external_links[i].parentNode;if(li.className=="noarchive")continue;vardepth=0;while((depth<3)&&(li.tagName!="OL")&&(li.parentNode!=null)){li=li.parentNode;depth++;}if(li.tagName!="OL"||!($(li).hasClass('references')))continue;vartitre=getTextContent(external_links[i]);varlast=document.createElement("small");last.setAttribute("class","cachelinks");last.style.color="#3366BB";last.appendChild(document.createTextNode("\u00a0["));insertAfter(external_links[i].parentNode,last,external_links[i]);varlink=document.createElement("a");link.setAttribute("href","http://wikiwix.com/cache/?org="+wgServer+"&url="+chemin.replace(/%/g,"%25").replace(/&/g,"%26")+"&title="+encodeURIComponent(titre));link.setAttribute("title","archive de "+titre);link.appendChild(document.createTextNode("archive"));link.style.color="#3366BB";last.appendChild(link);last.appendChild(document.createTextNode("]"));}}}});
Bonjour, je constate que les parties liées à la monétisation des pages mis en cache sont supprimées. Pourquoi ?
Pour mémoire la plupart des contenus repris en cache sont en infraction avec les lois sur la copie il me semble (reprise intégrale).
J'aime beaucoup la mise en garde en bas de page ici -> → Ne copiez pas de texte, ni d'une page web, ni d'un autre support : respectez le droit d'auteur (aide) ;
Hormis le caractère de copie de contenu, ce projet n'est il pas une illustration du non respect des webmestre vivant de leur site ?
Merci pour vos éclaircissements.
cordialement.
Bonjour, le cache ne stocke que ce qui est interne au domaine, souvent les publicités sont gérées via des serveurs externes auquel cas ceux-ci ne sont pas pris en compte. Lorsqu'un domaine autorise l'archivage par le biais de la non existence de la balise meta noarchive ou dans le robots.txt il est tout à fait tolérer de stocker son contenu, mais pas ce qui est externe. Cordialement Pmartin (d) 26 octobre 2010 à 18:23 (CEST)[répondre]
Bonsoir, Le stockage est en effet implicitement possible comme dit ici (balise meta ...) puisque non explicitement interdit seulement la loi est très claire à ce sujet et s'il n'est pas marqué vol interdit sur un véhicule, cela ne signifie pas pour autant que le vol est possible pour ce véhicule.
l'usage privé du copiste : art. L.122-5 2° : il ne peut s'agir que d'un usage individuel du copiste lui-même, non destiné à une utilisation collective.
Pour ce qui est du contenu copié la réutilisation d'un contenu privé a quelques fin que ce soit est elle moins permise. Comprenez bien que le fait de détenir une information est une chose en faire usage en est une autre. Si l'on considère vos pages présentant le contenu d'un site à une date X on se rend vite compte (passons sur les encarts de monétisation pour lesquel vous ne répondez pas et sur lesquels je reviendrai) que votre ? / le site wikiwix.com procède a une copie textuelle de contenu protégé et procède de plus a une copie graphique du site archivé. Pour ces deux copies il y a une atteinte directe aux droits d'auteurs qui ne peut en aucun cas être contesté.
Tout auteur est titulaire d'un droit de propriété sur son œuvre qui consiste à en contrôler toutes les exploitations. Lui seul peut autoriser les exploitations de son œuvre telles que la représentation, la reproduction, ainsi que des transpositions comme la traduction, l'adaptation, la transformation et l'arrangement (art.L.122-4 du code de la propriété intellectuelle).
Pour revenir sur le contenu que vous qualifiez d'externe (encarts de monétisation) l'étude du code source des pages du site wikiwix.com montre clairement une intervention sur les constituants actifs du site copié (javascript) qui eux sont en effet en charge de la gestion du contenu publicitaire mais propres au site copié (s'il fallait s'en convaincre, il suffirait de constater la présence d'identifiants uniques destinés à en identifier le propriétaire légitime sur les versions d'origine des pages). La démarche de "nettoyage du code" est donc bien une démarche volontaire visant le site copié et non une altération lié a un contenu externe. Si l'on résonne maintenant de façon plus procédurale, la page visité est chargé dans le navigateur d'un visiteur (code javascript qualifié plus avant de constituant actif compris) ensuite le navigateur génère un rendu visuel de la page chargé et a ce moment seulement les encarts externes sont créés dynamiquement. Les pages copiées sont donc bien volontairement altérées en amont puisque le contenu actif en est supprimé par le robot d'indexation qui lui au moment de la collecte n'a pas de contenu externe visible. J'ajouterai pour me rapprocher de la notion d'étique, que cette démarche peut clairement être perçue comme cavalière et préjudiciable dans la mesure on le processus de rendu visuel de la page effectué par le navigateur, est a quelques détails près similaire dans le cas des CSS et des JAVASCRIPT (code de nature différent mais interprété par le navigateur).Comment expliquer une altération dans un cas et pas dans l'autre alors. c'est sur ce point que j'estime peu éthique la démarche de filtrage des pages.
Une dernière piste a explorer serait celle du préjudice financier suporté par les auteurs originels dans la mesure ou la notoriété de wikipédia n'étant plus a faire, la présence de liens vers ses pages "mises en cache" entraine fatalement une perte d'exploitation pour l'auteur du site copié.
Comprenez bien que je ne cherche pas polémique, je souhaite seulement avoir ici l'assurance que la respectable fondation wikipédia est consciente d'enfreindre délibérément, quoique indirectement, le code de la propriété en mettant en avant un site produisant un contenu pouvant être qualifié a première vue d'illégal tout en privant certains editeurs plus ou moins gros de leur revenus légitimes.
« En cliquant sur les liens [archive] des trois liens externes de l'article sur le pont de la Motte, je suis tombé les trois fois sur "une image de la page telle qu'elle était le 29/10/2010", soit aujourd'hui! C'est inutile. Pourquoi ces liens sont-ils présents? Qu'est-ce qui m'échappe? »
Effectivement, nous avons un bug depuis quelques semaines, nous détectons bien les nouveaux liens en temps réel, mais nous ne les archivons plus. Nous avons travaillé la semaine dernière sur le problème et nous sommes proches de la solution. Pour pallier la perte de la synchronisation, nous allons récupéré les liens du dumps [4] qui date du premier Novembre, et relancer une procédure d'initialisation. Cordialement Pmartin (d) 1 novembre 2010 à 11:17 (CET)[répondre]
Il est possible également que lors du dump initiale seul les liens externes contenu dans la section "note et référence" soit retenu. Ensuite il y a une une extension sur "les sources" qui ont été ajoutés et que je suis sur que nous n'avons pas vérifié. Je pense que l'initialisation devrais remettre d'équerre tout çà. Cordialement Pmartin (d) 1 novembre 2010 à 16:14 (CET)[répondre]
Parfois les pages supprimées ne se traduisent pas par des erreurs 404 ou 500 mais par des redirections. Exemple : [6]. La page est redirigée vers l'accueil, et c'est l'accueil qui s'affiche dans wikiwix.
Pourtant au final le résultat est le même : la page originale n'est plus accessible. Dans le cas présent, la page est sur web.archive.org, mais ce n'est pas toujours le cas. Y a-t-il un moyen de parcourir l'historique du cache de wikiwix (s'il existe) pour retrouver une version spécifique ?
Comme je te l'ai dit par mail, il y a déjà des contribureurs qui demandent l'adoption de Wikiwix en tant qu'archive sur Wikipédia en anglais. Qu'en dis-tu ? Ne te fatigues pas à répondre là-bas, je te fais volontiers les traductions. Concentres-toi sur les manips techniques, chacun son domaine. ;-) Dodoïste[ dring-dring ]7 février 2011 à 23:23 (CET)[répondre]
Wikiwix utilise un système de backup régulier (je suppose que oui) ;
Oui
Si Wikiwix fournira bien un backup à la communauté au cas où son service serait arrêté ou suspendu ;
Nous n'avons pas le droit de diffuser les archives, elles ne sont pas libre de droit, si le dump du backup est distribué cela sous entend que nous mettons à la disposition des sources propriétaires.
Si la WMF peut disposer d'un backup régulier de l'archive Wikiwix.
Le cas est différent car il s'agit d'une copie de sauvegarde gérer par la WMF.
Merci pour ces renseignements. Donc, si je comprends bien, la WMF pourrait disposer d'un backup de l'archive Wikiwix, à des fins de sécurité uniquement et pas de diffusion (le contenu était sous Copyright). C'est bien cela ? Merci encore. :-) Dodoïste[ dring-dring ]14 février 2011 à 18:45 (CET)[répondre]
Pas exactement, mais on a le droit de disposer de quelques backup décentralisé ( grosso modo un pour la WMF et/ou deux ou trois personnes de la communauté ) mais nous n'avons pas le droit de diffuser le backup à la communauté. Pmartin
Le problème est corrigé. Les vidéos ne sont pas stockés nous n'avons pas le droits compte tenu qu'il y a un droit à l'image qui vient se greffer. Cordialement Pmartin (d) 21 juin 2011 à 01:47 (CEST)[répondre]
Cache Vidéo Youtube (cette page ne peut pas être affichée dans un cadre)[modifier le code]
Bonjour Pmartin,
Je vous écris au sujet de la fonction :
"If you wish to prevent this website to be cached here, please use the website blocking form."J'ai voulu tester par curiosité cette fonction de cache d'une page externe (Youtube)
sur un nouveau lien que je viens de saisir dans l'article René-Louis Baron.
Il s'agit du lien externe n°1 (« laboratoire de recherches ») en fin du 3ème paragraphe du Préambule de la page et vers http://www.youtube.com/watch?v=Zt2IDNi14ZE.
Vu que le lecteur de l'archive arrive maintenant sur une page affichant le message
« Une erreur s'est produite... » puis « Ce contenu ne peut pas être affiché dans une cadre »,
j'ai voulu réinitialiser la valeur du paramètre de la nouvelle fonction mais impossible (ou bien, je ne trouve pas ?)...
S'il vous plait, pouvez-vous m'indiquer ce que je dois faire
pour obtenir cette réinitialisation.
MERCI d'avance.--JCaillat > M'écrire 26 mai 2011 à 18:47 (CEST)[répondre]
J-ai lance une proposition sur ro.wp pour utiliser le system cache de wikiwix aussi sur pour notre Wikipedia. En analysant la page, j'ai observe qu'il y a 2 petits problèmes:
D'une part, le contenu de la page n'est pas traduit. Est-ce que vous pourriez nous indiquer la façon de la traduire?
D'autre part, pas tous les liens externes existent dans le cache. Y a-t-il quelque chose qu'on doit faire pour que les liens de ro.wp soient indexes?
Această pagină este o versiune arhivată a _acestui URL_.
Ea apare așa cum arăta în momentul în care a fost introdusă ca legătură externă în Wikipedia.
Puteți găsi informații și ne puteți oferi opinia dvs. legată de arhivă _pe această pagină_. | Dacă nu doriți ca acest sit să fie arhivat aici, vă rugăm să folosiți _formularul de blocare a siturilor_.
J'ai aussi trouve un bug: si le titre est un URL, je recois cette erreur de wikiwix: Warning: strpos() [function.strpos]: Empty delimiter in /home/wikiwix/cache/include/class.robots.php on line 55. Est-ce que le parametre title est obligatoire ou on peut l'eviter?--Strainu (d) 11 juin 2011 à 18:55 (CEST)[répondre]
Nous avons fait un petit experiment. Un collegue a ajoute un lien vers [11] mais il n'as pas visite le cache que ce matin. Le resultat est que [12] montre l'heure de ce matin, ce qui peut montrer que la page est mise en cache que lors du premier acces au cache. Est-ce que cette hypothese est vraie? Mersi.--Strainu (d) 17 juin 2011 à 08:40 (CEST)[répondre]
Normalement, tous les liens qui sont ajoutés sur wp sont sauvegardés avec un délai max de 24 heures , mais je confirmerai cela Lundi. Pmartin (d) 17 juin 2011 à 10:01 (CEST)[répondre]
Ce sont uniquement les liens du namespace principales qui sont stockés dans les 24 heures. Les autres sont stockés avec une périodicité d'environ tous les 3 mois. Cordialement Pmartin (d) 21 juin 2011 à 01:35 (CEST)[répondre]
Je cherche desesperement à mettre en réference le site du festival de Lyon Charbonnière sur l'article à propos de René Arrieu pour la pièce Coriolan de Juillet 1953.
C'est complexe et une petite aide + explications de ta part seraient un vrai bonheur... Salut et Fraternité--Zanatany (d) 12 juin 2011 à 13:10 (CEST)[répondre]
[13] il s'agissait d'un bug, en fait nous avons stocké une page index.html à la racine du système, ne permettant plus l'accès à la page index.php. Cordialement Pmartin (d) 20 juin 2011 à 09:33 (CEST)[répondre]
yo, c'est bizarre. au moment où j'ai rajouté le lien en ref2 (crossword puzzles) la page était active vu que je venais de lire l'article. j'ai remarqué hier que le lien n'était plus actif [14] et bizarrement ça se répercute sur le cache [15]. j'ai raté un truc ? - mirror ☣ Rᴑᴙᴚim4 janvier 2012 à 10:23 (CET) PS: au cas où l'article sur google cache [16][répondre]
Le jours où tu as mis le lien, la sauvegarde ne s'est pas effectué ( soit perte de la synchro, soit serveur irc de la WMF hs, soit ...) et la page de google que tu m'as donnée n'est pas archivable ( car elle contient la balise no archive ) comme toutes les pages de google. Donc impossible pour nous de récupérer le contenu, je t'invite pour plus de sureté la prochaine fois que tu ajoutes un lien de cliquer sur le lien archive qui est généré ca lance le stockage immédiatement et désolé pour la perte du contenu du lien. Cordialement --Pmartin (d) 25 janvier 2012 à 18:14 (CET)[répondre]
Problème avec le cache de la page d'accueil de Seeks Project[modifier le code]
Bonjour,
J'ai voulu sourcer la licence de Seeks, mais vu que je n'ai pas l'habitude, j'ai dû mal m'y prendre ou alors il y a un bug... "Elle apparaît ci-dessous telle qu'elle était lorsqu'elle elle a été insérée comme lien externe dans Wikipedia." → En fait, l'affichage de la page source est bon en suivant le lien, mais l'archive est une page complètement différente et s'affiche mal !
J'espère que tu pourras m'aider, merci d'avance ! --Flûte (d) 14 janvier 2012 à 19:54 (CET)[répondre]
Beaucoup plus facile cf discussion plus haut :) , "j'ai dû mal m'y prendre ou alors il y a un bug" pas de bug juste que la page était déjà mis en lien dans wikipedia du coup l'archive date un peu. Je peux tout simplement faire une mise à jours ce qui resoudera par la même le problème d'(affichage. Cordialement Pmartin (d) 16 janvier 2012 à 17:43 (CET)[répondre]
Oups, désolé, je n'ai pas tout lu... (je ne vois pas de quel passage tu parles, je lirais plus attentivement dès que possible). Pour la mise à jour, ce serait bien, sauf si ça remplace l'ancienne capture... Est-ce le cas ? En effet, je ne sais pas si les informations de la capture précédente, qui sont différentes, sont utilisées pour un autre article... As-tu moyen de vérifier ça avant de supprimer ?
Merci pour ta réponse rapide ! Flûte (d) 16 janvier 2012 à 23:54 (CET)[répondre]
Si je comprends bien, l'archive existe depuis que quelqu'un a mis un lien vers cette page externe ? Donc l'archive existait mais ne pouvait pas être utilisée car il n'y avait pas de lien vers celle-ci ?
Du coup, oui, je veux bien une mise à jour, stp ! :) Merci d'avance ! Flûte (d) 23 janvier 2012 à 21:35 (CET)[répondre]
Bonsoir, il semble y a avoir un léger problème avec un cache ici. Il pointe vers un fichier de type rtf qui a quelques difficultés à s'ouvrir normalement. Problème lié au cache, au format, à un intermédiaire php, à la compatibilité, à mon ordinateur ? Existe-t-il un moyen de régler cela pour simplifier la démarche du lecteur ? Merci d'avance. --Tryonisos (d) 11 avril 2012 à 00:49 (CEST)[répondre]
Le deuxième lien externe de cet article ne fonctionne pas, l'archive également. Je ne sais pas ce qu'il faut faire donc je m'adresse à vous pour régler ce souci.
↑ Daniel Fouray, Jean-Luc Mélenchon s'explique sur ses revenus, entretien vidéo accordé à Ouest-France, 14/04/2012, en ligne [archive], sur le site www.ouest-france.fr
Je mets souvent des liens vers des articles ou livres numérisés, comme ici. Il n'y a pas de problèmes pour le lien externe, en revanche l'archive refuse de s'afficher. On voit quelques éléments du site d'origine, mais pas le document lui-même. Que faire ? Zythème (d) 5 juillet 2013 à 15:54 (CEST)[répondre]
Exemple : le titre de la news est "Saltatrici italiane per le gare di Coppa del Mondo di Sapporo", et le lien "attaché" est [archive : on arrive "quelque part" sur le site, mais pas à la news "Saltatrici italiane per le gare di Coppa del Mondo di Sapporo" de fin janvier ou début février 2013 .
Il y a un lien brisé parmi les références de l'article : un lien vers une image. Quand je clique sur Wikiwix, j'obtient un écran séparé horizontalement tout blanc, avec dans le panneau supérieur "404" et dabs l'inférieur "Erreur 404".
Pour info, je ne trouve d'archive de ce lien nulle part...
J’ai trouvé trois liens d’archive curieux dans l’article Immigration en France : celui-ci et celui-là indiquent « 2Le cache est actuellement en lecture seule » pour seul résultat. Quand à celui-ci il donne quelque chose mais dans un sale état (et ça ne semble pas être la bonne page de toutes façons, voici une version archivée correcte).
Précision : j’ai corrigé ces liens, il faut se reporter à cette version de l’article pour les retrouver. Ce sont les notes 142, 143 et 144.
J’ai un comportement curieux de l’archivage sur cette page à la référence 53 : l’archive renvoie vers un ficher « display.php » alors que le lien pointe vers un fichier xls. À noter que l’archivage fonctionne correctement à la note 52 juste au-dessus qui est également un fichier xls.
P.S. En prévisualisation, je vois que des liens [archive] ont été ajoutés automatiquement après chacun des liens externes ci-dessus. Aurais-je sans le savoir fait juste ce qu'il fallait? Je n'ose y croire, d'autant moins que le second ajout serait une archive du site wikiwix lui-même. (Et le tout, soit dit en passant, sur une page de discussion.) Tonymec (discuter) 1 mars 2014 à 10:42 (CET)[répondre]
Le site cristobal-colon.net est fermé depuis 2011 à cause du piratage effectué principalement par les auteurs de wikipedia.
Sur une autre page concernant Colomb, http://fr.wikipedia.org/wiki/Christophe_Colomb la note 84 indique que la page est en archive, c'est faux !! Cette page n'est dans aucun cache, sur aucun site, puisque le site est fermé et le contenu a été détruit sur notre serveur!!!
Nous n'avons jamais autorisé quiconque à nous piller ! C'est tout simplement du vol organisé par wikipedia malgré les mentions légales portées au bas de ma page dont le texte est le suivant :
"Rappel important : Conformément à l'article L.122-4 du code de la propriété intellectuelle toute représentation ou reproduction non expressément autorisée, intégrale ou partielle et par quelque procédé que ce soit est illicite et constitue une contrefaçon sanctionnable par les articles L.335-2 et suivants du code de la propriété intellectuelle. "
Ce n'est pas la première fois que nous avons à nous plaindre de ce type de comportement de la part des pilleurs de wikipedia.
C'est à cause du vol incessant sur notre site, effectué par de prétendu rédacteurs de wikipedia, que l'Association "L'Amiral de la Mer Océane" a été fermé. Désormais les communications et les transmission informations se font par CD-rom et sur papier, uniquement aux membre de l'association.
Des petites images (gif) ne s'affichent pas sur une page en cache[modifier le code]
Sur cette page en cache, les petites images ne s'affichent pas, bien que les liens sous-jacents soient actifs.
La page originale a été déplacée et j'ai trouvé où, aussi je vais corriger le lien dans Électron-volt, et la page en cache va peut-être disparaître du cache, si qqn veut corriger le bug si besoin, il risque de devoir retrouver la page dans les archives du cache (est-ce possible ?), à moins que la nouvelle page en cache ait le même bug.
Le bug pourrait être que la mise en cache de l'image gif a ajouté une entête donnant la provenance de l'image, mais du coup ce n'est plus une image gif valide.
SGlad (discuter) 17 novembre 2014 à 14:19 (CET)[répondre]
Vous êtes en train de consulter une version archivée de cette URL.
Elle apparaît ci-dessous telle qu'elle était lorsqu'elle elle a été insérée comme lien externe dans Wikipedia.
--89.156.192.168 (discuter) 8 avril 2015 à 16:21 (CEST)--89.156.192.168 (discuter) 8 avril 2015 à 16:21 (CEST)Bonjour
A 83 ans, je ne suis pas de la génération informatique. Mon problème concerne les liens archivés. J'ai publié sur Wiki plusieurs textes concernant Etienne Chevalier et consorts (Montreuil 93, baronne de Dannemoine, etc... . Archivés sous l'URL http://perso.numericable.com/rconnat/ puis suite en .html.
Cette URL est maintenant caduque car j'ai quitté numericable comme provider)
Ma nouvelle URL est maintenant http://pontonnier93.fr/ suite en . html Mon provider étant maintenant Gandi et mon domaine .www.pontonnier93.fr .
J'ai changé aujourdhui mercredi 8 mars l'ancienne URL pour la remplacer par la nouvelle mais mon texte étant archivé, j'ignore si j'ai bien fait car j'ai toujours l'erreur 404.
Pourriez-vous jeter un œil car je poursuit un travail sur cette famille et j'envisage de la publier, mais avant je veux être certain que ma nouvelle URL soit visible.
Cordialement 89.156.192.168 (discuter) 8 avril 2015 à 16:21 (CEST)
René Connat pour historic93[répondre]
Alain594 : Non le fait de retirer un lien sur wikipedia ne supprime pas le cache, pour la bonne et simple raison qu'un lien peut être présent sur d'autres articles. Mais effectivement nous pourrions mettre en place un système de mise à jours des liens à la demande. Mais à la base de la prise de décision, il était très important que la mise à jours d'une page ne soit pas automatique. Je viens de mettre à jours la page dans le cache. --Pmartin (discuter) 12 mai 2016 à 10:51 (CEST)[répondre]
Pmartin : Merci beaucoup pour ces informations et pour la mise à jour du cache. Il me semble en effet qu'un système de mise à jour des liens à la demande aurait son utilité. Cela n'implique pas que l'archive initiale doivent être supprimée (elle peut toujours être conservée pour servir en cas de nécessité), mais l'archive visible de tous gagnerait à pouvoir être mise à jour selon une procédure officielle. Encore merci !
SGlad : il est possible de mettre toutes les archives en https ( https://archive.wikiwix.com ) mais pas de mettre uniquement les liens qui sont en https, le https fonctionne en tout ou rien. Mais cela rehausserait le coût pour l'achat d'un certificat SSL , et également la charge sur les serveurs. Il faut d'abord que je mesure l'impact financier et ressources serveurs avant de basculer en SSL, mais j'ai planifié cela avant la fin de cette année.--Pmartin (discuter) 20 mai 2016 à 11:47 (CEST)[répondre]
Par exemple, [19] ou [20], dans ces caches, il apparaît:
Impossible d'archiver cette url (robots.txt ou noarchive).
Serait-il difficile de ne pas mettre en cache ces pages, et donc de ne pas avoir de liens correspondants [archive] sur une page wikipedia?
J’imagine que les directives à prendre en compte proviennent de l'entête "X-Robots-Tag", ou de la balise meta name="robots" ou du fichier robots.txt. --Yvore (discuter) 21 mars 2017 à 00:28 (CET)[répondre]
Les liens [archive] sont placés pour tous les liens externes présents sur un article (Javascript pour tous les href), indépendamment du fait que ce lien ait été archivé ou non. Cela permet de garder une certaine indépendance pour les deux parties :) --Framawiki✉21 mars 2017 à 19:30 (CET)[répondre]
Bonjour Pmartin :
J'ai 3 questions sur l'archivage Wikiwix :
Si un lien externe a été ajouté dans un article le 1er janvier 2017, puis a été ajouté dans un autre article le 2 février 2017, est-ce que la sauvegarde Wikiwix (créée le 1er janvier 2017) de la page externe a été mise à jour le 2 février 2017 ?
Quand on ajoute un lien externe sur Wikipédia, la page externe correspondante est archivée sur archive.wikiwix.com et l'archive est consultable en cliquant sur [archive]. Pourquoi, lorsque le lien externe pointe directement sur une archive, le lien [archive] n'apparaît pas ? Exemples : le lien dans la section "Liens externes" de Kaos Studios (vers une archive Wikiwix) et le dernier lien dans la section "Liens externes" de Yūzō Takada (vers une archive web.archive.org).
La sauvegarde d'une page externe sur Wikiwix dépend de son utilisation sur Wikipédia. Si Wikipédia n'a plus de lien vers une page externe, l'archive correspondante est supprimée sur Wikiwix. Y-a-t-il un risque, pour le lien dans la section "Liens externes" de Kaos Studios, que l'archive directement pointée soit supprimée ? Autrement dit, est-ce que cette archive Wikiwix existe (et sera maintenue) parce qu'elle est pointée directement (ou juste parce que l'url primaire est utilisée ailleurs dans Wikipédia) ?
C'est l'archive à date du 1 er janvier 2017, qui est accessible, mais nous pouvons revoir le processus pour avoir plusieurs copies à des dates différentes.
Je n'ai pas de préférence mais, si le processus peut être revu, ça vaut le coup d'interroger la communauté. Par ailleurs, la mise à jour d'une archive pourrait être souhaitée lorsque la source évolue. Dans ce diff par exemple, j'ai constaté la mise à jour d'une source, alors j'aurais bien aimé forcer la mise à jour de l'archive Wikiwix (je fais un raisonnement général, même si mon exemple est mauvais car cette source là n'est pas archivable à cause de "robots.txt ou noarchive").
Là aussi, ça vaut le coup d'interroger la communauté, mais je ne comprends pas complètement votre réponse. Dans le sondage que vous citez, la communauté souhaite voir les liens [archive] dans toutes les sections. Pourtant, dans cet exemple, je ne vois pas [archive] à côté du lien dans la section "Liens externes". En supposant que MediaWiki:Gadget-ArchiveLinks.js gère l'affichage de [archive], ma question initiale est maladroite. J'aurais dû demander : est-ce qu'une archive est créée dans le cache Wikiwix si la source ajoutée dans un article est déjà une archive, par exemple est-ce vous avez une archive du dernier lien dans la section "Liens externes" de Yūzō Takada ?
Je ne comprends pas votre réponse. Ai-je eu tort en écrivant "Si Wikipédia n'a plus de lien vers une page externe, l'archive correspondante est supprimée sur Wikiwix." ? La page Utilisateur:Pmartin/Cache indique "Lors de la suppression d'un lien externe dans un article, celui-ci sera effacé du cache de façon automatique après vérification que celui-ci n'est plus lié à aucun article."
Bonjour @PmartinNicoScribe : 3. paraît pourtant clair : Si Wikiwix "ne procède pas à l'effacement des pages sources", toute page y reste archivée à la même adresse y compris quand disparaît le lien vers la source initiale. (Voir aussi ci-dessus : "12 mai 2016 à 10:51... le fait de retirer un lien sur wikipedia ne supprime pas le cache".) — Valp1 août 2017 à 10:40 (CEST)[répondre]
Valp : oui, j'ai encore fait une formulation maladroite, la réponse 3 de Pmartin est très claire (et cette réponse est une bonne nouvelle pour plein de raisons). Mais cette réponse m'a beaucoup surpris, parce que j'étais convaincu du contraire et parce qu'elle contredit le passage cité de Utilisateur:Pmartin/Cache. --NicoScribe (discuter) 1 août 2017 à 17:29 (CEST)[répondre]
Réponse à ma question : Via Google, cherché et trouvé deux autres pages encore actives pour remplacer le lien mort (recherche de: « "25 octobre 2008" Hébron »). — Valp1 août 2017 à 11:06 (CEST)[répondre]
Pour information, le cache hébergé sur Wikiwix semble à nouveau hors-ligne depuis quelques jours, avec le message « cant connect db ». Bon courage pour la réparation ! —Pols12 (discuter) 1 octobre 2019 à 22:14 (CEST)[répondre]
Désolé pour la réponse tardive mais merci Pols12 pour tes encouragements, nous avions un système que nous estimions énergivore qui était en doublon avec notre nouveau système. Le "can't connect db" est du à un problème matériel que nous sollicitons du coup moins, mais qui du coup risque de se reproduire. Pmartin (discuter) 12 août 2020 à 20:02 (CEST)[répondre]
J'ai ajouté un lien dans l'article wikipedia "Déduction naturelle" section "Lien externe" vers un logiciel php situé à l'adresse teachinglogic.liglab.fr/DN.
Mais il y a deux problèmes avec l'archive
1)le lien est obsolète
2) Quand on utilise un bouton du programme php, les requêtes se font à l'adresse ci-dessus sans le DN et se terminent par une page d'erreur, car la version archivée utilisait l'adresse teachinglogic.liglab.fr
Aussi, dans mon cas, l'archivage d'un lien obsolète est génante et je souhaiterais l'éviter. Sans trop comprendre les indications fournies, j'ai placé à l'adresse teachinglogic.liglab.fr/DN le fichier robots.txt contenant : User-agent:wikiwix-bot
Disallow:/
Est-ce la bonne solution pour éviter l'archivage ?
Liviusbarbatus (discuter) 22 novembre 2019 à 13:49 (CET)[répondre]
Si j'ai bien compris le message d'un bénévole de Wikipédia que je viens de voir sur ce site (worldcat....Atala), on étudie ici la possibilité que Wikipédia conserve de tels vieux liens qui sont à risque de disparaître. Je vous écris pour donner mon avis fortement en faveur de la conservation de tels liens, et de ce lien en particulier dont je viens de me servir. En dehors de mes désirs personnels, je trouve très frustrant de tomber sur des liens inactifs quand je lis des pages de Wikipédia. Il me semble très désirable POUR LA RÉPUTATION DE WIKIPÉDIA de ne pas avoir tous ces vieux liens inactifs.
Cette mise en archive est pourtant très utile, car dès que le député quitte sa fonction (ce qui est souvent le cas après qu'il soit élu au parlement fédéral et qu'il devienne donc admissible pour WP), la page est supprimée sur le site.