RechercheAbonnementArchivesCourrier

Page d'accueil

Les Chroniques de Cybérie
14 juillet 1999

© Les Éditions Cybérie inc.

14 juillet 1999

Salutations à tous les Cybériens et Cybériennes!

Cette Chronique n'est optimisée ni pour Netscape, ni pour Internet Explorer, elle l'est pour ses lecteurs et lectrices.

Cette semaine...

Moteurs de recherche : la pointe de l’iceberg
Les câblos devront partager leur infrastructure
Apple, fournisseur d’accès?
Les «hacktivistes», la presse et la loi
Rapports et évidences
En bref..
Beau détour

 Moteurs de recherche : la pointe de l’iceberg
Le Web : 800 millions de pages, 180 millions d’images, 15 téraoctets (dix à la puissance douze) de données, et au mieux un moteur de recherche n’en indexe que la pointe de l’iceberg, soit 16 %.  C’est le portrait que dressent Steve Lawrence et C. Lee Giles du NEC Research Institute dans une étude publiée dans le numéro courant du magazine scientifique Nature (abonnement requis) et bientôt disponible sur le Web.

Les robots indexeurs des moteurs de recherche ne suffisent plus à la tâche selon les auteurs de l’étude qui dressent un bilan quasi tragique de la situation.  Les moteurs n’indexent pas de manière égale les contenus, peuvent prendre des mois à répertorier les nouvelles pages, et répertorient collectivement (après recoupements) 42 % de ce qui est disponible sur le Web.  Le plus complet, d’après les résultats des chercheurs, est Northern Light et ne couvre que 16 % du contenu disponible sur le Web.  Il est suivi de Snap (15.5 %), AltaVista (15.5 %), HotBot (11.3 %), Microsoft (8.5 %), Infoseek (8.0 %), Google (7.8 %), Yahoo! (7.4 %), Excite (5.6 %), Lycos (2.5 %), et EuroSeek (2.2 %).

Si le jugement est sévère, il comporte néanmoins des conséquences lourdes pour les utilisateurs tout comme pour les diffuseurs de contenus.  On estime à 85 % la proportion des utilisateurs du réseau qui ont recours, à divers degrés, aux moteurs de recherche pour trouver de l’information.  Les moteurs de recherche, y compris ceux qui se dissimulent sous des allures de portails, se classent régulièrement au palmarès des sites les plus consultés.  La réussite des sites marchands est souvent tributaire de leur présence dans l’index des moteurs.

Parce que les robots indexeurs cheminent de lien en lien pour trouver les nouvelles pages, ils sont donc plus susceptibles de trouver des pages vers lesquelles pointent des liens.  Le référencement est donc faussé au profit des pages «populaires», surtout pour des moteurs comme Google et DirectHit qui basent leur indexation sur cette «popularité» des pages.  Selon les auteurs, Infoseek serait le plus susceptible d’indexer des pages jouissant d’une moindre visibilité.

La «fraîcheur» du contenu indexé fait aussi problème.  L’âge moyen des pages est de 186 jours, il varie de 141 jours chez Northern Light à 240 jours chez Snap.  Que dire des liens invalides pointant vers des pages périmées ou déplacées? La moyenne pour les moteurs testés dans l’étude est de 5,3 %, elle atteint 14 % chez Lycos mais n’est que de 2,2 % chez HotBot.

Les chercheurs ont aussi constaté une faible utilisation des balises meta par les auteurs de pages.  Ces balises, ou marqueurs, servent à insérer dans les codes de mise en page les titres, description et mots clés relatifs à une page et facilitent l’indexation par les robots indexeurs.  Seulement 34,2 % des sites analysés disposaient de ces métainformations.  Et là encore, on a recensé pas moins de 123 balises différentes, ce qui suggère un manque de normalisation dans leur utilisation.

Dans l’ensemble, ces résultats minables des moteurs de recherche seraient attribuables au modèle économique des moteurs.  Il ne serait pas rentable d’améliorer la couverture ou le rafraîchissement ponctuel des bases de données qui exigent une infrastructure lourde et coûteuse.

Les auteurs n’abordent pas la question de la pertinence des résultats de recherche, celle-ci étant largement conditionnée par l’interrogation qui est faite par les utilisateurs, d’où l’importance pour eux de maîtriser les fonctions de recherche propres à chaque moteur.  Pour élargir la «couverture» d’une recherche, ils soulignent cependant l’avantage, dans bien des cas, d’utiliser un métamoteur comme MetaCrawler qui lance simultanément une recherche sur plusieurs moteurs, récupère les résultats, élimine les doublons et classe les données recueillies par ordre de pertinence.

Côté contenu, les chercheurs estiment à 83 % la proportion de contenu commercial sur le Web (ce qui inclut les sites des organismes de presse nous a précisé M. Lawrence, qui songe à créer une catégorie spécifique pour les prochaines études).  Suivent les contenus éducatifs et scientifiques, ceux relatifs à la santé, les pages personnelles, les sites d’organismes et sociétés.  Les contenus pour adultes ne représenteraient que 1,5 % de l’espace Web.

Parallèlement à la publication de ce rapport du NEC Research Institute, le service CNet publiait un banc d’essai des moteurs et HotBot en sortait grand gagnant en raison de la pertinence des résultats, suivi d’AltaVista, Excite, Infoseek et Lycos.  CNet mettait aussi en évidence l’utilité des métamoteurs pour effectuer des recherches étendues.

D’autre part, et d’intérêt pour les utilisateurs qui souhaitent optimiser leurs recherches Web, on nous annonçait récemment la mise à jour du Guide d'initiation à la recherche dans Internet (GIRI) de l’Université Laval, ainsi que le projet de mise à jour du Guide des indispensables de la recherche dans Internet (GIRI - 2) qui devrait se concrétiser en septembre.

Haut de la page

 Les câblos devront partager leur infrastructure
Le Conseil de la radiodiffusion et des télécommunications canadiennes (CRTC), dans une décision publiée le 6 juillet, ordonne aux câblodistributeurs d’ouvrir l’accès à leur infrastructure aux fournisseurs d’accès Internet concurrents.  Les câblodistributeurs devront donc fournir au Conseil dans les soixante jours, pour approbation, une grille tarifaire visant la vente de leurs services à haut débit aux autres fournisseurs d’accès.  Ces derniers pourront ensuite revendre l’accès à haut débit à leur clientèle.  Reste à voir si la marge entre le gros et le détail leur permettra de tirer un certain profit de l’opération.

Ce nouveau mécanisme avantagera à coup sûr les fournisseurs d’accès traditionnels et leurs clientèles.  Il ne suffira aux abonnés que de signifier à leur fournisseur actuel leur intention de passer à l’accès haut débit, moyennant bien sûr les considérations techniques de cet accès (branchement préalable, modem câble).  Les abonnés n’auront donc pas à changer d’adresse de courrier électronique, ou d’adresse d’hébergement de pages, ce qui constituait un irritant pour bon nombre de clients potentiels de l’accès câble qui hésitaient à faire le pas.

La décision du CRTC cadre avec les orientations américaines en matière d’ouverture des infrastructures, telles que réclamée par la OpenNet Coalition qui milite contre les monopoles des câblos.  Le mois dernier, un tribunal de l’Oregon ordonnait à la société AT&T d’ouvrir aux fournisseurs indépendants d’accès Internet l’infrastructure de câblodistribution de sa filiale Tele-Communications Inc.  Des décisions semblables sont attendues en Californie, en Floride et dans l’État du Washington.

Grogne chez les câblodistributeurs tant canadiens qu’américains qui, après avoir investi des centaines de millions de dollars dans le déploiement de leur infrastructure, voudraient bien se réserver le monopole de l’accès à haut débit qui gagne en popularité.  On apprenait la semaine dernière dans Bénéfice.Net que le câblodistributeur canadien Vidéotron avait quintuplé en un an le nombre de ses abonnés Internet.

Haut de la page

 Apple, fournisseur d'accès?
La société Apple doit incessamment dévoiler les résultats de son troisième trimestre et les perspectives sont excellentes.  Grâce à l’énorme succès remporté par ses produits, dont le iMac, le cours du titre a connu une belle hausse dernièrement.  En outre, Apple a engrangé trois milliards de dollars en disponibilités à court terme, et s’apprête à annoncer de nouveaux produits à la grande foire MacWorld qui se tiendra à New York du 20 au 23 juillet.

Un cousin portable pour le iMac? Le service SiliconValley.Com n’a aucun doute, citant des sources proches de l’entreprise de Cupertino.  Seule ombre à l’horizon, les délais très courts pour approvisionner le marché avant la rentrée scolaire.  L’iMac portable se vendrait à un prix permettant de concurrencer les produits de ce créneau déjà disponibles sur le marché et viendrait compléter la gamme Apple.  De quoi aura l’air le iMac portable? Rien de confirmé du côté de Apple, mais les inconditionnels du Mac ne se privent pas de suggestions pour l’enrobage design des nouveaux produits du verger.

Autre question, et non des moindres, Apple se lancera-t-il dans l’accès Internet? C’est la possibilité que soulevait MacWeek récemment, reprenant les propos du quotidien londonien The Register.  Apple serait en négociation avec une société spécialisée dans le développement d’infrastructure d’accès et envisagerait aussi de lancer un portail.  Cette décision reposerait sur des données de marketing solides, dont le fait que 80 % des acheteurs d’iMac citent l’accès Internet comme une des principales raisons d’achat.  D’ailleurs, le fabricant d’ordinateurs Dell s’est déjà lancé dans le marché de l’accès en Allemagne et au Royaume-Uni, et vient d’ouvrir son service d’accès Internet gratuit et portail DellNet France en collaboration avec Cegetel et Excite.

Raison de plus de surveiller les annonces attendues au MacWorld plus tard ce mois-ci.

Haut de la page

 Les «hacktivistes», la presse et la loi
En fin de semaine dernière se tenait à Las Vegas le septième congrès annuel DEF CON, les grandes assises des hackers, crackers, phreakers et autres «hacktivistes» du réseau.  Événement attendu : le «dévoilement» par le groupe Cult of the Dead Cow de la nouvelle version de Back Orifice, un cheval de Troie présenté comme un outil de gestion de réseau à distance.

On ne compte plus les détournements de sites, intrusions illégales, infections de virus, vers et chevaux de Troie en tous genres.  C’est devenu presque banal pour la presse d’en parler, ça remplit les colonnes des faits divers de l’actualité techno.  Et c’est un des volets des compte rendus de DEF CON qui a attiré notre attention.

La visibilité offerte par la presse aux faits d’armes des hackers serait-elle, en fait, une des causes de l’augmentation du nombre d’incidents rapportés? D’après Michael Martinez de la chaîne de télévision ABC, et dont les propos sont rapportés par Wired, les hacktivistes ne parviennent pas à faire passer leur message car ils communiquent mal leurs véritables intentions à la presse.  Martinez était un des conférenciers invités au DEF CON et a déclaré «Nous [les journalistes] connaissons le comment, le où et le quand, mais pas le pourquoi.  Vous [les hacktivistes] vous plaignez que nous ne comprenons pas, et nous disons que vous ne nous permettez pas de comprendre.»

Le débat sur les rapports presse/hacktivistes avait été lancé sur ZDNet quelques jours auparavant et bon nombre de porte-parole de l’underground techno accusaient la presse de confondre le véritable hacking et le simple vandalisme de sites Web.  Entre autres, Jon Katz estime que la visibilité accordée par la presse à la modification de certaines pages Web ne fait qu’assurer que les cas se multiplieront, bien qu’ils ne représentent essentiellement que des incidents bénins sans conséquences profondes pour le réseau.

«Depuis la fin de la Guerre froide, les autorités et la presse sont en manque de “méchants”» selon Katz, ce qui explique la vision orwellienne projetée par la presse.

Précédant le DEF CON à Las Vegas se tenait le Black Hat Briefings 1999, événement aussi lié à la sécurité informatique.  Lié à ce point que l’admission aux Black Hat Briefings donnait droit d’accès au DEF CON.  Une des conférencières invitées était l’éminente criminaliste newyorkaise Jennifer Stisa Granick, bien connue pour sa défense de personnes accusées de crimes informatiques.  Citée dans Wired, Madame Granick a affirmé que les hacktivistes et agents de diffusion viraux étaient peut-être difficiles à attraper, mais faciles à inculper car la plupart avouent les faits qui leur sont reprochés lorsqu’ils sont arrêtés.

C’est que l’application des lois à l’espace cyber et informatique est encore en train de se modeler et que les accusés connaissent mal leurs droits et les éléments de preuve nécessaires à leur incrimination.  «C’est un nouveau champ d’application du droit, et comme tous les nouveaux champs d’application il est propice aux abus» a déclaré Madame Granick, ajoutant que la jurisprudence qui se forme présentement au fil des causes entendues et défendues est capitale car elle demeurera longtemps dans le paysage juridique du réseau.

Haut de la page

 Rapports et évidences
Abondance de rapports, cette semaine, bien qu’on ait parfois l’impression que l’on insiste sur des évidences.

Commençons par le document de Human Rights Watch sur la censure des contenus Internet et la surveillance des utilisateurs du réseau dans certains pays du Moyen-Orient et d’Afrique du nord.  Peu de surprise, ici, quand on apprend que les autorités d’Arabie Saoudite, du Yémen et des Émirats Arabes Unis censurent l’accès à Internet par l’imposition de serveurs mandataires destinés à filtrer les contenus disponibles aux citoyens de ces États.  En Jordanie, on utilise les leviers fiscaux pour rendre l’accès Internet hors de portée du grand public, bien qu’il n’y ait pas à proprement parler de censure.  À Bahrain et en Tunisie, on soupçonne les autorités d’intercepter pour fin de surveillance les communications par courrier électronique.  On relève aussi des situations étranges en Jordanie et en Égypte où des articles de journaux censurés ont été mis en ligne sur des serveurs Web locaux sans que les responsables n’aient été importunés.  HRW suggère un ensemble de politiques destinées à assurer le respect de la liberté d’expression à cette étape décisive de l’implantation d’Internet dans ces pays.

Aux États-Unis, tout est question de couleur.  Un rapport de la National Telecommunications and Information Administration (NTIA) du ministère du Commerce parle d’un «fossé numérique» qui ne cesse de se creuser entre blancs, noirs et hispaniques.  On constate en effet un recul de six points depuis 1994 dans la proportion de foyers noirs et hispaniques branchés à Internet par rapport au pourcentage de foyers de race blanche.  L’administration fédérale mise, entre autres, sur les centres d’accès communautaires pour réduire l’écart entre inforiches et infopauvres.

Puis, le Programme des Nations Unies pour le Développement vient de publier son rapport annuel sur l’état du développement humain des nations.  Le PNUD consacre un chapitre entier à Internet et aux possibilités que le réseau offre pour le développement des nations.  Le journal Libération traite la nouvelle dans plusieurs articles, et souligne que «À la différence de la colonisation ou autres échanges inégaux, l'Internet est en effet ambivalent : d'une part il accentue la mise en concurrence mondiale, d'autre part il pourrait fournir une partie des outils nécessaires pour s'y insérer.  À condition d'en avoir les moyens : le rapport propose une taxe sur les mails ou sur les dépôts de brevets pour financer l'accès des pays en développement aux technologies de l'information.»

Et dans ce même rapport du PNUD, le classement par pays de l’indice de développement humain où le Canada arrive, pour une sixième année consécutive, au premier rang.  Pour Michel Venne, dans Le Devoir, il faut cependant mettre un bémol sur les savants calculs du PNUD, quoiqu’en diront les autorités fédérales canadiennes.  «Le Canada n'est pas le meilleur pays au monde à tous points de vue.  Il est au neuvième rang pour la pauvreté humaine.  Il est 20e pour le PNB par habitant.  Il est 4e pour la participation des femmes.  Il est 16e pour le taux net de scolarisation au secondaire.  Il y a plus d'illettrés au Canada que dans trois autres pays industrialisés et le taux de chômeurs de longue durée est plus élevé ici que dans huit autres pays riches.»

Haut de la page

 En bref...
Déjà annoncée en avril dernier, l’entrée en bourse de NETgraphe, éditrice des sites Web La Toile du Québec, Économédia, Mégagiciel et Multimédium est maintenant officielle.  C’est par l’acquisition de Ressources Cristobal inc., société inscrite à la Bourse de Montréal, que NETgraphe fait son entrée sur le parquet et devient ainsi la première entreprise Internet québécoise à devenir une société publique.  Il sera intéressant de surveiller l’orientation de NETgraphe et de ses sites au cours des prochains mois.  On sait déjà que Économédia, netmag spécialisé en information économique et financière, permettra bientôt le courtage en ligne et la gestion des finances personnelles.  Aussi à surveiller, la réaction des milieux financiers à cette entrée en bourse.  Plus de détails la semaine prochaine.

Un fournisseur d’accès canadien a eu gain de cause devant un tribunal dans une affaire de courrier non sollicité .  Le Globe&Mail rapporte que le fournisseur Nexx Online avait suspendu le service d’accès et d’hébergement Web d’une entreprise qui envoyait pas moins de 200 000 courriers électroniques non sollicités par jour pour promouvoir ses produits.  L’entreprise avait porté plainte contre le fournisseur qui, de son côté, devait essuyer les plaintes de son fournisseur de connexion.  Le magistrat a estimé qu’il y avait infraction à la «nétiquette» de la part du spammeur, et que le fournisseur était en droit de mettre fin au contrat d’accès et d’hébergement.  Malheureusement, comme aucune loi canadienne n’interdit comme tel l’envoi de courrier électronique non sollicité, le spammeur s’est trouvé un fournisseur plus complaisant et a recommencé son petit manège.

La Bibliothèque nationale du Canada a un nouveau directeur en la personne de l’auteur et homme de théâtre Roch Carrier.  Les Archives nationales du Canada aussi ont un nouveau chef, soit M. Ian Wilson.  Selon la ministre responsable, leur plus grand défi sera d'assurer le passage de ces institutions au troisième millénaire et d'accroître leur accès à la population canadienne.  Ce mandat découle des recommandations issues du rapport présenté à la Ministre sur le «Rôle des Archives nationales du Canada et de la Bibliothèque nationale du Canada».  On peut lire dans ces recommandations que «La Bibliothèque nationale devrait fermement appuyer une “initiative canadienne sur les bibliothèques numériques” indépendante et dotée d'une vision plus large des ressources numériques».  En outre, on évoque une vocation plus virtuelle de la diffusion des produits des Archives, «Nous recommandons de faire disparaître les centres ou points d'accès décentralisés.  Les Archives nationales devraient se concentrer sur les possibilités qu'offre le Web et sur la diffusion plus large et plus efficiente de microfilms afin de se donner une présence nationale accrue.»

Dans Libération, «À la recherche de la “Web attitude”», néologisme proposé par Bill Gates dans son dernier ouvrage et qui en a laissé bon nombre perplexe.  «Aussi ne restait-il plus qu'une solution : demander, en guise de devoir de vacances, à ceux (la liste n'est évidemment pas exhaustive) qui se préoccupent de l'Internet en France et ailleurs, ce microcosme actif et pensant, ce que signifiait pour eux la “Web attitude”.  Certains ont décliné, d'autres ont demandé des précisions sur la pensée gatesienne, très nombreux sont ceux qui ont confessé ne pas avoir lu l'ouvrage.  On ne peut pas leur en vouloir.» Collection de réponses sérieuses, esquives élégantes ou pieds de nez caustiques.

Haut de la page

 Beau détour
Invitation à visiter le site de Vincent B., photographe pour voir ses photos, mais aussi celles de ses invités.

Et sur ce, nous vous souhaitons à tous et toutes une excellente semaine.

Écrire à Jean-Pierre Cloutier


Page d'accueilRechercheAbonnementArchivesCourrier
© Les Éditions Cybérie inc. | Revue de presse | Publicité

URL : http://www.cyberie.qc.ca/chronik/990714.html