Le web simplifié en 5 sources
Publié le: 17 octobre 2019
Sources d’information

L’information contenue sur internet peut paraître infinie, mais saviez-vous qu’il est possible de la catégoriser en seulement 5 types de sources? Simples à départager, le fait de bien les comprendre vous sauvera du temps pour guider vos prochaines recherches web. Je vous explique ici en quoi consiste chaque type de source, quand les utiliser et quelles sont leurs limites. De plus, vous y trouverez aussi quelques exemples pour celles & ceux qui souhaitent les explorer davantage!

1. Moteur

Un moteur de recherche documente les pages web par mots-clés.

Quand les utiliser:

  • Lorsque l’on sait ce que l’on cherche, c’est-à-dire quand vous connaissez les mots-clés propres à votre sujet d’intérêt.

Limites:

  • Le choix des mots-clés est important. Pour contourner ce problème, il faut trouver des synonymes.
  • La langue est également une limite. Il vaut mieux chercher en français et en anglais au minimum.

Exemples: Google, Bing, Gigablast, WolframAlpha

2. Répertoire / Annuaire

De style « pages jaunes », un répertoire de recherche (aussi appelé « annuaire ») regroupe l’information en larges catégories. Il peut être généraliste, spécialisé ou géographique.

Quand les utiliser:

  • Lorsque le domaine est mal connu
  • Lorsque l’information est très vaste
  • Pour trouver des listes (de compagnies, de personnes, de journaux, etc.)

Limites:

  • Indexation humaine manuelle et donc subjective
  • Information moins précise
  • Information répertoriée en fonction de la popularité du site plutôt que de sa pertinence

Exemples: Wikipedia (et tous les « wiki »), Gigablast Directory, Jasmine Directory, World Wide Web Virtual Library

3. Métamoteur

Un métamoteur utilise plusieurs moteurs de recherche simultanément. Il a l’avantage d’éliminer automatiquement les doublons.

Quand les utiliser:

  • Lorsqu’une recherche dans un moteur ne donne pas assez de résultats

Limites:

  • Utile surtout pour « débroussailler » un sujet
  • Les résultats sont très disparates car les moteurs cherchent tous de façon différente

Exemples: Dogpile, DuckDuckGo, Metacrawler, Webcrawler, Yippy

4. Web invisible

Aussi appelé « web profond », c’est la partie du web qui est accessible en ligne, mais non indexée par les moteurs/répertoires généralistes. L’information s’y trouve habituellement sous la forme de base de données.

Règle générale, on dit que 30% de l’information sur internet est indexée par des moteurs & répertoires. Le 70% restant se trouve donc sur le web invisible. Par ailleurs, seulement 3% de l’information sur internet est indexé par Google. S’il s’agit de votre seule source d’information, vous passez donc à côté de 97% d’internet!

Quand l’utiliser:

  • Pour de l’information très précise, des études, des articles de presse, de l’information archivée, etc.
  • Lorsque l’on sait exactement ce que l’on cherche et dans quels types de source le trouver (site universitaire, bibliothèque, archives de journaux, etc.).

Limite:

  • Le web invisible est immense et ne se fouille pas qu’avec un seul moteur. Si on ne sait pas où chercher, on peut facilement être englouti.

Exemples:

  • Pages dont les données trop volumineuses pour être indexées. À titre d’exemple, Google se limite à recenser 500k de données par site web.
  • Pages qui ne sont pas reliées par hypertexte.
  • Bases de données accessibles seulement par des formulaires de requête.
  • Sites d’information qui refusent l’indexation par les robots.
  • Sites payants.
  • Intranet.

5. Web informel / Web 2.0

Le web informel contient de l’information provenant de la communauté internaute.

Quand l’utiliser:

  • Lorsque vous voulez connaître l’opinion des internautes ou entrer en contact avec eux. Savoir ce qu’ils pensent de vous, vos produits, votre entreprise, etc.
  • Permet de sonder les courants informels et évaluer ce qui se dit de bouche-à-oreille.

Limite:

  • Cette information est informelle et ne représente donc que l’opinion de ceux qui la propagent. Il faut faire très attention lorsqu’on l’utilise car elle ne peut être considérée comme fiable.

Exemples: blogues, forums, médias sociaux, sites personnels, médias alternatifs…

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

*

code