Comment connaitre la composition du "fonds documentaire" des moteurs de recherche

Question

Bonjour,
Savez-vous comment savoir comment est constitué le "fonds documentaire" des moteurs de recherche ?
Par exemple pour :  "bibliothèques de prison", il y a  beaucoup de bonnes réponses sur Google et surtout sur Isidore mais quasi aucune sur Google Scholar . Une des raisons est que Google Scholar n'indexe pas les fonds de l'ENSSIB.

Comment fonctionne ce moteur ? et les autres ? pour s'alimenter ?

En vous remerciant par avance pour vos indications,

Bien cordialement,

Réponse

Date de la réponse :  22/05/2018

Vous souhaitez savoir comment fonctionne les moteurs de recherche en général et vous aimeriez connaître plus particulièrement la différence entre Google et Google Scholar.
Par ailleurs vous souhaitez savoir pourquoi Google Scholar n'indexe pas les documents de la bibliothèque numérique de l'Enssib et pourquoi on les trouve sur la plateforme Isidore.

Concernant le fonctionnement du moteur Google, nous vous invitons à consulter la page "Comment fonctionne la recherche Google" de Google.
En voici un extrait :

"Lorsqu'un internaute saisit une requête, nos ordinateurs recherchent les pages correspondantes dans l'index, et renvoient les résultats les plus pertinents selon nous. Plus de 200 facteurs sont pris en compte pour calculer la pertinence d'une page, l'un d'eux étant le classement PageRank. PageRank évalue l'importance d'une page en fonction des liens provenant d'autres sites et renvoyant à ladite page. En d'autres termes, tous les liens qui figurent sur d'autres sites et qui renvoient vers l'une de vos pages sont pris en compte pour établir le classement PageRank de votre site. Tous les liens ne sont pas équivalents : Google s'efforce d'identifier les liens de spam et les autres pratiques nuisant à la qualité des résultats de recherche. Les meilleurs liens sont ceux fournis pour la qualité de votre contenu."

Concernant le fonctionnement de Google Scholar, nous vous invitons à consulter le guide réalisé par Form@Doct (Université de Bretagne Loire) intitulé : Google scholar, sur les épaules des géants. Il y est indiqué dans l'encadré "Google Scholar, quel contenu ? Quelle couverture" :

"Son historique : Google Scholar est lancé en 2004.  Il propose des articles issus de périodiques avec évaluation par les pairs (peer-review), des articles en pré-publication, des livres, des thèses, des rapports. C'est un service gratuit.
Ses sources : les documents indexés proviennent d'éditeurs scientifiques, de sociétés savantes, de répertoires de pre-prints, de serveurs universitaires. Cependant, Google Scholar ne donne aucune liste de ses sources. Ses limites restent donc très floues.
Sa couverture : cette base est multidisciplinaire, mais les ressources en sciences exactes et médicales sont mieux couvertes que les sciences humaines et sociales.
Divers types de documents : livres, thèses, articles de revues scientifiques, résumés, proceedings, rapports techniques
Les langues : majoritairement en anglais."

Vous pourrez consulter également d'autres guides réalisés par Form@Doct qui pourront vous intéresser :

Pour aller plus loin :