Internet = La Base de Données !

Les serveurs de Google traitent 1 petaoctet toutes les 72 minutes sur Internet.

Cette fabuleuse quantité de données disponible est-elle en train de devenir (ou même déjà devenue) la base de données unique de la planète, contenant suffisamment de connaissances pour que des traitements statistiques prennent le relais dans de nombreux cas sur des théories bien plus sophistiquées.

La première étape est la simple recherche Google, et la confiance que l’on y accorde dans de nombreux cas.

Voici quelques exemples extraits de Google trends :

Ecoles d\'ingenieurs

Sur ce premier exemple on peut constater une diminution progressive du nombre de recherches sur les écoles d’ingénieurs, assez homogène suivant les écoles. Cette courbe confirme le constat statistique d’une diminution du nombre général de candidats dans les études scientifiques.

Recherches de stages

Sur cette courbe on compare le nombre de recherches de stage par type : conseil, finance, informatique. On ne peut constater aucune réaction forte liée à la crise. Le décalage entre l’informatique et les autres domaines confirme aussi les autres statistiques connues. Il est à noter que les domaines “industrie” ou “telecoms” ne sont pas représentatifs dans les recherches.

Recherche telechargement ou streaming

Au moment ou le téléchargement fait beaucoup parler de lui en France, ces deux courbes donnent une tendance intéressante : depuis 2007, le nombre de demandes sur le streaming explose, rendant le téléchargement pratiquement non représentatif. Les études sur le comportement et la consommation des media video l’annonçaient, les jeunes préfèrent visionner à la demande.

Ces exemples confirment l’intérêt de disposer de ces données pour confirmer des tendances. Les données publiques sont disponibles avec un décalage, mais Google les actualise chaque jour. Ceci confirme donc les possibilités ouvertes sur les études prospectives. Par exemple, le décollage des marchés automobile ou immobilier peut être précédé par un grand nombre de recherches effectuées par des clients intéressés, aussi bien sur les sites professionnels, qu’à la recherche de crédits ou de petites annonces.

De nouveaux programmes de recherche sont lancées par la NSF impliquant 6 universités, Google et IBM et visant des réseaux de 1.600 processeurs. Leur objectif sera de simuler le fonctionnement de systèmes vivants complexes, comme le cerveau.

L’analyse du vivant, qui est lui-même un système d’évolution statistique basé sur de grands nombres, se prête sans doute à ce nouveau mode d’analyse.

Article

Comments are closed.