Le Google hacking est une façon experte d’utiliser Google. Il s’agit d’une technique légale et très puissante, qui vous permettra d’obtenir des informations d’une précision inégalée.

On peut utiliser Google comme un utilisateur lambda ou comme un utilisateur averti avec le formulaire de recherche avancé: dans cet article, je vais vous montrer comment l’utiliser de façon experte.

Comme vous le savez, Google est le leader des moteurs de recherche, et quasiment toutes les informations que vous mettez en accès visible sur internet sont référencées sur ce moteur de recherche.

Vous avez déjà utilisé le formulaire de recherche avancé afin de trouver une information spécifique, donc vous avez du voir dans l’URL de la page de résultat des critères comme as_filetype=.. ou as_q=..

Ce formulaire avancé est en fait le sommet de l’iceberg que Google met à disposition du public afin de trouver des informations, mais il existe beaucoup d’autre critères que je vais vous citer.

Les opérateurs suivant s’appellent des Google dorks, on les appellera opérateurs afin de n’effrayer personne pour la suite de cet article.

Méthode

Les requêtes seront à ajouter dans la barre de recherche afin que les caractères spéciaux soient transcrit en hexadécimal dans l’URL.

Lors de vos tests, il est possible que Google vous demande de remplir un formulaire de captcha, ne vous en faites pas c’est normal: il s’assure juste que votre requête est faites par un humain.

Afin de trouver ce qu’on cherche, il est nécessaire de savoir ce que l’on veut, si on cherche un livre, on va noter les informations sémantiques de ce livre: son format: PDF, son titre et un petit texte sous forme d’un paragraphe si possible.

Dans les opérateurs suivant, le … représente l’emplacement de la variable de recherche, respectez bien la casse de texte pour que vos tests marchent.

Opérateurs de recherche

intext:... Une expression dans le corps d’une page.
inurl:... Une expression dans l’URL d’une page.
intitle:... Une expression dans l’URL d’une page.
inanchor:... Une expression dans l’ancre d’un lien.
author:... Les pages d’un auteur.
"..." Une expression exacte (sans espace).
cache:... La page mise en cache de cet URL.
define:... Définition du mot suivant.
filetype:... Extension du fichier.
info:... Informations sur cet URL.
link:... Pages qui possèdent des liens vers cet URL.
location:... Pages qui traitent de ce lieu.
site:... Dans les pages d’un site précis.
source:...  Information qui proviennent de ce site.
-... Critères d’informations que l’on ne souhaite pas obtenir.
~... Similaire à ça.
...|... OU logique.
... ... ET logique.
1..3 Nombre compris entre 1 et 3.
...*... Un terme commençant par cela et se finissant par ça.
date:... Limite les résultats indexés depuis le mois renseigné.
... ... Défini un autre critère de recherche.
+... Trie les résultats selon la présence de cette expression.

Pratique

Vous avez les opérateurs dans les mains, maintenant comment s’en sert-on ?!

Pour commencer on va rechercher tous les pages ou notre e-mail est visible:
intext:"votre-adresse-email"

Puis de limiter les résultats à un site précis :
intext:"votre-adresse-email" site:www.site.com

Faites bien attention aux espaces dans les guillemets, sinon la requête sera faussée.

Requêtes complexes

Il existe des requêtes complexes servant à obtenir des informations rares.

Fichiers

Voici une requête afin de trouver tous les dossiers racines des serveurs d’internet, contenant des fichiers d’une extension souhaité et dont le nom est spécifié :
intitle:index.of”last modified”parent directory”(EXTENSION)"NOM"-htm-html-php-asp

Testez le en remplaçant l’EXTENSION et le NOM du fichier souhaité, exemple:
intitle:index.of”last modified”parent directory”(mp3|wma)"tryo"-htm-html-php-asp

Cette requête redoutable marche pour toutes les extensions de fichier !

Caméras

Les plateformes de gestion de caméra non protégées sont aussi trouvables:
Axis :inurl:/view.shtml et inurl:view/index.shtml
Canon : sample/LvAppl/
MOBOTIX : control/userimage.html
FlexWatch : /app/idxas.html
JVC : intitle:”V.Networks [Motion Picture(Java)]”

Liste d’adresse e-mail

filetype:xls inurl:”email.xls”

Cacher ses fichiers

Pour un webmaster, il est responsable de tous les fichiers présent sur un site qu’il gère ainsi que les soucis qu’il cause à ses clients en rendant les fichiers visibles par Google.

Il faut pour ca voir pourquoi les moteurs de recherche voient ces fichiers: car tous les serveurs possèdent la même faille: afficher les fichiers lorsqu’un dossier est visible et ne possède pas d’index.

Pour éviter que Google voit les fichiers que l’on possède dans un dossier sur un serveur, il y a plusieurs solutions:

Créer un index

Il s’agit de créer un fichier nommé “index.html” ou “index.php” à l’intérieur de chaque dossiers afin que la visualisation des fichiers et dossiers ne se fasse pas

Interdire la visualisation des fichiers

Il faut utiliser le fichier de configuration serveur .htaccess et introduire l’instruction suivante:Options -Indexes

Conclusion

Cet article à pour but de vous prévenir d’une chose: toutes les informations mises sur internet et non protégées sont susceptibles d’être vues par Google, et donc par vous !

En France, laisser à la portée du public un formulaire de recherche ayant la possibilité de donner accès à des ressources copiées fait tomber le créateur du formulaire sous le coup de la loi sur le recel.

En voyant le potentiel de cette méthode de recherche, on comprend mieux pourquoi Google ne laisse pas à la portée des utilisateurs lambda un meilleur formulaire.