Toutes les sources ne peuvent être insérées via la méthode “point & click” décrite dans le tutoriel précédent.
Cela peut être empêché:
- car l’affichage ne se charge pas
- que cliquer sur un élément d’article ne soit pas possible
- que le robot ne comprenne pas quelle boite spécifique vous intéresse
Il est néanmoins bien souvent possible de rédiger manuellement ces sélecteurs.
Pour ce faire, il est nécessaire de connaitre quelques bases en HTML.
L’HTML est une langue de page web sous forme de balise.
Comment les développeurs conçoivent-ils une page web ?
Ils créent des boites, les imbriquent les unes dans les autres et y injectent ensuite du contenu (des liens URL, des images, du texte, etc.).
Le but du jeu est de retrouver quelle boite contient le contenu d’un sélecteur et de l’indiquer au robot Cikisi.
Ces boites sont de certains types, appelés “tag html”. Vous en utiliserez une douzaine tout au plus et bien souvent les mêmes pour les mêmes sélecteurs.
Voici les plus courantes:
- h1, h2, h3, h4, h5 et h6 : h pour “header”. Ce sont des boites prévues pour les titres. “h1” sera le plus gros titre possible et h6 le plus petit.
- p : pour “paragraph”, contient du texte
- img : une boite pour y mettre des images (95% des sélecteurs “images”)
- a : la boite prévue pour les liens URL. 100% des sélecteurs “link”.
- div : une boite “fourre-tout”. Quand un développeur veut ranger du contenu quelque part, mais n’a pas d’idée d’où le mettre (car pas de type de boite dédié), il le range dans une “div”.
- ul : une liste à puces de plusieurs éléments (une recette de cuisine par exemple)
- li : à l’intérieur d’un “ul”, ce sont les points de la liste
Comment trouver le type de boite qui m’intéresse ?
- Ouvrez la page qui vous intéresse.
- Faites un click droit sur l’élément de votre choix (un titre par exemple)
- Cliquez sur “inspecter” tout en bas
- Les “boites” sont inscrites en rose sur le volet qui s’ouvre à droite
Laissez votre avis sur ce sujet.