Petit guide sur les expressions régulières 1


Madeline
Sur twitter

Madeline

Diplômée d'Audencia Nantes, j'ai commencé par faire des stages en communication web, puis web marketing avant de me plonger dans le SEO.

Je suis actuellement consultante SEO chez iProspect. J'ai ouvert ce blog pour partager des astuces, des tuto, ou des informations plus orientées techniques et opérationnelles.
Madeline
Sur twitter

Peut-être avez-vous entendu parler de regex sans savoir ce que ça signifiait ni comment ça se prononçait et encore moins à quoi ça servait.

Peut-être connaissez-vous déjà le mot regex, sa signification (regular expression, soit expression régulière ou encore expression rationnelle) mais vous ne savez pas les utiliser.

Et bien voici un petit guide qui je l’espère répondra à ces questions.

Qu’est-ce qu’une expression régulière ?

En quelques mots, les regex servent à schématiser des chaines de caractères.

Prenons un exemple précis : vous êtes dans Google Analytics et souhaitez avoir les statistiques sur un certain type de page, par exemple des rubriques.

Vous savez que les URL des rubriques correspondent à : /rubrique-pageN.html et les produits à /rubrique/produit-ID.html . Et bien grâce aux expressions régulières, dans les filtres de google analytics (ou les segments, on peut les utiliser à plusieurs endroits), vous pourrez en sélectionnant « correspondant à l’expression régulière » voir toutes les pages qui correspondent à ces schémas.

Où utiliser des regex ?

Les expressions régulières, c’est quand même bien pratique. Surtout si vous utilisez Google Analytics. Ou bien Screaming Frog. Ou encore SEO tools for Excel. Ou bien Google Spreadsheet. Ou bien un pour faire des règles de redirections. Bref, les regex, c’est bien utile quand on fait du webmarketing, du seo, du dev, etc.

Allez, entrons dans le vif du sujet.

Comment écrire une expression régulière ?


(voir la présentation)

le point d’interrogation ?

? : le point d’interrogation permet de dire qu’un caractère est optionnel.

Exemple : Matt?hieu (le 2e T est optionnel)
Ce qui rend possible : Matthieu, Mathieu

les parenthèses ()

() : permet de mieux limiter un groupe, un ensemble de caractère. C’est la même utilisation qu’en maths.

le pipe |

| : signifie OU (cela donne le choix parmi plusieurs possibilités)

Exemple : Matthieu|Mathieu
Ce qui donne : Matthieu ou Mathieu

l’antislash \

\ permet de forcer un caractère, de dire qu’il ne s’agit pas d’un opérateur mais bien d’un caractère.

Par exemple : Mathieu ou Matthieu\?
Si je ne mets pas le point d’interrogation, mon expression serait interprétée comme ceci : Mathieu ou Matthie, Mathieu ou Matthieu

le point .

. : le point permet de remplacer un caractère (chiffre, lettre, caractère spécial, etc.)

le plus +

+ : le plus indique qu’un caractère est répété au moins 1 fois

Exemple : Mat+hieu
Ce qui donne : Mathieu, Matthieu, Matttttttttttttttttttttttttttttttttttthieu (mais pas Mahieu)

l’étoile *

* : l’étoile indique qu’un caractère est peut-être répété.

Exemple : Mat*hieu
Ce qui peut donner : Mahieu, Mathieu, Matthieu, Mattttttttttttttttttttttttttthieu

(.*) permet de dire que n’importe quel caractère est répété. Bref, qu’il y a une chaine de caractères, qu’il y a un truc, ou pas.

les crochets []

[] indique un caractère parmi une liste.
[0-3] = un chiffre entre 0 et 3
on pourrait également l’écrire (0|1|2|3) mais c’est plus long.

[mdp] = soit m, soit d, soit p
[a-z] = une lettre en minuscule entre a et z
[A-Z] = une lettre en majuscule
[a-zA-Z] = une lettre en minuscule ou une lettre en majuscule, bref une lettre
[a-zA-Z0-9] = une lettre en minuscule ou une lettre en majuscule ou un chiffre, bref une lettre ou un chiffre

les accolades{}

{} permet de dire combien de fois est répété.
{3} = est répété 3 fois
{2,5} : est répété au moins 2 fois et au plus 5 fois (bref est répété entre 2 et 5 fois).

Pour rappel, l’étoile indique qu’il n’y a pas de limite dans la répétition, on peut également écrire * = {0,}
Le + = {1,}
? = {0,1}

l’accent circonflexe ^

^indique le début d’une chaine de caractère
Exemple : ^http (ca commence par http, il n’y a rien avant http)

[^] exclut une liste.
Par exemple [^mdp], ça ne contient ni m, ni d, ni p.

le dollar $

$ indique la fin d’une chaine de caractère
Exemple \.html$ (ca se termine par .html, il n’y a rien derrière le .html)

Voilà, ce n’est pas plus compliqué que ça…il y a d’autres petites astuces mais rien qu’avec ça, on peut faire beaucoup.


Laissez un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Commentaire sur “Petit guide sur les expressions régulières