Guide Regex — Expressions Regulieres Expliquees

Expressions regulieres : le superpouvoir du developpeur

Les expressions regulieres (regex) sont des sequences de caracteres qui definissent un motif de recherche. Elles sont l'un des outils les plus puissants et polyvalents en programmation : elles permettent de chercher, valider, extraire et remplacer du texte avec une precision impossible a atteindre avec de simples recherches de chaines. Tous les langages de programmation les supportent, tous les editeurs de texte avances les utilisent, et la connaissance des regex distingue un developpeur competent d'un expert.

Notre Regex Tester permet d'ecrire des expressions regulieres et de voir les resultats en temps reel : le texte de test est mis en surbrillance la ou le motif correspond, les groupes de capture sont extraits et affiches, et les erreurs de syntaxe sont signalees instantanement. Il supporte les drapeaux g (global), i (insensible a la casse), m (multiligne) et s (dotall). C'est l'outil ideal pour developper et debugger des regex complexes avant de les inserer dans le code.

Syntaxe regex fondamentale

Motifs regex courants

# Email (base)
^[\w.-]+@[\w.-]+\.[a-zA-Z]{2,}$

# IPv4
^(?:(?:25[0-5]|2[0-4]\d|[01]?\d\d?)\.){3}(?:25[0-5]|2[0-4]\d|[01]?\d\d?)$

# URL
https?://[\w.-]+(?:\.[\w]{2,})(?:/[\w./-]*)*(?:\?[\w=&]*)?(?:#\w*)?

# Data italiana (GG/MM/AAAA)
^(0[1-9]|[12]\d|3[01])/(0[1-9]|1[0-2])/(\d{4})$

# Password forte (min 8 char, maiuscola, minuscola, numero)
^(?=.*[a-z])(?=.*[A-Z])(?=.*\d).{8,}$

# Codice fiscale italiano
^[A-Z]{6}\d{2}[A-Z]\d{2}[A-Z]\d{3}[A-Z]$

Les metacaracteres fondamentaux : . (n'importe quel caractere), * (0 ou plus de repetitions), + (1 ou plus), ? (0 ou 1), \d (chiffre), \w (caractere de mot : lettre, chiffre, underscore), \s (espace blanc), ^ (debut de chaine), $ (fin de chaine). Les crochets [] definissent une classe de caracteres : [a-z] correspond a n'importe quelle lettre minuscule. Les parentheses () creent des groupes de capture qui permettent d'extraire des parties specifiques de la correspondance.

Techniques avancees

Les lookahead (?=...) et lookbehind (?<=...) sont des assertions qui verifient une condition sans consommer de caracteres. Le motif de mot de passe fort utilise plusieurs lookaheads : (?=.*[a-z]) verifie au moins une minuscule, (?=.*[A-Z]) au moins une majuscule, (?=.*\d) au moins un chiffre, sans specifier dans quel ordre ils doivent apparaitre. Cette technique est fondamentale pour les validations complexes ou plusieurs conditions doivent etre satisfaites simultanement.

Greedy vs lazy est un concept crucial : les quantificateurs *, + sont greedy par defaut (ils correspondent au maximum possible). Avec le texte "un et deux", le motif .+ correspond a tout "un et deux" (greedy), tandis que .+? correspond uniquement a "un" (lazy, s'arrete au premier ). Le choix entre greedy et lazy change radicalement le resultat.

Pour les developpeurs web, les regex sont utilisees de maniere extensive dans la validation de formulaires et le parsing de donnees. Pour generer des donnees de test pour vos regex, utilisez le Password Generator pour des chaines aleatoires, URL Encode/Decode pour des URL encodees a valider, et Hash Generator pour verifier des motifs de hash. Pour la validation des enregistrements DNS (une application courante des regex dans les outils reseau), testez les motifs avec notre DNS Lookup pour verifier que les enregistrements correspondent au format attendu.

Regex Tester : Guide des Expressions Regulieres avec Tests en Temps Reel

Expressions regulieres : le superpouvoir du developpeur

Syntaxe regex fondamentale

Techniques avancees

Explore the Network