De reguliere uitdrukkingen (of afgekort regex) die worden gebruikt in zoekacties en segmentatieregels zijn die welke worden ondersteund door Java. Als u meer specifieke informatie nodig heeft raadpleeg dan http://java.sun.com/j2se/1.5/docs/api/java/util/regex/Pattern.html. Bekijk de aanvullende verwijzingen en voorbeelden hieronder.
De constructie... |
...komt overeen met het volgende: |
Vlaggen |
|
|
Schakelt overeenkomen van hoofd-/kleine letters in (standaard is het patroon hoofdletter-gevoelig). |
Tekens |
|
|
Het teken x, met uitzondering van het volgende... |
|
Het teken met de hexadecimale waarde |
|
Het Tab-teken ( |
|
Het teken voor een nieuwe regel (line feed) ( |
|
Het teken voor een carriage-return ( |
\f |
Het teken voor form-feed ('\u000C') |
\a |
Het waarschuwingsteken (bel) ('\u0007') |
\e |
Het escape-teken ('\u001B') |
\cx |
Het besturingsteken dat overeenkomt met x |
\0n |
Het teken met de octale waarde 0n (0 <= n <= 7) |
\0nn |
Het teken met de octale waarde 0nn (0 <= n <= 7) |
\0mnn |
Het teken met de octale waarde 0mnn (0 <= m <= 3, 0 <= n <= 7) |
\xhh |
Het teken met de hexadecimale waarde 0xhh |
Quote |
|
|
Niets, maar quote het volgende teken. Dit is vereist als u een van de metatekens |
|
Dit is bijvoorbeeld het teken voor een backslash |
|
Niets, maar quote alle tekens tot |
|
Niets, maar beëindigt quoten dat werd gestart door \Q |
Klassen voor Unicode-blokken en categorieën |
|
|
Een teken in het Griekse blok (eenvoudig blok) |
|
Een hoofdletter (eenvoudige categorie) |
|
Een valutasymbool |
|
Elk teken met uitzondering van die in het Griekse blok (negatie) |
|
Elke letter met uitzondering van hoofdletters (subtractie) |
Tekenklassen |
|
|
|
|
Elk teken met uitzondering van |
|
|
Voorgedefinieerde tekenklassen |
|
|
Elk teken (met uitzondering van regeleinden) |
|
Een getal: |
|
Geen getal: |
|
Een teken voor witruimte: |
|
Een teken niet zijnde witruimte: |
|
Een woordteken: |
|
Een teken voor geen-woord: |
Overeenkomsten voor begrenzingen |
|
|
Het begin van een regel |
|
Het einde van een regel |
|
Een woordgrens |
|
Grens voor geen-woord |
Gulzige parameters |
|
Deze zullen overeenkomen met zoveel als voor hen mogelijk is. |
|
X |
X, één maal of helemaal niet |
X |
X, nul of meer keren |
X |
X, één of meer keren |
Weigerachtige (niet-gulzige) parameters |
|
Deze zullen overeenkomen met zo weinig als voor hen mogelijk is. |
|
X |
X, één maal of helemaal niet |
X |
X, nul of meer keren |
X |
X, één of meer keren |
Logische operatoren |
|
XY |
X gevolgd door Y |
X |
Of X óf Y |
|
XY als een enkele groep |
Reguliere uitdrukking | Vindt het volgende: |
(\b\w+\b)\s\1\b |
dubbele woorden |
[\.,]\s*[\.,]+ | mix van komma's en punten |
\. \s$ | extra witruimte, gevolgd door de punt aan het einde van de regel |
\s+a\s+[aeiou] | Engels: woorden, beginnend met een klinker, zouden moeten worden voorafgegaan door "an", niet "a" |
\s+an\s+[^aeiou] | Engels: dezelfde controle als hierboven, maar voor medeklinkers ("a", niet "an") |
\s\s+ | meer dan één spatie |
\.[A-Z] | missende spatie tussen een punt en het begin van een nieuwe zin |
Auteursrechten | Home | Inhoudsopgave |