RegEx - Reguläre Ausdrücke
Ein regulärer Ausdruck ist ein Muster, das mit dem zu untersuchenden Text verglichen und auf Übereinstimmungen überprüft wird. AllSync verwendetMicrosoft VBScript Regular Expressions 5.5
als Interpreter für reguläre Ausdrücke.
- Platzhalter und Steuerzeichen
- Reguläre Beispielausdrücke für einzelne Zeichen
- Reguläre Beispielausdrücke für den Gesamtausdruck
- Hilfreiche Webseiten für die Verwendung von RegEx
Platzhalter und Steuerzeichen
Ausdruck | Syntax | Beschreibung |
---|---|---|
Zeilenbeginn | ^ | Startet die Übereinstimmung am Zeilenbeginn. Ist nur am Anfang eines Ausdrucks von Bedeutung. |
Oder | | | Prüft den Ausdruck vor oder nach dem | auf Übereinstimmung. Wird hauptsächlich in einer Gruppe verwendet, z.B. "(Rücken)|(Fuß)massage" entspricht "Rückenmassage" und "Fußmassage". |
Zeilenende | $ | Verankert die Übereinstimmung am Zeilenende. Ist nur am Ende eines Ausdrucks von Bedeutung. |
Nicht im Zeichensatz enthaltenes Zeichen | [^] | Prüft ein beliebiges, nicht im Zeichensatz enthaltenes Zeichen, das auf ^ folgt, auf Übereinstimmung. |
Markierter Ausdruck | {} | Markiert den übereinstimmenden Text mit dem Ausdruck in Klammern. |
Gruppieren | () | Gruppiert einen untergeordneten Ausdruck. |
N-ter markierter Text | \N | Hiermit wird der Text, der dem N-ten markierten Ausdruck entspricht, auf Übereinstimmung geprüft, wobei N eine Zahl zwischen 1 und 9 ist. |
Beliebiges Zeichen | . | Prüft ein beliebiges einzelnes Zeichen auf Übereinstimmung. |
Ein oder mehrere | + | Prüft mindestens ein Vorkommnis des vorhergehenden Ausdrucks auf Übereinstimmung. |
Maximum von einem oder mehreren | # | Prüft mindestens ein Vorkommnis des vorhergehenden Ausdrucks auf Übereinstimmung und prüft dabei möglichst viele Zeichen auf Übereinstimmung. |
Escape | \ | Prüft das auf den umgekehrten Schrägstrich (\) folgende Zeichen auf Übereinstimmung. Damit können Sie in einer regulären Ausdrucksnotation verwendete Zeichen, wie z.B. { und ^, finden. |
Übereinstimmung verhindern | ~X | Verhindert die Prüfung der Übereinstimmung, wenn an dieser Stelle im Ausdruck X angezeigt wird. "Fuß~(ball)" entspricht z.B. "Fuß" in "fußkrank" und "Fußmassage," nicht aber "Fuß" in "Fußball." |
N Mal wiederholen | ^N | Prüft N Vorkommnisse des vorhergehenden Ausdrucks auf Übereinstimmung. "[0-9]^4" entspricht z.B. einer beliebigen vierziffrigen Folge. |
Zeichensatz | [] | Prüft ein beliebiges in den eckigen Klammern [] enthaltenes Zeichen auf Übereinstimmung. Um einen Zeichenbereich festzulegen, führen Sie die Anfangs- und Endzeichen durch einen Bindestrich (-) getrennt auf, wie z.B. [a-z]. |
Alphanumerisches Zeichen | :a | Prüft den Ausdruck ([a-zA-Z0-9]) auf Übereinstimmung. |
Buchstabe | :c | Prüft den Ausdruck ([a-zA-Z]) auf Übereinstimmung. |
Dezimalzahl | :d | Prüft den Ausdruck ([09]) auf Übereinstimmung. |
Hexadezimalzahl | :h | Prüft den Ausdruck ([0-9a-fA-F]+) auf Übereinstimmung. |
Bezeichner | :I | Prüft den Ausdruck ([a-zA-Z-$][a-zA-Z0-9_$]*-) auf Übereinstimmung. |
Relationale Zahl | :n | Prüft den Ausdruck (([0-9]+.[0-9]*)|([0-9]*.[0-9]+)|([0-9]+)) auf Übereinstimmung. |
Zeichenfolge in Anführungszeichen | :q | Prüft den Ausdruck (("[~"]*")|('[~']*')) auf Übereinstimmung. |
Alphabetische Zeichenfolge | :w | Prüft den Ausdruck ([a-zA-Z]+) auf Übereinstimmung. |
Dezimale Ganzzahl | :z | Prüft den Ausdruck ([0-9]+) auf Übereinstimmung. |
Tabulatorzeichen | \t | Prüft ein Tabulatorzeichen, Unicode U+0009, auf Übereinstimmung. |
Unicode-Zeichen | \x#### oder \u#### | Prüft ein vom Unicode-Wert gegebenes Zeichen auf Übereinstimmung, wobei #### 1 bis 4 hexadezimalen Ziffern entspricht. |
Null oder mehr | * | Prüft Null oder mehr Vorkommnisse des vorhergehenden Ausdrucks auf Übereinstimmung. |
Maximal Null oder mehr | @ | Prüft Null oder mehr Vorkommnisse des vorhergehenden Ausdrucks auf Übereinstimmung und stimmt möglichst viele Zeichen ab. |
Reguläre Beispielausdrücke für einzelne Zeichen
Symbol | Beispiel | Ergebnis | Verwendung |
---|---|---|---|
. | Ma.er | findet Maier, Majer, Mayer | Ein beliebiges Zeichen |
[ ] | Ma[iy]er | findet Maier, Mayer | Eines der Zeichen in den Klammern |
[ - ] | b[a-z]d | findet bad, bbd, bcd, bzd | Ein Zeichen im angegebenen Bereich |
[^ ] | Ma[^iy]er | findet Majer, aber nicht Maier oder Mayer | Ein nicht in den Klammern aufgelistetes Zeichen |
\d | Nr \d | findet Nr 1, Nr 9 | Eine Ziffer (entspricht [0-9]) |
\D | Nr \D | findet Nr A, aber nicht Nr 1 | Keine Ziffer (entspricht [^0-9]) |
\w | Anhang \w | findet Anhang 1, Anhang A | Buchstabe, Ziffer oder Unterstrich (entspricht [a-zA-Z0-9_]) |
\W | abc\Wefg | findet abc efg, aber nicht abcdefg | kein Buchstabe, Ziffer oder Unterstrich (entspricht [^a-zA-Z0-9_]) |
\t | abc\txyz | findet abc & Tabulator & xyz | Steuerzeichen „Tabulator“ |
\n | abc\nxyz | findet abc & Zeilenumbruch & xyz | Steuerzeichen für Zeilenumbruch |
\f | abc\fxyz | findet abc & Seitenvorschub & xyz | Steuerzeichen für Seitenvorschub |
\r | abc\rxyz | findet abc & Zeilenvorschub & xyz | Steuerzeichen für Zeilenvorschub |
\x | \x41BC | findet ABC | Auf „x“ folgt der hexadezimale Zeichenwert eines Zeichens |
Reguläre Beispielausdrücke für den Gesamtausdruck
Symbol | Beispiel | Ergebnis | Verwendung |
---|---|---|---|
^ | ^Wort | findet Wort am Anfang | markiert den Anfang der Zeichenkette |
$ | Wort$ | findet Wort am Ende | markiert das Ende der Zeichenkette |
\b | ung\b | findet ung am Wortende | bezeichnet eine Wortgrenze (zwischen \w und \W) |
\B | \Baus | findet Haus oder Maus, aber nicht aus | bezeichnet alles außer einer Wortgrenze |
Hilfreiche Webseiten
- Wikipedia - Reguläre Ausdrücke
- Microsoft VBScript Regular Expressions 5.5 (englisch)
- RegEx Tutorial (englisch)
- Regular Expression Tester (englisch)
- Regular Expression Syntax (englisch)