{"id":4224,"date":"2018-09-08T16:49:27","date_gmt":"2018-09-08T14:49:27","guid":{"rendered":"http:\/\/www.tutego.de\/blog\/javainsel\/?p=4224"},"modified":"2018-09-08T16:49:27","modified_gmt":"2018-09-08T14:49:27","slug":"einfuehrung-in-regulaere-ausdruecke-mit-der-java-api","status":"publish","type":"post","link":"https:\/\/www.tutego.de\/blog\/javainsel\/2018\/09\/einfuehrung-in-regulaere-ausdruecke-mit-der-java-api\/","title":{"rendered":"Einf\u00fchrung in regul\u00e4re Ausdr\u00fccke mit der Java-API"},"content":{"rendered":"<p>Ein regul\u00e4rer Ausdruck (engl. regular expression, kurz Regex) ist die Beschreibung eines Musters\u00a0(engl. pattern). Regul\u00e4re Ausdr\u00fccke werden bei der Zeichenkettenverarbeitung beim Suchen und Ersetzen eingesetzt. F\u00fcr folgende Szenarien bietet die Java-Bibliothek entsprechende Unterst\u00fctzung an:<\/p>\n<ul>\n<li>Frage nach einer kompletten \u00dcbereinstimmung: Passt eine Zeichenfolge komplett auf ein Muster? Wir nennen das vollst\u00e4ndigen Match. Die R\u00fcckgabe einer solchen Anfrage ist einfach wahr oder falsch.<\/li>\n<li>Finde Teil-Strings: Das Pattern beschreibt einen Teil-String, und gesucht sind alle Vorkommen dieses Musters in einem Such-String.<\/li>\n<li>Ersetze Teilfolgen: Das Pattern beschreibt Zeichenfolgen, die durch andere Zeichenfolgen ersetzt werden.<\/li>\n<li>Zerlegen einer Zeichenfolge: Das Muster steht f\u00fcr Trennzeichen, sodass nach dem Zerlegen eine Sammlung von Zeichenfolgen entsteht.<\/li>\n<\/ul>\n<p>Tipp:\u00a0Regex-Ausdr\u00fccke lassen sich \u00fcber Tools visualisieren. Online ist das zum Beispiel mit https:\/\/www.debuggex.com\/ oder http:\/\/regexper.com\/ m\u00f6glich, http:\/\/xenon.stanford.edu\/~xusch\/regexp\/ \u00bbliest\u00ab regul\u00e4re Ausdr\u00fccke vor.<\/p>\n<h4>Regex-API<\/h4>\n<p>Ein Pattern-Matcher\u00a0ist die \u00bbMaschine\u00ab, die regul\u00e4re Ausdr\u00fccke verarbeitet. Zugriff auf diese Mustermaschine bietet die Klasse Matcher. Dazu kommt die Klasse Pattern, die die regul\u00e4ren Ausdr\u00fccke in einem internen vorcompilierten Format repr\u00e4sentiert. Beide Klassen befinden sich im Paket java.util.regex. Um die Sache etwas zu vereinfachen, gibt es bei String zwei kleine Hilfsmethoden, die im Hintergrund auf die Klassen verweisen, um eine einfachere API anbieten zu k\u00f6nnen; diese nennen sich auch Fassaden-Methoden. Wir werden am Anfang erst mit den String-Methoden arbeiten und uns sp\u00e4ter die Klasse Pattern genauer anschauen. Die die Objektmethode matches(\u2026)\u00a0der Klasse String testet, ob ein regul\u00e4rer Ausdruck eine Zeichenfolge komplett beschreibt.<\/p>\n<h3>Konstruktion von regul\u00e4ren Ausdr\u00fccken<\/h3>\n<p>In diesem Abschnitt wollen wir schauen, was ein Pattern-Matcher alles erkennen kann und wie die Syntax daf\u00fcr aussieht.<\/p>\n<h4>Literale Zeichen<\/h4>\n<p>Der einfachste regul\u00e4re Ausdruck besteht aus einzelnen Zeichen, den Literalen.<\/p>\n<table>\n<tbody>\n<tr>\n<td width=\"231\">Ausdruck<\/td>\n<td width=\"220\">Ergebnis<\/td>\n<\/tr>\n<tr>\n<td width=\"231\">&#8222;tutego&#8220;.matches( &#8222;tutego&#8220; )<\/td>\n<td width=\"220\">true<\/td>\n<\/tr>\n<tr>\n<td width=\"231\">&#8222;tutego&#8220;.matches( &#8222;Tutego&#8220; )<\/td>\n<td width=\"220\">false<\/td>\n<\/tr>\n<tr>\n<td width=\"231\">&#8222;tutego&#8220;.matches( &#8222;-tutego-&#8220; )<\/td>\n<td width=\"220\">false<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<p>Tabelle: Einfache regul\u00e4re Ausdr\u00fccke und ihr Ergebnis<\/p>\n<p>F\u00fcr diesen Fall ben\u00f6tigen wir keine regul\u00e4ren Ausdr\u00fccke, ein equals(\u2026) w\u00fcrde reichen.<\/p>\n<p>Hinweis:\u00a0Bei Java ist es immer so, dass der regul\u00e4re Ausdruck den gesamten String komplett treffen muss, und nicht nur einen Teilstring. In nahezu jeder anderen Sprache und Bibliothek ist das nicht so, hier z\u00e4hlt ein Teilstring als \u201ematch\u201c. In einer JavaScript-Konsole:<\/p>\n<p>&#8222;tutego&#8220;.match( \/tutego\/ )<\/p>\n<p>[&#8222;tutego&#8220;, <strong>index: 0<\/strong>, input: &#8222;tutego&#8220;, groups: undefined]<\/p>\n<p>&#8222;Tutego&#8220;.match( \/tutego\/ )<\/p>\n<p><strong>null<\/strong><\/p>\n<p>&#8222;-tutego-&#8222;.match( \/tutego\/ )<\/p>\n<p>[&#8222;tutego&#8220;, <strong>index: 1<\/strong>, input: &#8222;-tutego-&#8222;, groups: undefined]<\/p>\n<h4>Spezialzeichen (Metazeichen)<\/h4>\n<p>In regul\u00e4ren Ausdr\u00fccken sind einige Zeichen reserviert, weshalb sie nicht als einfaches Literal gewertet werden. Zu diesen Zeichen mit besonders Bedeutung z\u00e4hlen: \\ (Backslash), ^ (Caret), $ (Dollarzeichen), . (Punkt), | vertikaler Strich, ? (Fragezeichen), * (Sternchen), + (Pluszeichen), (, ) (runde Klammer auf und zu), [, ] (eckige Klammer auf und zu), { (geschweifte Klammer auf).<\/p>\n<p>Um diese Zeichen als Literal verwenden zu k\u00f6nnen ist eine Ausmaskierung mit \\ n\u00f6tig.<\/p>\n<table>\n<tbody>\n<tr>\n<td width=\"231\">Ausdruck<\/td>\n<td width=\"220\">Ergebnis<\/td>\n<\/tr>\n<tr>\n<td width=\"231\">&#8222;1+1&#8220;.matches( <strong>&#8222;1+1&#8220;<\/strong> )<\/td>\n<td width=\"220\">false<\/td>\n<\/tr>\n<tr>\n<td width=\"231\">&#8222;1+1&#8220;.matches( <strong>&#8222;1\\\\+1&#8220;<\/strong> )<\/td>\n<td width=\"220\">true<\/td>\n<\/tr>\n<tr>\n<td width=\"231\">&#8222;11111&#8220;.matches( <strong>&#8222;1+1&#8220;<\/strong> )<\/td>\n<td width=\"220\">true<\/td>\n<\/tr>\n<tr>\n<td width=\"231\">&#8222;+1&#8220;.matches( <strong>&#8222;+1&#8220;<\/strong> )<\/td>\n<td width=\"220\">PatternSyntaxException: Dangling meta character &#8218;+&#8216; near index 0<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<p>Metazeichen m\u00fcssen ausmaskiert werden<\/p>\n<p>Der Ausdruck &#8222;11111&#8220;.matches(&#8222;1+1&#8220;<strong>)<\/strong> macht deutlich, dass + ein besonders Symbol ist, was f\u00fcr Wiederholungen steht. Wird es, wie im letzten Fall, falsch angewendet, folgt eine Ausnahme.<\/p>\n<h4>Zeichenklassen<\/h4>\n<p>Mit einer Zeichenklasse\u00a0ist es m\u00f6glich ein von mehren Zeichen aus einer Menge zu matchen. So steht [aeiou] f\u00fcr eines der Zeichen a, e, i, o oder u. Die Reihenfolge der Zeichen spielt keine Rolle. Mit einem Minuszeichen lassen sich Bereiche definieren. So steht [0-9a-fA-F] f\u00fcr die Zeichen 0, 1, 2, \u2026, 9 oder Gro\u00df-\/Kleinbuchstaben a, b, c, d, e, f, A, B, C, D, E, F. Auch hier spielt die Reihenfolge keine Rolle, es h\u00e4tte auch [a-fA-F0-9] hei\u00dfen k\u00f6nnen. Mehrere Bereiche mit rechteckigen Klammern lassen sich hintereinander stellen.<\/p>\n<p>Die Metazeichen wie * oder + k\u00f6nnen ohne Ausmaskierung in Zeichenklassen verwendet werden, nur eben das Minus nicht, es sei denn, es steht am Anfang oder am Ende.<\/p>\n<p>&nbsp;<\/p>\n<table>\n<tbody>\n<tr>\n<td width=\"231\">Ausdruck<\/td>\n<td width=\"220\">Ergebnis<\/td>\n<\/tr>\n<tr>\n<td width=\"231\">&#8222;tutego&#8220;.matches(<strong>&#8222;[tT]utego&#8220;<\/strong> )<\/td>\n<td width=\"220\">true<\/td>\n<\/tr>\n<tr>\n<td width=\"231\">&#8222;Tutego&#8220;.matches(<strong>&#8222;[tT]utego&#8220;<\/strong> )<\/td>\n<td width=\"220\">true<\/td>\n<\/tr>\n<tr>\n<td width=\"231\">&#8222;Nr. 1&#8220;.matches( <strong>&#8222;Nr\\\\. [0-9]&#8220;<\/strong> )<\/td>\n<td width=\"220\">true<\/td>\n<\/tr>\n<tr>\n<td width=\"231\">&#8222;1*2&#8220;.matches( <strong>&#8222;[0-9][+*\/][0-9]&#8220;<\/strong> )<\/td>\n<td width=\"220\">true<\/td>\n<\/tr>\n<tr>\n<td width=\"231\">&#8222;1*2&#8220;.matches( &#8222;[0-9][<strong>&#8211;<\/strong>+*\/][0-9]&#8220; )<\/td>\n<td width=\"220\">true<\/td>\n<\/tr>\n<tr>\n<td width=\"231\">&#8222;1-2&#8220;.matches( &#8222;[0-9][+<strong>&#8211;<\/strong>*\/][0-9]&#8220; )<\/td>\n<td width=\"220\">PatternSyntaxException: Illegal character range near index 8<\/td>\n<\/tr>\n<tr>\n<td width=\"231\">&#8222;1-2&#8220;.matches( &#8222;[0-9][+<strong>\\\\-<\/strong>*\/][0-9]&#8220; )<\/td>\n<td width=\"220\">true<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<p>Beispiel f\u00fcr Zeichenklassen<\/p>\n<p><strong>Hinweis:\u00a0<\/strong>Es ist wichtig daran zu denken, dass es immer nur einzelnen Zeichen sind und keine Zahlenbereiche. Wenn wir [1-99] vor uns haben, dann ist das mitnichten ein regul\u00e4rer Ausdruck f\u00fcr Zahlen von 1 bis 99, sondern nur die Ziffern 1, 2, 3, \u2026, 9 und dann noch einmal die 9 extra, was redundant ist, und gek\u00fcrzt werden kann auf [1-9].<\/p>\n<h4>Negative Zeichenklassen<\/h4>\n<p>Steht direkt hinter der \u00f6ffnenden eckigen Klammer ein ^, definiert das negative Zeichenklassen. Der Match ist dann auf allen Zeichen, die in der negativen Zeichenklasse <em>nicht<\/em> vorkommen.<\/p>\n<p>&nbsp;<\/p>\n<table>\n<tbody>\n<tr>\n<td width=\"231\">Ausdruck<\/td>\n<td width=\"220\">Ergebnis<\/td>\n<\/tr>\n<tr>\n<td width=\"231\">&#8222;1&#8220;.matches( <strong>&#8222;[^-+*\/]&#8220;<\/strong> )<\/td>\n<td width=\"220\">true<\/td>\n<\/tr>\n<tr>\n<td width=\"231\">&#8222;\u00df&#8220;.matches( <strong>&#8222;[^-+*\/]&#8220;<\/strong> )<\/td>\n<td width=\"220\">true<\/td>\n<\/tr>\n<tr>\n<td width=\"231\">&#8222;\/&#8220;.matches( &#8222;[^-+*\/]&#8220; )<\/td>\n<td width=\"220\">false<\/td>\n<\/tr>\n<tr>\n<td width=\"231\">&#8222;&#8220;.matches( &#8222;[^-+*\/]&#8220;<\/td>\n<td width=\"220\">false<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<p>Beispiel f\u00fcr negative Zeichenklassen<\/p>\n<p>Das letzte Beispiel macht deutlich, dass eine negative Zeichenklasse auch f\u00fcr ein Zeichen, n\u00e4mlich f\u00fcr ein Zeichen, das eben nicht +, -, *, \/ ist. Kein Zeichen kann das nicht sein.<\/p>\n<h4>Jedes Zeichen (.)<\/h4>\n<p>Der . (Punkt) ist ein m\u00e4chtiges Metazeichen und steht f\u00fcr (fast) jedes erdenkliche Zeichen.<\/p>\n<p><strong>Hinweis:\u00a0<\/strong>Der . (Punkt) matcht standardm\u00e4\u00dfig keinen Zeilenumbruch. Das hat historische Gr\u00fcnde, denn die ersten Werkzeuge arbeiteten zeilenbasiert, und da war es nicht gew\u00fcnscht, wenn der Ausdruck mit auf die n\u00e4chste Zeile ging. In Java k\u00f6nnen wir einstellen, ob der Punkt auch einen Zeilenumbruch erkennen soll.<\/p>\n<table>\n<tbody>\n<tr>\n<td width=\"231\">Ausdruck<\/td>\n<td width=\"220\">Ergebnis<\/td>\n<\/tr>\n<tr>\n<td width=\"231\">&#8222;Filk&#8220;.matches( <strong>&#8222;F..k&#8220;<\/strong> )<\/td>\n<td width=\"220\">true<\/td>\n<\/tr>\n<tr>\n<td width=\"231\">&#8222;123&#8220;.matches( <strong>&#8222;\\\\d\\\\d\\\\d&#8220;<\/strong> )<\/td>\n<td width=\"220\">true<\/td>\n<\/tr>\n<tr>\n<td width=\"231\">&#8222;a b&#8220;.matches( <strong>&#8222;a\\\\sb&#8220;<\/strong> )<\/td>\n<td width=\"220\">true<\/td>\n<\/tr>\n<tr>\n<td width=\"231\">&#8222;a\\nb&#8220;.matches( &#8222;a\\\\sb&#8220; )<\/td>\n<td width=\"220\">true<\/td>\n<\/tr>\n<tr>\n<td width=\"231\">&#8222;\\n&#8220;.matches( <strong>&#8222;.&#8220;<\/strong> )<\/td>\n<td width=\"220\">false<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<p>Beispiel mit dem Punkt<\/p>\n<h4>Vordefinierte Zeichenklassen<\/h4>\n<p>Gewisse Zeichenklassen kommen immer wieder vor, etwa f\u00fcr Ziffern. Daher gibt es vordefinierte Zeichenklassen, die uns Schreibarbeit ersparen und den regul\u00e4ren Ausdruck \u00fcbersichtlicher machen. Die wichtigsten sind:<\/p>\n<table>\n<tbody>\n<tr>\n<td width=\"220\">Zeichenklasse<\/td>\n<td width=\"220\">Enth\u00e4lt<\/td>\n<\/tr>\n<tr>\n<td width=\"220\">\\d<\/td>\n<td width=\"220\">Ziffer: [0-9]<\/td>\n<\/tr>\n<tr>\n<td width=\"220\">\\D<\/td>\n<td width=\"220\">Keine Ziffer: [^0-9] bzw. [^\\d]<\/td>\n<\/tr>\n<tr>\n<td width=\"220\">\\s<\/td>\n<td width=\"220\">Wei\u00dfraum: [ \\t\\n\\x0B\\f\\r]<\/td>\n<\/tr>\n<tr>\n<td width=\"220\">\\S<\/td>\n<td width=\"220\">Keinen Wei\u00dfraum: [^\\s]<\/td>\n<\/tr>\n<tr>\n<td width=\"220\">\\w<\/td>\n<td width=\"220\">Wortzeichen: [a-zA-Z_0-9]<\/td>\n<\/tr>\n<tr>\n<td width=\"220\">\\W<\/td>\n<td width=\"220\">Keine Wortzeichen: [^\\w]<\/td>\n<\/tr>\n<tr>\n<td width=\"220\">\\p{Blank}<\/td>\n<td width=\"220\">Leerzeichen oder Tab: [ \\t]<\/td>\n<\/tr>\n<tr>\n<td width=\"220\">\\p{Lower}, \\p{Upper}<\/td>\n<td width=\"220\">Einen Klein-\/Gro\u00dfbuchstaben: [a-z] bzw. [A-Z]<\/td>\n<\/tr>\n<tr>\n<td width=\"220\">\\p{Alpha}<\/td>\n<td width=\"220\">Einen Buchstaben: [\\p{Lower}\\p{Upper}]<\/td>\n<\/tr>\n<tr>\n<td width=\"220\">\\p{Alnum}<\/td>\n<td width=\"220\">Ein alphanumerisches Zeichen: [\\p{Alpha}\\p{Digit}]<\/td>\n<\/tr>\n<tr>\n<td width=\"220\">\\p{Punct}<\/td>\n<td width=\"220\">Ein Interpunktionszeichen: !&#8220;#$%&amp;'()*+,-.\/:;&lt;=&gt;?@[\\]^_`{|}~<\/td>\n<\/tr>\n<tr>\n<td width=\"220\">\\p{Graph}<\/td>\n<td width=\"220\">Ein sichtbares Zeichen: [\\p{Alnum}\\p{Punct}]<\/td>\n<\/tr>\n<tr>\n<td width=\"220\">\\p{Print}<\/td>\n<td width=\"220\">Ein druckbares Zeichen: [\\p{Graph}]<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<p>Tabelle: Vordefinierte Zeichenklassen<\/p>\n<p>Bei den Wortzeichen handelt es sich standardm\u00e4\u00dfig um die ASCII-Zeichen und nicht um deutsche Zeichen mit unseren Umlauten oder allgemeine Unicode-Zeichen. Eine umfassende \u00dcbersicht liefert die API-Dokumentation der Klasse java.util.regex.Pattern unter https:\/\/docs.oracle.com\/javase\/10\/docs\/api\/java\/util\/regex\/Pattern.html, die auch weitere vordefinierte Zeichenklassen auflistet.<\/p>\n<p>&nbsp;<\/p>\n<table>\n<tbody>\n<tr>\n<td width=\"231\">Ausdruck<\/td>\n<td width=\"220\">Ergebnis<\/td>\n<\/tr>\n<tr>\n<td width=\"231\">&#8222;123&#8220;.matches( <strong>&#8222;\\\\d\\\\d\\\\d&#8220;<\/strong> )<\/td>\n<td width=\"220\">true<\/td>\n<\/tr>\n<tr>\n<td width=\"231\">&#8222;a b&#8220;.matches( <strong>&#8222;a\\\\sb&#8220;<\/strong> )<\/td>\n<td width=\"220\">true<\/td>\n<\/tr>\n<tr>\n<td width=\"231\">&#8222;a\\nb&#8220;.matches( &#8222;a\\\\sb&#8220; )<\/td>\n<td width=\"220\">true<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<p>Beispiel mit vordefinierten Zeichenklassen<\/p>\n<h4>Vorhanden oder nicht?<\/h4>\n<p>Steht hinter einem Zeichen ein Fragezeichen, so ist es optional. Das Fragezeichen nennen wir auch Quantifizierer. Auch hinter einer Zeichenklasse, vordefinierten Zeichenklasse ist ein Fragezeichen erlaubt. Mehrere Zeichen k\u00f6nnen durch runde Klammen zusammengefasst werden.<\/p>\n<p>&nbsp;<\/p>\n<table>\n<tbody>\n<tr>\n<td width=\"231\">Ausdruck<\/td>\n<td width=\"220\">Ergebnis<\/td>\n<\/tr>\n<tr>\n<td width=\"231\">&#8222;Lyric&#8220;.matches( &#8222;Lyrics?&#8220; )<\/td>\n<td width=\"220\">true<\/td>\n<\/tr>\n<tr>\n<td width=\"231\">&#8222;Lyrics&#8220;.matches( &#8222;Lyrics?&#8220; )<\/td>\n<td width=\"220\">true<\/td>\n<\/tr>\n<tr>\n<td width=\"231\">&#8222;1&#8220;.matches( &#8222;\\\\d?&#8220; )<\/td>\n<td width=\"220\">true<\/td>\n<\/tr>\n<tr>\n<td width=\"231\">&#8222;&#8220;.matches( &#8222;\\\\d?&#8220; )<\/td>\n<td width=\"220\">true<\/td>\n<\/tr>\n<tr>\n<td width=\"231\">&#8222;Christian&#8220;.matches( &#8222;Chris(tian)?&#8220; )<\/td>\n<td width=\"220\">true<\/td>\n<\/tr>\n<tr>\n<td width=\"231\">&#8222;Chris&#8220;.matches( &#8222;Chris(tian)?&#8220; )<\/td>\n<td width=\"220\">true<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<p>Beispiel mit optionalen Zeichenfolgen<\/p>\n<h4>Beliebige Wiederholungen<\/h4>\n<p>Neben dem Fragzeichen an gibt es weitere Quantifizierer. F\u00fcr eine Zeichenkette X gilt:<\/p>\n<p>&nbsp;<\/p>\n<table>\n<tbody>\n<tr>\n<td width=\"168\">Quantifizierer<\/td>\n<td width=\"272\">Anzahl an Wiederholungen<\/td>\n<\/tr>\n<tr>\n<td width=\"168\">X?<\/td>\n<td width=\"272\">X kommt einmal oder keinmal vor.<\/td>\n<\/tr>\n<tr>\n<td width=\"168\">X*<\/td>\n<td width=\"272\">X kommt keinmal oder beliebig oft vor.<\/td>\n<\/tr>\n<tr>\n<td width=\"168\">X+<\/td>\n<td width=\"272\">X kommt einmal oder beliebig oft vor.<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<p>Tabelle: Quantifizierer im Umgang mit einer Zeichenkette X<\/p>\n<p>Sehen wir uns ein paar Ausdr\u00fccke an:<\/p>\n<table>\n<tbody>\n<tr>\n<td width=\"220\">Ausdruck<\/td>\n<td width=\"220\">Ergebnis<\/td>\n<\/tr>\n<tr>\n<td width=\"220\">&#8222;Gooooo&#8220;.matches( <strong>&#8222;Go+&#8220;<\/strong> )<\/td>\n<td width=\"220\">true<\/td>\n<\/tr>\n<tr>\n<td width=\"220\">&#8222;Go&#8220;.matches( <strong>&#8222;Go+&#8220;<\/strong> )<\/td>\n<td width=\"220\">true<\/td>\n<\/tr>\n<tr>\n<td width=\"220\">&#8222;G&#8220;.matches( <strong>&#8222;Go+&#8220;<\/strong> )<\/td>\n<td width=\"220\">false<\/td>\n<\/tr>\n<tr>\n<td width=\"220\">&#8222;Go&#8220;.matches( <strong>&#8222;Go*&#8220;<\/strong> )<\/td>\n<td width=\"220\">true<\/td>\n<\/tr>\n<tr>\n<td width=\"220\">&#8222;G&#8220;.matches( <strong>&#8222;Go*&#8220;<\/strong> )<\/td>\n<td width=\"220\">true<\/td>\n<\/tr>\n<tr>\n<td width=\"220\">&#8222;lalala&#8220;.matches( <strong>&#8222;(la)+&#8220;<\/strong> )<\/td>\n<td width=\"220\">true<\/td>\n<\/tr>\n<tr>\n<td width=\"220\">&#8222;yo 4711&#8220;.matches( <strong>&#8222;yo \\\\d+&#8220;<\/strong> )<\/td>\n<td width=\"220\">true<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<p>Tabelle: Beispiele f\u00fcr regul\u00e4re Ausdr\u00fccke mit Wiederholungen<\/p>\n<p>Eine Sonderform ist X(?!Y) \u2013 das dr\u00fcckt aus, dass der regul\u00e4re Ausdruck Y dem regul\u00e4ren Ausdruck X nicht folgen darf (die API-Dokumentation spricht von \u00bbzero-width negative lookahead\u00ab).<\/p>\n<p>Ein weiterer Quantifizierer kann die Anzahl einschr\u00e4nken und die Anzahl eines Vorkommens genauer beschreiben:<\/p>\n<ul>\n<li>X{n}. X muss genau n-mal vorkommen.<\/li>\n<li>X{n,}. X kommt mindestens n-mal vor.<\/li>\n<li>X{n,m}. X kommt mindestens n-, aber maximal m-mal vor.<\/li>\n<\/ul>\n<p>Beispiel<\/p>\n<p>Eine E-Mail-Adresse endet mit einem Domain-Namen, der zwei oder drei Zeichen lang ist. Ein einfacher regul\u00e4rer Ausdruck sieht aus aus: &#8222;[\\\\w|-]+@\\\\w[\\\\w|-]*\\\\.[a-z]{2,3}&#8220;.<\/p>\n<h3>Die Klassen Pattern und Matcher, Pattern.matches(\u2026) bzw. String#matches(\u2026)<\/h3>\n<p>Der Aufruf der Objektmethode matches(String) auf einem String-Objekt bzw. das statische Pattern.matches(String, CharSequence) ist nur eine Abk\u00fcrzung f\u00fcr die \u00dcbersetzung eines Patterns und Anwendung von matches() auf einem Matcher-Objekt.<\/p>\n<table>\n<tbody>\n<tr>\n<td width=\"220\">String#matches(\u2026)<\/td>\n<td width=\"220\">Pattern.matches(\u2026)<\/td>\n<\/tr>\n<tr>\n<td width=\"220\">public boolean<br \/>\nmatches(String regex) {<br \/>\nreturn Pattern.matches(regex, this);<br \/>\n}<\/td>\n<td width=\"220\">public static boolean<br \/>\nmatches(String regex, CharSequence input) {<br \/>\nPattern p = Pattern.compile(regex);<br \/>\nMatcher m = p.matcher(input);<br \/>\nreturn m.matches();<br \/>\n}<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<p>Tabelle: Implementierungen der beiden matches(&#8230;)-Methoden<\/p>\n<p>W\u00e4hrend also die Objektmethode matches(String) von String zu Pattern.matches(String, CharSequence) delegiert, steht hinter der statischen Fassadenmethode in Pattern die wirkliche Nutzung der beiden zentralen Klassen Pattern f\u00fcr das Muster und Matcher f\u00fcr die Mustermaschine. Wenn wir also schreiben &#8222;Filk&#8220;.matches(&#8222;F..k&#8220;) ist das \u00e4quivalent zu Pattern.matches(&#8222;F..k&#8220;, &#8222;Filk&#8220;) und das ist \u00e4quivalent zu<\/p>\n<p>Pattern p = Pattern.compile( &#8222;F..k&#8220; );<br \/>\nMatcher m = p.matcher( &#8222;Filk&#8220; );<br \/>\nboolean b = m.matches();<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Ein regul\u00e4rer Ausdruck (engl. regular expression, kurz Regex) ist die Beschreibung eines Musters\u00a0(engl. pattern). Regul\u00e4re Ausdr\u00fccke werden bei der Zeichenkettenverarbeitung beim Suchen und Ersetzen eingesetzt. F\u00fcr folgende Szenarien bietet die Java-Bibliothek entsprechende Unterst\u00fctzung an: Frage nach einer kompletten \u00dcbereinstimmung: Passt eine Zeichenfolge komplett auf ein Muster? Wir nennen das vollst\u00e4ndigen Match. Die R\u00fcckgabe einer solchen [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_jetpack_newsletter_access":"","_jetpack_dont_email_post_to_subs":false,"_jetpack_newsletter_tier_id":0,"_jetpack_memberships_contains_paywalled_content":false,"_jetpack_feature_clip_id":0,"_jetpack_memberships_contains_paid_content":false,"footnotes":"","jetpack_post_was_ever_published":false,"_links_to":"","_links_to_target":""},"categories":[11],"tags":[],"class_list":["post-4224","post","type-post","status-publish","format-standard","hentry","category-insel"],"jetpack_featured_media_url":"","jetpack_sharing_enabled":true,"_links":{"self":[{"href":"https:\/\/www.tutego.de\/blog\/javainsel\/wp-json\/wp\/v2\/posts\/4224","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.tutego.de\/blog\/javainsel\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.tutego.de\/blog\/javainsel\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.tutego.de\/blog\/javainsel\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/www.tutego.de\/blog\/javainsel\/wp-json\/wp\/v2\/comments?post=4224"}],"version-history":[{"count":1,"href":"https:\/\/www.tutego.de\/blog\/javainsel\/wp-json\/wp\/v2\/posts\/4224\/revisions"}],"predecessor-version":[{"id":4225,"href":"https:\/\/www.tutego.de\/blog\/javainsel\/wp-json\/wp\/v2\/posts\/4224\/revisions\/4225"}],"wp:attachment":[{"href":"https:\/\/www.tutego.de\/blog\/javainsel\/wp-json\/wp\/v2\/media?parent=4224"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.tutego.de\/blog\/javainsel\/wp-json\/wp\/v2\/categories?post=4224"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.tutego.de\/blog\/javainsel\/wp-json\/wp\/v2\/tags?post=4224"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}