視覚障害者のための
正規表現入門5



【メタ文字】
前節までの説明でいくつか特殊な文字が出てきました。
0回以上の繰り返しを意味するアスタリスク。
1回以上の繰り返しを意味する半角プラス。
選択を意味するパイプライン。
表現をまとめる丸括弧。
これら、特殊な文字をメタ文字、あるいは超越文字と呼びます。
後述しますが、他にも、大括弧、ハイフン、エンマーク、ドルマーク、ハット、ピリオドなどがメタ文字になります。正規表現の構造をあらわす文字として、通常の文字とは区別します。
でも、アスタリスクもプラスも、普通の文章で使いますね。 じゃ、メタ文字そのものを表現するにはどうすればいいでしょう。
たとえばアスタリスクを例にとりましょう。アスタリスクの0回以上の繰り返しをどう表現するかが問題です。
アスタリスクを2個連ねて、

**

では駄目です。構文として通りません。
メタ文字を通常文字として使うには、エンマーク(欧米圏ではバックスラッシュ)を前置する必要があります。「通常文字として使っているよ」と正規表現を処理するプログラムに教えてやるのです。これをエスケープと呼びます。
正規表現、

\**

とすれば、アスタリスクの0回以上の繰り返しを表現できます。
1回以上なら、

\*+

です。

じゃ、エンマークそのものを表現するのは?

\\

です。
おなじようにエンマークを前置して、エンマークをふたつ連ねればいいのです。


次の項目へ
前の項目へ
正規表現入門の目次ページ
文字主体トップページ







Copyright(C) 2003 Kazuhiro Kito All rights reserved