正規表現で日本語が入るようにする方法

文字列のチェックの際、正規表現を使用し不正な文字列か判定することは多いと思います。 ここでは、日本語のひらがなや漢字などをチェックする正規表現をまとめていきたいと思います。

またこれらを実装する前に以下のサイトで正規表現を確認してから実装するとスムーズな開発が可能です weblabo.oscasierra.net

文字判定に使用する正規表現

文字 正規表現
ひらがな ^[ぁ-んー]*$
カタカナ(全角) ^[ァ-ヶー]*$
カタカナ(半角) ^[ア-ン゙゚]*$
漢字 ^[一-龠]*$
半角数字 ^[0-9]*$
英語(小文字) ^[a-z]*$
英語(大文字) ^[A-Z]*$
記号 ^[!"#$%&'()*+-.,\/:;<=>?@[\]^_`{|}~]*$
スペース(半角) ^[ ]+
スペース(全角) ^[ ]+

複数の文字種に対応する正規表現

またこれらは複合的に使用することができます。
以下のように記述することで使用したい文字種を選択することも可能です

文字 正規表現
ひらがな + カタカナ + 漢字 ^[ぁ-んァ-ヶア-ン゙゚一-龠]*$
半角数字 + 英語 ^[0-9a-zA-Z]*$

否定の意味で正規表現を使用する

例えば、スペースを許容したくない場合など否定の意味で正規表現を使用することも可能です

文字 正規表現
スペース以外の全ての文字 ^[^  ]*$