NAME

perlsyn - Perl の文法

DESCRIPTION

Perl プログラムは、宣言と文の並びから構成され、上から下へと実行されます。ループ、サブルーチン、その他の制御機構でコードの色々なところにジャンプできます。

Perl は 自由書式 言語ですが、好きなように整形したりインデントしたりできます。空白が文法の重要な要素である Python のような言語と異なり、空白はほとんどトークンの分割の役目です。

Perl の多くの文法要素は 省略可能 です。全ての関数をかっこで括ったり、全ての変数を宣言したりすることを要求するのではなく、しばしばそのような明示的な要素を置いておいて、 Perl にあなたが意味しているところを見つけ出させることができます。これは Do What I Mean と知られ、頭文字を取って DWIM と呼ばれます。これによって、プログラマを怠惰にでき、彼らが快適だと思うスタイルでコーディングできるようにします。

Perl は、awk, sed, C, Bourne Shell, Smalltalk, Lisp, 果ては英語といった、多くの言語からコンセプトと 文法を借用 しています。他の言語も Perl から文法を借用しています; 特に正規表現拡張をです。従って、他の言語でプログラミングしていたなら、Perl にも見たことがあるようなものがあるでしょう。それらはしばしば同じように動作しますが、違う点についての情報は perltrap を参照してください。

宣言

Perl で宣言が必要なものはレポートフォーマットとサブルーチンだけです (サブルーチンすら宣言が不要な場合もあります)。変数は、undef 以外の定義された値を代入されるまでは未定義値(undef)となります。数値として使われる場合、undef は 0 として扱われます; 文字列として使われる場合、これは空文字列 "" として扱われます; リファレンスとして使われる場合、これは何も代入されていないので、エラーとして扱われます。警告を有効にしているなら、undef を文字列や数値として扱おうとすると未初期価値を指摘されます。ええ、普通は。次のような真偽値コンテキストなら:

    my $a;
    if ($a) {}

(定義済みかどうかではなく、真かどうかを考慮するので)警告から免れます。未定義の左辺値を操作する、++, --, +=, -=, .= のような演算子でも:

    my $a;
    $a++;

とすることでもそのような警告から免れます。

宣言は、文が置けるところであればどこにでも置くことができますが、基本的な文の並びは実行時には何の効果も持ちません -- 宣言はコンパイル時にすべての効果が表れます。典型的なすべての宣言は、スクリプトの先頭か終端に置かれます。しかしながら、局所変数を my() を使って作成してレキシカルなスコープを使っているのであれば、フォーマットやサブルーチンの定義を、同じブロックのスコープの中でその局所変数にアクセスすることが可能であるようにしておく必要があるでしょう。

サブルーチンの宣言は、プログラムの後のほうにあるサブルーチン名をリスト演算子のように使うことを許します。定義されていないサブルーチンの宣言を、sub name と記述することで宣言できるので、以下のようにできます。

    sub myname;
    $me = myname $0             or die "can't get myname";

myname() 関数は、リスト演算子のように働くのであり、単項演算子としてではないということに注意してください。ですから、こういった場合に || の代わりに or を使うことには注意してください。しかし、サブルーチンを sub myname ($) のように宣言しているのであれば、 or でも || でもうまく行きます。

サブルーチンの宣言は require 文を使って詰め込むこともできますし、 use 文を使って自分の名前空間にロードしたりインポートしたりすることができます。これに関する詳細は perlmod を参照してください。

文の並びはレキシカルスコープを持った変数の宣言を含むことができますが、変数名の宣言とは切り離され、その宣言は通常の文のように振る舞い、それが通常の文であるかのように文の並びに組みこまれます。これは、そういった宣言がコンパイル時の効果と実行時の効果の両方を持っているということです。

コメントは “#” 文字から、行末まで続き、その部分は無視されます。例外は、文字列や正規表現の中にある "#" です。

単純文

単純文となる唯一の種類は、その副作用のために評価される式です。すべての単純文は、それがセミコロンを省略することのできるブロックの最後にない限りは文を終端するためのセミコロンがなければなりません (ブロックが二行以上に渡る場合には、セミコロンを付けることをお薦めします。なぜなら、別の行を追加する可能性があるからです)。 eval {} や do {} のように、一見複合文のようにみえるけれどもそうではない(これらは単なる式における TERM です)ものがあって、そういったものを文の最後のアイテムとして使った場合には明示的に終端する必要があるのだということに注意してください。

真偽値

数値 0, 文字列 '0' と '', 空リスト (), undef は全て真偽値コンテキストでは偽となります。その他の全ての値は真です。真の値を ! や not で否定すると、特殊な偽の値を返します。これを文字列として評価すると '' として扱われますが、数値として評価すると 0 として扱われます。

文修飾子

任意の単純文には、一つの修飾子を終端のセミコロンの直前(もしくはブロックの終端の直前)に付けることができます。使うことのできる修飾子は以下の通りです。

    if EXPR
    unless EXPR
    while EXPR
    until EXPR
    when EXPR
    for LIST
    foreach LIST

修飾子に引き続く EXPR は「条件」として参照されます。その真偽値が修飾子の振る舞いを決定します。

if はもし条件が真の場合にのみ文を実行します。 unless は逆で、条件が真 でない限り (つまり、条件が偽なら) 文を実行します。

    print "Basset hounds got long ears" if length $ear >= 10;
    go_outside() and play() unless $is_raining;

when は、$_ が EXPR にスマートマッチングした時に文を実行し、それから、given スコープの中の場合は break し、直接 for ループの内側にあるなら next します。 "Switch statements" も参照してください。

    given ($something) {
        $abc    = 1 when /^abc/;
        $just_a = 1 when /^a/;
        $other  = 1;
    }

    for (@names) {
        admin($_)   when [ qw/Alice Bob/ ];
        regular($_) when [ qw/Chris David Ellen/ ];
    }

foreach 修飾子は反復子です: LIST の値それぞれ毎に文を実行します(実行中は $_ がそれぞれの値のエイリアスとなります)。

    print "Hello $_!\n" foreach qw(world Dolly nurse);

while は条件が真の間文を繰り返します。 until は逆で、条件が真 になるまで (つまり条件が偽の間) 文を繰り返します:

    # Both of these count from 0 to 10.
    print $i++ while $i <= 10;
    print $j++ until $j >  10;

修飾子 while と until は、一般的な "while loop" の意味を持っています(条件が最初に評価される)が、do-ブロック(もしくは現在では使用を推奨されていない do-サブルーチン文)に適用されるときは例外で、このときは条件が評価されるよりも前に、一度ブロックが実行されます。このため、次のようなループを記述することができます。

    do {
        $line = <STDIN>;
        ...
    } until $line  eq ".\n";

"do" in perlfunc を参照してください。後述するループの制御文は、修飾子がループラベルを取らないためにこの構造文では 動作しない ということにも注意してください。申し訳ない。こういった場合に対処するのに別のブロックを内側に入れたり(next の場合)、別のブロックで囲む(last の場合)という方法が常に使えます。 next では単に中かっこを二重にします:

    do {{
        next if $x == $y;
        # do something here
    }} until $x++ > $z;

last の場合は、もっと念入りにする必要があります:

    LOOP: { 
            do {
                last if $x = $y**2;
                # do something here
            } while $x++ <= $z;
    }

注意: (my $x if ... のような) 条件構造やループ構造で修飾された my 文の振る舞いは 未定義 です。 my 変数の値は undef かも知れませんし、以前に代入された値かも知れませんし、その他の如何なる値の可能性もあります。この値に依存してはいけません。 perl の将来のバージョンでは現在のバージョンとは何か違うかも知れません。ここには厄介なものがいます。

複合文

Perl では、スコープを定義するような文の並びをブロックと呼びます。ブロックはそれを含むファイルによって範囲が定められることがあります (ファイルが require されたときか、プログラム全体としての場合)し、文字列の展開によって範囲が定められる(eval の場合)こともあります。

しかし一般的には、ブロックは中かっこによって範囲が定められます。この構文的な構造をブロックと呼びます。

以下に挙げる複合文を制御フローとして使うことができます:

    if (EXPR) BLOCK
    if (EXPR) BLOCK else BLOCK
    if (EXPR) BLOCK elsif (EXPR) BLOCK ... else BLOCK
    unless (EXPR) BLOCK
    unless (EXPR) BLOCK else BLOCK
    unless (EXPR) BLOCK elsif (EXPR) BLOCK ... else BLOCK
    LABEL while (EXPR) BLOCK
    LABEL while (EXPR) BLOCK continue BLOCK
    LABEL until (EXPR) BLOCK
    LABEL until (EXPR) BLOCK continue BLOCK
    LABEL for (EXPR; EXPR; EXPR) BLOCK
    LABEL foreach VAR (LIST) BLOCK
    LABEL foreach VAR (LIST) BLOCK continue BLOCK
    LABEL BLOCK continue BLOCK

しかし注意して欲しいのは、C や Pascal とは異なり、ブロックを取るように定義されていて文を取るではないということです。つまり、中かっこは 必要なもの です -- 曖昧な文が許されません。中かっこなしの条件文を使いたいのであれば、いくつかのやり方があります。以下の全ては同じことです:

    if (!open(FOO)) { die "Can't open $FOO: $!"; }
    die "Can't open $FOO: $!" unless open(FOO);
    open(FOO) or die "Can't open $FOO: $!";     # FOO or bust!
    open(FOO) ? 'hi mom' : die "Can't open $FOO: $!";
                        # a bit exotic, that last one

if 文は明解です。ブロックは常に中かっこで区切られるので、if と else の対応が曖昧になるようなことは決してありません。 unless を if の代わりに使うと、検査を反転します。 if と同様、unless は else に引き続くことができます。 unless は一つまたはそれ以上の elsif に引き続くことすらできますが、この特定の言語構文を使う前に二倍考えたいでしょう; あなたのコードを読む誰もが何が行われているのかを理解する前に少なくとも二倍考える必要があるからです。

while 文は、式が真である間、ブロックを実行します。 until 文は、式が偽である間、ブロックを実行します。 LABEL は省略可能ですが、ある場合には、コロンを伴った識別子になります。 LABEL は next、last、redo といったループ制御文のループを規定します。 LABEL が省略された場合、ループ制御文はそれを含むループの中で最も内側のループを参照します。これは、実行時に LABEL を検出するための呼び出しスタックの動的な後戻り検索を含むことができます。そのような推奨されない振る舞いは、use warnings プラグマや -w フラグを使った場合には警告を引き起こします。

continue ブロックが存在する場合、常に条件が再評価される直前に実行されます。したがって、このブロックをループ変数のインクリメントのために使うことができます。これは、ループがnext文を通して継続されるときでも実行されます。

エクステンションモジュールは新しい種類の複合文を定義するために Perl パーサをフックできます。これらはエクステンションが認識するキーワードで導入され、キーワードに引き続く文法は完全にエクステンションで定義されます。もしあなたが実装車なら、仕組みについては "PL_keyword_plugin" in perlapi を参照してください。あなたがそのようなモジュールを使うなら、定義されている文法の詳細についてはそのモジュールの文書を参照してください。

ループ制御

next コマンドはループの次の繰り返しを開始します:

    LINE: while (<STDIN>) {
        next LINE if /^#/;      # discard comments
        ...
    }

last コマンドはループから即座に脱出します。 continue ブロックがあっても、それは実行されません:

    LINE: while (<STDIN>) {
        last LINE if /^$/;      # exit when done with header
        ...
    }

redo コマンドは、条件の再評価をすることなしにループブロックの再実行を行います。 continue ブロックがあっても、それは 実行されません。このコマンドは通常、プログラムに対する入力に関してプログラム自身をだましたいといったときに使われます。

たとえば、/etc/termcap のようなファイルを処理することを考えてみましょう。もし入力された行の行末が継続を示すバックスラッシュであった場合、先へ進んで次のレコードを取り出したいと思うでしょう。

    while (<>) {
        chomp;
        if (s/\\$//) {
            $_ .= <>;
            redo unless eof();
        }
        # now process $_
    }

これは Perl の省略記法で、もっとはっきりと書くと以下のようになります:

    LINE: while (defined($line = <ARGV>)) {
        chomp($line);
        if ($line =~ s/\\$//) {
            $line .= <ARGV>;
            redo LINE unless eof(); # not eof(ARGV)!
        }
        # now process $line
    }

上記の例で continue ブロックがあったとしたら、それは (redo は continue ブロックをスキップするので) 正規表現によって捨てられた行だけが実行されるということに注意してください。 continue ブロックは行カウンターをリセットするとか、一度だけマッチする ?pat? をリセットするのに使われます。

    # inspired by :1,$g/fred/s//WILMA/
    while (<>) {
        ?(fred)?    && s//WILMA $1 WILMA/;
        ?(barney)?  && s//BETTY $1 BETTY/;
        ?(homer)?   && s//MARGE $1 MARGE/;
    } continue {
        print "$ARGV $.: $_";
        close ARGV  if eof();           # reset $.
        reset       if eof();           # reset ?pat?
    }

while を until で置き換えた場合検査の意味は逆転しますが、繰り返しが実行されるより前に条件が検査されることは変わりありません。

ループ制御文は if や unless 中では動作しません。なぜならそこはループではないからです。しかし中かっこを二重にしてこれに対処することはできます。

    if (/pattern/) {{
        last if /fred/;
        next if /barney/; # same effect as "last", but doesn't document as well
        # do something here
    }}

これは、ブロック自身は一度だけ実行されるループとして動作するからです; "Basic BLOCKs" を参照してください。

Perl 4 では使うことのできた while/if BLOCK BLOCK という形式は、もはや使うことができません。 if BLOCK の部分を if (do BLOCK) で置き換えてください。

for ループ

Perl の C 形式の for ループは、対応する while ループと同様に動作します。つまり、以下のものは:

    for ($i = 1; $i < 10; $i++) {
        ...
    }

以下のものと同じです:

    $i = 1;
    while ($i < 10) {
        ...
    } continue {
        $i++;
    }

小さな違いが一つあります: for の初期化部で my を使って変数が宣言された場合、この変数のレキシカルスコープは for ループ (ループ本体と制御部) と完全に同じです。

通常の、配列に対する添え字付けのループのほかにも、for は他の多くの興味深いアプリケーションのために借用することができます。以下の例は、対話的なファイル記述子の終端を明示的に検査してしまうとプログラムをハングアップしたように見えてしまう問題を回避するものです。

    $on_a_tty = -t STDIN && -t STDOUT;
    sub prompt { print "yes? " if $on_a_tty }
    for ( prompt(); <STDIN>; prompt() ) {
        # do something
    }

for ループの条件として readline (または演算子形式の <EXPR>) を使う場合、以下のように省略形が使えます。この振る舞いは while ループ条件と同じです。

    for ( prompt(); defined( $_ = <STDIN> ); prompt() ) {
        # do something
    }

foreach ループ

foreach ループは通常のリスト値に対しての繰り返しを行い、変数 VAR にリストの要素を繰り返し一回に一つずつセットします。変数の前に my というキーワードが置かれていた場合、その変数はレキシカルスコープを持ち、したがってそれはループの中でのみ可視となります。このキーワードがなければ、変数はループに対してローカルとなり、ループを抜けた後で以前の値が再度取得されます。変数が事前に my を使って宣言されていたならば、グローバルなものの代わりにその変数を使いますが、それもループにローカルなものとなります。この暗黙のローカル化は foreach の中でのみ起きます。

読みやすさのために foreach を、簡潔さのために for を使うことができます(あるいは C シェルよりも Bourne シェルに親しんでいるのなら for の方が自然でしょう)。 VAR が省略された場合には、$_ に値が設定されます。

LIST の要素が左辺値であった場合、ループの中で VAR を変更することにより、対応する値を変更することができます。逆に、LIST の要素が左辺値でない場合は、この要素を修正しようとしても失敗します。言い換えると、foreach ループの帰納変数がループの対象となっているリスト中の個々のアイテムに対するエイリアスになっているからです。

LIST のいずれかの部分が配列であった場合に、たとえば splice を使ってループの本体でその要素を削除したりあるいは追加したりすると foreach は非常に混乱してしまいます。ですからそういうことをしてはいけません。

VAR が tie されていたりあるいは他の特殊変数であった場合には foreach はあなたのもくろみどおりには動かないでしょう。こういうこともしてはいけません。

例:

    for (@ary) { s/foo/bar/ }

    for my $elem (@elements) {
        $elem *= 2;
    }

    for $count (10,9,8,7,6,5,4,3,2,1,'BOOM') {
        print $count, "\n"; sleep(1);
    }

    for (1..15) { print "Merry Christmas\n"; }

    foreach $item (split(/:[\\\n:]*/, $ENV{TERMCAP})) {
        print "Item: $item\n";
    }

以下の例は、C プログラマーが Perl でとあるアルゴリズムを記述するときに使うであろうやり方です:

    for (my $i = 0; $i < @ary1; $i++) {
        for (my $j = 0; $j < @ary2; $j++) {
            if ($ary1[$i] > $ary2[$j]) {
                last; # can't go to outer :-(
            }
            $ary1[$i] += $ary2[$j];
        }
        # this is where that last takes me
    }

それに対して、次の例は Perl プログラマーが同じことをよりゆったりとして行うやり方です:

    OUTER: for my $wid (@ary1) {
    INNER:   for my $jet (@ary2) {
                next OUTER if $wid > $jet;
                $wid += $jet;
             }
          }

どのくらいこれが簡単になったように見えますか? これは明確で、安全で、高速です。これは余計なものが少ないので明確なのです。これは後で内側のループと外側のループとの間にコードを付加えた場合でも、それを間違って実行することがないので安全なのです。 next は内側のループを終了するのではなく、外側のループの繰り返しを行います。そしてこれは、Perl は foreach 文をそれと等価な for ループよりもすばやく実行するので高速なのです。

基本ブロック

ブロックそれ自身は(ラベルが付いていようがついてなかろうが)一度だけ実行されるループと、文法的には等価なものです。このため、ブロックから脱出するためやブロックの再スタートのために任意のループ制御文を使うことができます(これは eval{}、sub{}、さらに一般的な認識とは異なり ループではない do{} ブロックに対しては 真ではない ということに注意してください)。 continue ブロックは省略することができます。

BLOCK 構造は case 構造を行うのにも使えます。

    SWITCH: {
        if (/^abc/) { $abc = 1; last SWITCH; }
        if (/^def/) { $def = 1; last SWITCH; }
        if (/^xyz/) { $xyz = 1; last SWITCH; }
        $nothing = 1;
    }

古いバージョンの Perl には公式の switch 文がなかったので、このような構文はとてもよく使われています。

switch 文

Perl 5.10 から、以下のように書くと:

    use feature "switch";

Perl 6 で提案されているものを基礎とした switch 機能が有効になります。

キーワード given と when は他の言語での switch および case と同様のものなので、上記のコードは以下のように書けます:

    given($_) {
        when (/^abc/) { $abc = 1; }
        when (/^def/) { $def = 1; }
        when (/^xyz/) { $xyz = 1; }
        default { $nothing = 1; }
    }

この構造はとても柔軟で、強力です。例えば:

    use feature ":5.10";
    given($foo) {
        when (undef) {
            say '$foo is undefined';
        }
        when ("foo") {
            say '$foo is the string "foo"';
        }
        when ([1,3,5,7,9]) {
            say '$foo is an odd digit';
            continue; # Fall through
        }
        when ($_ < 100) {
            say '$foo is numerically less than 100';
        }
        when (\&complicated_check) {
            say 'a complicated check for $foo is true';
        }
        default {
            die q(I don't know what to do with $foo);
        }
    }

given(EXPR) はブロックのレキシカルスコープ内で EXPR を $_ に代入するので、これは以下と似ています:

        do { my $_ = EXPR; ... }

しかし、ブロックは when が成功するか、明示的な break によって自動的に破壊されるところが違います。

強力さのほとんどは暗黙のスマートマッチングによるものです:

        when($foo)

は正確に以下と等価です:

        when($_ ~~ $foo)

ほとんどの場合で、when(EXPR) は暗黙的な $_ へのスマートマッチング (つまり $_ ~~ EXPR) として扱われます。 (スマートマッチングに関するさらなる情報については "Smart matching in detail" を参照してください。) しかし、EXPR が以下の例外ケースの一つの場合は、直接真偽値として扱われます:

サブルーチンかメソッド呼び出し
正規表現マッチング: つまり、/REGEX/ や $foo =~ /REGEX/ や正規表現マッチングの否定 (!/REGEX/ or $foo !~ /REGEX/)。
$_ < 10 や $x eq "abc" (や、もちろん $_ ~~ $c) のような比較
defined(...), exists(...), eof(...) のいずれか
否定表現 !(...), not (...), 排他的論理和 (...) xor (...)
真偽値ではなく数値を返す -s, -M, -A, -C を除くファイルテスト演算子。
フリップフロップ演算子 .. と ...。

このような場合、EXPR の値は直接真偽値として使われます。

更に:

EXPR が ... && ... または ... and ... の場合、テストは両方の引数に対して再帰的に適用されます。 両方の 引数がテストに成功した場合、この引数は真偽値として扱われます。
EXPR が ... || ..., ... // ..., ... or ... の場合、テストは最初の引数に対して再帰的に適用されます。

これらの規則は複雑に見えますが、普通はあなたが実行したい通りに実行します。例えば、以下のように書けます:

    when (/^\d+$/ && $_ < 75) { ... }

その他の便利な省略記法としては、given の引数としてリテラルな配列やハッシュを書くと、これはリファレンスに変化します。それで、例えば given(@foo) は given(\@foo) と同じです。

default は正確に when(1 == 1) のように振る舞い、常にマッチングします。

脱出

囲まれている given ブロックから脱出するために、break キーワードが使えます。全ての when ブロックの末尾には暗黙に break があります。

次の条件への移動(Fall-through)

一つの条件から次へ移動するためには、continue キーワードが使えます:

    given($foo) {
        when (/x/) { say '$foo contains an x'; continue }
        when (/y/) { say '$foo contains a y' }
        default    { say '$foo does not contain a y' }
    }

ループ内の switch

given() を使う代わりに、foreach() ループを使えます。たとえば、以下は配列内に特定の文字列が何回現れるかを数えるためのひとつの方法です:

    my $count = 0;
    for (@array) {
        when ("foo") { ++$count }
    }
    print "\@array contains $count copies of 'foo'\n";

when ブロックの末尾に、暗黙の next があります。もし最初のマッチングだけに興味があるなら、明示的な last でこれを上書きできます。

これは、for $item (@array) のように明示的にループ変数を指定した場合は動作しません。デフォルト変数 $_ を使う必要があります。 (for my $_ (@array) は使えます。)

スマートマッチングの詳細

スマートマッチングの振る舞いは引数にどのような型が使われたかに依存します。振る舞いは以下の表によって決定されます: 適用される最初の行がマッチングの振る舞いを決定します (従って普通は右側のオペランドの型で決定されます)。スマートマッチングは bless されていないハッシュや配列のリファレンスを暗黙的にデリファレンスするので、これらの場合 "Hash" と "Array" のエントリが適用されます。 (bless されたリファレンスの場合、"Object" エントリが適用されます。)

"Matching Code" の列は常に正確な説明というわけではないことに注意してください。例えば、スマートマッチング演算子の短絡化はいつでも可能ですが、grep はそうではありません。

    $a      $b        暗黙に行われるマッチング マッチングコード
    ======  =====     ======================== =============
    Any     undef     未定義か                 !defined $a

    Any     Object    $object の ~~ オーバーロードを起動するか die する

    Hash    CodeRef   sub が各キーで真か [1]    !grep { !$b->($_) } keys %$a
    Array   CodeRef   sub が各要素で真か [1]    !grep { !$b->($_) } @$a
    Any     CodeRef   サブルーチンが真か        $b->($a)

    Hash    Hash      ハッシュキーが同じか (全てのキーが両方のハッシュにあるか)
    Array   Hash      ハッシュキーの積集合     grep { exists $b->{$_} } @$a
    Regex   Hash      ハッシュキー grep        grep /$a/, keys %$b
    undef   Hash      常に偽 (undef はキーになれない)
    Any     Hash      ハッシュエントリがあるか exists $b->{$a}

    Hash    Array     ハッシュキーの積集合     grep { exists $a->{$_} } @$b
    Array   Array     配列が比較できるか [2]
    Regex   Array     配列 grep                grep /$a/, @$b
    undef   Array     配列が undef を含むか    grep !defined, @$b
    Any     Array     配列要素とマッチング [3]
                                               grep $a ~~ $_, @$b

    Hash    Regex     ハッシュキー grep        grep /$b/, keys %$a
    Array   Regex     配列 grep                grep /$b/, @$a
    Any     Regex     パターンマッチング       $a =~ /$b/

    Object  Any       $object の ~~ オーバーロードを起動するかフォールバック:
    Any     Num       数値比較                 $a == $b
    Num     numish[4] 数値比較                 $a == $b
    undef   Any       未定義か                 !defined($b)
    Any     Any       文字列比較               $a eq $b

 1 - 空のハッシュや配列はマッチングする。
 2 - これは、各要素をもう一つの配列の同じ添え字の要素と
     スマートマッチングする。 [3]
 3 - 循環参照が発見されると、参照の等価性にフォールバックする
 4 - 実数か、数値のように見える文字列

オーバーロードを使ったマッチングのカスタマイズ

~~ 演算子をオーバーロードすることで、オブジェクトのマッチングする方法を変更できます。これは通常のスマートマッチングの意味論を置き換えられます。

~~ は、(オブジェクトの基礎となる構造に依存するのを避けるために) これをオーバーロードしていないオブジェクトに対しては動作しないことを注意するべきです。

また、スマートマッチングのマッチングルールはオーバーロードより優先順位が高いので、$obj がスマートマッチングをオーバーロードしていて、

    $obj ~~ X

としても X を引数としたオーバーロードメソッドは自動的には起動されません; 代わりに上述の表が通常通り適用され、X の型に基づいて、オーバーロードメソッドは起動されたり起動されなかったりします。

overload を参照してください。

Perl 6 からの違い

Perl 5 のスマートマッチングと given/when 構文は Perl 6 のものと完全に同一ではありません。もっとも目に見える違いは、Perl 5 では、given() と when() の引数は (後者を文修飾子として使う場合を除いて)かっこでくくる必要があります。 Perl 6 では、if(), while(), when() のような制御構造でのかっこは常に省略可能です; Perl 5 では、潜在的な大混乱と引き換えにしなければこれを省略できません; なぜなら Perl 5 は以下のような表現において:

  given $foo {
    ...
  }

given の引数はハッシュ %foo の要素であるかのようにパースして、中かっこをハッシュ要素文法として解釈するからです。

スマートマッチングの表は Perl 6 仕様で提案されれているものと同一ではありません; 主に Perl 6 と Perl 5 のデータモデルの違いによります。

Perl 6 では、when() は常にその引数に対する暗黙のスマートマッチングを行いますが、Perl 5 では上述の通り、状況によっては暗黙のスマートマッチングを抑制したほうが便利です。 (主な違いは、Perl 5 は内部的にさえ真偽値型を持たないことによります。)

goto 文

気弱な人のためでないにも関らず、Perl は goto 文をサポートしています。 goto-LABEL、goto-EXPR、goto-&NAME の三つの形式があります。ループのラベルは実際には goto の正当なターゲットではなく、ループの名前にすぎません。

goto-LABEL 形式は LABEL でラベル付けされた文を見つけだし、そこから実行を再開します。これはサブルーチンであるとか foreach ループのような初期化を必要とするような構造へ飛び込むために使うことはできません。また、最適化されて無くなってしまうような構造へ飛び込むこともできません。動的スコープの中以外のほとんどの場所へは、サブルーチンの外も含めて移動することができます。しかし、通常は last や die のような別のやり方を使ったほうが良いでしょう。 Perl の作者は、未だかつてこの形式の goto を使うことが必要だと感じたことはありません(Perl の場合です。C の場合はまた別の話です)。

goto-EXPR 形式は動的に解決されるスコープを持っているラベル名を期待しています。これによって FORTRAN の計算型 goto が実現できますが、これは保守性に重きを置くのであれば使うことは止めた方が良いでしょう。

    goto(("FOO", "BAR", "GLARCH")[$i]);

goto-&NAME は高度にマジカルで、名前付きサブルーチンの呼び出しをカレントで実行されているサブルーチンに置き換えます。これは別のサブルーチンをロードして、最初の場所で呼び出された別のサブルーチンを要求することをしようとする AUTOLOAD() サブルーチンで使われていてます (カレントのサブルーチンにおける @_ に対するもの以外の変更は、別のサブルーチンへ伝播します)。 goto の後で、caller() でなくてもこのサブルーチンが最初に呼ばれたのだということを伝えることすらできるでしょう。

このようなケースのほとんどすべての場合、goto に頼るのではなくて next、last、redo といった制御フロー機構を使うことが、ずっとずっと良いアイデアでしょう。一部のアプリケーションに対しては、eval{} と die() を catch と throw のペアとして例外処理を行うための賢明なアプローチとして使うことができるでしょう。

POD: 組み込みドキュメント

Perl は、ソースコードとドキュメントとを混ぜ書きするための仕掛けを持っています。新しい文の始まりが期待されているときに、コンパイラは以下の例のような = 記号で始まっている語を見つけると:

    =head1 Here There Be Pods!

そのテキストと、=cut で始まる行までの内容を無視します。間に入るテキストの書式は perlpod で説明されています。

これによって、ソースコードとドキュメントとを以下に示す例のように自由に混ぜることができるようになります。

    =item snazzle($)

    The snazzle() function will behave in the most spectacular
    form that you can possibly imagine, not even excepting
    cybernetic pyrotechnics.

    =cut back to the compiler, nuff of this pod stuff!

    sub snazzle($) {
        my $thingie = shift;
        .........
    }

コンパイラはパラグラフの途中に pod エスケープがあったとしてもそれを認識できるのに、pod トランスレータは pod 指示子で始まっているパラグラフのみに注目すべき(これは構文解析を簡単にするためです)であるということに注意して下さい。つまり、以下の例にある "secret stuff" はコンパイラからも、トランスレータからも無視されるということです。

    $a=3;
    =secret stuff
     warn "Neither POD nor CODE!?"
    =cut back
    print "got $a\n";

この例の warn() のようなものが、将来に渡って無視されるということに依存すべきではありません。すべての pod トランスレータがそのように振る舞うわけではありませんし、コンパイラは将来これを無視しないようになるかもしれません。

pod 指示子を、コードの一部を手っ取り早くコメントアウトするために使うこともできます。

Plain Old Comments (Not!)

C のプリプロセッサと同じように、Perl は行指示子を処理できます。これを使うことによって、エラーメッセージや警告メッセージにあるファイル名や行番号を制御することができます (特に、eval() で処理される文字列のために)。この仕組みの構文は C のプリプロセッサとほとんど同じで、正規表現:

    # example: '# line 42 "new_filename.plx"'
    /^\#   \s*
      line \s+ (\d+)   \s*
      (?:\s("?)([^"]+)\2)? \s*
     $/x

にマッチしたものの $1 が次の行の行番号となり、省略することもできる $3 は(クォートありかなしで指定された)ファイル名となります。

行指示子にはかなり明らかな技があります。デバッガとプロファイラは、与えられたファイルの特定の行番号に対して現れた最新のソース行のみを表示します。あとでデバッグしたいコードでは行番号の衝突が起きないように注意するべきです。

コマンドシェルでタイプすることのできる例をいくつか挙げます:

    % perl
    # line 200 "bzzzt"
    # the `#' on the previous line must be the first char on line
    die 'foo';
    __END__
    foo at bzzzt line 201.

    % perl
    # line 200 "bzzzt"
    eval qq[\n#line 2001 ""\ndie 'foo']; print $@;
    __END__
    foo at - line 2001.

    % perl
    eval qq[\n#line 200 "foo bar"\ndie 'foo']; print $@;
    __END__
    foo at foo bar line 200.

    % perl
    # line 345 "goop"
    eval "\n#line " . __LINE__ . ' "' . __FILE__ ."\"\ndie 'foo'";
    print $@;
    __END__
    foo at goop line 345.