NAME

perlsyn - Perl の文法

DESCRIPTION

Perl プログラムは、宣言と文の並びから構成され、上から下へと実行されます。 ループ、サブルーチン、その他の制御機構でコードの色々なところに ジャンプできます。

Perl は 自由書式 言語ですが、好きなように整形したりインデントしたり できます。 空白が文法の重要な要素である Python のような言語と異なり、 空白はほとんどトークンの分割の役目です。

Perl の多くの文法要素は 省略可能 です。 全ての関数をかっこで括ったり、全ての変数を宣言したりすることを 要求するのではなく、しばしばそのような明示的な要素を置いておいて、 Perl にあなたが意味しているところを見つけ出させることができます。 これは Do What I Mean と知られ、頭文字を取って DWIM と呼ばれます。 これによって、プログラマを 怠惰 にでき、彼らが快適だと思うスタイルで コーディングできるようにします。

Perl は、awk, sed, C, Bourne Shell, Smalltalk, Lisp, 果ては英語といった、 多くの言語からコンセプトと 文法を借用 しています。 他の言語も Perl から文法を借用しています; 特に正規表現拡張をです。 従って、他の言語でプログラミングしていたなら、Perl にも見たことがあるような ものがあるでしょう。 それらはしばしば同じように動作しますが、違う点についての情報は perltrap を参照してください。

宣言

Perl で宣言が必要なものはレポートフォーマットとサブルーチンだけです (サブルーチンすら宣言が不要な場合もあります)。 変数は、undef 以外の定義された値を代入されるまでは未定義値(undef)と なります。 数値として使われる場合、undef0 として扱われます; 文字列として使われる場合、これは空文字列 "" として扱われます; リファレンスとして使われる場合、これは何も代入されていないので、エラーとして 扱われます。 警告を有効にしているなら、undef を文字列や数値として扱おうとすると 未初期価値を指摘されます。 ええ、普通は。 次のような真偽値コンテキストなら:

    my $a;
    if ($a) {}

(定義済みかどうかではなく、真かどうかを考慮するので)警告から免れます。 未定義の左辺値を操作する、++, --, +=, -=, .= のような 演算子でも:

    my $a;
    $a++;

とすることでもそのような警告から免れます。

宣言は、文が置けるところであればどこにでも置くことができますが、 基本的な文の並びは実行時には何の効果も持ちません -- 宣言はコンパイル時に すべての効果が表れます。 典型的なすべての宣言は、スクリプトの先頭か終端に置かれます。 しかしながら、局所変数を my() を使って作成してレキシカルなスコープを 使っているのであれば、フォーマットやサブルーチンの定義を、同じブロックの スコープの中でその局所変数にアクセスすることが可能であるようにしておく 必要があるでしょう。

サブルーチンの宣言は、プログラムの後のほうにあるサブルーチン名を リスト演算子のように使うことを許します。 定義されていないサブルーチンの宣言を、sub name と記述することで 宣言できるので、以下のようにできます。

    sub myname;
    $me = myname $0             or die "can't get myname";

myname() 関数は、リスト演算子のように働くのであり、単項演算子としてでは ないということに注意してください。 ですから、こういった場合に || の代わりに or を使うことには 注意してください。 しかし、サブルーチンを sub myname ($) のように宣言しているのであれば、 or でも || でもうまく行きます。

サブルーチンの宣言は require 文を使って詰め込むこともできますし、 use 文を使って自分の名前空間にロードしたりインポートしたりすることが できます。 これに関する詳細は perlmod を参照してください。

文の並びはレキシカルスコープを持った変数の宣言を含むことができますが、 変数名の宣言とは切り離され、その宣言は通常の文のように振る舞い、 それが通常の文であるかのように文の並びに組みこまれます。 これは、そういった宣言がコンパイル時の効果と実行時の効果の両方を 持っているということです。

コメント

コメントは “#” 文字から、行末まで続き、その部分は無視されます。 例外は、文字列や正規表現の中にある "#" です。

単純文

単純文となる唯一の種類は、その副作用のために評価される式です。 すべての単純文は、それがセミコロンを省略することのできるブロックの 最後にない限りは文を終端するためのセミコロンがなければなりません (ブロックが二行以上に渡る場合には、セミコロンを付けることをお薦めします。 なぜなら、別の行を追加する可能性があるからです)。 eval {}do {} のように、一見複合文のようにみえるけれども そうではない(これらは単なる式における TERM です)ものがあって、 そういったものを文の最後のアイテムとして使った場合には明示的に終端する 必要があるのだということに注意してください。

真偽値

数値 0, 文字列 '0''', 空リスト (), undef は全て真偽値 コンテキストでは偽となります。 その他の全ての値は真です。 真の値を !not で否定すると、特殊な偽の値を返します。 これを文字列として評価すると '' として扱われますが、数値として評価すると 0 として扱われます。

文修飾子

任意の単純文には、一つ の修飾子を終端のセミコロンの直前(もしくは ブロックの終端の直前)に付けることができます。 使うことのできる修飾子は以下の通りです。

    if EXPR
    unless EXPR
    while EXPR
    until EXPR
    when EXPR
    for LIST
    foreach LIST

修飾子に引き続く EXPR は「条件」として参照されます。 その真偽値が修飾子の振る舞いを決定します。

ifもし 条件が真の場合にのみ文を実行します。 unless は逆で、条件が真 でない限り (つまり、条件が偽なら) 文を 実行します。

    print "Basset hounds got long ears" if length $ear >= 10;
    go_outside() and play() unless $is_raining;

when は、$_EXPR にスマートマッチングした 時に 文を 実行し、それから、given スコープの中の場合は break し、 直接 for ループの内側にあるなら next します。 "Switch statements" も参照してください。

    given ($something) {
        $abc    = 1 when /^abc/;
        $just_a = 1 when /^a/;
        $other  = 1;
    }

    for (@names) {
        admin($_)   when [ qw/Alice Bob/ ];
        regular($_) when [ qw/Chris David Ellen/ ];
    }

foreach 修飾子は反復子です: LIST の値それぞれ毎に文を実行します(実行中は $_ がそれぞれの値の エイリアスとなります)。

    print "Hello $_!\n" foreach qw(world Dolly nurse);

while は条件が真 の間 文を繰り返します。 until は逆で、条件が真 になるまで (つまり条件が偽の間) 文を 繰り返します:

    # Both of these count from 0 to 10.
    print $i++ while $i <= 10;
    print $j++ until $j >  10;

修飾子 whileuntil は、一般的な "while loop" の意味を 持っています(条件が最初に評価される)が、do-ブロック(もしくは現在では 使用を推奨されていない do-サブルーチン文)に適用されるときは例外で、 このときは条件が評価されるよりも前に、一度ブロックが実行されます。 このため、次のようなループを記述することができます。

    do {
        $line = <STDIN>;
        ...
    } until $line  eq ".\n";

"do" in perlfunc を参照してください。 後述するループの制御文は、修飾子がループラベルを取らないために この構造文では 動作しない ということにも注意してください。 申し訳ない。 こういった場合に対処するのに別のブロックを内側に入れたり(next の場合)、 別のブロックで囲む(last の場合)という方法が常に使えます。 next では単に中かっこを二重にします:

    do {{
        next if $x == $y;
        # do something here
    }} until $x++ > $z;

last の場合は、もっと念入りにする必要があります:

    LOOP: { 
            do {
                last if $x = $y**2;
                # do something here
            } while $x++ <= $z;
    }

注意: (my $x if ... のような) 条件構造やループ構造で修飾された my 文の振る舞いは 未定義 です。 my 変数の値は undef かも知れませんし、以前に代入された値かも 知れませんし、その他の如何なる値の可能性もあります。 この値に依存してはいけません。 perl の将来のバージョンでは現在のバージョンとは何か違うかも知れません。 ここには厄介なものがいます。

複合文

Perl では、スコープを定義するような文の並びをブロックと呼びます。 ブロックはそれを含むファイルによって範囲が定められることがあります (ファイルが require されたときか、プログラム全体としての場合)し、 文字列の展開によって範囲が定められる(eval の場合)こともあります。

しかし一般的には、ブロックは中かっこによって範囲が定められます。 この構文的な構造をブロックと呼びます。

以下に挙げる複合文を制御フローとして使うことができます:

    if (EXPR) BLOCK
    if (EXPR) BLOCK else BLOCK
    if (EXPR) BLOCK elsif (EXPR) BLOCK ... else BLOCK
    unless (EXPR) BLOCK
    unless (EXPR) BLOCK else BLOCK
    unless (EXPR) BLOCK elsif (EXPR) BLOCK ... else BLOCK
    LABEL while (EXPR) BLOCK
    LABEL while (EXPR) BLOCK continue BLOCK
    LABEL until (EXPR) BLOCK
    LABEL until (EXPR) BLOCK continue BLOCK
    LABEL for (EXPR; EXPR; EXPR) BLOCK
    LABEL foreach VAR (LIST) BLOCK
    LABEL foreach VAR (LIST) BLOCK continue BLOCK
    LABEL BLOCK continue BLOCK

しかし注意して欲しいのは、C や Pascal とは異なり、ブロックを取るように 定義されていて文を取るではないということです。 つまり、中かっこは 必要なもの です -- 曖昧な文が許されません。 中かっこなしの条件文を使いたいのであれば、いくつかのやり方があります。 以下の全ては同じことです:

    if (!open(FOO)) { die "Can't open $FOO: $!"; }
    die "Can't open $FOO: $!" unless open(FOO);
    open(FOO) or die "Can't open $FOO: $!";     # FOO or bust!
    open(FOO) ? 'hi mom' : die "Can't open $FOO: $!";
                        # a bit exotic, that last one

if 文は明解です。 ブロックは常に中かっこで区切られるので、ifelse の対応が 曖昧になるようなことは決してありません。 unlessif の代わりに使うと、検査を反転します。 if と同様、unlesselse に引き続くことができます。 unless は一つまたはそれ以上の elsif に引き続くことすらできますが、 この特定の言語構文を使う前に二倍考えたいでしょう; あなたのコードを読む 誰もが何が行われているのかを理解する前に少なくとも二倍考える必要が あるからです。

while 文は、式が である間、ブロックを 実行します。 until 文は、式が偽である間、ブロックを実行します。 LABEL は省略可能ですが、ある場合には、コロンを伴った識別子になります。 LABEL は nextlastredo といったループ制御文のループを規定します。 LABEL が省略された場合、ループ制御文はそれを含むループの中で最も内側の ループを参照します。 これは、実行時に LABEL を検出するための呼び出しスタックの動的な後戻り検索を 含むことができます。 そのような推奨されない振る舞いは、use warnings プラグマや -w フラグを 使った場合には警告を引き起こします。

continue ブロックが存在する場合、 常に条件が再評価される直前に実行されます。 したがって、このブロックをループ変数のインクリメントのために 使うことができます。 これは、ループがnext文を通して継続されるときでも実行されます。

エクステンションモジュールは新しい種類の複合文を定義するために Perl パーサをフックできます。 これらはエクステンションが認識するキーワードで導入され、キーワードに 引き続く文法は完全にエクステンションで定義されます。 もしあなたが実装車なら、仕組みについては "PL_keyword_plugin" in perlapi を 参照してください。 あなたがそのようなモジュールを使うなら、定義されている文法の詳細については そのモジュールの文書を参照してください。

ループ制御

next コマンドはループの次の繰り返しを開始します:

    LINE: while (<STDIN>) {
        next LINE if /^#/;      # discard comments
        ...
    }

last コマンドはループから即座に脱出します。 continue ブロックがあっても、それは実行されません:

    LINE: while (<STDIN>) {
        last LINE if /^$/;      # exit when done with header
        ...
    }

redo コマンドは、条件の再評価をすることなしにループブロックの 再実行を行います。 continue ブロックがあっても、それは 実行されません。 このコマンドは通常、プログラムに対する入力に関してプログラム自身を だましたいといったときに使われます。

たとえば、/etc/termcap のようなファイルを処理することを 考えてみましょう。 もし入力された行の行末が継続を示すバックスラッシュであった場合、先へ進んで 次のレコードを取り出したいと思うでしょう。

    while (<>) {
        chomp;
        if (s/\\$//) {
            $_ .= <>;
            redo unless eof();
        }
        # now process $_
    }

これは Perl の省略記法で、もっとはっきりと書くと以下のようになります:

    LINE: while (defined($line = <ARGV>)) {
        chomp($line);
        if ($line =~ s/\\$//) {
            $line .= <ARGV>;
            redo LINE unless eof(); # not eof(ARGV)!
        }
        # now process $line
    }

上記の例で continue ブロックがあったとしたら、それは (redo は continue ブロックをスキップするので) 正規表現によって 捨てられた行だけが実行されるということに注意してください。 continue ブロックは行カウンターをリセットするとか、 一度だけマッチする ?pat? をリセットするのに使われます。

    # inspired by :1,$g/fred/s//WILMA/
    while (<>) {
        ?(fred)?    && s//WILMA $1 WILMA/;
        ?(barney)?  && s//BETTY $1 BETTY/;
        ?(homer)?   && s//MARGE $1 MARGE/;
    } continue {
        print "$ARGV $.: $_";
        close ARGV  if eof();           # reset $.
        reset       if eof();           # reset ?pat?
    }

whileuntil で置き換えた場合検査の意味は逆転しますが、 繰り返しが実行されるより前に条件が検査されることは変わりありません。

ループ制御文は ifunless 中では動作しません。 なぜならそこはループではないからです。 しかし中かっこを二重にしてこれに対処することはできます。

    if (/pattern/) {{
        last if /fred/;
        next if /barney/; # same effect as "last", but doesn't document as well
        # do something here
    }}

これは、ブロック自身は一度だけ実行されるループとして動作するからです; "Basic BLOCKs" を参照してください。

Perl 4 では使うことのできた while/if BLOCK BLOCK という形式は、 もはや使うことができません。 if BLOCK の部分を if (do BLOCK) で置き換えてください。

for ループ

Perl の C 形式の for ループは、対応する while ループと同様に 動作します。 つまり、以下のものは:

    for ($i = 1; $i < 10; $i++) {
        ...
    }

以下のものと同じです:

    $i = 1;
    while ($i < 10) {
        ...
    } continue {
        $i++;
    }

小さな違いが一つあります: for の初期化部で my を使って変数が 宣言された場合、この変数のレキシカルスコープは for ループ (ループ本体と制御部) と完全に同じです。

通常の、配列に対する添え字付けのループのほかにも、for は他の 多くの興味深いアプリケーションのために借用することができます。 以下の例は、対話的なファイル記述子の終端を明示的に検査してしまうと プログラムをハングアップしたように見えてしまう問題を回避するものです。

    $on_a_tty = -t STDIN && -t STDOUT;
    sub prompt { print "yes? " if $on_a_tty }
    for ( prompt(); <STDIN>; prompt() ) {
        # do something
    }

for ループの条件として readline (または演算子形式の <EXPR>) を 使う場合、以下のように省略形が使えます。 この振る舞いは while ループ条件と同じです。

    for ( prompt(); defined( $_ = <STDIN> ); prompt() ) {
        # do something
    }

foreach ループ

foreach ループは 通常のリスト値に対しての繰り返しを行い、変数 VAR に リストの要素を繰り返し一回に一つずつセットします。 変数の前に my というキーワードが置かれていた場合、その変数は レキシカルスコープを持ち、したがってそれはループの中でのみ可視となります。 このキーワードがなければ、変数はループに対してローカルとなり、ループを 抜けた後で以前の値が再度取得されます。 変数が事前に my を使って宣言されていたならば、グローバルなものの 代わりにその変数を使いますが、それもループにローカルなものとなります。 この暗黙のローカル化は foreach の中で のみ 起きます。

読みやすさのために foreach を、簡潔さのために for を使うことが できます(あるいは C シェルよりも Bourne シェルに親しんでいるのなら for の方が自然でしょう)。 VAR が省略された場合には、$_ に値が設定されます。

LIST の要素が左辺値であった場合、ループの中で VAR を変更することにより、 対応する値を変更することができます。 逆に、LIST の要素が左辺値でない場合は、この要素を修正しようとしても 失敗します。 言い換えると、foreach ループの帰納変数がループの対象となっている リスト中の個々のアイテムに対するエイリアスになっているからです。

LIST のいずれかの部分が配列であった場合に、たとえば splice を使って ループの本体でその要素を削除したりあるいは追加したりすると foreach は非常に混乱してしまいます。 ですからそういうことをしてはいけません。

VAR が tie されていたりあるいは他の特殊変数であった場合には foreach はあなたのもくろみどおりには動かないでしょう。 こういうこともしてはいけません。

例:

    for (@ary) { s/foo/bar/ }

    for my $elem (@elements) {
        $elem *= 2;
    }

    for $count (10,9,8,7,6,5,4,3,2,1,'BOOM') {
        print $count, "\n"; sleep(1);
    }

    for (1..15) { print "Merry Christmas\n"; }

    foreach $item (split(/:[\\\n:]*/, $ENV{TERMCAP})) {
        print "Item: $item\n";
    }

以下の例は、C プログラマーが Perl でとあるアルゴリズムを記述するときに 使うであろうやり方です:

    for (my $i = 0; $i < @ary1; $i++) {
        for (my $j = 0; $j < @ary2; $j++) {
            if ($ary1[$i] > $ary2[$j]) {
                last; # can't go to outer :-(
            }
            $ary1[$i] += $ary2[$j];
        }
        # this is where that last takes me
    }

それに対して、次の例は Perl プログラマーが同じことをよりゆったりとして 行うやり方です:

    OUTER: for my $wid (@ary1) {
    INNER:   for my $jet (@ary2) {
                next OUTER if $wid > $jet;
                $wid += $jet;
             }
          }

どのくらいこれが簡単になったように見えますか? これは明確で、安全で、 高速です。 これは余計なものが少ないので明確なのです。 これは後で内側のループと外側のループとの間にコードを付加えた場合でも、 それを間違って実行することがないので安全なのです。 next は内側のループを終了するのではなく、外側のループの繰り返しを 行います。 そしてこれは、Perl は foreach 文をそれと等価な for ループよりも すばやく実行するので高速なのです。

基本ブロック

ブロックそれ自身は(ラベルが付いていようがついてなかろうが)一度だけ 実行されるループと、文法的には等価なものです。 このため、ブロックから脱出するためやブロックの再スタートのために 任意のループ制御文を使うことができます(これは eval{}sub{}、 さらに一般的な認識とは異なり ループではない do{} ブロックに対しては 真ではない ということに注意してください)。 continue ブロックは省略することができます。

BLOCK 構造は case 構造を行うのにも使えます。

    SWITCH: {
        if (/^abc/) { $abc = 1; last SWITCH; }
        if (/^def/) { $def = 1; last SWITCH; }
        if (/^xyz/) { $xyz = 1; last SWITCH; }
        $nothing = 1;
    }

古いバージョンの Perl には公式の switch 文がなかったので、このような 構文はとてもよく使われています。

switch 文

Perl 5.10 から、以下のように書くと:

    use feature "switch";

Perl 6 で提案されているものを基礎とした switch 機能が有効になります。

キーワード givenwhen は他の言語での switch および case と 同様のものなので、上記のコードは以下のように書けます:

    given($_) {
        when (/^abc/) { $abc = 1; }
        when (/^def/) { $def = 1; }
        when (/^xyz/) { $xyz = 1; }
        default { $nothing = 1; }
    }

この構造はとても柔軟で、強力です。 例えば:

    use feature ":5.10";
    given($foo) {
        when (undef) {
            say '$foo is undefined';
        }
        when ("foo") {
            say '$foo is the string "foo"';
        }
        when ([1,3,5,7,9]) {
            say '$foo is an odd digit';
            continue; # Fall through
        }
        when ($_ < 100) {
            say '$foo is numerically less than 100';
        }
        when (\&complicated_check) {
            say 'a complicated check for $foo is true';
        }
        default {
            die q(I don't know what to do with $foo);
        }
    }

given(EXPR) はブロックのレキシカルスコープ内で EXPR を $_ に 代入するので、これは以下と似ています:

        do { my $_ = EXPR; ... }

しかし、ブロックは when が成功するか、明示的な break によって 自動的に破壊されるところが違います。

強力さのほとんどは暗黙のスマートマッチングによるものです:

        when($foo)

は正確に以下と等価です:

        when($_ ~~ $foo)

ほとんどの場合で、when(EXPR) は暗黙的な $_ へのスマートマッチング (つまり $_ ~~ EXPR) として扱われます。 (スマートマッチングに関するさらなる情報については "Smart matching in detail" を参照してください。) しかし、EXPR が以下の例外ケースの一つの場合は、直接真偽値として扱われます:

このような場合、EXPR の値は直接真偽値として使われます。

更に:

これらの規則は複雑に見えますが、普通はあなたが実行したい通りに実行します。 例えば、以下のように書けます:

    when (/^\d+$/ && $_ < 75) { ... }

その他の便利な省略記法としては、given の引数としてリテラルな配列や ハッシュを書くと、これはリファレンスに変化します。 それで、例えば given(@foo)given(\@foo) と同じです。

default は正確に when(1 == 1) のように振る舞い、常に マッチングします。

脱出

囲まれている given ブロックから脱出するために、break キーワードが 使えます。 全ての when ブロックの末尾には暗黙に break があります。

次の条件への移動(Fall-through)

一つの条件から次へ移動するためには、continue キーワードが使えます:

    given($foo) {
        when (/x/) { say '$foo contains an x'; continue }
        when (/y/) { say '$foo contains a y' }
        default    { say '$foo does not contain a y' }
    }

ループ内の switch

given() を使う代わりに、foreach() ループを使えます。 たとえば、以下は配列内に特定の文字列が何回現れるかを数えるための ひとつの方法です:

    my $count = 0;
    for (@array) {
        when ("foo") { ++$count }
    }
    print "\@array contains $count copies of 'foo'\n";

when ブロックの末尾に、暗黙の next があります。 もし最初のマッチングだけに興味があるなら、明示的な last でこれを 上書きできます。

これは、for $item (@array) のように明示的にループ変数を指定した場合は 動作しません。 デフォルト変数 $_ を使う必要があります。 (for my $_ (@array) は使えます。)

スマートマッチングの詳細

スマートマッチングの振る舞いは引数にどのような型が使われたかに依存します。 振る舞いは以下の表によって決定されます: 適用される最初の行がマッチングの振る舞いを決定します (従って普通は右側のオペランドの型で決定されます)。 スマートマッチングは bless されていないハッシュや配列のリファレンスを 暗黙的にデリファレンスするので、これらの場合 "Hash" と "Array" の エントリが適用されます。 (bless されたリファレンスの場合、"Object" エントリが適用されます。)

"Matching Code" の列は常に正確な説明というわけではないことに 注意してください。 例えば、スマートマッチング演算子の短絡化はいつでも可能ですが、grep は そうではありません。

    $a      $b        暗黙に行われるマッチング マッチングコード
    ======  =====     ======================== =============
    Any     undef     未定義か                 !defined $a

    Any     Object    $object の ~~ オーバーロードを起動するか die する

    Hash    CodeRef   sub が各キーで真か [1]    !grep { !$b->($_) } keys %$a
    Array   CodeRef   sub が各要素で真か [1]    !grep { !$b->($_) } @$a
    Any     CodeRef   サブルーチンが真か        $b->($a)

    Hash    Hash      ハッシュキーが同じか (全てのキーが両方のハッシュにあるか)
    Array   Hash      ハッシュキーの積集合     grep { exists $b->{$_} } @$a
    Regex   Hash      ハッシュキー grep        grep /$a/, keys %$b
    undef   Hash      常に偽 (undef はキーになれない)
    Any     Hash      ハッシュエントリがあるか exists $b->{$a}

    Hash    Array     ハッシュキーの積集合     grep { exists $a->{$_} } @$b
    Array   Array     配列が比較できるか [2]
    Regex   Array     配列 grep                grep /$a/, @$b
    undef   Array     配列が undef を含むか    grep !defined, @$b
    Any     Array     配列要素とマッチング [3]
                                               grep $a ~~ $_, @$b

    Hash    Regex     ハッシュキー grep        grep /$b/, keys %$a
    Array   Regex     配列 grep                grep /$b/, @$a
    Any     Regex     パターンマッチング       $a =~ /$b/

    Object  Any       $object の ~~ オーバーロードを起動するかフォールバック:
    Any     Num       数値比較                 $a == $b
    Num     numish[4] 数値比較                 $a == $b
    undef   Any       未定義か                 !defined($b)
    Any     Any       文字列比較               $a eq $b

 1 - 空のハッシュや配列はマッチングする。
 2 - これは、各要素をもう一つの配列の同じ添え字の要素と
     スマートマッチングする。 [3]
 3 - 循環参照が発見されると、参照の等価性にフォールバックする
 4 - 実数か、数値のように見える文字列

オーバーロードを使ったマッチングのカスタマイズ

~~ 演算子をオーバーロードすることで、オブジェクトのマッチングする方法を 変更できます。 これは通常のスマートマッチングの意味論を置き換えられます。

~~ は、(オブジェクトの基礎となる構造に依存するのを避けるために) これをオーバーロードしていないオブジェクトに対しては動作しないことを 注意するべきです。

また、スマートマッチングのマッチングルールはオーバーロードより 優先順位が高いので、$obj がスマートマッチングをオーバーロードしていて、

    $obj ~~ X

としても X を引数としたオーバーロードメソッドは自動的には起動されません; 代わりに上述の表が通常通り適用され、X の型に基づいて、オーバーロード メソッドは起動されたり起動されなかったりします。

overload を参照してください。

Perl 6 からの違い

Perl 5 のスマートマッチングと given/when 構文は Perl 6 のものと 完全に同一ではありません。 もっとも目に見える違いは、Perl 5 では、given()when() の引数は (後者を文修飾子として使う場合を除いて)かっこでくくる必要があります。 Perl 6 では、if(), while(), when() のような制御構造での かっこは常に省略可能です; Perl 5 では、潜在的な大混乱と引き換えにしなければこれを省略できません; なぜなら Perl 5 は以下のような表現において:

  given $foo {
    ...
  }

given の引数はハッシュ %foo の要素であるかのようにパースして、 中かっこをハッシュ要素文法として解釈するからです。

スマートマッチングの表は Perl 6 仕様で提案されれているものと 同一ではありません; 主に Perl 6 と Perl 5 のデータモデルの違いによります。

Perl 6 では、when() は常にその引数に対する暗黙のスマートマッチングを 行いますが、Perl 5 では上述の通り、状況によっては暗黙のスマートマッチングを 抑制したほうが便利です。 (主な違いは、Perl 5 は内部的にさえ真偽値型を持たないことによります。)

goto 文

気弱な人のためでないにも関らず、Perl は goto 文をサポートしています。 goto-LABEL、goto-EXPR、goto-&NAME の三つの形式があります。 ループのラベルは実際には goto の正当なターゲットではなく、 ループの名前にすぎません。

goto-LABEL 形式は LABEL でラベル付けされた文を見つけだし、そこから 実行を再開します。 これはサブルーチンであるとか foreach ループのような 初期化を必要とするような構造へ飛び込むために使うことはできません。 また、最適化されて無くなってしまうような構造へ飛び込むこともできません。 動的スコープの中以外のほとんどの場所へは、サブルーチンの 外も含めて移動することができます。 しかし、通常は lastdie のような別のやり方を使ったほうが 良いでしょう。 Perl の作者は、未だかつてこの形式の goto を使うことが 必要だと感じたことはありません(Perl の場合です。C の場合はまた別の話です)。

goto-EXPR 形式は動的に解決されるスコープを持っているラベル名を 期待しています。 これによって FORTRAN の計算型 goto が実現できますが、 これは保守性に重きを置くのであれば使うことは止めた方が良いでしょう。

    goto(("FOO", "BAR", "GLARCH")[$i]);

goto-&NAME は高度にマジカルで、名前付きサブルーチンの呼び出しを カレントで実行されているサブルーチンに置き換えます。 これは別のサブルーチンをロードして、最初の場所で呼び出された 別のサブルーチンを要求することをしようとする AUTOLOAD() サブルーチンで使われていてます (カレントのサブルーチンにおける @_ に対するもの以外の変更は、 別のサブルーチンへ伝播します)。 goto の後で、caller() でなくてもこのサブルーチンが 最初に呼ばれたのだということを伝えることすらできるでしょう。

このようなケースのほとんどすべての場合、goto に頼るのではなくて nextlastredo といった制御フロー機構を使うことが、 ずっとずっと良いアイデアでしょう。 一部のアプリケーションに対しては、eval{} と die() を catch と throw のペアとして例外処理を行うための賢明なアプローチとして 使うことができるでしょう。

POD: 組み込みドキュメント

Perl は、ソースコードとドキュメントとを混ぜ書きするための仕掛けを 持っています。 新しい文の始まりが期待されているときに、コンパイラは 以下の例のような = 記号で始まっている語を見つけると:

    =head1 Here There Be Pods!

そのテキストと、=cut で始まる行までの内容を無視します。 間に入るテキストの書式は perlpod で説明されています。

これによって、ソースコードとドキュメントとを以下に示す例のように 自由に混ぜることができるようになります。

    =item snazzle($)

    The snazzle() function will behave in the most spectacular
    form that you can possibly imagine, not even excepting
    cybernetic pyrotechnics.

    =cut back to the compiler, nuff of this pod stuff!

    sub snazzle($) {
        my $thingie = shift;
        .........
    }

コンパイラはパラグラフの途中に pod エスケープがあったとしてもそれを 認識できるのに、pod トランスレータは pod 指示子で始まっている パラグラフのみに注目すべき(これは構文解析を簡単にするためです)で あるということに注意して下さい。 つまり、以下の例にある "secret stuff" はコンパイラからも、 トランスレータからも無視されるということです。

    $a=3;
    =secret stuff
     warn "Neither POD nor CODE!?"
    =cut back
    print "got $a\n";

この例の warn() のようなものが、将来に渡って無視されるということに 依存すべきではありません。 すべての pod トランスレータがそのように振る舞うわけではありませんし、 コンパイラは将来これを無視しないようになるかもしれません。

pod 指示子を、コードの一部を手っ取り早くコメントアウトするために 使うこともできます。

Plain Old Comments (Not!)

C のプリプロセッサと同じように、Perl は行指示子を処理できます。 これを使うことによって、エラーメッセージや警告メッセージにある ファイル名や行番号を制御することができます (特に、eval() で処理される文字列のために)。 この仕組みの構文は C のプリプロセッサとほとんど同じで、正規表現:

    # example: '# line 42 "new_filename.plx"'
    /^\#   \s*
      line \s+ (\d+)   \s*
      (?:\s("?)([^"]+)\2)? \s*
     $/x

にマッチしたものの $1 が次の行の行番号となり、省略することもできる $3 は(クォートありかなしで指定された)ファイル名となります。

行指示子にはかなり明らかな技があります。 デバッガとプロファイラは、与えられたファイルの特定の行番号に対して現れた 最新のソース行のみを表示します。 あとでデバッグしたいコードでは行番号の衝突が起きないように注意するべきです。

コマンドシェルでタイプすることのできる例をいくつか挙げます:

    % perl
    # line 200 "bzzzt"
    # the `#' on the previous line must be the first char on line
    die 'foo';
    __END__
    foo at bzzzt line 201.

    % perl
    # line 200 "bzzzt"
    eval qq[\n#line 2001 ""\ndie 'foo']; print $@;
    __END__
    foo at - line 2001.

    % perl
    eval qq[\n#line 200 "foo bar"\ndie 'foo']; print $@;
    __END__
    foo at foo bar line 200.

    % perl
    # line 345 "goop"
    eval "\n#line " . __LINE__ . ' "' . __FILE__ ."\"\ndie 'foo'";
    print $@;
    __END__
    foo at goop line 345.