NAME

perlsub - Perl のサブルーチン

SYNOPSIS

サブルーチンを宣言するには:

    sub NAME;                     # "先行" 宣言
    sub NAME(PROTO);              #  同上。ただしプロトタイプ付き
    sub NAME : ATTRS;             #  属性付き
    sub NAME(PROTO) : ATTRS;      #  属性とプロトタイプ付き

    sub NAME BLOCK                # 宣言と定義
    sub NAME(PROTO) BLOCK         #  同上。ただしプロトタイプ付き
    sub NAME : ATTRS BLOCK        #  属性付き
    sub NAME(PROTO) : ATTRS BLOCK #  プロトタイプと属性付き

実行時に無名サブルーチンを定義するには:

    $subref = sub BLOCK;                 # プロトタイプなし
    $subref = sub (PROTO) BLOCK;         # プロトタイプ付き
    $subref = sub : ATTRS BLOCK;         # 属性付き
    $subref = sub (PROTO) : ATTRS BLOCK; # プロトタイプと属性付き

サブルーチンをインポートするには:

    use MODULE qw(NAME1 NAME2 NAME3);

サブルーチンを呼び出すには:

    NAME(LIST);    # かっこが付いているときは & は省略可能。
    NAME LIST;     # 予め宣言/インポートされているならかっこは省略可能。
    &NAME(LIST);   # プロトタイプを回避する。
    &NAME;         # 呼び出されたサブルーチンから現在の @_ を可視化する。

DESCRIPTION

多くの言語と同様、Perl はユーザー定義のサブルーチンを提供しています。これらのサブルーチンは、メインプログラムのどこにでも置くことができ、 do, require, use といったキーワードを使って他のファイルからロードすることができ、eval や無名サブルーチンを使って生成することもできます。サブルーチンの名前や、コードリファレンスを保持する変数を使って間接的に関数を呼び出すことも可能です。

Perl での関数呼び出しと戻り値のモデルは単純です。全ての関数は引数を、平坦で一つのスカラのリストで受け取り、同様に全ての関数は呼び出し元に対して平坦で一つのスカラのりストで返すというものです。これらの呼び出しリストと戻り値リストにある全ての配列とハッシュは、潰されてそのアイデンティティを失います。しかし、これを避けるために常にリファレンスで渡すことができます。呼び出しリストと戻り値リストの両方とも好きなだけの数のスカラを保持することができます(明確な return 文のない関数はしばしばサブルーチンと呼ばれますが、Perl の定義上はこれらの間に何の違いもありません)。

ルーチンに渡されるすべての引数は配列 @_ に置かれます。したがって、ある関数を二つの引数を付けて呼び出したならば、その引数は $_[0] と $_[1] に格納されます。配列 @_ は local 配列ですが、その要素は実際のスカラパラメータの別名です。たとえば $_[0] が更新された場合、対応する引数が更新されます (更新できない場合にはエラーとなります)。引数が、配列やハッシュの(関数が呼び出された時点では存在してない) 要素であった場合、その要素は(対応する別名が)修正されたりリファレンスが取られたときにのみ作成されます(以前の一部のバージョンの Perl では、この要素は代入が行われようが行われまいが作成されていました)。配列 @_ 全体に対する代入は別名を破棄し、何の引数も更新しません。

サブルーチンから脱出するために使われた return 文が使われることもありますし、サブルーチン呼び出しのコンテキストによって適切なコンテキスト(リスト、スカラ、無効)で評価される戻り値の指定を省略する事が可能です。もし何の戻り値も指定しなければ、サブルーチンはリストコンテキストにおいては空リストを返し、スカラコンテキストにおいては未定義値を返し、無効コンテキストではなにも返しません。

return がなく、最後の文が式だった場合、その値が返されます。最後の文が foreach や while のようなループ制御構造だった場合、返される値は不定です。空のサブルーチンは空リストを返します。

Perlは名前付き仮引数を持っていません。 my() にこれらのリストを代入することで行えます。プライベートであると宣言されずに使われている変数は全てグローバル変数です。プライベート変数に関する詳細は"Private Variables via my()" と "Temporary Values via local()" を参照してください。パッケージで(おそらくはファイルでも)分けられている関数のセットのための保護された環境を作るには "Packages" in perlmod を参照してください。

例:

    sub max {
        my $max = shift(@_);
        foreach $foo (@_) {
            $max = $foo if $max < $foo;
        }
        return $max;
    }
    $bestday = max($mon,$tue,$wed,$thu,$fri);

例:

    # 行を取り、空白で始まる継続行を連結します

    sub get_line {
        $thisline = $lookahead;  # global variables!
        LINE: while (defined($lookahead = <STDIN>)) {
            if ($lookahead =~ /^[ \t]/) {
                $thisline .= $lookahead;
            }
            else {
                last LINE;
            }
        }
        return $thisline;
    }

    $lookahead = <STDIN>;       # get first line
    while (defined($line = get_line())) {
        ...
    }

引数に名前を付けるためにプライベート変数のリストに代入する:

    sub maybeset {
        my($key, $value) = @_;
        $Foo{$key} = $value unless $Foo{$key};
    }

これは、参照渡しを値渡しにする効果もあります。なぜなら、値のコピーを代入しているからです。このようにしないのであれば、関数は自由に @_ の値をその場で書き換えることができ、それはそのまま呼び出し側の値を変更します。

    upcase_in($v1, $v2);  # this changes $v1 and $v2
    sub upcase_in {
        for (@_) { tr/a-z/A-Z/ }
    }

もちろん、このやり方で定数を変更することは許されません。ある引数が実際にはリテラルであった場合にその引数を変更しようとすると、 (おそらくは致命的な)例外が引き起こされることになるでしょう。例えば次の例はうまく働きません。

    upcase_in("frederick");

upcase_in() 関数を安全なものにするには、パラメータそのものを書き換えるのではなくそのコピーを返すように記述するようにします:

    ($v3, $v4) = upcase($v1, $v2);  # this doesn't change $v1 and $v2
    sub upcase {
        return unless defined wantarray;  # void context, do nothing
        my @parms = @_;
        for (@parms) { tr/a-z/A-Z/ }
        return wantarray ? @parms : $parms[0];
    }

この(プロトタイプがついていない)関数が自分に対して本当のスカラが渡されたのか配列が渡されたのかを気にしていないということに注意してください。 Perl は一つの巨大な平坦な(リストの中にリストが含まれることはない、ということ) @_ パラメータリストとして全ての引数を見るのです。これは Perl の単純な引数渡しの形式のやり方の一つです。この upcase() 関数は、以下のような呼び出しをした場合でも upcase() の定義を変更することなく完璧に動作します:

    @newlist   = upcase(@list1, @list2);
    @newlist   = upcase( split /:/, $var );

ただし、以下のような呼び出しをやろうとしてはいけません:

    (@a, @b)   = upcase(@list1, @list2);

関数に渡される引数リストは平坦なリストであるのと同様、戻り値のリストもまた平坦なリストです。ですから、関数が返した全ての要素は @a に格納され、@b は空になります。別のやり方については "Pass by Reference" を参照してください。

サブルーチンは、明示的な & というプリフィックスを付けて呼び出すことができます。最近の Perl では & は省略可能であり、サブルーチンがあらかじめ宣言されている場合には括弧も省略できます。 defined() や undef() の引数として使ったような、単なる名前付きサブルーチンであるときの & は 省略可能ではありません。 &$subref() や &{$subref}() のような、サブルーチンの名前やリファレンスを使った間接的なサブルーン呼び出しを行いたいたいときにも & は省略することはできません。但し$subref->() の記法が問題を解決します。詳しくは perlref を参照してください。

サブルーチンは再帰的に呼び出すこともできます。あるサブルーチンが & 付きで呼び出されたなら、引数リストは省略可能で、もし省略されたなら、そのサブルーチンに対して @_ 配列は設定されません: 代わりに呼び出し時の @_ 配列がサブルーチンに対して可視となります。これは新しいユーザーが避けたいと思う効果的なメカニズムです。

    &foo(1,2,3);        # 三つの引数を渡す
    foo(1,2,3);         # 上と同じ

    foo();              # 空リストを渡す
    &foo();             # 上と同じ

    &foo;               # foo() は foo(@_) と同様現在の引数を取る!!
    foo;                # サブルーチン foo が予め定義されている場合に限り
                        # foo() と同様、それ以外では "foo"

& 形式は引数リストを省略可能にするばかりでなく、与えられた引数に対するすべてのプロトタイプチェックも無効にします。これは一部には歴史的な理由であり、一部にはあなたが自分の行っている動作をわかっているときにうまくごまかしを行う便利な方法を残しておくためです。後に出てくる Prototypes を参照してください。

名前が全て大文字であるサブルーチンは、名前が全て小文字のモジュール名が (訳注: pragma 用として) 予約されているのと同じように Perl のコアで予約されています。実行時にシステム自身によって (通常はイベントをトリガーとして) 間接的に呼び出されるサブルーチンは、名前を全て大文字で書くのがしきたりです。特殊で、あらかじめ決められていることをするサブルーチンは、 AUTOLOAD, CLONE, DESTROY に、perltie と PerlIO::via で説明されている関数全てを加えたものです。

The BEGIN, UNITCHECK, CHECK, INIT, END サブルーチンはサブルーチンというよりは特殊コードブロックで、その中でも一つのパッケージに複数作ることができ、明示的には 呼び出せません 。 "BEGIN, UNITCHECK, CHECK, INIT and END" in perlmod を参照してください。

my() によるプライベート変数

概要:

    my $foo;            # declare $foo lexically local
    my (@wid, %get);    # declare list of variables local
    my $foo = "flurp";  # declare $foo lexical, and init it
    my @oof = @bar;     # declare @oof lexical, and init it
    my $x : Foo = $y;   # similar, with an attribute applied

警告: my 定義での属性リストの使用はいまだ改良の途中です。現在の文法とインターフェースは変更される可能性があります。 attributes と Attribute::Handlers を参照してください。

my 演算子は、それを囲んでいるブロック、条件文 (if/unless/elsif/else)、ループ(for/foreach/while/until/continue)、サブルーチン、eval、あるいは do/require/use されたファイルにレキシカルに閉じ込められる変数を定義します。二つ以上リストアップされている場合には、そのリストは括弧でくくられていなければなりません。すべてのリスト要素は正しい左辺値でなければなりません。 $/ のような組み込み変数が現時点では local で 局所化 されなければならないのに対し、アルファベットと数字による識別子はレキシカルでマジカルなスコープになります。

local 文によって生成される動的変数とは異なり、my を使って宣言されたレキシカル変数はそれを呼び出したサブルーチンも含め、外側の世界からは秘匿されます。自分自身が同じサブルーチンを呼んだ場合でさえそうです。個々の呼び出しはそれぞれのコピーを所有します。

このことは静的に閉じているレキシカルスコープで宣言されている my 変数が見えなくなるということは意味しません。動的変数だけが切り取られます。例を挙げると、以下の bumpx() はレキシカル変数 $x にアクセスします。なぜなら、my と sub の両方が同じスコープに現れているからです。

    my $x = 10;
    sub bumpx { $x++ }

しかしながら eval() は、eval() 自身の内側にある宣言によって隠されない名前の寿命と同じ長さを持つスコープのレキシカル変数を見ることができます。 perlref を参照してください。

my() に対するパラーメータリストには、お望みとあらば変数を初期化するための代入を行うことができます(変数に対して初期値が与えられなければ、その変数は未定義値を使って生成されます)。一般的にこの機能はサブルーチンに対する入力パラメータに名前を付けるために使われています。例を挙げましょう:

    $arg = "fred";        # "global" variable
    $n = cube_root(27);
    print "$arg thinks the root is $n\n";

fred thinks the root is 3

    sub cube_root {
        my $arg = shift;  # name doesn't matter
        $arg **= 1/3;
        return $arg;
    }

my は、あなたが代入を行いたいと考えている何かに対する修飾子です。ですから、引数リストの中にある変数に対して代入を行うときには my はそれらの変数がスカラとして見えているのか配列として見えているかという状態を変えることはありません。ですから、

    my ($foo) = <STDIN>;                # WRONG?
    my @FOO = <STDIN>;

これらは両方とも右辺に対してリストコンテキストを与えます。それに対して

    my $foo = <STDIN>;

これはスカラコンテキストを与えます。しかし、以下のような宣言を行った場合、一つの変数だけが有効です:

    my $foo, $bar = 1;                  # WRONG

これは以下のように書いたのと同じことになります

    my $foo;
    $bar = 1;

宣言された変数は、その文が終了するまでは導入されません(不可視の状態です)。したがって、

    my $x = $x;

これは古い $x の値を使って新しい $x を初期化するのに使うことができます。そして

    my $x = 123 and $x == 123

これは古い $x の値がたまたま 123 でない限り、新しい $x には偽が設定されます。

制御構文のレキシカルスコープは、その制御ブロックを区切る中かっこによって厳格に束縛されることはありません; 制御式もまた、スコープの一部です。ですから以下のループでは

    while (my $line = <>) {
        $line = lc $line;
    } continue {
        print $line;
    }

$line のスコープはその宣言から(continueブロックを含む)ループ構造の残りの部分まで拡張されますが、それを越えることはありません。同様に、以下の条件文では

    if ((my $answer = <STDIN>) =~ /^yes$/i) {
        user_agrees();
    } elsif ($answer =~ /^no$/i) {
        user_disagrees();
    } else {
        chomp $answer;
        die "'$answer' is neither 'yes' nor 'no'";
    }

$answer のスコープはその宣言から条件文の elsif と else ブロックを含む残りの部分まで拡張されますが、それを越えることはありません。修飾子付きの文での変数のスコープに関する情報については "Simple statements" in perlsyn を参照してください。

foreach はその添え字変数に対するスコープをデフォルトでは local のやり方で動的なものにしています。しかしながら、添え字変数に my というキーワードが前置されていた場合、または現在のスコープでその名前がすでにレキシカルである場合には、新しいレキシカル変数が代わりに作られます。ですから以下のループでは:

    for my $i (1, 2, 3) {
        some_function();
    }

$i のスコープはループの終端まで拡張されますが、それを越えることはないので、 $i の値は some_function() の中では参照することができなくなります。

ユーザーの一部には、レキシカルなスコープの変数の使用を奨励することを望んでいる人もいるでしょう。常にグローバルであるパッケージ変数に対する暗黙の使用を捕捉することを助けるものとして、

    use strict 'vars';

のようにすると、この文からそれを囲むブロックの終端までの間の変数の参照は、レキシカル変数に対する参照か、our または use vars による事前宣言か、さもなければ完全なパッケージ名で修飾した名前でなければなりません。それ以外のものがあるとコンパイルエラーが発生します。これの対象となっているブロックの内側にあるブロックで no strict 'vars' とすると(内側のブロック中では)この制限を取り消すことができます。

my はコンパイル時の効果と実行時の効果の両方を持っています。コンパイル時においては、コンパイラはその変数を認識します。これの基本的な実用性は use strict 'vars' を黙らせるということですが、 perlref で詳細を記述しているクロージャの作成にも有用です。実際の初期化は実行時まで遅らされ、そのためたとえばループを通る度に適切に実行されるのです。

my によって宣言された変数はどのパッケージの一部でもなく、そのためパッケージ名を使って修飾されることは決してありません。特に、パッケージ変数(もしくはその他のグローバルな変数)をレキシカルにしようとすることは許されていません。

    my $pack::var;      # ERROR!  Illegal syntax

実際のところ、動的変数(パッケージ変数やグローバル変数として知られているもの)は、同じ名前を持ったレキシカルが可視な状態であったとしても、 :: 記法を使った(名前の)完全な修飾を行うことによってまだアクセス可能なのです:

    package main;
    local $x = 10;
    my    $x = 20;
    print "$x and $::x\n";

この例は 20 と 10 を出力します。

このファイルの外側の世界からこのような識別子を隠すために、my 変数をファイルの最も外側のスコープで宣言することができます。これは、概念としては C でのファイルレベルの static 変数と似ています。これをサブルーチンの内側で行うには、クロージャ(レキシカルアクセスを伴った無名関数)を使います。ブロックで外側のブロックから呼び出すことのできないようなプライベートなサブルーチンを作りたいなら、無名サブルーチンのリファレンスを保持するレキシカル変数を宣言することができます:

    my $secret_version = '1.001-beta';
    my $secret_sub = sub { print $secret_version };
    &$secret_sub();

このリファレンスが決して、モジュールの内側にあるどんな関数からも返されることがないのと同様に、外側のモジュールはサブルーチンを見ることができません。なぜなら、その名前はどのパッケージのシンボルテーブルにも存在していないからです。 $some_pack::secret_version などの手段を使って呼び出すことは できない のだということを思い出してください。これは単なる $secret_version であって、修飾されることはなく修飾することはできません。

しかしこれはオブジェクトメソッドと共に動作させることはできません。全てのオブジェクトメソッドは、発見可能な何らかのパッケージのシンボルテーブルに存在している必要があります。これを回避する方法については "Function Templates" in perlref を参照してください。

永続的なプライベート変数

Perl 5.10 で永続的プライベート変数を構築するには二つの方法があります。一つ目は単に state 機能を使うことです。あるいは、5.10 よりも古いリリースとの互換性を維持したいなら、クロージャを使うことです。

state() による永続変数

perl 5.9.4 から、my の代わりに state キーワードを使って変数を宣言できます。しかし、これを働かせるには、feature プラグマを使うか、一行野郎では -E を使うことで予めこの機能を有効にしなければなりません。 (feature を参照してください)

例えば、以下のコードはプライベートなカウンタを管理し、gimme_another() 関数が呼び出されるたびにカウンタを増加させます:

    use feature 'state';
    sub gimme_another { state $x; return ++$x }

また、$x はレキシカルなので、その外側の Perl コードからアクセスすることはできません。

変数宣言と結び付けられたとき、(state $x = 42 のような)state 変数への単純なスカラ代入は一度目だけ実行されます。その後再びこの文が評価されても、代入は無視されます。非スカラ変数へのこの種の代入の振る舞いは未定義です。

クロージャによる永続変数

レキシカル変数はそれを囲むブロック、eval、do FILE に属するレキシカル(もしくは静的)スコープに属します。このことは C の static と同様に動作するということを意味しません。通常は C の auto と同じように動作しますが、暗黙のガベージコレクションを伴っています。

C や C++ におけるローカル変数とは異なり、Perl のレキシカル変数は単にそのスコープから抜けたからという理由で、必ずしもリサイクルされません。何かもっと永続的なものがそのレキシカル変数に関してまだ気付いていれば、それは留まるでしょう。何か他のものがレキシカル変数を参照していれば、そのレキシカル変数は解放されません -- そしてそうあるべきです。あなたはそれを使いおわるまではメモリを解放したいとは思わないでしょうし、使い終わったものを保持し続けたいとも思わないでしょう。あなたのために自動ガベージコレクションがこれを行います。

これはつまり、レキシカル変数に対するリファレンスを返したり保存したりすることができるということです。一方 C の auto 変数に対するポインタを返すことはエラーとなります。レキシカル変数はまた、C の関数に static な変数のシミュレートも行います。以下の例はレキシカルスコープを持つと同時に static な寿命を持つ関数にプライベートな変数です。 C の static 変数のようなものを作りたいというのであれば、関数全体をさらにブロックで囲んでやり、static 変数をブロックの内側で、かつ関数の外側の場所においてやります。

    {
        my $secret_val = 0;
        sub gimme_another {
            return ++$secret_val;
        }
    }
    # $secret_val now becomes unreachable by the outside
    # world, but retains its value between calls to gimme_another

この関数が require や use を通じて別の独立したファイルから取り込まれた場合、これはとても役に立つことでしょう。もしこれがすべてメインプログラムの中にあるのであれば、ブロック全体をメインプログラムの前に置くか、(こちらか好ましいやり方ですが) プログラムが実行されるよりも前に実行されることが保証されている BEGIN コードブロックの中に置くようにして、my を早めに実行するように変更する必要があるでしょう:

    BEGIN {
        my $secret_val = 0;
        sub gimme_another {
            return ++$secret_val;
        }
    }

特別なトリガーコードブロックである BEGIN, CHECK, INIT, END については "BEGIN, UNITCHECK, CHECK, INIT and END" in perlmod を参照してください。

最も外側のスコープ(ファイルスコープ)で宣言されたのであれば、レキシカル変数は C のファイルに static なものと同じように振る舞います。同じファイルの、宣言の後にある全ての関数から参照可能でありますが、そのファイルの外側から参照することはできません。この戦略はモジュールの中でモジュール全体から見えるプライベートな変数を作るために使われます。

local() を使った一時的な値

警告: 一般的には、local ではなくmy を使うべきです。なぜなら、そちらのほうが早く、安全だからです。この例外には、グローバルな句読点変数(punctuation variable)、グローバルファイルハンドル、フォーマット、そして Perl のシンボルテーブル自身に対する直接の操作が含まれます。 local はほとんどの場合、変数の現在の値が呼び出されたサブルーチンに対して可視にしなければならない場合に使われます。

Synopsis:

    # 値のローカル化

    local $foo;                 # $foo を動的にローカルにする
    local (@wid, %get);         # 変数のリストをローカルにする
    local $foo = "flurp";       # $foo を動的にして、初期化する
    local @oof = @bar;          # @oof を動的にして、初期化する

    local $hash{key} = "val";   # このハッシュエントリにローカルな値を入れる
    local ($cond ? $v1 : $v2);  # いくつかの種類の左辺値はローカル化に
                                # 対応している

    # シンボルのローカル化

    local *FH;                  # $FH, @FH, %FH, &FH ... をローカル化
    local *merlyn = *randal;    # ここで $merlyn は実際には $randal、さらに
                                #        @merlyn は実際には @randal、など
    local *merlyn = 'randal';   # 「同様」: 'randal' を *randal にする
    local *merlyn = \$randal;   # 単に $merlyn の別名で @merlyn などではない

local は、引数に取ったそのリスト中の変数を(local() を囲む)ブロック (あるいは、サブルーチン, eval、do FILE)と、そのブロック中で呼び出された全てのもの にローカルなものにします。 local は単にグローバル変数(やパッケージ変数)に一時的な値を与えるだけです。これは動的スコープとして知られています。レキシカルスコープは my を使って行われ、これは C の自動変数宣言のように働きます。

いくつかの種類の左辺値もローカル化できます : ハッシュと配列の要素とスライス、条件文(その結果が常にローカル化可能なもの)、シンボリックリファレンス。単純変数に関しては、これは新しく、動的スコープを持つ値を作ります。

local に対して二つ以上の変数や表現を与えるのならば、それらの変数は括弧でくくっておかなければなりません。この演算子は引数リストにある変数のカレントの値を隠れたスタックに保存し、ブロックやサブルーチン、eval から抜けるときにその値を復帰することによって動作しています。これはつまり、呼び出されたサブルーチンからもローカル変数を参照することができるけれども、グローバルなものを見ることはできないということです。引数リストには、好みに応じてリスト中のローカル変数を初期化するための代入を行うことができます(ある特定の変数に対して初期値が与えられなかった場合には、その変数は未定義値を伴って生成されます)。

local は実行時演算子なので、ループで通る度に実行されます。現在の Perl はメモリの使用に関して改善されていますが、結果として、ループの外側で変数を宣言したほうがより効率が良いのです。

local() の文法的注意

local は左辺値に対する単なる修飾子です。局所化された変数に代入を行ったとき、local はそのリストがスカラとして見えているのか配列として見えているかということを変えることはありません。ですから、

    local($foo) = <STDIN>;
    local @FOO = <STDIN>;

これらの両方ともが右辺をリストコンテキストにするのに対して、

    local $foo = <STDIN>;

これはスカラコンテキストを与えます.

特殊変数のローカル化

特殊変数をローカル化すると、それに新しい値を入れられますが、特殊機能はなくなりません。これは、その特殊機能に関係する全ての副作用はローカル化された値に対しても働くということを意味します。

この機能は以下のようなコードが動作するようにします:

    # Read the whole contents of FILE in $slurp
    { local $/ = undef; $slurp = <FILE>; }

しかし、これはいくつかの値のローカル化を制限することに注意してください; 例えば、以下の文は、perl 5.9.0 からは、 Modification of a read-only value attempted というエラーで die します; なぜなら $1 変数はマジカルで読み込み専用だからです:

    local $1 = 2;

同様ですが、ある意味ではより見分けにくいですが、以下のコード片は perl 5.9.0 では die します:

    sub f { local $_ = "foo"; print }
    for ($1) {
        # now $_ is aliased to $1, thus is magic and readonly
        f();
    }

この状況への代替案については次の節を参照してください。

警告: tie された配列とハッシュのローカル化は現在のところ記述されたとおりに動作しません。これは Perl の将来のリリースで修正されます; 当面の間は、tie された配列やハッシュのローカル化によるどのような振る舞いにも依存しないようなコードにしてください (個々の要素のローカル化は問題ありません)。さらなる詳細については "Localising Tied Arrays and Hashes Is Broken" in perl58delta を参照してください。

グロブのローカル化

以下のような構造は

    local *name;

現在のパッケージでグロブ name のための完全に新しいシンボルテーブルエントリを作成します。これは、このグロブスロットに入る全ての変数 ($name, @name, %name, &name, name ファイルハンドル) は動的にリセットされることを意味します。

これは特に、最終的にこれらの変数によってもたらされるマジックは局所的には失われることを意味します。言い換えると、local */ としても、入力レコードセパレータの内部の値には何の影響も与えないということです。

とりわけ、もしデフォルトスカラ $_ の新しい値で作業をしたいけれども、上述した、$_ が以前運んでいたマジカルな値に関する潜在的な問題を避けたいなら、 local $_ ではなく local *_ を使うべきです。 perl 5.9.1 以降、(my $_ とすることで) レキシカルな $_ を使うこともでき、これによってこの問題を完全に回避できます。

複合型の要素のローカル化

合成型のメンバー(たとえば配列やハッシュの要素)の局所化したときにどうなるかを説明しましょう。この場合、その要素は 名前によって 局所化が行われます。これはつまり、local のスコープが終わったときに、local で名前が使われていたキーを持つハッシュの要素と local で名前が使われていた配列要素に関して保存されていた値を復帰するということです。 local() が効果を持っているところでそういった要素が削除された場合 (例えばハッシュに対して delete() を使うとか配列に対して shift()を使う)に、local() の有効範囲を抜けたところで削除された要素が復活し、配列の拡張と拡張した分の要素の値を undef にするということを行います。例えば以下のような場合、

    %hash = ( 'This' => 'is', 'a' => 'test' );
    @ary  = ( 0..5 );
    {
         local($ary[5]) = 6;
         local($hash{'a'}) = 'drill';
         while (my $e = pop(@ary)) {
             print "$e . . .\n";
             last unless $e > 3;
         }
         if (@ary) {
             $hash{'only a'} = 'test';
             delete $hash{'a'};
         }
    }
    print join(' ', map { "$_ $hash{$_}" } sort keys %hash),".\n";
    print "The array has ",scalar(@ary)," elements: ",
          join(', ', map { defined $_ ? $_ : 'undef' } @ary),"\n";

Perl は以下のような出力をします。

    6 . . .
    4 . . .
    3 . . .
    This is a test only a test.
    The array has 6 elements: 0, 1, 2, undef, undef, 5

複合型の存在していないメンバーに対する local() の振る舞いは将来変更される予定です。

左辺値サブルーチン

警告: 左辺値サブルーチンは未だ実験的機能であり、将来のバージョンの Perl では実装が変更されるかもしれません。

サブルーチンから、変更可能な値を返すことが可能です。そうするためには、サブルーチンが左辺値を返すように宣言しなければなりません。

    my $val;
    sub canmod : lvalue {
        # return $val; this doesn't work, don't say "return"
        $val;
    }
    sub nomod {
        $val;
    }

    canmod() = 5;   # assigns to $val
    nomod()  = 5;   # ERROR

サブルーチンと、代入の右側のスカラ/リストコンテキストはサブルーチン呼び出しがスカラに置き換えられたかのようにして決定されます。例として、以下を考えると:

    data(2,3) = get_data(3,4);

両方のサブルーチンはスカラコンテキストで呼び出され、一方:

    (data(2,3)) = get_data(3,4);

及び:

    (data(2),data(3)) = get_data(3,4);

については全てのサブルーチンはリストコンテキストで呼び出されます。

Lvalue subroutines are EXPERIMENTAL

これは便利なようですが、慎重になるべきいくつかの理由があります。

return キーワードは使えず、サブルーチンスコープから抜ける前に値を渡さなければなりません。 (上述の例のコメントを参照してください)。これは普通は問題になりませんが、深くネストしたループから明示的に return で脱出するのは、時々よい方法となりますが、出来なくなります。

これはカプセル化に違反しています。通常の mutator は、自身が保護している属性にセットする前に引数をチェックできますが、左辺値サブルーチンにはその機会はありません。以下を考えてみてください;

    my $some_array_ref = [];    # protected by mutators ??

    sub set_arr {               # normal mutator
        my $val = shift;
        die("expected array, you supplied ", ref $val)
           unless ref $val eq 'ARRAY';
        $some_array_ref = $val;
    }
    sub set_arr_lv : lvalue {   # lvalue mutator
        $some_array_ref;
    }

    # set_arr_lv cannot stop this !
    set_arr_lv() = { a => 1 };

シンボルテーブルのエントリを渡す(型グロブ)

警告: このセクションで説明されている仕組みは、古いバージョンの Perl において参照渡しをシミュレートするための唯一の方法でした。これは現在でも使うことができるのですが、新しいリファレンスの仕組みはこれをより簡単に行います。後の説明を参照してください。

サブルーチンが渡された配列のローカルなコピーではなくてグローバルなものの変更ができるように、サブルーチンに対して配列の値ではなく配列の名前を渡したくなることもあるでしょう。 perl においては、これを *foo のようにアスタリスクを使って行うことができます。これは前に置かれたアスタリスクが変数やサブルーチンなどに対して使われる前置キャラクター全てにマッチするワイルドカードとしてみなすことができるので、“型グロブ”としてよく知られています。

型グロブは評価されたときにその名前を持つ全てのオブジェクト(ファイルハンドル、フォーマット、サブルーチンも含まれます)を表すスカラ値を生成します。代入が行われたとき、* は代入したものを反映するようになります。例えば:

    sub doubleary {
        local(*someary) = @_;
        foreach $elem (@someary) {
            $elem *= 2;
        }
    }
    doubleary(*foo);
    doubleary(*bar);

スカラは既に参照渡しされているので、陽に $_[0] などで参照してこの機構を使わなくてもスカラ引数を変更することができます。全ての要素がスカラとして渡された配列の要素はすべて変更することができますが、push、pop、もしくは配列のサイズを変更するためには * 機構(もしくは同等のリファレンス機構)を使う必要があります。これは型グロブ(もしくはリファレンス)を渡すのを確実に高速にするでしょう。

配列の変更を望まないとしても、この機構は単一のリストの中にある複数のリストを渡すのに便利です。なぜなら、通常はリスト機構はすべての配列の値を結合してしまうので独立した配列を取り出すことができないからです。型グロブについては、 "Typeglobs and Filehandles" in perldata も参照してください。

今でも local() を使うとき

my があるにも関らず、今でも local 演算子を使うべき場所が三ヶ所あります。実際にはその三ヶ所においては、my ではなく、必ず local を使わなければなりません。

グローバル変数(特に $_) に関して、一時的な値を与えたいとき。

@ARGV や句読点変数(punctuation variables)のようなグローバル変数では、局所化のために local() を使わなければなりません。以下のブロックは /etc/motd を読み込み、等価記号を使って行の塊を分割し、その結果を @Fields に格納します。
```
    {
        local @ARGV = ("/etc/motd");
        local $/ = undef;
        local $_ = <>;  
        @Fields = split /^\s*=+\s*$/;
    } 
```
特に重要なのは、任意のルーチンの中で $_ を局所化し、それに対して代入することです。 while 文での暗黙的な代入に注意してください。
ローカルなファイルハンドルやディレクトリハンドル、もしくはローカル関数を作成する必要がある場合。

関数に固有のファイルハンドルが必要な関数は、完全な型グロブを使った local() を使わなければなりません。これによって、新しいシンボルテーブルのエントリが作成されます:
```
    sub ioqueue {
        local  (*READER, *WRITER);    # not my!
        pipe    (READER,  WRITER)     or die "pipe: $!";
        return (*READER, *WRITER);
    }
    ($head, $tail) = ioqueue();
```
無名シンボルテーブルを生成する方法については、Symbol モジュールを参照してください。

型グロブに対するリファレンスの代入はエイリアスを生成するので、以下の例では効果的にローカル関数(あるいは少なくともローカルエイリアス)を生成するのに使うことができます。
```
    {
        local *grow = \&shrink; # only until this block exists
        grow();                 # really calls shrink()
        move();                 # if move() grow()s, it shrink()s too
    }
    grow();                     # get the real grow() again
```
こういったやり方で、名前によって関数を操作する方法に関しての詳細は "Function Templates" in perlref を参照してください。
配列やハッシュのある要素だけを一時的に変更したい場合。

一つの要素だけを局所化することが可能です。通常はこれは動的に行われます。
```
    {
        local $SIG{INT} = 'IGNORE';
        funct();                            # uninterruptible
    } 
    # interruptibility automatically restored here
```
しかし、これはレキシカル変数であっても動作します。 5.005 より前のものでは、この操作は間違った状況になる可能性がありました。

参照渡し

もし、配列やハッシュを二つ以上関数に渡したいとか関数から返したいと考えていて、同時にそれらを完全な状態で扱いたいというのであれば、明示的に参照渡しを使う必要があるでしょう。これを行う前に、perlref で説明されているリファレンスを理解する必要があります。このセクションでは改めて説明するようなことはしません。

幾つか単純な例を挙げましょう。まず最初に、ある関数に幾つかの配列を渡し、全ての配列に対して pop を行って引数として受け取った配列のそれぞれの最後の要素からなる新しいリストを返すということを考えてみましょう。

    @tailings = popmany ( \@a, \@b, \@c, \@d );

    sub popmany {
        my $aref;
        my @retlist = ();
        foreach $aref ( @_ ) {
            push @retlist, pop @$aref;
        }
        return @retlist;
    }

以下の例は、引数として渡された全てのハッシュにあるキーのリストを返す関数です:

    @common = inter( \%foo, \%bar, \%joe );
    sub inter {
        my ($k, $href, %seen); # locals
        foreach $href (@_) {
            while ( $k = each %$href ) {
                $seen{$k}++;
            }
        }
        return grep { $seen{$_} == @_ } keys %seen;
    }

とはいうものの、これは通常のリストを返す機構を使っています。ハッシュを渡そうとしたり、ハッシュを返そうとすると何が起きるのでしょうか? そうです、引数の一つだけを使い引数の連結が行われることを気にしなければ通常の呼び出し規約と同じことです。ただし、少々高くつきます。

のように書くのはトラブルのもとです。

    (@a, @b) = func(@c, @d);
or
    (%a, %b) = func(%c, %d);

これらの構文は単純にうまくいきません。戻り値は @aや %aだけにセットされて、@b や %b はクリアされます。それに加え、この関数は引数として二つの配列、二つのハッシュを受け取りません。受け取るのは常に @_ に格納されている(二つの引数の内容が連結された)一つの長いリストなのです。

これをリファレンス経由で扱うように変更できるのであれば、見た目はそれ程良くありませんがプログラムを明確にできます。以下の例は引数として配列のリファレンスを二つ取り、その配列の要素の数によって順序づけられた二つの配列を返す関数です:

    ($aref, $bref) = func(\@c, \@d);
    print "@$aref has more than @$bref\n";
    sub func {
        my ($cref, $dref) = @_;
        if (@$cref > @$dref) {
            return ($cref, $dref);
        } else {
            return ($dref, $cref);
        }
    }

これは以下のように書くこともできます:

    (*a, *b) = func(\@c, \@d);
    print "@a has more than @b\n";
    sub func {
        local (*c, *d) = @_;
        if (@c > @d) {
            return (\@c, \@d);
        } else {
            return (\@d, \@c);
        }
    }

この例では、シンボルテーブルの別名づけをするために型グロブを使っています。しかし、これは微妙なものであり、my 変数を使った場合にはうまくいきません。なぜなら、グローバルなもの(local() で偽装したものを含む)だけがシンボルテーブルにあるからです。

ファイルハンドルを扱おうというのであれば、通常は *STDOUT のような裸の型グロブ(bare typeglob)を使うことができますが、型グロブのリファレンスも動作します。例を挙げましょう:

    splutter(\*STDOUT);
    sub splutter {
        my $fh = shift;
        print $fh "her um well a hmmm\n";
    }

    $rec = get_rec(\*STDIN);
    sub get_rec {
        my $fh = shift;
        return scalar <$fh>;
    }

新しいファイルハンドルを生成することを考えているのであれば、以下のようにできます。リファレンスではなく、生の *FH を渡すことに注意してください。

    sub openit {
        my $path = shift;
        local *FH;
        return open (FH, $path) ? *FH : undef;
    }

プロトタイプ

Perl はとても限られた形のコンパイル時引数チェックに対応しています。以下のように宣言すると:

    sub mypush (\@@)

mypush() は push() が取るのとまったく同じ引数を取ります。関数宣言はコンパイル時に可視でなければなりません。プロトタイプの効果は、関数を & を使わない新しい形式の呼び出しで解釈したときのみです。言い換えれば、組み込み関数と同じように関数を呼び出せば、それは組み込み関数と同じように振る舞う、ということです。古い形式のサブルーチンと同じように呼び出せば、それは古い形式のサブルーチンと同じように振る舞います。 \&foo のようなサブルーチンのリファレンスや &{$subref} のような間接的なサブルーチン呼び出し、$subref->() に関してはプロトタイプはなんの影響も及ぼさないので、この規則から外れます。

メソッド呼び出しはプロトタイプを行う/行わないによる影響を受けません。なぜなら正確な呼び出しコードは、継承に依存しているためにコンパイル時には不確定だからです。

組み込み関数のように動作するサブルーチンをあなたに定義させるのがこの機能の基本的な目的なので、ここで対応した組み込み関数のように解釈される幾つかの関数プロトタイプを挙げておきましょう。

    宣言                  呼び出し

    sub mylink ($$)          mylink $old, $new
    sub myvec ($$$)          myvec $var, $offset, 1
    sub myindex ($$;$)       myindex &getstring, "substr"
    sub mysyswrite ($$$;$)   mysyswrite $buf, 0, length($buf) - $off, $off
    sub myreverse (@)        myreverse $a, $b, $c
    sub myjoin ($@)          myjoin ":", $a, $b, $c
    sub mypop (\@)           mypop @array
    sub mysplice (\@$$@)     mysplice @array, @array, 0, @pushme
    sub mykeys (\%)          mykeys %{$hashref}
    sub myopen (*;$)         myopen HANDLE, $name
    sub mypipe (**)          mypipe READHANDLE, WRITEHANDLE
    sub mygrep (&@)          mygrep { /foo/ } $a, $b, $c
    sub myrand (;$)          myrand 42
    sub mytime ()            mytime

バックスラッシュが付けられたプロトタイプ文字は、実引数がその文字で始まるものでなければならないことを表します。 @_ の一部として渡された引数は、そのサブルーチン呼び出しにおいて与えられた実引数に \ を適用したリファレンスとなります。

\[] 記法を使うことで、複数の引数型を同時にバックスラッシュ指定できます:

    sub myref (\[$@%&*])

というのは以下のように myref() を呼び出すのを許し:

    myref $var
    myref @array
    myref %hash
    myref &sub
    myref *glob

myref() の最初の引数はスカラ、配列、ハッシュ、コード、グロブのいずれかへのリファレンスです。

バックスラッシュが付けられていない文字は特別な意味を持っています。バックスラッシュを付けられていないすべての @ と% は残りの引数全てを取ってしまい、さらにリストコンテキストを強制します。 $ で表される引数はスカラコンテキストを強制されます。第一引数として渡された場合、& は sub キーワードや連続したカンマを要求しないような無名サブルーチンを要求します。

* は、スロットにある裸の単語、定数、スカラ式、型グロブ、型グロブに対するリファレンスを許しています。その値はサブルーチンにとって単純なスカラとすることも型グロブに対するリファレンスにもなります。そのような引数を常に型グロブリファレンスに変換したい場合は、 Symbol::qualify_to_ref() を以下のように使います:

    use Symbol 'qualify_to_ref';

    sub foo (*) {
        my $fh = qualify_to_ref(shift, caller);
        ...
    }

セミコロン (;) は、必須の引数と省略可能な引数とを分割します。 @ や % の前ではこれは冗長です。その他のものを吸収します。

プロトタイプの最後の文字、あるいはセミコロンの直前に、$ の代わりに _ を使えます: 引数が与えられない場合、$_ が代わりに使われます。

上の例の最後の三つのものは、構文解析器が特別扱いするということに注意してください。 mygrep() は本当のリスト演算子として解析され、myrand() は rand() と同じく単項演算子の優先順位を持った真の単項演算子として、そして mytime() は time() と同じ様な引数を取らないものとして解析されます。つまり、

    mytime +2;

とすると、プロトタイプなしの場合にパースされる mytime(2) ではなく、 mytime() + 2 となります。

& に関して興味深いことは、初期位置を使って新しい構文を生成できるということです:

    sub try (&@) {
        my($try,$catch) = @_;
        eval { &$try };
        if ($@) {
            local $_ = $@;
            &$catch;
        }
    }
    sub catch (&) { $_[0] }

    try {
        die "phooey";
    } catch {
        /phooey/ and print "unphooey\n";
    };

これは “unphooey” を出力します。(そう、@_ の可視性に関して解決していないことがあります。現時点ではこれを無視します(ただし、@_ をレキシカルスコープにすれば上記のサブルーチンはクロージャーのように振る舞うことができます... (んー、これってちょーっと Lisp っぽいかな? (気にしないでね))))

以下の例は Perl の grep 演算子のの再実装です:

    sub mygrep (&@) {
        my $code = shift;
        my @result;
        foreach $_ (@_) {
            push(@result, $_) if &$code;
        }
        @result;
    }

一部の人は、完全に英数字を使ったプロトタイプを好むかもしれません。英数字は、将来名前付き仮引数を追加するときのために意図的に使わずに残してあるのです。現時点でのプロトタイプの機構の主な目的はモジュール作者がそのユーザーに対してより良い診断メッセージを提供させるようにするためのものなのです。この記法は Perl プログラマが非常に理解しやすく、モジュールの中身に進入するようなことも読みづらくしたりすることもないと Larry は考えています。回線の雑音は飲み込みやすい小さな丸薬に視覚的に押し込められるのです。

もしプロトタイプに英数字を使おうとすると、オプションの警告 "Illegal character in prototype..." が生成されます。残念ながら、過去のバージョンの Perl では、有効なプロトタイプが前置されてさえいれば、英数字を含むプロトタイプも認められていました。この警告は、目障りなコードの大部分が修正されたなら、将来のバージョンの Perl で致命的エラーに格上げされるかもしれません。

新しい関数にプロトタイプを付けるのがおそらく最善であり、古い関数に対してプロトタイプを付けることはよくありません。なぜなら、(プロトタイプを付けたことによって)リストコンテキストとスカラコンテキストを黙って変えてしまうようなことに関して特に注意しなければならないからです。たとえば以下の例のようなただ一つの引数を取ると決めた関数を考えてみましょう:

    sub func ($) {
        my $n = shift;
        print "you gave me $n\n";
    }

そして、誰かがこの関数をリストを返すような配列や式を引数として渡したとすると:

    func(@foo);
    func( split /:/ );

自動的に scalar が引数の前に(こっそりと)付けられます。これにはいささかびっくりすることになるかもしれません。これまでそうであったような、要素を持った @foo が渡されることはありません。その代わり、func() は 1、つまり @foo の要素の数を得るようになります。そして split はスカラコンテキストで呼び出され、パラメータリスト @_ に落書きを始めてしまいます。あいたた。

もちろんこれは十分強力なものであり、世界をより良い場所にするという目的に限って使用すべきものでしょう。

定数関数

() というプロトタイプを持った関数はインライン展開される可能性を持っています。最適化と定数畳み込み後の結果が一つの定数か、何のリファレンスも持たないレキシカルスコープのスカラであったならば、その関数が & を使わずに呼びされたときに呼び出しのその場に置かれます。 & を使って呼び出された関数は決してインライン展開されることはありません(ほとんどの定数を宣言するための簡単な方法は constant.pm を参照してください)。

以下に挙げた関数は全てインライン展開されるでしょう:

    sub pi ()           { 3.14159 }             # 正確ではないが近い
    sub PI ()           { 4 * atan2 1, 1 }      # 可能な限り良いもの
                                                # そしてこれも展開されます!
    sub ST_DEV ()       { 0 }
    sub ST_INO ()       { 1 }

    sub FLAG_FOO ()     { 1 << 8 }
    sub FLAG_BAR ()     { 1 << 9 }
    sub FLAG_MASK ()    { FLAG_FOO | FLAG_BAR }

    sub OPT_BAZ ()      { not (0x1B58 & FLAG_MASK) }

    sub N () { int(OPT_BAZ) / 3 }

    sub FOO_SET () { 1 if FLAG_MASK & FLAG_FOO }

以下のものはインライン展開されないことに注意してください; より内側にスコープがあるので、畳み込まれた定数が一つの定数に削減できません:

    sub foo_set () { if (FLAG_MASK & FLAG_FOO) { 1 } }

    sub baz_val () {
        if (OPT_BAZ) {
            return 23;
        }
        else {
            return 42;
        }
    }

インライン展開するのに適切であったサブルーチンを再定義すると強制的な警告を受けることになります。 (この警告を、あるサブルーチンが定数サブルーチンとして認識されるかどうかを区別するために使うことができます。) 以前にコンパイルした関数の起動によってこの関数の古い値を使い続けるので、この警告はオプションにするには重大すぎると考えられました。そのサブルーチンを再定義できる必要があるのならば、() プロトタイプをやめる(これは呼び出しのセマンティクスを変えてしまうので注意してください)か、以下の例のようにしてインライン展開機構を働かせないようにしてサブルーチンがインライン展開されていないことを保証する必要があります。

    sub not_inlined () {
        23 if $];
    }

組み込み関数のオーバーライド

多くの組み込み関数はオーバーライドすることができます。ただし、これを行うのは、そうする理由と状況とがあるときのみに限るべきでしょう。これが行われる典型的な例は、非 UNIX システムにおいて欠けている組み込み機能をエミュレートするためにパッケージを使おうとする場合でしょう。

オーバーライドはコンパイル時にモジュールからのみ名前を import できます-- 通常の先行宣言では十分ではありません。しかしながら、use subs プラグマは import 構文を通して先行宣言を行い、さらにそれらの名前が組み込みのものをオーバーライドできるようにします:

    use subs 'chdir', 'chroot', 'chmod', 'chown';
    chdir $somewhere;
    sub chdir { ... }

曖昧さなく組み込みのものを参照するために、特別なパッケージ修飾子 CORE:: を組み込みの名前に前置することができます。たとえば CORE::open() とすると、たとえカレントパッケージが &open() といった別のサブルーチンを import していたとしてもこれは常に組み込み関数の open() を参照します。これは通常の関数呼び出しのように見えますが、そうではありません: \&CORE::open のようにしてリファレンスを得ることは出来ません。

ライブラリモジュールは、open だとか chdir のような組み込みの名前をデフォルトの @EXPORT リストの一部としてexport すべきではありません。なぜなら、ライブラリを使った人の名前空間を汚し、予期しない動作を呼び起こす可能性があるからです。 @EXPORT_OK に名前を追加すれば、ユーザーがその名前を陽に指定すれば import することができ、暗黙の内に import されてしまうことはありません。つまり、

    use Module 'open';

とすると、open() の import を行い、さらにそれのオーバーライドを行いますが、

    use Module;

とした場合にはデフォルトの import を行い、オーバーライドはしません。

組み込みのものに対するオーバーライディングのための機構はインポートを要求したパッケージに制限されています。名前空間に関係なく組み込みの任意のものをオーバーライドしたいと考えたときに使えることもある二番目の方法があります。それは特殊な名前空間 CORE::GLOBAL に対して sub をインポートすることによるものです。以下にちょっとした正規表現を使って glob 演算子を置き換える例を挙げます。

    package REGlob;
    require Exporter;
    @ISA = 'Exporter';
    @EXPORT_OK = 'glob';

    sub import {
        my $pkg = shift;
        return unless @_;
        my $sym = shift;
        my $where = ($sym =~ s/^GLOBAL_// ? 'CORE::GLOBAL' : caller(0));
        $pkg->export($where, $sym, @_);
    }

    sub glob {
        my $pat = shift;
        my @got;
        if (opendir my $d, '.') { 
            @got = grep /$pat/, readdir $d; 
            closedir $d;   
        }
        return @got;
    }
    1;

そして以下は悪い使い方(かもしれない)例です:

    #use REGlob 'GLOBAL_glob';      # override glob() in ALL namespaces
    package Foo;
    use REGlob 'glob';              # override glob() in Foo:: only
    print for <^[a-z_]+\.pm\$>;     # show all pragmatic modules

最初のコメント部分は不自然で、危険ですらある例です。グローバルに glob をオーバーライドすることによって、完全に認識されていなかったりモジュール固有の名前空間との協調を考慮せずに、glob の動作が 全ての 名前空間で強制的に新しい(そして破壊的な)ものになります。こういったことは(それが本当にやらなければいけないこととした上で) 大いに注意したうえで行うべきものです。

前述の REGlob の例は、perl の glob 演算子をオーバーライドするのに必要な全てのことを実装してはいません。組み込みの glob はそれがスカラコンテキストで使われたのかリストコンテキストで使われたのかによって異なる動作をしますが、先程の例の REGlob ではそうなっていません。 perl の組み込みのものの多くがこのようにコンテキストによって違う動作をし、オーバーライドするものを記述する場合にはきちんとそれをサポートしていなければなりません。 glob のオーバーライディングの完全版は、標準ライブラリにある File::DosGlob の実装で勉強してください。

組み込み関数をオーバーライドするとき、オーバーライドした関数は組み込み関数の元の文法(もしあれば)と一貫しているべきです。これは適切なプロトタイプを使うことで達成できます。オーバーライドできる組み込み関数のプロトタイプを得るためには、 "CORE::builtin_name" を引き数として prototype 関数を使ってください ("prototype" in perlfunc を参照してください)。

(system や chomp のように)文法をプロトタイプで表現できない組み込み関数に注意してください。もしこれらをオーバーライドすると、もとの文法を完全に真似ることはできません。

組み込みの do, require, glob もオーバーライドできますが、特別な魔法によって、これらの元の文法は保存され、オーバーライドしたもののためにプロトタイプを定義する必要はありません (しかし、do BLOCK 文法はオーバーライドできません)。

require は特別な追加の黒魔法を持ちます: require をオーバーライドしたものを require Foo::Bar として起動すると、実際には @_ に引き数として "Foo/Bar.pm" を受け取ります。 "require" in perlfunc を参照してください。

そして、以前の例から気付いたかもしれませんが、もし glob をオーバーライドすると、グロブ演算子 <*> もオーバーライドされます。

同様に、readline 関数をオーバーライドすると等価な I/O 演算子である <FILEHANDLE> もオーバーライドします。また、readpipe をオーバーライドすると、演算子 `` と qx// もオーバーライドします。

最後に、いくつかの組み込み関数(exists や grep) はオーバーライドできません。

オートロード

定義されていないサブルーチンを呼び出した場合、通常はそんなサブルーチンはないといった内容のエラーが即座に発生するでしょう(メソッドとして使われているサブルーチンも同様に、メソッドがそのクラスのパッケージのすべての基底クラス中に存在していなかったとき)。しかし、AUTOLOAD サブルーチンがそのパッケージの中で定義されているか元のサブルーチンで使われるパッケージの中で定義されていれば、元のサブルーチンに対して渡されたであろう引数を伴ってその AUTOLOAD サブルーチンが呼び出されます。元のサブルーチンの完全修飾された名前は AUTOLOAD ルーチンと同じパッケージのグローバルな変数 $AUTOLOAD の中に現れます。この名前は通常の引数として渡されることはありません。なぜなら、その、あー、なんというかこれが理由です。 (例外として、存在しない import か unimport メソッドへの呼び出しは単に無視されます。)

多くの AUTOLOAD ルーチンは eval() を使った要求サブルーチンに対する定義でロードされ、AUTOLOAD ルーチンのスタックフレームをトレースなしに消してしまうような特別な形式の goto() を使うサブルーチンを実行します(実例は標準の AutoLoader モジュールのソースを参照してください)。しかし、AUTOLOAD ルーチンはそのようなルーチンの模倣をすることもできて、かつそれを定義しません。たとえば、定義されてない関数があったときに、それを引数として system() を起動するようにさせます。あなたがやろうとしていることはこういうことです:

    sub AUTOLOAD {
        my $program = $AUTOLOAD;
        $program =~ s/.*:://;
        system($program, @_);
    }
    date();
    who('am', 'i');
    ls('-l');

このやり方で呼び出したい関数を先行宣言しておけば、括弧すら必要ではなくなります。

    use subs qw(date who ls);
    date;
    who "am", "i";
    ls '-l';

この例のもっと完全なものが、標準の Shell モジュールです。これは未定義のサブルーチンの呼び出しを外部プログラムの呼び出しとして扱います。

この仕掛けは、モジュール作者がモジュールを自動ロード可能なファイルに分割するのを助けるために使用可能です。 AutoLoader と AutoSplit で説明されている標準の AutoLoader モジュールと、SelfLoader で説明されている標準の SelfLoader モジュール、そして perlxs にある Perl プログラムに C の関数を追加することに関するドキュメントを参照してください。

サブルーチン属性

サブルーチン宣言や定義には、それと結び付けられた属性のリストを持たせることが出来ます。このような属性が合った場合、スペースかコロンを区切りとして分割され、 use attributes があったかのように扱われます。属性が現在対応している詳細については attributes を参照してください。古い use attrs の制限と違って、sub : ATTRLIST の文法は前方宣言でも動作し、サブルーチン定義だけではありません。

属性は単純な識別子名('_' 以外の句読点なし)でなければなりません。パラメータリストを追加するときに、括弧('(',')')のネストが正しいかどうかだけをチェックします。

(属性が不明だとしても)正常な文法の例です:

    sub fnord (&\%) : switch(10,foo(7,3))  :  expensive;
    sub plugh () : Ugly('\(") :Bad;
    sub xyzzy : _5x5 { ... }

不正な文法の例です:

    sub fnord : switch(10,foo(); # ()-string not balanced
    sub snoid : Ugly('(');        # ()-string not balanced
    sub xyzzy : 5x5;              # "5x5" not a valid identifier
    sub plugh : Y2::north;        # "Y2::north" not a simple identifier
    sub snurt : foo + bar;        # "+" not a colon or space

属性リストはサブルーチンと結び付けられたコードに定数文字列のリストとして渡されます。特に、上記の有効な文法の第二の例では、どのようにパースと起動が行われるかという点においては以下のようになります:

    use attributes __PACKAGE__, \&plugh, q[Ugly('\(")], 'Bad';

属性リストとその操作に関するさらなる詳細については、 attributes を参照してください。