如何理解Perl语言中的Glob

时间:2022-08-22 03:54:51

PerlGLOB入门

作者:Achilles Xu

本文假设你对Perl引用已经有所了解。

关于Perl glob,笔者建议阅读《Advanced Perl Programming》第一版的第三章和第二版的第一章。本文是笔者经过阅读以上内容并经过一些实践后完成的。

我们都知道Perl的引用类似C语言的指针。

C指针:
int a = 1;
int* pa;
pa = &a;
Perl引用:
my $a = 3;
my $ra = /$a;

引用都可以简单地看成是存储了变量的地址:

$a $ra
3 变量$a的地址

在各种语言里,都有符号表(Symbol Table)的概念。符号表存储着各种作用域里的符号(Symbol)。这里说的Symbol是指我们编程时用到的各种名称,包括变量名、函数名等。比如上面的“a”、“pa”、“ra”等都是symbol。看下面的代码:

my $a = "sdd";
my $b = 34;
my @b = (2,3);
my %b = (name => 'me', age => 28);
sub b {
print "hello/n";
}

产生的符号表:

... ...
symbol a 变量$a的地址
... ...
symbol b $b的地址 @b的地址 %b的地址 函数b的地址
... ...

可以看到symbol b里存放了好几个变量和函数的引用。在Perl里,symbol也可以被叫做glob。symbol b和symbal a可以分别用*b和*a表示。

glob的一个基本应用是alias(别名):

$a = 10;
*b = *a;
print $b . "/n";
$b = 20;
print $a . "/n";

运行结果:

10
20

符号表:

... ...
*a /$a
... ...
*b /$a
... ...

通过将引用赋给glob可以实现部分别名:

$a = 6;
@a = (1,2);
@b = (5,6);
print $a . "/n";
*b = /$a;
$b = 7;
print $a . "/n";

输出:

6
7

符号表:

... ...
*a /$a /@a
... ...
*b /$a /@b
... ...

可以看到,只是标量一样了,数组还是各自的。

还可以用于参数传递:

sub change {
*b = shift;
$b = "cc";
}
$a = "tt";
print $a . "/n";
change(*a);
print $a . "/n";

运行结果:

tt
cc

据说通过glob传递参数要比传引用快很多。

不同的作用域有不同的符号表:函数拥有自己的符号表,各个包也有自己的符号表。注意!词法变量(lexical variable,用my关键字声明的变量)不收入符号表。同时,也不能用my关键字来声明glob。my关键字只用来声明词法变量,glob不是词法变量。

《Advance Perl Programming》第二版里说:可以把glob看成一个很有限的hash,他只有几个key:SCALAR、ARRAY、HASH, IO, CODE, FORMAT和GLOB(笔者注:保存GLOB引用),另外还有两个key:PACKAGE和NAME(笔者注:仅做自省用)。比如一个glob:a,*a{SCALAR}就相当于/$a,*a{HASH}就相当于/%a等等。

$a = 234;
print $a . "/n";
${*a{SCALAR}} = 345;
print $a . "/n";

输出:

234
345

GLOB是Perl中几个比较难的概念之一。在Perl的核心库里,处处用到各种高深的glob技术。比如Exporter、AUTOLOAD、CORE等。虽然一般编程不需要用到特别深入的技术。如果能多了解一些,对于我们编程还是会大有益处的。