PERLFUNC(1) | Podręcznik programisty perla | PERLFUNC(1) |
perlfunc - Wbudowane funkcje perla
Uwaga! To tłumaczenie może być nieaktualne!
Funkcje z tej sekcji mogą służyć pomocą w wyrażeniach. Podpadają one pod dwie główne kategorie: operatory list, oraz nazwane operatory jednoargumentowe. [Przyp. tłum.: w perlu nie ma prawdziwych funkcji, są operatory] Różnią się one w związku priorytetowym przecinkiem. (zobacz tablicę priorytetów na stronie perlop(1).). Operatory list pobierają więcej niż jeden argument, podczas gdy operatory jednoargumentowe, z definicji, nigdy nie biorą więcej niż jeden argument. Tak więc przecinek kończy argument operatora jednoargumentowego, lecz jedynie rozdziela argumenty operatora listy. Ogólnie, operator jednoargumentowy daje swojemu argumentowi kontekst skalarny, podczas gdy operator listowy może dawać zarówno kontekst skalarny, jak i listowy. Jeśli daje obydwa, to argumenty skalarne będą najpierw, a za nimi nastąpią argumenty listowe. (Zauważ, że może istnieć tylko jeden argument listowy.) Np. funkcja splice() ma trzy argumenty skalarne, za którymi następuje lista.
W opisach składni, które są niżej, operatory list, które oczekują listy (i dają kontekst listowy elementom tej listy) są pokazywane z argumentem LISTA. Lista taka może składać się z dowolnej kombinacji argumentów skalarnych lub wartości listowych; wartości listowe będą włączone w listę tak, jakby każdy pojedynczy element był interpolowany w tym punkcie listy, tworząc dłuższą, jednowymiarową wartość listową. Elementy typu LISTA powinny być oddzielone przecinkami.
Każda funkcja z poniższej listy, może być użyta bez, albo z nawiasami wokół swoich argumentów. (Opisy składni pomijają nawiasy.) Jeśli używasz nawiasów, to prosta (lecz czasem zaskakująca) reguła jest taka: WYGLĄDA jak funkcja, więc JEST funkcją i priorytet nie ma znaczenia. W przeciwnym wypadku jest to operator listowy lub operator jednoargumentowy i priorytet się liczy. I biała spacja między funkcją i lewym nawiasem nie liczy się--więc musisz być czasem ostrożny:
print 1+2+4; # Drukuje 7. print(1+2) + 4; # Drukuje 3. print (1+2)+4; # Też drukuje 3! print +(1+2)+4; # Drukuje 7. print ((1+2)+4); # Drukuje 7.Jeśli uruchamiasz perla z przełącznikiem -w, to będziesz o tym ostrzegany. Na przykład trzecia z powyższych linii daje w efekcie:
print (...) interpreted as function at - line 1. Useless use of integer addition in void context at - line 1.Dla instrukcji, które mogą być używane zarówno w kontekstach skalarnych, jak i listowych, błąd nie wymagający przerwania jest ogólnie wskazywany w kontekście skalarnym przez zwrot niezdefiniowanej wartości, a w kontekście listowym przez zwrot listy null.
Zapamiętaj następującą
regułę:
Każdy operator i funkcja decyduje, jaki rodzaj
wartości jest najbardziej odpowiedni do zwrócenia w
kontekście skalarnym. Niektóre operatory zwracają
długość listy, która byłaby
zwrócona w kontekście listowym. Niektóre
zwracają pierwszą wartość listy. Niektóre
zwracają ostatnią wartość listy. Inne
zwracają liczbę pomyślnych operacji. Ogólnie,
robią one to, czego chcesz, chyba że oczekujesz
spójności.
Funkcje perla według kategorii
Oto funkcje perla (włączając rzeczy,
które wyglądają jak funkcje, np. niektóre
słowa kluczowe i nazwane operatory), poukładane według
kategorii. Niektóre funkcje pojawiają się w
więcej niż jednym miejscu.
* - sub było słowem
kluczowym w perl4, lecz w perl5 jest to operator, który
może być używany w wyrażeniach.
Alfabetyczny listing funkcji perla
-r Plik jest odczytywalny przez efektywny uid/gid. -w Plik jest zapisywalny przez efektywny uid/gid. -x Plik jest wykonywalny przez efektywny uid/gid. -o Właścicielem pliku jest efektywny uid.
-R Plik jest odczytywalny przez rzeczywisty uid/gid. -W Plik jest zapisywalny przez rzeczywisty uid/gid. -X Plik jest wykonywalny przez rzeczywisty uid/gid. -O Właścicielem pliku jest rzeczywisty uid.
-e Plik istnieje. -z Plik ma rozmiar zerowy. -s Plik ma rozmiar niezerowy (zwraca rozmiar).
-f Plik jest prostym plikiem. -d Plik jest katalogiem. -l Plik jest dowiązaniem symbolicznym. -p Plik jest nazwanym potokiem (FIFO). -S Plik jest gniazdem. -b Plik jest blokowym plikiem specjalnym. -c Plik jest znakowym plikiem specjalnym. -t Uchwyt pliku jest otwarty do tty.
-u Plik ma ustawiony bit `setuid'. -g Plik ma ustawiony bit `setgid'. -k Plik ma ustawiony bit `sticky'.
-T Plik jest plikiem tekstowym. -B Plik jest plikiem binarnym (przeciwieństwo -T).
-M Wiek pliku w dniach, gdy uruchomił się skrypt -A To samo dla czasu dostępu. -C To samo dla zmiany informacji inode.Interpretacja operatorów praw pliku -r, -R, -w, -W, -x i -X bazuje jedynie na prawach pliku i uid/gid użytkownika. Mogą istnieć inne powody, dla których w rzeczywistości nie możesz go odczytać, zapisać lub uruchomić. Zauważ też, że dla superużytkownika, operatory -r, -R, -w, i -W zawsze zwracają 1, a -x i -X zwracają 1, jeśli ustawiony jest tak dowolny bit wykonania. Skrypty uruchamiane przez superużytkownika powinny więc wywoływać do celów testowania praw pliku funkcję stat() lub tymczasowo zmienić uid na coś innego.
Przykład:
while (<>) { chop; next unless -f $_; # ignoruj specjalne ... }Zauważ, że -s/a/b/ nie dokonuje zanegowanego podstawienia. Powiedzenie -exp($foo) działa wciąż zgodnie z oczekiwaniami, jednak jedynie pojedyncze litery za znakiem minusa są interpretowane jako testy plikowe.
Przełączniki -T i -B działają tak, że testują pierwszy blok pliku w poszukiwaniu dziwnych znaków, takich jak dziwne kody sterujące, lub znaki z wysokiego zestawu znaków. Jeśli jest ich zbyt wiele (>30%), to jest to plik -B, w przeciwnym wypadku to plik -T. Dodatkowo, każdy plik, zawierający w pierwszym bloku null jest uważany za plik binarny. Jeśli -T lub -B jest używane na uchwycie pliku, to testowany jest bieżący bufor standardowego wejścia zamiast pierwszego bloku. Zarówno -T jak i -B zwracają odpowiedź pozytywną dla pliku null lub pliku, który jest na EOF podczas testowania jego uchwytu. Z uwagi na to, że dla testu -T trzeba odczytać plik, w większości przypadków używa się najpierw -f, jak w next unless -f $file && -T $file.
Jeśli któryś z operatorów testu plików (lub stat() czy lstat()) otrzymałby specjalny uchwyt pliku, składający się z samego podkreślenia, to użyta zostałaby struktura `stat' z poprzedniego testu pliku, oszczędzając wywołania systemowego. (Nie działa to dla -t, a ponadto powinieneś pamiętać, że lstat() i -l zostawiają w strukturze wartości dla dowiązań symbolicznych, a nie rzeczywistych plików.) Przykład:
print "Can do.\n" if -r $a ⎪⎪ -w _ ⎪⎪ -x _;
stat($filename); print "Readable\n" if -r _; print "Writable\n" if -w _; print "Executable\n" if -x _; print "Setuid\n" if -u _; print "Setgid\n" if -g _; print "Sticky\n" if -k _; print "Text\n" if -T _; print "Binary\n" if -B _;
Dla opóźnień lub większej dokładności niż jedna sekunda, możesz użyć perlowego interfejsu syscall(), i dostać się do setitimer(2), o ile twój system to obsługuje. W przeciwnym wypadku obejrzyj opis select(), gdzieś w tym dokumencie. Ogólnie częstym błędem jest łączenie wywołań alarm() i sleep().
Jeśli chcesz używać alarm() do timeout'owania wywołania systemowego, musisz użyć pary eval/die. Nie można oczekiwać, że alarm spowoduje, że wywołanie systemowe się zakończy, z $! ustawionym na EINTR, gdyż na niektórych systemach perl ustawia obsługę sygnałów tak, że wywołania systemowe są restartowane. Używanie eval/die działa zawsze.
eval { local $SIG{ALRM} = sub { die "alarm\n" }; # NB \n wymagane alarm $timeout; $nread = sysread SOCKET, $buffer, $size; alarm 0; }; die if $@ && $@ ne "alarm\n"; # propaguj błędy if ($@) { # timeout } else { # bez timeouta }
Dla operacji tangens, możesz użyć funkcji POSIX::tan(), lub użyć znanej relacji:
sub tan { sin($_[0]) / cos($_[0]) }
($pakiet, $nazwapliku, $linia) = caller;Z parametrem WYRAŻ zwraca trochę dodatkowych danych, z których korzysta debugger do drukowania śladu stosu. Wartość WYRAŻ wskazuje, o ile ramek wywołań należy się cofnąć od bieżącej.
($pakiet, $nazwapliku, $linia, $podprocedura, $maargumenty, $chcetablię, $teksteval, $jest_require) = caller($i);$podprocedura tutaj może być "(eval)", jeśli ramka nie jest wywołaniem podproceduralnym. W tej sytuacji ustawiane są dodatkowe elementy, $teksteval i $jest_require: $jest_require jest prawdziwe, jeśli ramka została utworzona w instrukcji require lub use, $teksteval zawiera tekst instrukcji eval WYRAŻ. Praktycznie, dla instrukcji eval BLOCK, $nazwapliku to "(eval)", a $teksteval jest niezdefiniowany. (Zauważ też, że każda instrukcja use tworzy ramkę require. (wewnątrz ramki eval WYRAŻ)
Co więcej, po wywołaniu z pakietu DB, caller
zwraca jeszcze dokładniejsze dane: ustawia zmienną
listową @DB::args na argumenty, z
którymi wywołano podprocedurę.
$cnt = chmod 0755, 'foo', 'bar'; chmod 0755, @executables; $mode = '0644'; chmod $mode, 'foo'; # ustawia prawa na --w----r-T! $mode = '0644'; chmod oct($mode), 'foo'; # to jest lepsze $mode = 0644; chmod $mode, 'foo'; # to jest najlepsze
while (<>) { chomp; # zapobiegaj \n na ostatnim polu @array = split(/:/); ... }Możesz w zasadzie uciąć wszystko co jest lwartością, włączając przypisanie:
chomp($cwd = `pwd`); chomp($answer = <STDIN>);Jeśli ucinasz listę, obcinany jest każdy element, a zwracana jest lista usuniętych znaków.
while (<>) { chop; # zapobież \n na ostatnim polu @array = split(/:/); ... }Możesz w zasadzie oderwać cokolwiek, co jest lwartością, włączając przypisanie:
chop($cwd = `pwd`); chop($answer = <STDIN>);Jeśli obrywasz listę, obrywany jest każdy element. Zwracana jest tylko wartość ostatniego oderwania.
Zauważ, że chop zwraca ostatni znak. Aby
zwrócić wszystkie poza ostatnim, użyj
substr($lancuch, 0, -1).
$cnt = chown $uid, $gid, 'foo', 'bar'; chown $uid, $gid, @filenames;Oto przykład, który podgląda nienumeryczne uid'y w pliku z hasłami:
print "User: "; chop($user = <STDIN>); print "Files: " chop($pattern = <STDIN>);
($login,$pass,$uid,$gid) = getpwnam($user) or die "$user not in passwd file";
@ary = <${pattern}>; # rozwiń nazwy plików chown $uid, $gid, @ary;Na większości systemów nie możesz zmieniać właścicielstwa, chyba że jesteś superużytkownikiem, choć powinieneś być w stanie zmieniać grupę na dowolną z twoich drugorzędnych grup. Na niezabezpieczonych systemach ograniczenia te mogą być mniejsze, lecz nie jest to przenośne założenie.
Jeśli pominięto LICZBĘ, to używane
jest $_.
open(OUTPUT, '⎪sort >foo'); # potok do `sort' ... # drukuj różne rzeczy na wyjście close OUTPUT; # czekaj na zakończenie `sort' open(INPUT, 'foo'); # pobierz wyniki sortowaniaUCHWYTPLIKU może być wyrażeniem, którego wartość daje rzeczywistą nazwę uchwytu pliku.
Dla operacji arcus cosinus, możesz użyć funkcji POSIX::acos(), lub następującej relacji:
sub acos { atan2( sqrt(1 - $_[0] * $_[0]), $_[0] ) }
Zauważ, że crypt jest funkcję jednokierunkową, podobnie jak rozbijanie jajek na omlet. Nie istnieje (znana) funkcja dekodująca. W wyniku, funkcja wcale nie jest tak użyteczna do kryptografii. (Dla tego, zobacz najbliższy mirror CPAN.)
Oto przykład, który daje pewność, że ktokolwiek uruchomi ten program, zna swoje własne hasło:
$pwd = (getpwuid($<))[1]; $salt = substr($pwd, 0, 2);
system "stty -echo"; print "Hasło: "; chop($word = <STDIN>); print "\n"; system "stty echo";
if (crypt($word, $salt) ne $pwd) { die "Niezmiernie mi przykro...\n"; } else { print "ok\n"; }Oczywiście wpisywanie swojego hasła za każdym razem, gdy ktoś o nie poprosi jest niemądre.
Przerywa powiązanie między plikiem DBM a
tablicą asocjacyjną.
Łączy to plik dbm(3), ndbm(3), sdbm(3), gdbm(), lub Berkeley DB z tablicą asocjacyjną. HASH jest nazwą tablicy asocjacyjnej. (w przeciwieństwie do normalnego otwierania, pierwszy argument NIE jest uchwytem pliku, choć wygląda podobnie). NAZWADB jest nazwą bazy danych (bez rozszerzeń w rodzaju .dir czy .pag). Jeśli baza nie istnieje, to jest tworzona z prawami określanymi przez PRAWA (zmodyfikowanymi przez umask()). Jeśli twój system obsługuje tylko starsze funkcje DBM, to możesz w swoim programie wykonać tylko jeden dbmopen(). W starszych wersjach perla, jeśli system nie miał ani DBM, ani ndbm, wywołanie dbmopen powodowało błąd krytyczny; teraz schodzi do sdbm(3).
Jeśli nie masz prawa zapisu do pliku DBM, to możesz tylko odczytywać zmienne asocjacyjne, nie możesz ich ustawiać. Jeśli chcesz spróbować, czy możesz zapisywać, użyj albo testów plikowych, albo spróbuj ustawić próbny wpis asocjacyjny wewnątrz eval(), co przechwyci błąd.
Zauważ, że funkcje takie, jak keys() i values() mogą zwracać w użyciu z plikami DBM wielkie tablice. Możesz do iteracji przez wielkie pliki DBM używać także each(). Przykład:
# drukuj offsety pliku historii dbmopen(%HIST,'/usr/lib/news/history',0666); while (($key,$val) = each %HIST) { print $key, ' = ', unpack('L',$val), "\n"; } dbmclose(%HIST);Zobacz też stronę podręcznika AnyDBM_File -- jest tam bardziej ogólny opis wad i zalet różnych podejść dbm. Zobacz też stronę DB_File, dla bogatej implementacji.
Wiele operacji zwraca undef aby wskazać błąd, koniec pliku, błąd systemowy, niezainicjalizowaną zmienną i inne wyjątki. Funkcja ta pozwala odróżnić undef od innych wartości. (Prosty test logiczny nie rozróżni undef, zero, pustego łańcucha, i "0", które wszystkie są jednakowo fałszywe.) Zauważ, że ponieważ undef jest prawidłowym skalarem, to jego obecność niekoniecznie musi wskazywać warunek wyjątkowy: pop() zwraca undef gdy jego argument jest pustą tablicą, lub gdy zwracany element jest wartością
defined() można używać też do sprawdzania czy podprocedura wychodzi. Z drugiej strony, używanie defined() na agregatach (tablicach asocjacyjnych i tablicach) nie musi zwrócić zgodnych z intuicją wyników i powinno się go w tych przypadkach unikać.
Gdy używane na elemencie tablicy asocjacyjnej, mówi czy wartość jest zdefiniowana, a nie czy taki klucz istnieje w tablicy. Dla tego celu, użyj exists, które jest opisane gdzie indziej w tym dokumencie.
Przykłady:
print if defined $switch{'D'}; print "$val\n" while defined($val = pop(@ary)); die "Can't readlink $sym: $!" unless defined($value = readlink $sym); sub foo { defined &$bar ? &$bar(@_) : die "Brak bar"; } $debugging = 0 unless defined $debugging;Uwaga: Wielu ludzi nadużywa defined(), a potem są oni zaskoczeni, że liczba 0 i "" (łańcuch o długości zero) są w rzeczywistości wartościami zdefiniowanymi. Na przykład, jeśli powiesz
"ab" =~ /a(.*)b/;to porównanie wzorca się powiedzie i $1 będzie zdefiniowane, niezależnie od tego, że trafiło w "nic". W rzeczywistości nie można powiedzieć, że trafiło w "nic". Raczej trafiło w coś, o długości zera znaków. Jest to wszystko bardzo czyste i uczciwe. Gdy funkcja zwraca wartość niezdefiniowaną, jest to przyznanie się, że nie mogła dać uczciwej odpowiedzi. Tak więc powinieneś używać defined() tylko jeśli sprawdzasz działanie tego, co próbujesz osiągnąć. W niektórych wypadkach, rzeczą, której oczekujesz jest proste porównanie z 0 lub "".
Obecnie używanie defined() na całej tablicy lub tablicy asocjacyjnej, zgłasza tylko czy została dla niego zaalokowana pamięć. Tak więc tablica, którą ustawiasz na pustą listę jest początkowo niezdefiniowana, a gdy się zapełni, staje się zdefiniowana. Zamiast tego powinieneś użyć prostego testu rozmiaru:
if (@an_array) { print "ma elementy tablicowe\n" } if (%a_hash) { print "ma elementy asocjacyjne\n" }Użycie na nich undef() powoduje wyczyszczenie ich pamięci i zgłoszenie, że nie są już zdefiniowane. Nie powinno się jednak tego robić, chyba że nie masz zamiaru ich więcej używać, ponieważ po prostu szybciej jest używać pamięci gotowej do wypełnienia, niż alokować ją od nowa.
Zachowanie defined() na agregatach może zostać zmienione, poprawione, lub zepsute w następnych wersjach perla.
Zobacz też opisy undef,
exists, i ref,
znajdujące się w innych miejscach tego dokumentu.
Następujący przykład kasuje wszystkie wartości tablicy asocjacyjnej:
foreach $key (keys %HASH) { delete $HASH{$key}; }Podobnie robi następujące:
delete @HASH{keys %HASH}(Ale obydwa są wolniejsze niż komenda undef().) Zauważ, że WYRAŻ może być arbitralnie skomplikowany tak długo, dopóki końcowa operacja jest podejrzeniem elementu asocjacyjnego lub wycinkiem tablicy asocjacyjnej (`hash slice'):
delete $ref->[$x][$y]{$key}; delete @{$ref->[$x][$y]}{$key1, $key2, @morekeys};
Równoważne przykłady:
die "Nie mogę przejść do spool: $!\n" unless chdir '/usr/spool/news'; chdir '/usr/spool/news' or die "Nie mogę przejść do spool: $!\n"Jeśli wartość WYRAŻ nie kończy się nową linią, drukowany jest również numer bieżącej linii skryptu i wejścia, a za nimi doklejana jest nowa linia. Wskazówka: Czasami dodanie ", stopped" do twojego komunikatu może nadać mu więcej sensu po doklejeniu łańcucha "at foo line 123". Załóżmy, że uruchamiasz skrypt "canasta".
die "/etc/games is no good"; die "/etc/games is no good, stopped";dają w efekcie odpowiednio:
/etc/games is no good at canasta line 123. /etc/games is no good, stopped at canasta line 123.Zobacz także exit() i warn().
Można zaaranżować sprawę tak,
że callback będzie wywoływany tuż przed
uczynieniem swojej powinności przez die(). Należy w
tym celu ustawić hak $SIG{__DIE__}.
Związany handler zostanie wywołany z tekstem
błędu i może zmienić treść
komunikatu błędu, wywołując die()
ponownie. Zobacz stronę perlvar(1), dla dalszych detali o
ustawianiu wpisów %SIG, a także
opis eval() dla paru przykładów.
do 'stat.pl';jest zupełnie jak
eval `cat stat.pl`;tylko trochę bardziej efektywne, utrzymuje śledzenie bieżącej nazwy plików dla komunikatów o błędach i przeszukuje wszystkie katalogi -I, jeśli plik nie znajduje się w katalogu bieżącym (zobacz także tablicę @INC w sekcji Predefined Names podręcznika perlvar(1)). Jednak jest takie samo w sensie, że przetwarza (parses) plik za każdym razem, gdy go wywołasz, więc przypuszczalnie nie chciałbyś tego wewnątrz pętli.
Zauważ, że włączanie
modułów bibliotecznych można załatwić
lepiej z pomocą operatorów use() i
require(), które również dokonują
sprawdzania błędów i powodują wyjątki
jeśli jest jakiś problem.
Przykład:
#!/usr/bin/perl require 'getopt.pl'; require 'stat.pl'; %days = ( 'Sun' => 1, 'Mon' => 2, 'Tue' => 3, 'Wed' => 4, 'Thu' => 5, 'Fri' => 6, 'Sat' => 7, );
dump QUICKSTART if $ARGV[0] eq '-d';
QUICKSTART: Getopt('f');
Wpisy są zwracane w kolejności dość losowej. Gdy tablica asocjacyjna jest całkowicie odczytana, w kontekście listowym zwracana jest tablica null (co po przypisaniu daje wartość FALSE (0)), a w kontekście skalarnym zwracany jest undef. Następne wywołanie each() po tym rozpocznie iterowanie od nowa. Dla każdej tablicy asocjacyjnej istnieje pojedynczy iterator, dzielony przez funkcje each(), keys() i values(); może być zresetowany przez odczytanie wszystkich elementów tablicy lub przez wywołanie keys HASH lub values HASH. Jeśli dodajesz, lub kasujesz elementy tablicy asocjacyjnej podczas jej iterowania, to może się zdarzyć, że niektóre wpisy utracisz, a niektóre dostaniesz zduplikowane. Nie rób więc tego.
Następujący przykład drukuje środowisko, podobnie jak program printenv(1), lecz w odwrotnej kolejności:
while (($key,$value) = each %ENV) { print "$key=$value\n"; }Zobacz też keys() i values().
eof bez argumentów, używa jako argumentu ostatniego odczytu pliku. Puste nawiasy () mogą wskazywać na pseudo plik, złożony z plików, wymienionych w linii komend, np. eof() dobrze jest używać wewnątrz pętli while (<>), aby wykryć koniec ostatniego pliku. Przykłady:
# resetuj numerowanie linii dla każdego pliku wejściowego while (<>) { print "$.\t$_"; close(ARGV) if (eof); # Nie eof(). }
# wstaw kreski przed ostatnią linią ostatniego pliku while (<>) { if (eof()) { print "--------------\n"; close(ARGV); # close or break; is needed if we # are reading from the terminal } print; }Wskazówka praktyczna: w perlu prawie nigdy nie trzeba używać eof, ponieważ operatory wejściowe zwracają undef gdy nie będą miały więcej danych.
Jeśli pojawi się błąd składni lub błąd czasu działania albo jeśli wykonana zostanie instrukcja die(), to zwrócona zostanie wartość niezdefiniowana, a $@ zostanie ustawione na komunikat o błędzie. Jeśli nie było błędu, $@ będzie łańcuchem null. Jeśli WYRAŻ zostanie pominięte, to wykonywane jest $_. Ostatni średnik, jeśli taki istnieje, może być pominięty w wyrażeniu. Ostrzegam jednak, że używanie eval() nie wycisza perla od drukowania ostrzeżeń na STDERR, ani nie upycha tekstu tych komunikatów do $@. Aby zrobić którąś z tych rzeczy, musisz użyć zabudowania $SIG{__WARN__}. Zobacz warn() i stronę perlvar(1).
Zauważ, że ponieważ eval() przechwytuje krytyczne (w innych wypadkach) błędy, to jest przydatny dla określania czy konkretna właściwość (taka, jak np. socket(), symlink(), itp. jest zaimplementowana. Jest to również mechanizm perla obsługiwania wyjątków, gdzie operator die jest mechanizmem ich podnoszenia.
Jeśli wykonywany kod się nie różni, możesz użyć postaci eval-BLOK do wychwytywania błędów czasu działania, bez potrzeby rekompilacji za każdym razem. Błąd, jeśli się pojawi, jest wciąż zwracany w $@. Przykłady:
# spowoduj, by dzielenie przez zero nie było krytyczne eval { $answer = $a / $b; }; warn $@ if $@;
# to samo, mniej efektywnie eval '$answer = $a / $b'; warn $@ if $@;
# błąd czasu kompilacji eval { $answer = };
# błąd czasu działania eval '$answer ='; # ustawia $@Używając postaci eval{} jako pułapki na wyjątki w bibliotekach, możesz nie życzyć sobie uruchamiania haków __DIE__, które mógł sobie ustawić użytkownik. Dla tego celu można wykorzystać konstrukcję local $SIG{__DIE__}. Przykład:
# bardzo prywatna pułapka na wyjątek dzielenia przez zero eval { local $SIG{'__DIE__'}; $answer = $a / $b; }; warn $@ if $@;Jest to szczególnie istotne, gdyż haki __DIE__ mogą wywoływać die() ponownie, co ma efekt zmieniania komunikatów o błędach:
# haki __DIE__ mogą modyfikować komunikaty o błędach { local $SIG{'__DIE__'} = sub { (my $x = $_[0]) =~ s/foo/bar/g; die $x }; eval { die "foo foofs here" }; print $@ if $@; # drukuje "bar barfs here" }Używając eval(), powinieneś szczególnie uważać, by pamiętać na co się patrzy gdy:
eval $x; # PRZYPADEK 1 eval "$x"; # PRZYPADEK 2
eval '$x'; # PRZYPADEK 3 eval { $x }; # PRZYPADEK 4
eval "\$$x++" # PRZYPADEK 5 $$x++; # PRZYPADEK 6Przypadki 1 i 2 zachowują się jednakowo: uruchamiają kod, zawarty w zmiennej $x. (Chociaż przypadek 2 ma ogłupiające cudzysłowy, powodujące, że czytelnik zastanawia się, co jeszcze może się zdarzyć (nic nie może).) Przypadki 3 i 4 zachowują się podobnie: wykonują one kod '$x', który nie robi nic poza zwróceniem wartości $x. (Przypadek 4 jest preferowany ze względów estetycznych, ma też zaletę kompilowania podczas kompilacji, a nie podczas działania.) Przypadek 5 jest miejscem, gdzie normalnie chciałbyś użyć cudzysłowów, poza tym, że w tej konkretnej sytuacji można użyć po prostu symbolicznych referencji. Jest tak w przypadku 6.
Jeśli w LIŚCIE jest więcej niż jeden argument, lub jeśli jest to tablica z więcej niż jedną wartością, wywoływany jest execvp(3) (z argumentami z LISTY). Jeśli jest tylko jeden argument skalarny, to jest on sprawdzany w poszukiwaniu metaznaków powłoki. Jeśli są tam jakieś znaki, to cały argument jest przekazywany do przetworzenia przez /bin/sh -c. Jeśli nie ma żadnych metaznaków, to argument jest dzielony na słowa i przekazywany bezpośrednio do execvp(3), co jest bardziej efektywne. Uwaga: exec() i system() nie opróżniają twojego bufora wejściowego, więc możliwe, że aby zapobiec utracie wyjścia, będziesz musiał ustawić $⎪. Przykłady:
exec '/bin/echo', 'Twoimi argumentami są: ', @ARGV; exec "sort $outfile ⎪ uniq";Jeśli tak naprawdę nie potrzebujesz wywołać pierwszego argumentu, lecz chcesz oszukać program, który wykonujesz co do jego nazwy, to możesz podać program, który chcesz wywołać jako "obiekt niebezpośredni" (bez przecinka) na samym początku LISTY. (Wymusza to zawsze interpretację LISTY jako listy wielowartościowej, nawet jeśli jest tam tylko pojedynczy skalar.) Przykład:
$shell = '/bin/csh'; exec $shell '-sh'; # udaj, że to powłoka loginowalub, bardziej bezpośrednio,
exec {'/bin/csh'} '-sh'; # udaj, że to powłoka loginowy
print "Istnieje\n" if exists $array{$key}; print "Zdefiniowany\n" if defined $array{$key}; print "Prawdziwy\n" if $array{$key};Element asocjacyjny może być prawdziwy tylko wtedy, gdy jest zdefiniowany, a zdefiniowany jeśli istnieje, lecz odwrotna kolejność niekoniecznie jest prawdziwa.
Zauważ, że WYRAŻ może być skomplikowany tak daleko, dopóki ostateczna operacja jest podejrzeniem klucza asocjacyjnego:
if (exists $ref->[$x][$y]{$key}) { ... }
$ans = <STDIN>; exit 0 if $ans =~ /^[Xx]/;Zobacz też die(). Jeśli WYRAŻ jest pominięte, to praca kończy się statusem 0. Jedynymi, uniwersalnymi i przenośnymi wartościami WYRAŻ są 0 dla sukcesu i 1 dla błędu; wszelkie inne są podstawą do dziwnych interpretacji, zależnych od środowiska, w którym program jest uruchomiony.
Nie powinieneś używać exit() do
przerywania podprocedury, jeśli istnieje szansa, że
ktoś mógłby chcieć ustawić
pułapkę na błąd. Zamiast tego użyj
die(), który może być przechwycony przez
eval().
use Fcntl;aby móc się nią posługiwać. Przetwarzanie argumentów i zwracanie wartości działa zupełnie jak w ioctl(), opisanym niżej. Zauważ, że fcntl() da błąd krytyczny po użyciu na maszynie, nie implementującej fcntl(2). Na przykład:
use Fcntl; fcntl($filehandle, F_GETLK, $packed_return_buffer);
OPERACJA jest jedną z LOCK_SH, LOCK_EX, lub LOCK_UN. Możliwa jest jeszcze kombinacja z LOCK_NB. Stałe te mają tradycyjne wartości 1, 2, 8 i 4, lecz możesz używać nazw symbolicznych po zaimportowaniu ich z modułu Fcntl, robiąc to albo pojedynczo, albo grupowo, używając tagu ':flock' . LOCK_SH żąda blokady dzielonej, LOCK_EX żąda blokady na wyłączność, a LOCK_UN zwalnia poprzednio zażądaną blokadę. Jeśli do LOCK_SH lub LOCK_EX dodany zostanie LOCK_NB, to flock nie będzie blokował, oczekując na zablokowanie, lecz zakończy działanie natychmiast (aby dowiedzieć się, czy uzyskałeś blokadę, sprawdź status wyjścia).
Aby zapobiec prawdopodobnie dekoordynacji, perl opróżnia UCHWYTPLIKU przed jego (od)blokowaniem.
Zauważ, że emulacja zbudowana za pomocą lockf(3) nie daje blokad dzielonych i wymaga, by UCHWYTPLIKU był otwarty z zamiarem zapisu. Jest to semantyka, którą implementuje lockf(3). Większość (wszystkie?) systemów jednak implementuje lockf(3) na zasadach blokowania fcntl(2), więcej różnice nie powinny się dawać we znaki.
Zauważ też, że niektóre wersje flock() nie mogą blokować rzeczy poprzez sieć; będziesz musiał użyć do tego bardziej specyficznego dla systemu fcntl(). Jeśli chcesz, możesz zmusić perla do ignorowania systemowej funkcji flock(2) i używać jego własnej, opartej o fcntl(2) emulacji. Robi się to, podając programowi Configure przełącznik -Ud_flock. Trzeba to oczywiście zrobić podczas konfigurowania perla jako takiego.
Oto doklejacz mailboxa dla systemów BSD.
use Fcntl ':flock'; # importuj stałe LOCK_*
sub lock { flock(MBOX,LOCK_EX); # a w wypadku, gdyby ktoś dokleił # podczas naszego oczekiwania... seek(MBOX, 0, 2); }
sub unlock { flock(MBOX,LOCK_UN); }
open(MBOX, ">>/usr/spool/mail/$ENV{'USER'}") or die "Nie mogę otworzyć mailboxa!: $!";
lock(); print MBOX $msg,"\n\n"; unlock();Zobacz też stronę podręcznika. Są tam inne przykłady flock().
Jeśli fork()'ujesz bez czekania na dzieci, zbierzesz zombies. (Osierocone procesy.)
$SIG{CHLD} = sub { wait };Istnieje też trik podwójnego forka (sprawdzanie błędów forka zostało pominięte);
unless ($pid = fork) { unless (fork) { exec "co naprawdę chcesz robić"; die "bez exec"; # ... or ... ## (jakiś_kod_perla) exit 0; } exit 0; } waitpid($pid,0);Zobacz też stronę podręcznika perlipc(1). Są tam dalsze przykłady forkowania i zbierania konających dzieci.
Zauważ, że jeśli twoje forkowane dziecko
dziedziczy systemowe deskryptory plików, takie jak STDIN i
STDOUT, które w rzeczywistości są
połączone potokiem lub gniazdem, to jeśli
skończysz działanie, zdalny serwer (taki jak httpd, rsh)
nie będzie myślał, że rzeczywiście
skończyłeś. Powinieneś je otworzyć na
nowo na /dev/null.
format Something = Test: @<<<<<<<< @⎪⎪⎪⎪⎪ @>>>>> $str, $%, '$' . int($num) .
$str = "widget"; $num = $cost/$quantity; $~ = 'Something'; write;Dla dalszych opisów i przykładów, zobacz stronę perlform(1).
Uważaj, jeśli wstawiasz wokół
obrazka podwójne cudzysłowy--znak
"@" może być
wzięty za początek nazwy tablicy. formline() zawsze
zwraca TRUE. Zobacz stronę perlform(1) dla dalszych
przykładów.
if ($BSD_STYLE) { system "stty cbreak </dev/tty >/dev/tty 2>&1"; } else { system "stty", '-icanon', 'eol', "\001"; }
$key = getc(STDIN);
if ($BSD_STYLE) { system "stty -cbreak </dev/tty >/dev/tty 2>&1"; } else { system "stty", 'icanon', 'eol', '^@'; # ASCII null } print "\n";Określenie, czy $BSD_STYLE powinno być ustawione, pozostawiamy jako ćwiczenie dla czytelnika.
Na systemach, kompatybilnych z POSIX, bardziej
przenośna do tego celu może być funkcja
POSIX::getattr(). Zobacz też moduł
Term::ReadKey z najbliższego mirrora
CPAN; szczegóły o CPAN można znaleźć
we wpisie CPAN ze strony podręcznika
perlmod(1).
$login = getlogin ⎪⎪ getpwuid($<) ⎪⎪ "Kilroy";Nie wykorzystuj getlogin() do autentykacji: nie jest tak bezpieczny jak getpwuid().
use Socket; $hersockaddr = getpeername(SOCK); ($port, $iaddr) = unpack_sockaddr_in($hersockaddr); $herhostname = gethostbyaddr($iaddr, AF_INET); $herstraddr = inet_ntoa($iaddr);
($nazwa,$hasło,$uid,$gid, $quota,$komentarz,$gcos,$katalog,$shell) = getpw* ($nazwa,$hasło,$gid,$członkowie) = getgr* ($nazwa,$aliasy,$typadresu,$długość,@addrs) = gethost* ($nazwa,$aliasy,$typadresu,$sieć) = getnet* ($nazwa,$aliasy,$protokół) = getproto* ($nazwa,$aliasy,$port,$protokół) = getserv*(Jeśli wpis nie istnieje, dostaniesz listę null.)
W kontekście skalarnym, dostajesz nazwę. Wyjątkiem jest funkcja podglądania według nazwy, gdzie dostajesz inną rzecz, jaką by ona nie była. (Jeśli wpis nie istnieje, otrzymujesz wartość niezdefiniowaną.) Na przykład:
$uid = getpwnam $nazwa = getpwuid $nazwa = getpwent $gid = getgrnam $nazwa = getgrgid $nazwa = getgrent itd.Wartość $członkowie, zwracana przez getgr*() to oddzielona spacjami lista nazw loginowych członków grupy.
Jeśli w C obsługiwana jest zmienna errno, to dla funkcji gethost*() jego wartość będzie przekazywana przez $?. Wartość @addrs, zwracana przez wykonane wywołanie, jest listą czystych (raw) adresów, zwróconych przez odpowiednie wywołanie systemowe. W domenie internetowej, każdy adres jest czterobajtowy, a rozpakować go możesz, mówiąc coś w rodzaju:
($a,$b,$c,$d) = unpack('C4',$addr[0]);
use Socket; $mysockaddr = getsockname(SOCK); ($port, $myaddr) = unpack_sockaddr_in($mysockaddr);
# 0 1 2 3 4 5 6 7 8 ($sec,$min,$hour,$mday,$mon,$year,$wday,$yday,$isdst) = gmtime(time);Wszystkie elementy tablicy są numeryczne i pochodzą wprost ze struktury tm. Ogólnie znaczy to, że $mon ma zakres 0..11, a $wday 0..6, z niedzielą kryjącą się pod 0. Dodatkowo, $year jest liczbą lat od 1900, a nie po prostu dwiema ostatnimi cyframi roku.
Jeśli WYRAŻ jest pominięte, wykonuje gmtime(time()).
W kontekście skalarnym, zwraca wartość ctime(3):
$now_string = gmtime; # np. "Thu Oct 13 04:54:34 1994"Zobacz też funkcję timegm(), udostępnianą przez moduł Time::Local, a także funkcję strftime(3), dostępną przez moduł POSIX.
Postać goto-WYRAŻ oczekuje nazwy etykiety, której zakres może być rozwiązany dynamicznie. Pozwala to na obliczane goto per FORTRAN, lecz nie jest zbyt zalecane, jeśli optymalizujesz ze względu na łatwość konserwacji programu:
goto ("FOO", "BAR", "GLARCH")[$i];Postać goto-&NAZWA jest bardzo magiczna i podmienia wywołanie do nazwanej podprocedury dla bieżącej procedury. Jest to używane przez podprocedury AUTOLOAD, które chcą ładować inne podprocedury, a potem udawać, że ta inna podprocedura została wywołana jako pierwsza (poza tym, wszelkie zmiany @_ bieżącej podprocedury są przekazywane innej podprocedurze.) Po tym goto, nawet caller() nie będzie w stanie powiedzieć, że ta procedura była wywołana pierwsza.
Wykonuje BLOK lub WYRAŻ dla każdego elementu LISTY (ustawiając lokalnie $_ na każdy element) i zwracając listę wartości, składających się z tych, dla których wykonane wyrażenie było prawdziwe. W kontekście skalarnym, zwraca liczbę prawdziwych wyrażeń.
@foo = grep(!/^#/, @bar); # Pozbądź się komentarzylub równoważnie,
@foo = grep {!/^#/} @bar; # pozbądź się komentarzyZauważ, że skoro $_ jest referencją do wartości listy, może być używane do modyfikowania elementów tablicy. Podczas gdy jest to przydatne i obsługiwane, może to spowodować też nieoczekiwane rezultaty, szczególnie w wypadku gdy LISTA nie jest nazwaną tablicą.
Grep zwraca aliasy do oryginalnej listy. Znaczy to, że
modyfikowanie elementu listy zwróconej przez to polecenie,
modyfikuje też element listy oryginalnej.
print hex '0xAf'; # drukuje '175' print hex 'aF'; # to samo
require "ioctl.ph"; # przypuszczalnie w /usr/local/lib/perl/ioctl.phJeśli ioctl.ph nie istnieje, lub nie ma właściwych definicji, będziesz musiał użyć swojej własnej, opartej na nagłówkach C, takich jak <sys/ioctl.h>. (Istnieje skrypt perla o nazwie h2ph(1), która pomaga w konwersji, lecz jest to nietrywialna sprawa.) SKALAR jest wartością zapisywaną, lub odczytywaną, zależnie od FUNKCJI--wskaźnik do wartości łańcuchowej SKALARA będzie przekazany jako trzeci argument właściwego wywołania ioctl. (Jeśli SKALAR nie ma wartości łańcuchowej, lecz ma numeryczną, to zostanie przekazana ta wartość zamiast wskaźnika do łańcucha. Aby zapewnić, że będzie to prawdziwe, przed użyciem dodaj do skalara 0). Do manipulowania na wartościach struktur, używanych przez ioctl() przydatne są funkcje pack() i unpack(). Następujący przykład ustawia znak kasowania na DEL.
require 'ioctl.ph'; $getp = &TIOCGETP; die "NO TIOCGETP" if $@ ⎪⎪ !$getp; $sgttyb_t = "ccccs"; # 4 znaki i short if (ioctl(STDIN,$getp,$sgttyb)) { @ary = unpack($sgttyb_t,$sgttyb); $ary[2] = 127; $sgttyb = pack($sgttyb_t,@ary); ioctl(STDIN,&TIOCSETP,$sgttyb) ⎪⎪ die "Nie mogę wykonać ioctl: $!"; }Wartość zwracana ioctl (i fcntl) jest następująca:
gdy OS zwraca: to Perl zwraca: -1 wartość niezdefiniowaną 0 łańcuch "0 but true" coś innego to samoTak więc, mimo że perl zwraca po sukcesie TRUE, a w wypadku niepowodzenia FALSE, możesz łatwo określić rzeczywistą wartość zwróconą przez system operacyjny:
($retval = ioctl(...)) ⎪⎪ ($retval = -1); printf "System zwrócił %d\n", $retval;
$_ = join(':', $login,$passwd,$uid,$gid,$gcos,$home,$shell);Zobacz też opis split.
A oto jeszcze inny sposób na wydrukowanie środowiska:
@keys = keys %ENV; @values = values %ENV; while ($#keys >= 0) { print pop(@keys), '=', pop(@values), "\n"; }a co, jeśli by je posortować według klucza:
foreach $key (sort(keys %ENV)) { print $key, '=', $ENV{$key}, "\n"; }Aby posortować tablicę według wartości, będziesz musiał użyć funkcji sort. Oto numeryczne posortowanie tablicy asocjacyjnej według jej wartości:
foreach $key (sort { $hash{$b} <=> $hash{$a} } keys %hash)) { printf "%4d %s\n", $hash{$key}, $key; }Jako lwartość, keys umożliwia zwiększanie liczby komórek asocjacyjnych, zaalokowanych dla danej tablicy asocjacyjnej. Możesz zyskać na efektywności, jeśli tablica ma być duża. (Jest to podobne do pre-rozszerzania tablicy przez przeznaczanie $#array większego numeru.) Jeśli powiesz
keys %hash = 200;to %hash będzie miał co najmniej 200 zaalokowanych komórek. Komórki te będą utrzymywane nawet, jeśli zrobisz %hash = (). Jeśli chcesz zwolnić zasób wewnątrz zakresu, użyj undef %hash. Korzystając z powyższej właściwości, zawsze można zmniejszyć liczbę zaalokowanych komórek.
$cnt = kill 1, $child1, $child2; kill 9, @goners;W przeciwieństwie do zachowania w powłoce, w perlu jeśli -1SYGNAŁ jest ujemny, to killuje grupy procesów, zamiast procesów. (W Systemie V, ujemny numer PROCESU odnosi się też do grup procesów, lecz nie jest to przenośne.) Oznacza to, że zazwyczaj chcesz przekazywać sygnały dodatnie. Możesz też używać nazw sygnałów w cudzysłowach. Zobacz jeszcze sekcję Signals w podręczniku perlipc(1).
LINE: while (<STDIN>) { last LINE if /^$/; # zakończ po skończeniu z nagłówkiem ... }
Jeśli WYRAŻ jest pominięte,
używane jest $_.
Jeśli WYRAŻ jest pominięte,
używane jest $_.
Zamiast local(), często raczej
wolałbyś użyć my(), gdyż to
pierwsze tak naprawdę nie jest tym czym się
większości ludzi wydaje. Odsyłam do sekcji
Private Variables via my() w podręczniku
perlsub(1).
# 0 1 2 3 4 5 6 7 8 ($sec,$min,$hour,$mday,$mon,$year,$wday,$yday,$isdst) = localtime(time);Wszystkie elementy tablicy są numeryczne i pochodzą wprost ze struktury tm. W rzeczywistości znaczy to, że $mon ma zasięg 0..11, a $wday 0..6, gdzie 0 oznacza niedzielę. Poza tym, $year jest liczbą lat ot 1900 roku, tj. rok 123 oznacza 2023.
Jeśli WYRAŻ zostanie pominięte, to używany jest czas bieżący (localtime(time)).
W kontekście skalarnym, zwraca wartość ctime(3):
$now_string = localtime; # np., "Thu Oct 13 04:54:34 1994"Zobacz też moduł Time::Local i funkcje strftime(3) i mktime(3), dostępne przez moduł POSIX.
Jeśli WYRAŻ jest pominięte,
używane jest $_.
@chars = map(chr, @nums);tłumaczy listę liczb na odpowiadające im znaki. A
%hash = map { getkey($_) => $_ } @array;jest tylko śmiesznym sposobem zapisania
%hash = (); foreach $_ (@array) { $hash{getkey($_)} = $_; }
LINE: while (<STDIN>) { next LINE if /^#/; # pozbądź się komentarzy ... }Zauważ, że jeśli powyżej był blok continue, to zostałby on wykonany nawet na usuniętych liniach. Jeśli argument ETYKIETY jest pominięty, komenda odnosi się do najbardziej wewnętrznej otaczającej pętli.
$val = oct($val) if $val =~ /^0/;Jeśli WYRAŻ jest pominięte, używa $_. Funkcja ta jest często używana gdy łańcuch w rodzaju "644" musi być np. przekonwertowany na prawa pliku. (Chociaż perl automatycznie konwertuje łańcuchy na liczby, zgodnie z potrzebami, to automatyczna konwersja zakłada podstawę 10.)
Jeśli nazwa pliku rozpoczyna się od '<' lub od niczego, plik jest otwierany dla wejścia (odczytu). Jeśli nazwa pliku rozpoczyna się od '>', plik jest kasowany i otwierany dla zapisu. Jeśli nazwa pliku rozpoczyna się od '>>', plik jest otwierany dla dopisywania. Jeśli przed '>' lub '<' postawisz '+', oznacza to, że chcesz zarówno czytać, jak i zapisywać do pliku. Tryb '+<' jest zazwyczaj preferowany dla poprawek odczytu/zapisu--tryb '+>' najpierw pobiłby plik. Przedrostek i nazwa pliku mogą być oddzielone spacjami. Wszystkie te przedrostki odpowiadają trybom otwarcia funkcji fopen(3).
Jeśli nazwa pliku rozpoczyna się od "⎪", to plik jest rozumiany jako komenda, do której potokiem przesyłane jest wyjście. Odwrotnie, jeśli nazwa pliku kończy się tym symbolem, to nazwa pliku jest interpretowana jako komenda, której wyjście jest przesyłane potokiem na nasze wejście (Zobacz sekcję Using open() for IPC w podręczniku perlipc(1)). (Możesz nie mieć czystego open(), powodującego, że komenda jest zarówno potokiem wejściowym, jak i wyjściowym. Są jednak na to rady, zobacz stronę podręcznika IPC::Open2, IPC::Open3, oraz sekcję Bidirectional Communication w podręczniku perlipc(1).)
Otwieranie '-' otwiera strumień STDIN, a otwieranie '>-' otwiera STDOUT. Open po sukcesie zwraca zero, a w przeciwnym wypadku wartość niezdefiniowaną. Jeśli open otworzył potok, wartość zwracana jest identyfikatorem podprocesu (pid).
Jeśli masz na tyle pecha, że pracujesz z perlem na systemie, który odróżnia pliki tekstowe i binarne (nowoczesne systemy ich nie rozróżniają), to powinieneś poczytać o funkcji binmode, opisanej gdzieś w tym dokumencie. Systemy, wymagające binmode rozpoznaje się po ich formacie pliku tekstowego. Systemy takie, jak Unix i Plan9, które oddzielają linie pojedynczym znakiem i które kodują go w C jako "\n", nie potrzebują binmode. Reszta tak.
Przykłady:
$ARTICLE = 100; open ARTICLE or die "Nie mogę znaleźć artykułu $ARTICLE: $!\n"; while (<ARTICLE>) {...
open(LOG, '>>/usr/spool/news/twitlog'); # (log jest zarezerwowany)
open(DBASE, '+<dbase.mine'); # otwórz dla odnowienia
open(ARTICLE, "caesar <$article ⎪"); # dekoduj artykuł
open(EXTRACT, "⎪sort >/tmp/Tmp$$"); # $$ jest pidem naszego procesu
# przetwórz listę argumentów plików, wraz z wszelkimi załącznikami
foreach $file (@ARGV) { process($file, 'fh00'); }
sub process { local($filename, $input) = @_; $input++; # jest to inkrementacja łańcuchowa unless (open($input, $filename)) { print STDERR "Nie mogę otworzyć $filename: $!\n"; return; }
while (<$input>) { # note use of indirection if (/^#include "(.*)"/) { process($1, $input); next; } ... # cokolwiek } }Możesz również, zgodnie z tradycją powłoki Bourne, podać WYRAŻ, zaczynający się od ">&", co oznacza, że reszta łańcucha jest interpretowana jako nazwa uchwytu pliku (lub numerycznego deskryptora pliku), który należy zduplikować i otworzyć. & można użyć po >, >>, <, +>, +>>, i +<. Tryb, który podasz, powinien odpowiadać trybowi oryginalnego uchwytu pliku. (Duplikowanie uchwytów pliku nie pobiera na konto żadnych istniejących zawartości buforów stdio.) Oto skrypt, który zachowuje, przekierowuje i odświeża STDOUT i STDERR:
#!/usr/bin/perl open(SAVEOUT, ">&STDOUT"); open(SAVEERR, ">&STDERR");
open(STDOUT, ">foo.out") ⎪⎪ die "Nie mogę przekierować stdout"; open(STDERR, ">&STDOUT") ⎪⎪ die "Nie mogę zduplikować stdout";
select(STDERR); $⎪ = 1; # zrób niebuforowane select(STDOUT); $⎪ = 1; # j/w
print STDOUT "stdout 1\n"; # działa to też dla print STDERR "stderr 1\n"; # podprocesów
close(STDOUT); close(STDERR);
open(STDOUT, ">&SAVEOUT"); open(STDERR, ">&SAVEERR");
print STDOUT "stdout 2\n"; print STDERR "stderr 2\n";Możesz podać "<&=N", gdzie N jest liczbą. Perl wtedy dokona operacji równoważnej fdopen(3) z C. Na przykład:
open(FILEHANDLE, "<&=$fd")Jeśli otwierasz potok do komendy "-", np. albo "⎪-" albo "-⎪", to dokonywany jest niejawny fork, a zwrócona wartość open jest wewnątrz procesu rodzicielskiego pidem potomka, a w wątku potomka zerem. (Aby określić, czy open był pomyślny, użyj defined($pid).) Uchwyt pliku u rodzica zachowuje się normalnie, lecz i/o dla tego uchwytu jest przesyłane przez potok STDOUT/STDIN procesu potomnego. W procesie potomny uchwyt nie jest otwierany--i/o jest z/do nowego STDOUT lub STDIN. Zazwyczaj jest to używane jak normalny potokowy open, lecz daje lepszą kontrolę nad wywoływaniem komendy potoku, np. gdy pracujesz w suid i nie chcesz być zmuszonym do skanowania komend powłoki w poszukiwaniu metaznaków. Następujące pary są mniej lub bardziej równoważne:
open(FOO, "⎪tr '[a-z]' '[A-Z]'"); open(FOO, "⎪-") ⎪⎪ exec 'tr', '[a-z]', '[A-Z]';
open(FOO, "cat -n '$file'⎪"); open(FOO, "-⎪") ⎪⎪ exec 'cat', '-n', $file;Dla szczegółów, zobacz sekcję Safe Pipe Opens w podręczniku perlipc(1).
UWAGA: Przy każdej operacji, dokonującej forkowania, nieopróżnione bufory pozostają takie w obydwu procesach, co znaczy, że lepiej ustawić $⎪, aby zapobiec duplikowaniu wyjścia.
Zamykanie potokowego uchwytu pliku powoduje, że proces rodzicielski czeka, aż dziecko zakończy i zwraca wartość statusu w $?.
Jeśli używasz konstruktora z pakietu IO::Handle (lub z jego podklas, takich jak IO::File czy IO::Socket), możesz generować anonimowe uchwyty plików, które mają zakres dowolnych zmiennych, które utrzymują do nich referencje. Zamykają się one automatycznie po wyjściu z zakresu:
use IO::File; ... sub read_myfile_munged { my $ALL = shift; my $handle = new IO::File; open($handle, "myfile") or die "myfile: $!"; $first = <$handle> or return (); # Automatyczne zamknięcie tutaj. mung $first or die "mung failed"; # Lub tutaj. return $first, <$handle> if $ALL; # Lub tutaj. $first; # Lub tutaj. }Nazwa pliku, która jest przekazana open, przechodzi operację usuwania prowadzących i kończących białych spacji. Aby otworzyć plik, posiadający te dziwne znaki, trzeba je chronić:
$file =~ s#^(\s)#./$1#; open(FOO, "< $file\0");Jeśli chcesz użyć prawdziwego, znanego z C open() (zobacz stronę open(2)), to powinieneś użyć funkcji sysopen(). Jest to inny sposób chronienia nazw plików przed interpretacją. Np:
use IO::Handle; sysopen(HANDLE, $path, O_RDWR⎪O_CREAT⎪O_EXCL, 0700) or die "sysopen $path: $!"; HANDLE->autoflush(1); HANDLE->print("stuff $$\n"); seek(HANDLE, 0, 0); print "Plik zawiera: ", <HANDLE>;Dla dalszych detali o miksowaniu odczytywania i zapisywania, obejrzyj opis seek(), znajdujący się gdzie indziej w tym dokumencie.
A Łańcuch ascii, dopełniany spacjami. a Łańcuch ascii, dopełniany przez null. b Łańcuch bitowy (wznosząca kolejność bitów, jak w vec()). B Łańcuch bitowy (malejąca kolejność bitów). h Łańcuch szesnastkowy (najpierw niski nibble). H Łańcuch szesnastkowy (najpierw wysoki nibble).
c Wartość char ze znakiem. C Wartość char bez znaku.
s Wartość short. S Wartość short bez znaku. (Ten 'short' jest _dokładnie_ 16 bitowy, co może się różnić od tego, co lokalny kompilator C nazywa jako 'short'.)
i Wartość int ze znakiem. I Wartość int bez znaku. (Ten 'int' jest przynajmniej 32 bitowy. Dokładny rozmiar zależy od tego, co lokalny kompilator C uważa za 'int' i może być nawet większe niż 'long', opisywany dalej.)
l Wartość long ze znakiem. L Wartość long bez znaku. (Ta wartość 'long' jest _dokładnie_ 32 bitowa, co może się różnić od tego, co lokalny kompilator C uważa za 'long'.)
n Short w porządku sieciowym (big-endian). N Long w porządku sieciowym (big-endian). v Short w porządku "VAX" (little-endian). V Long w porządku "VAX" (little-endian). (Te 'short' i 'long' są _dokładnie_ 16 i 32 bitowe (odpowiednio).)
f Float pojedynczej precyzji w formacie macierzystym. d Float podwójnej precyzji w formacie macierzystym.
p Wskaźnik do łańcucha zakończonego zerem. P Wskaźnik do struktury (łańcuch o ustalonej długości).
u Uuencodowany łańcuch.
w Skompresowany integer BER. Jego bajty reprezentują całkowity integer o podstawie 128, najpierw bardziej znaczące cyfry, z tak małą ilością cyfr, jak tylko się da. Ósmy bit jest ustawiany na każdym bajcie, poza ostatnim.
x Bajt null. X Wstecz o bajt (?) (Back up a byte). @ Wypełnienie null do bezwzględnej pozycji (?) (Null fill to absolute position).Po każdej literze może opcjonalnie następować liczba, która podaje licznik powtórzeń. Dla wszystkich typów, poza "a", "A", "b", "B", "h", "H", i "P", funkcja pack pożre tyle samo wartości z LISTY. Gwiazdka (*) dla licznika powtórzeń, oznacza użycie wszystkich elementów, które pozostały. Typy "a" i "A" pobierają tylko jedną wartość, lecz pakują ją jako łańcuch o podanej długości, wypełniając ją w razie potrzeby zerami, lub spacjami. (Podczas rozpakowywania, "A" zdejmuje kończące spacje i zera, lecz "a" tego nie robi.) Podobnie, pola "b" i "B" pakują łańcuchy, które są długości tylu bitów. "h" i "H" pakują łańcuchy, które są długości tylu nibblów. "P" pakuje wskaźnik do struktury, której rozmiar jest wskazywany przez długość. Liczby rzeczywiste (float, double) są tylko w formacie macierzystym maszyny; z powodu wielości formatów zmiennoprzecinkowych i braku standardowej reprezentacji "sieciowej", nie ma żadnego sposobu uniwersalnej wymiany. Oznacza to, że spakowane dane zmiennoprzecinkowe, zapisane na jednej maszynie, mogą nie być odczytywalne na innej - nawet jeśli obydwie używają arytmetyki zmiennoprzecinkowej IEEE (gdyż endainowość pamięci nie jest częścią specyfikacji IEEE). Zauważ, że perl używa wewnętrznie dla wszystkich obliczeń numerycznych reprezentacji double i że konwersja z double na float, a potem z powrotem na double powoduje utratę precyzji (np. unpack("f", pack("f", $foo)) nie będzie w ogólnym przypadku się równać $foo).
Przykłady:
$foo = pack("cccc",65,66,67,68); # foo to "ABCD" $foo = pack("c4",65,66,67,68); # to samo
$foo = pack("ccxxcc",65,66,67,68); # foo to "AB\0\0CD"
$foo = pack("s2",1,2); # "\1\0\2\0" na little-endian # "\0\1\0\2" na big-endian
$foo = pack("a4","abcd","x","y","z"); # "abcd"
$foo = pack("aaaa","abcd","x","y","z"); # "axyz"
$foo = pack("a14","abcdefg"); # "abcdefg\0\0\0\0\0\0\0"
$foo = pack("i9pl", gmtime); # rzeczywista struktura tm (przynajmniej na moim systemie)
sub bintodec { unpack("N", pack("B32", substr("0" x 32 . shift, -32))); }Ten sam wzorzec może być ogólnie używany też w funkcji unpack.
Zobacz sekcję Packages w podręczniku
perlmod(1). Zobacz też podręcznik
perlsub(1), gdzie opisane są problemy zakresów.
Obejrzyj jeszcze stronę IPC::Open2,
IPC::Open3 oraz sekcję Bidirectional Communication
z podręcznika perlipc(1). Są tam przykłady
takich rzeczy.
$tmp = $ARRAY[$#ARRAY--];Jeśli tablica nie ma elementów, zwracana jest wartość niezdefiniowana. Jeśli parametr TABLICA zostanie pominięty, to pobiera z tablicy @ARGV w programie głównym, oraz z @_ w podprocedurach, podobnie jak shift().
Zauważ, że jeśli przechowujesz UCHWYTYPLIKÓW w tablicy, lub innym wyrażeniu, będziesz musiał używać bloku, zwracającego jego wartość:
print { $files[$i] } "stuff\n"; print { $OK ? STDOUT : STDERR } "stuff\n";
Nie wpadnij w pułapkę używania
printf(), gdy wystarczyłby zwykły print().
Funkcja print() jest efektywniejsza i mniej wrażliwa na
błędy.
for $value (LIST) { $ARRAY[++$#ARRAY] = $value; }lecz jest efektywniejsze. Zwraca nową liczbę elementów tablicy.
Jeśli WYRAŻ jest pominięte,
używane jest $_.
(Uwaga: Jeśli twoja funkcja rand zwraca stale liczby,
które są zbyt wielkie, lub zbyt małe, to znaczy,
że twoja wersja perla prawdopodobnie została skompilowana
ze złą liczbą RANDBITS.)
Jeśli masz zamiar dokonywać testów plikowych na wartościach zwracanych przez readdir(), to lepiej poprzedź te nazwy katalogiem. Powinno się tak robić, gdyż nie readdir() nie przechodzi do swojego katalogu i zaszło by testowanie nie tego pliku co trzeba.
opendir(DIR, $some_dir) ⎪⎪ die "Nie powiódł się opendir $some_dir: $!"; @dots = grep { /^\./ && -f "$some_dir/$_" } readdir(DIR); closedir DIR;
# Uproszczony ogołacacz komentarzy Pascala # (uwaga: zakłada brak { i } w łańcuchach) LINE: while (<STDIN>) { while (s⎪({.*}.*){.*}⎪$1 ⎪) {} s⎪{.*}⎪ ⎪; if (s⎪{.*⎪ ⎪) { $front = $_; while (<STDIN>) { if (/}/) { # Koniec komentarza? s⎪^⎪$front{⎪; redo LINE; } } } print; }
REF SCALAR ARRAY HASH CODE GLOBJeśli referencjowany obiekt został błogosławiony (bless()) do pakietu, to zwracana jest nazwa pakietu. Możesz myśleć o ref() jak o operatorze typeof().
if (ref($r) eq "HASH") { print "r jest referencją do tablicy asocjacyjnej.\n"; } if (!ref ($r) { print "r nie jest referencją.\n"; }Zobacz też stronę podręcznika perlref(1).
W przeciwnym wypadku żąda włączenia pliku biblioteki (o ile nie jest on już włączony). Plik jest włączany z użyciem mechanizmu do-PLIK, który w zasadzie jest wariacją eval(). Semantyka jest podobna do następującej podprocedury:
sub require { local($filename) = @_; return 1 if $INC{$filename}; local($realfilename,$result); ITER: { foreach $prefix (@INC) { $realfilename = "$prefix/$filename"; if (-f $realfilename) { $result = do $realfilename; last ITER; } } die "Nie mogę znaleźć $filename w \@INC"; } die $@ if $@; die "$filename nie zwróciło prawdziwej wartości" unless $result; $INC{$filename} = $realfilename; $result; }Zauważ, że plik nie będzie włączany pod tą samą nazwą dwukrotnie. Jako ostatnią instrukcję, plik musi zwracać TRUE, wskazując tak pomyślne wykonanie kodu inicjalizacji, więc zazwyczaj kończy się takie pliki "1;", chyba że jesteś pewien, że zwróci TRUE tak czy inaczej. Lepiej jednak wstawić po prostu"1;", na wypadek np. dodania nowych instrukcji.
Jeśli WYRAŻ jest prostym słowem, require zakłada rozszerzenie ".pm" i samodzielnie zamienia "::" na "/", ułatwiając ładowanie modułów standardowych. Ta postać ładowania modułów nie ryzykuje zmieniania twojej przestrzeni nazw. to make it easy to load standard modules. This form of loading of modules does not risk altering your namespace.
Dla potężniejszego narzędzia importu,
obejrzyj opis use, znajdujący się
w tym dokumencie, oraz stronę perlmod(1).
reset 'X'; # resetuj wszystkie zmienne X reset 'a-z'; # resetuj zmienne małoliterowe reset; # resetuj tylko przeszukiwania ??Resetowanie "A-Z" nie jest zalecane, gdyż odniesie się ono również do tablic ARGV i ENV. Resetowane są tylko zmienne pakietu--zmienne leksykalne są nietykane, lecz one i tak oczyszczają się na wyjściu z zakresu. Zobacz opis my, znajdujący się gdzieś w tym dokumencie.
(Zauważ, że przy braku return, podprocedura,
eval, lub do PLIK zakończą automatycznie z
wartością ostatniego wykonanego wyrażenia.)
print reverse <>; # line tac, last line first
undef $/; # for efficiency of <> print scalar reverse <>; # byte tac, last line tsrifOperator ten jest też przydatny do inwersji tablicy asocjacyjnej, choć są tu pewne zastrzeżenia. Jeśli wartość jest w oryginalnej tablicy zduplikowana, to tylko jedna z nich może być reprezentowana jako klucz w tablicy odwróconej. Musi to też przewinąć całą tablicę i zbudować nową, co dla dużej tablicy może trochę potrwać.
%by_name = reverse %by_address; # Inwersja tablicy asocjacyjnej
@counts = ( scalar @a, scalar @b, scalar @c );Nie istnieje odpowiednik, konwertujący skalar w listę. Jest tak dlatego, że w praktyce nie jest on nigdy potrzebny. Jeśli jednak naprawdę chcesz tak zrobić, możesz użyć konstrukcji @{[ (jakieś wyrażenie) ]}, a zwykle powinno wystarczyć zwykłe (some expression).
Jeśli chcesz ustawić pozycję pliku dla sysread() i syswrite(), nie używaj seek() -- użyj sysseek().
Na niektórych systemach musisz wykonać seek za każdym razem, gdy przełączasz się między zapisem i odczytem. Wśród innych rzeczy, może to mieć efekt wołania funkcji stdio clearerr(3). Wartość GDZIE 1 jest przydatna do nie ruszania się z pozycji pliku:
seek(TEST,0,1);Jest to również przydatne dla aplikacji, emulujących tail -f. Gdy raz wejdziesz na EOF, a potem zaśniesz na chwilę, to dobrze przed następnym odczytem użyć seek(), aby wszystko zresetować. seek() nie zmienia bieżącej pozycji, lecz czyści warunek EOF uchwytu, więc następne <PLIK> powoduje, że perl znów coś będzie próbował odczytać. Mamy przynajmniej taką nadzieję.
Jeśli to nie działa (niektóre stdio są szczególnie dziwne), to możesz potrzebować czegoś więcej, jak:
for (;;) { for ($curpos = tell(FILE); $_ = <FILE>; $curpos = tell(FILE)) { # szukaj jakichś rzeczy i wstaw je do plików } sleep($for_a_while); seek(FILE, $curpos, 0); }
select(REPORT1); $^ = 'report1_top'; select(REPORT2); $^ = 'report2_top';UCHWYTPLIKU może być wyrażeniem, które daje nazwę rzeczywistego uchwytu pliku. Tak więc:
$oldfh = select(STDERR); $⎪ = 1; select($oldfh);Niektórzy programiści wolą myśleć o uchwytach pliku jak o obiektach, posiadających metody, zapisując ostatni przykład jako:
use IO::Handle; STDERR->autoflush(1);
$rin = $win = $ein = ''; vec($rin,fileno(STDIN),1) = 1; vec($win,fileno(STDOUT),1) = 1; $ein = $rin ⎪ $win;Jeśli chcesz wykonywać tę funkcję na wielu uchwytach plików, możesz napisać podprocedurę:
sub fhbits { local(@fhlist) = split(' ',$_[0]); local($bits); for (@fhlist) { vec($bits,fileno($_),1) = 1; } $bits; } $rin = fhbits('STDIN TTY SOCK');Spotykanym idiomem jest:
($nfound,$timeleft) = select($rout=$rin, $wout=$win, $eout=$ein, $timeout);aby blokować, aż coś stanie się gotowe, wykonaj po prostu
$nfound = select($rout=$rin, $wout=$win, $eout=$ein, undef);Większość systemów nie zwraca niczego mądrego w $timeleft, więc wywołanie select() w kontekście skalarnym zwróci po prostu $nfound.
Każda z masek bitowych może być niezdefiniowana. Podany timeout jest podawany w sekundach. Może być ułamkowy. Uwaga: nie wszystkie implementacje zwracają $timeleft. Jeśli go nie zwracają, to zwracają wartość równą tej, przekazanej w $timeout.
A oto 250 milisekundowe zaśnięcie:
select(undef, undef, undef, 0.25);UWAGA: Nie próbuj łączyć buforowanego I/O (np. read czy <FH>) z funkcją select. Użyj zamiast tego sysread().
$semop = pack("sss", $semnum, -1, 0); die "Problem z semaforem: $!\n" unless semop($semid, $semop);Aby ustawić semafor, zamień "-1" na "1".
Dla operacji odwrotnej do sinusa, możesz użyć funkcji POSIX::asin(), lub następującej relacji:
sub asin { atan2($_[0], sqrt(1 - $_[0] * $_[0])) }
Na niektórych systemach, spanie może trwać do sekundy mniej niż żądałeś, zależnie od sposobu obliczania sekund. Większość nowoczesnych systemów przesypia cały okres.
Dla pauz, lub większej dokładności niż sekunda, możesz użyć interfejsu syscall() perla i dostać się do funkcji setitimer(2), o ile jest ona obsługiwana przez twój system. Możesz też zapoznać się z opisem select(), znajdującym się gdzieś w tym dokumencie.
Zobacz także funkcję sigpause() z
modułu POSIX.
W celu polepszenia efektywności, pomijany jest normalny kod wołania podprocedur: podprocedura nie może być rekurencyjna, a dwa porównywane elementy nie są przekazywane przez @_, lecz jako globalne zmienna pakietu $a oraz $b (zobacz przykład poniżej). Są one przekazywane przez referencję, więc nie modyfikuj ani $a, ani $b. Nie próbuj też deklarować ich jako leksykalne.
Nie można też wyjść z bloku sortującego przy użyciu żadnego operatora kontroli pętli czy goto().
Gdy działa use locale, sort LIST sortuje LISTĘ według odpowiedniego locale. Zobacz stronę perllocale(1).
Przykłady:
# sortuj leksykalnie @articles = sort @files;
# to samo, z jawną procedurą sortującą @articles = sort {$a cmp $b} @files;
# teraz niewrażliwie na wielkość liter @articles = sort {uc($a) cmp uc($b)} @files;
# to samo w odwrotnym porządku @articles = sort {$b cmp $a} @files;
# sortuj rosnąco, numerycznie @articles = sort {$a <=> $b} @files;
# j/w, malejąco @articles = sort {$b <=> $a} @files;
# sortuj, używając jawnej nazwy podprocedury sub byage { $age{$a} <=> $age{$b}; # założenie numeryczności } @sortedclass = sort byage @class;
# to sortuje tablicę asocjacyjną %age według wartości (zamiast klucza) # przy użyciu funkcji inline @eldest = sort { $age{$b} <=> $age{$a} } keys %age;
sub backwards { $b cmp $a; } @harry = ('dog','cat','x','Cain','Abel'); @george = ('gone','chased','yz','Punished','Axed'); print sort @harry; # drukuje AbelCaincatdogx print sort backwards @harry; # drukuje xdogcatCainAbel print sort @george, 'to', @harry; # drukuje AbelAxedCainPunishedcatchaseddoggonetoxyz
# sortuj nieefektywnie według malejącego porównania numerycznego, # używając pierwszej liczby całkowitej po znaku =, lub w przeciwnym # wypadku cały rekord, bez zwracania uwagi na wielkość liter.
@new = sort { ($b =~ /=(\d+)/)[0] <=> ($a =~ /=(\d+)/)[0] ⎪⎪ uc($a) cmp uc($b) } @old;
# to samo, dużo efektywniej; # zbudujemy zewnętrzne indeksy @nums = @caps = (); for (@old) { push @nums, /=(\d+)/; push @caps, uc($_); }
@new = @old[ sort { $nums[$b] <=> $nums[$a] ⎪⎪ $caps[$a] cmp $caps[$b] } 0..$#old ];
# to samo, przy użyciu Schwartzian Transform (bez tymczasowych) @new = map { $_->[0] } sort { $b->[1] <=> $a->[1] ⎪⎪ $a->[2] cmp $b->[2] } map { [$_, /=(\d+)/, uc($_)] } @old;Jeśli używasz strict, nie możesz deklarować $a i $b jako leksykalia. Są one pakietowymi globaliami. Znaczy to, że jeśli jesteś w pakiecie głównym (main), to jest to
@articles = sort {$main::b <=> $main::a} @files;kub po prostu
@articles = sort {$::b <=> $::a} @files;lecz jeśli jesteś w pakiecie FooPack, to jest to
@articles = sort {$FooPack::b <=> $FooPack::a} @files;Funkcja porównująca musi się zachowywać [jednoznacznie]. Jeśli zwraca niespójne, nielogiczne wyniki (np. czasem mówiąc, że $x[1] jest mniejsze niż $x[2], a czasem odwrotnie), to interpreter perla prawdopodobnie się wysypie i zrzuci core. Wynika to całkowicie z zależności od systemowej funkcji bibliotecznej qsort(3); funkcja ta często nie dokonuje pewnych sprawdzeń w celu polepszenia szybkości.
push(@a,$x,$y) splice(@a,$#a+1,0,$x,$y) pop(@a) splice(@a,-1) shift(@a) splice(@a,0,1) unshift(@a,$x,$y) splice(@a,0,0,$x,$y) $a[$x] = $y splice(@a,$x,1,$y);Przykład, przy założeniu, że długości tablic są przekazywane przed tablicami:
sub aeq { # porównaj dwie wartości listowe local(@a) = splice(@_,0,shift); local(@b) = splice(@_,0,shift); return 0 unless @a == @b; # ta sama długość? while (@a) { return 0 if pop(@a) ne pop(@b); } return 1; } if (&aeq($len,@foo[1..$len],0+@bar,@bar)) { ... }
Jeśli nie jest w kontekście listowym, to zwraca listę znalezionych pól i dzieli do tablicy @_. (w kontekście listowym możesz wymusić dzielenie do @_, używając jako rozdzielaczy wzorca ??, lecz będzie wciąż zwracać wartość tablicową.) Używanie jawnego dzielenia do @_ nie jest jednak zalecane.
Jeśli WYRAŻ jest pominięty, dzielony jest łańcuch $_. Jeśli pominięty jest też WZORZEC, dzielenie następuje na białych spacjach (po pominięciu wszelkich prowadzących białych spacji). Wszystko, odpowiadające WZORCOWI jest uważane za rozdzielacz pól. (Zauważ, że rozdzielacz może być dłuższy niż jeden znak.) Jeśli podano wartość LIMIT i nie jest to liczba ujemna, dzielenie następuje do nie więcej niż tej ilości pól. Jeśli LIMIT nie jest podany, kończące wypełnienia nullowe są obcinane (co dobrze pamiętać użytkownikom pop()). Jeśli LIMIT jest ujemny, to jest traktowany tak, jakby podano arbitralnie duży LIMIT.
Wzorzec, odpowiadający łańcuchowi null (żeby nie być zmylonym ze wzorcem null //, który jest tylko jednym członkiem z zestawu wzorców odpowiadających łańcuchowi null) będzie dzielił wartość WYRAŻ na oddzielne znaki w każdym punkcie, który odpowie zapytaniu. Na przykład:
print join(':', split(/ */, 'hi there'));da w wyniku 'h:i:t:h:e:r:e'.
Parametr LIMIT może być użyty do podzielenia linii częściowo
($login, $passwd, $remainder) = split(/:/, $_, 3);Podczas przypisywania do listy, jeśli nie podano LIMITU, perl ustawia domyślny limit wielkości o 1 większej niż lista zmiennych na liście, zapobiegając tak niepotrzebnej pracy. Dla powyższej listy, LIMIT byłby ustawiony domyślnie na 4. W aplikacjach, gdzie czas jest krytycznym czynnikiem, powstrzymuje cię to od dzielenia na więcej pól, niż rzeczywiście potrzebujesz.
Jeśli WZORZEC zawiera nawiasy, z łańcuchów odpowiadającym podłańcuchom rozdzielacza tworzone są dodatkowe elementy tablicy.
split(/([,-])/, "1-10,20", 3);daje wartość listową
(1, '-', 10, ',', 20)Jeśli masz cały nagłówek normalnego unixowego komunikatu pocztowego w nagłówku $header, to możesz rozdzielić go na pola i wartości w następujący sposób:
$header =~ s/\n\s+/ /g; # obsłuż linie kontynuacji %hdrs = (UNIX_FROM => split /^(.*?):\s*/m, $header);Wzorzec /WZORZEC/ może być zamieniony wyrażeniem, umożliwiając tak podawanie wzorców, które zmieniają się w czasie. (aby dokonać kompilacji czasu działania tylko raz, użyj /$variable/o.)
Specjalnym przypadkiem jest podanie jako WZORZEC spacji (' '). Będzie to powodować dzielenie na białych spacjach, podobnie jak domyślna wersja split. Tak więc split(' ') może być używany do domyślnego zachowania awk, gdzie split(/ /) daje tyle łańcuchów null, ile jest prowadzących białych spacji. Split dla /\s+/ jest podobny do split(' '), lecz dowolna biała spacja powoduje null na pierwszym polu. Split bez argumentów dokonuje w rzeczywistości wewnętrznie split(' ', $_).
Przykład:
open(passwd, '/etc/passwd'); while (<passwd>) { ($login, $passwd, $uid, $gid, $gcos, $home, $shell) = split(/:/); ... }(Zauważ, że $shell w powyższym będzie miał za sobą nową linię. Aby ją usunąć, zapoznaj się z funkcjami chop, chomp i join, opisanymi gdzieś w tym dokumencie.)
Perl emuluje funkcję C sprintf(), lecz nie używa jej (poza liczbami zmiennoprzecinkowymi, a nawet wtedy dozwolone są tylko standardowe modyfikatory). W wyniku, w perlu nie są dostępne żadne niestandardowe rozszerzenia lokalnej wersji sprintf().
Perlowy sprintf() zezwala na następujące, ogólnie znane konwersje:
%% znak procentu %c znak o podanym kodzie %s łańcuch %d integer ze znakiem, dziesiętnie %u integer bez znaku, dziesiętnie %o integer bez znaku, ósemkowo %x integer bez znaku, szesnastkowo %e liczba zmiennoprzecinkowa w notacji naukowej %f liczba zmiennoprzecinkowa w ustalonej notacji dziesiętnej %g liczba zmiennoprzecinkowa w notacji %e lub %fDodatkowo, perl zezwala na następujące szeroko-obsługiwane konwersje:
%X podobne do %x, lecz na dużych literach %E podobne do %e, lecz z użyciem dużego E %G podobne do %g, lecz z użyciem dużego E %p wskaźnik (daje adres wartości, podany szesnastkowo) %n specjalne: przechowuje liczbę dotychczas wpisanych do następnej zmiennej z listy parametrówI w końcu, dla kompatybilności wstecznej, perl zezwala na poniższe zbyteczne, lecz szeroko obsługiwane konwersje:
%i synonim %d %D synonim %ld %U synonim %lu %O synonim %lo %F synonim %fPerl zezwala na użycie następujących uniwersalnych flag między znakiem %, a literą konwersji:
spacja poprzedź liczbę dodatnią spacją + poprzedź liczbę dodatnią plusem - wyrównuj do lewej w obszarze pola 0 użyj zer zamiast spacji do wyrównywania w prawo # poprzedź liczbę ósemkową "0", szesnastkową "0x" liczba minimalna wielkość pola .liczba "precyzja": liczba cyfr po kropce dziesiętnej dla zmiennoprzecinkowych, maksymalna długość dla łańcucha, lub minimalna długość dla liczby całkowitej (integer) l interpretuj integer jak typ C "long", lub "unsigned long" h interpretuj integer jak typ C "short", lub "unsigned short"Istnieje też jedna flaga specyficzna dla perla:
V interpretuj integer jako standardowy typ integera w perluTam, gdzie we flagach pojawia się liczba, można użyć gwiazdki ("*"). W tym wypadku perl używa zamiast liczby wartości następnego argumentu z listy parametrów. Jeśli szerokość pola, uzyskana przez "*" jest ujemna, to ma to samo działanie, co flaga '-': wyrównywanie do lewej.
Jeśli działa use locale,
znaki używane do kropki dziesiętnej będą
drukowane według locale LC_NUMERIC. Zobacz stronę
perllocale(1).
W rzeczywistości, zazwyczaj w ogóle nie jest konieczne wywoływanie srand, ponieważ jest ono wywoływane niejawnie przy pierwszym użyciu operatora rand. Jednak nie było tak w wersjach wcześniejszych niż perl 5.005, więc jeśli twój skrypt ma działać ze starszymi wersjami, powinien jednak wołać srand().
Zauważ, że dla potrzeb kryptografii potrzebujesz czegoś więcej niż tylko wylosować domyślne nasionko. Popularną metodą jest sprawdzanie sum kontrolnych skompresowanego wyjścia z jednego, lub więcej programów szybko zmieniającego się statusu systemu operacyjnego. Na przykład:
srand (time ^ $$ ^ unpack "%L*", `ps axww ⎪ gzip`);Jeśli naprawdę ci na tym zależy, zobacz moduł Math::TrulyRandom w CPAN.
Nie wołaj srand() wielokrotnie, chyba że dokładnie wiesz co i w jakim celu robisz. Celem tej funkcji jest zasilenie funkcji rand() tak, by rand() zwracał inną sekwencję dla każdego uruchomienia programu. Zrób to raz, na samym początku programu, bo w przeciwnym wypadku nie uzyskasz z rand() liczb losowych!
Często wywoływane programy (takie jak skrypty CGI), które jako nasionka używają po prostu
time ^ $$mogą paść ofiarą własności matematycznej, że
a^b == (a+1)^(b+1)przez jedną trzecią czasu. Więc nie rób tego.
($dev,$ino,$mode,$nlink,$uid,$gid,$rdev,$size, $atime,$mtime,$ctime,$blksize,$blocks) = stat($filename);Nie wszystkie z tych pól są obsługiwane na wszystkich rodzajach systemów plików. Oto znaczenia pól:
0 dev numer urządzenia systemu plików 1 ino numer inode 2 mode prawa pliku (typ i prawa) 3 nlink liczba twardych dowiązań do pliku 4 uid numeryczny UID właściciela 5 gid numeryczny GID właściciela 6 rdev identyfikator urządzenia (tylko dla plików specjalnych) 7 size całkowity rozmiar w bajtach 8 atime ostatni dostęp od epoki 9 mtime ostatnia modyfikacja od epoki 10 ctime ostatnia zmiana inode od epoki 11 blksize preferowany rozmiar bloku dla I/O systemu plików 12 blocks rzeczywista liczba zaalokowanych bloków(Epoka nastąpiła o 00:00 1 stycznia, 1970 GMT.)
Jeśli funkcja dostanie specjalny uchwyt pliku, składający się z podkreślenia, to nie jest ona wykonywana, lecz przekazywana jest zawartość ostatniego testu pliku. Przykład:
if (-x $file && (($d) = stat(_)) && $d < 0) { print "$file jest wykonywalnym plikiem NFS\n"; }(Działa to tylko na maszynach, dla których numer urządzenia jest ujemny dla NFS.)
Na przykład oto pętla, która wstawia wpisy tworzące indeks przed każdą linię, zawierającą określony wzorzec:
while (<>) { study; print ".IX foo\n" if /\bfoo\b/; print ".IX bar\n" if /\bbar\b/; print ".IX blurfl\n" if /\bblurfl\b/; ... print; }Użycie study spowoduje szukanie /\bfoo\b/ tylko w miejscach $_, które zawierają "f", gdyż jest to najrzadszy znak. Ogólnie, daje to duże zyski, poza przypadkami patologicznymi. Jedynym pytaniem jest to, czy zachowuje ci to więcej czasu niż zabrało zbudowanie powiązanej listy.
Zauważ, że jeśli musisz szukać łańcuchów, o których nic nie wiesz, aż do uruchomienia, to możesz zbudować całą pętlę jako łańcuch i evalować to, by zapobiec ciągłemu rekompilowaniu wzorców. W połączeniu z czynieniem $/ niezdefiniowanym, aby wessać całe pliki jako jeden rekord, może to być bardzo szybkie, często szybsze niż specjalizowane programy typu fgrep(1). Następujący przykład skanuje listę plików (@files) w poszukiwaniu listy słów (@words) i drukuje nazwy plików, zawierających odpowiednik:
$search = 'while (<>) { study;'; foreach $word (@words) { $search .= "++\$seen{\$ARGV} if /\\b$word\\b/;\n"; } $search .= "}"; @ARGV = @files; undef $/; eval $search; # to krzyczy $/ = "\n"; # ustaw normalny rozdzielacz wejścia foreach $file (sort keys(%seen)) { print $file, "\n"; }
Funkcji substr() możesz użyć jako
lwartości, w którym wypadku WYRAŻ musi być
lwartością. Jeśli przyznasz coś
krótszego niż DŁUGOŚĆ,
łańcuch zostanie skrócony, a jeśli
coś dłuższego, to łańcuch zostanie
rozciągnięty. Aby zachować stałą
długość łańcucha, możesz
potrzebować dopełnić, lub obciąć
wartości przy użyciu sprintf().
$symlink_exists = (eval {symlink("","")};, $@ eq '');
require 'syscall.ph'; # może być niezbędne h2ph syscall(&SYS_write, fileno(STDOUT), "hi there\n", 9);Zauważ, że perl obsługuje przekazywanie do 14 argumentów do wywołania systemowego, co w praktyce powinno wystarczyć.
Prawidłowe wartości i bity flag parametru TRYB są zależne od systemu; są one dostępne przez standardowy moduł Fcntl. Jednak z przyczyn historycznych, niektóre wartości są uniwersalne; zero oznacza tylko dla odczytu, jeden tylko dla zapisu, a dwa dla zapisu i odczytu.
Jeśli plik NAZWAPLIKU nie istnieje, a wywołanie open go tworzy (zazwyczaj dlatego, że TRYB zawiera flagę O_CREAT), to wartość PRAW określa prawa nowo utworzonego pliku. Jeśli są one pominięte, używana jest domyślna wartość 0666, która umożliwia wszystkim odczyt i zapis. Wartość ta ma sens, zobacz umask.
Moduł IO::File daje bardziej obiektowe podejście
do tych rzeczy.
Aby spowodować odczyt danych z któregoś
miejsca łańcucha (różnego niż
początek), można podać dodatkowo parametr OFFSET.
Jeśli parametr ten jest ujemny, to wskazywana jest pozycja
przesunięta o tyleż bajtów w tył od
końca łańcucha. Jeśli dodatni offset jest
większy od długości SKALARA, to wynikiem jest
wypełnienie do wymaganego rozmiaru znakami "\-", a
następnie doklejenie odczytu.
Zwracana jest nowa pozycja, lub wartość
niezdefiniowana w wypadku błędu. Pozycja zerowa zwracana
jest jako łańcuch "0 but true"; tak więc
sysseek() zwraca TRUE po sukcesie i FALSE po
błędzie, lecz wciąż możesz
łatwo ustalić nową pozycję.
Ponieważ zarówno system() i odwrotne apostrofy blokują SIGINT i SIGQUIT, ubicie ich nie powoduje przerwania twojego programu.
@args = ("command", "arg1", "arg2"); system(@args) == 0 or die "system @args się nie powiódł: $?"A oto bardziej wyrafinowany przykład analizowania wartości zwracanej przez system(). Ma to miejsce na systemie unixowym i jest robione, aby sprawdzić wszystkie możliwości, włącznie z sygnałami i zrzutami core.
$rc = 0xffff & system @args; printf "system(%s) zwrócił %#04x: ", "@args", $rc; if ($rc == 0) { print "normalne zakończenie\n"; } elsif ($rc == 0xff00) { print "komenda się nie powiodła: $!\n"; } elsif ($rc > 0x80) { $rc >>= 8; print "niezerowy status wyjścia $rc\n"; } else { print "skończył z "; if ($rc & 0x80) { $rc &= ~0x80; print "zrzutem core z "; } print "sygnałem $rc\n" } $ok = ($rc != 0);
Dodatkowo można podać OFFSET, aby zapisać
dane z jakiejś części łańcucha,
która nie jest początkiem. Ujemna wartość
offsetu nakazuje zapisywanie od miejsca, przesuniętego o tyle
bajtów od końca łańcucha.
Zauważ, że funkcje takie, jak keys() i valuse() mogą zwracać wielkie wartości tablicowe, jeśli użyć je na dużych obiektach, takich jak pliki DBM. Lepiej może być użyć funkcji each() i na nich iterować. Przykład:
# drukuj offsety pliku historii use NDBM_File; tie(%HIST, 'NDBM_File', '/usr/lib/news/history', 1, 0); while (($key,$val) = each %HIST) { print $key, ' = ', unpack('L',$val), "\n"; } untie(%HIST);Klasa, implementująca tablicę asocjacyjną, powinna mieć następujące metody:
TIEHASH classname, LIST DESTROY this FETCH this, key STORE this, key, value DELETE this, key EXISTS this, key FIRSTKEY this NEXTKEY this, lastkeyKlasa, implementująca zwykłą tablicę, powinna mieć następujące metody:
TIEARRAY classname, LIST DESTROY this FETCH this, key STORE this, key, value [others TBD]Klasa, implementująca skalar, powinna mieć następujące metody:
TIESCALAR classname, LIST DESTROY this FETCH this, STORE this, valueW przeciwieństwie do funkcji dbmopen(), funkcja tie() nie używa, lub wymaga dla ciebie modułów (use, require)--musisz o to zadbać samodzielnie. Zobacz podręcznik DB_File oraz moduł Config dla interesujących implementacji tie().
($user,$system,$cuser,$csystem) = times;
Jeśli WYRAŻ jest pominięte, używa
$_.
If EXPR is omitted, uses $_.
undef $foo; undef $bar{'blurfl'}; # Porównaj z: delete $bar{'blurfl'}; undef @ary; undef %hash; undef &mysub; return (wantarray ? (undef, $errmsg) : undef) if $they_blew_it; select undef, undef, undef, 0.25; ($a, $b, undef, $c) = &foo; # Ignoruj trzecią zwróconą wartość
$cnt = unlink 'a', 'b', 'c'; unlink @goners; unlink <*.bak>;Uwaga: unlink nie skasuje katalogów, chyba że jesteś superużytkownikiem i przekazałeś perlowi flagę -U. Nawet gdy te warunki są spełnione, bądź ostrzeżony, że skasowanie katalogu może wywołać uszkodzenie systemu plików. Zamiast tego użyj rmdir.
Jeśli LISTA jest pominięta, używa
$_.
sub substr { local($what,$where,$howmuch) = @_; unpack("x$where a$howmuch", $what); }a potem mamy
sub ordinal { unpack("c",$_[0]); } # to samo co ord()Dodatkowo, możesz poprzedzić pola %<liczbą>, wskazując, że chcesz <liczba>-bitową sumę szesnastkową elementów, zamiast samych elementów. Domyślna jest suma 16-bitowa. Na przykład, następujący przykład oblicza tę samą liczbę co program sum z Systemu V:
while (<>) { $checksum += unpack("%16C*", $_); } $checksum %= 65536;Następujący fragment efektywnie oblicza liczbę ustawionych bitów w wektorze bitowym:
$setbits = unpack("%32b*", $selectmask);
unshift(ARGV, '-e') unless $ARGV[0] =~ /^-/;Zauważ, że LISTA jest doklejana cała, a nie jeden element naraz, więc doklejone elementy pozostają w tej samej kolejności. Aby ją odwrócić, użyj reverse.
BEGIN { require Module; import Module LIST; }poza tym, że Module musi być gołym słowem.
Jeśli pierwszy argument use jest liczbą, to jest ona traktowana jako numer wersji, zamiast nazwa modułu. Jeśli wersja interpretera perla jest mniejsza niż WERSJA, to wyświetlony zostanie komunikat o błędzie, a perl natychmiast zakończy działanie. Jest to często przydatne, jeśli chcesz sprawdzić wersję perla przed używaniem modułów bibliotecznych, które zmieniły się w sposób niekompatybilny od czasu starszych wersji perla. (staramy się by tak nie było.)
Słowo BEGIN wymusza by require i import zaszły podczas kompilacji. Require zapewnia, że moduł będzie załadowany do pamięci, jeśli wcześniej nie był. Import nie jest wbudowany--jest to tylko zwykłe, statyczne wywołanie metody pakietu "Module" aby powiedzieć modułowi, by zaimportował listę właściwości do pakietu bieżącego. Moduł może implementować swoją metodę import w dowolny sposób, choć większość modułów woli wyprowadzać swoją metodę poprzez dziedziczenie z klasy Exporter, zdefiniowanej w module Exporter, Zobacz podręcznik Exporter. Jeśli nie ma żadnej metody importującej, to błąd jest cicho ignorowany. Może się to w przyszłych wersjach zmienić na błąd krytyczny.
Jeśli nie chcesz zmieniania swojej przestrzeni nazw, załącz jawnie pustą listę:
use Module ();Jest to dokładnie równoważne
BEGIN { require Module; }Jeśli między Module, a LISTA jest obecny argument WERSJA, to use wywoła metodę VERSION klasy Module z podaną wersją, jako argumentem. Domyślna metoda VERSION, dziedziczona z klasy Universal, zakracze jeśli podana wersja jest większa niż wartość zmiennej $Module::VERSION. (Zauważ, że nie ma przecinka po WERSJI!)
Ponieważ jest to szeroko otwarty interfejs, można tak implementować też pragmy (dyrektywy kompilatora). Obecnie zaimplementowane pragmy to:
use integer; use diagnostics; use sigtrap qw(SEGV BUS); use strict qw(subs vars refs); use subs qw(afunc blurfl);Te pseudo moduły importują semantykę do bieżącego zakresu bloku, w przeciwieństwie do zwykłych modułów, które importują symbole do bieżącego pakietu.
Istnieje odpowiadająca komenda "no", która de-importuje rzeczy zaimportowane przez use, np. wywołuje metodę unimport Module LISTA zamiast import.
no integer; no strict 'refs';Jeśli nie ma metody unimport, wywołanie to kończy się błędem krytycznym.
Dla listy standardowych modułów i pragm, zobacz
podręcznik perlmod.
#!/usr/bin/perl $now = time; utime $now, $now, @ARGV;
vec($image, $max_x * $x + $y, 8) = 3;Wektory utworzone przez vec() mogą też być obsługiwane przez operatory logiczne ⎪, & i ^, które założą, że bitowa operacja wektorowa jest oczekiwana gdy obydwa operandy są łańcuchami.
Aby przekształcić wektor bitowy na tablicę łańcuchową zer i jedynek, użyj:
$bits = unpack("b*", $vector); @bits = split(//, unpack("b*", $vector));Jeśli znasz dokładną długość w bitach, możesz podać ją zamiast *.
use POSIX ":sys_wait_h"; ... waitpid(-1,&WNOHANG);to możesz dokonać nieblokującego oczekiwania na dowolny proces. Nieblokujące oczekiwanie jest dostępne na maszynach, obsługujących albo wywołanie waitpid(2), albo wait4(2). Jednak oczekiwanie na konkretny pid z FLAGAMI wartości 0 jest zaimplementowane wszędzie. (Perl emuluje wywołanie systemowe, pamiętając wartości statusu procesów, które zakończyły się, lecz nie były odczytane przez skrypt perla)
return unless defined wantarray; # nie myśl o robieniu więcej my @a = complex_calculation(); return wantarray ? @a : "@a";
Jeśli zainstalowany jest handler $SIG{__WARN__), nie są drukowane żadne komunikaty. Od handlera zależy obsługa komunikatu, gdy tak zadecyduje (np. przekonwertowanie go na die()). Większość handlerów musi więc wywoływać warn() ponownie, aby wyświetlić komunikat. Zauważ, że jest to bezpieczne i nie spowoduje nieskończonej pętli, gdyż haki __WARN__ nie są wołane z niego samego.
Zachowanie to jest trochę inne od tego dla $SIG{__DIE__} (które nie powstrzymywały tekstu komunikatów, lecz mogły wywołać die() ponownie, aby je zmienić).
Używanie handlerów __WARN__ daje potężne narzędzie do wyciszania wszystkich ostrzeżeń (nawet tak zwanych obowiązkowych). Na przykład:
# wywal wszystkie ostrzeżenia czasu kompilacji BEGIN { $SIG{'__WARN__'} = sub { warn $_[0] if $DOWARN } } my $foo = 10; my $foo = 20; # bez ostrzegania o zduplikowaniu my $foo # lecz przecież sam się o to prosiłeś! # bez ostrzeżeń czasu kompilacji i czasu działania przed tym miejscem $DOWARN = 1;
# ostrzeżenia czasu działania są tu włączone warn "\$foo is alive and $foo!"; # pojawia sięZobacz stronę perlvar(1) dla szczegółów o ustawianiu wpisów %SIG i dla przykładów.
Początek przetwarzania formy jest obsługiwany automatycznie: jeśli nie ma miejsca na stronie na sformatowany rekord, to strona jest przewijana przez wpisanie form feed, następnie używany jest specjalny format góry-strony (do formatowania nagłówka nowej strony), a potem wpisany jest rekord. Domyślnie, format góry-strony jest nazwą uchwytu pliku z dodanym "_TOP", lecz można go ustawić dynamicznie, przyznając zmiennej $^ nazwę podczas gdy wybrany (select) jest uchwyt pliku. Liczba pozostających linii bieżącej strony znajduje się w zmiennej $- i może być ustawiona na 0 aby wymusić nową stronę.
Jeśli UCHWYTPLIKU nie jest podany, wyjście idzie do bieżącego domyślnego kanału wyjścia, którym jest początkowo STDOUT, a który może być zmieniony operatorem select. Jeśli UCHWYTPLIKU jest wyrażeniem WYRAŻ, to jest ono analizowane, a wynikowy łańcuch jest używany do podejrzenia nazwy UCHWYTUPLIKU. Dla dalszych informacji o formatach, zobacz stronę perlform(1).
Zauważ, że zapis NIE jest
odwrotnością odczytu. Niestety.
Powyższe tłumaczenie pochodzi z nieistniejącego już Projektu Tłumaczenia Manuali i może nie być aktualne. W razie zauważenia różnic między powyższym opisem a rzeczywistym zachowaniem opisywanego programu lub funkcji, prosimy o zapoznanie się z oryginalną (angielską) wersją strony podręcznika za pomocą polecenia:
Prosimy o pomoc w aktualizacji stron man - więcej informacji można znaleźć pod adresem http://sourceforge.net/projects/manpages-pl/.
perl 5.004, patch 01 | 3rd Berkeley Distribution |