PO4A(7) | Po4a Алати | PO4A(7) |
po4a - радни оквир за превод документације и осталог материјала
po4a (PO for anything [PO за било шта]) олакшава одржавање превода докумената употребом класичних gettext алата. Главна особина po4a је да раскида везу између садржаја превода и структуре његовог документа.
Овај документ служи као увод у po4a који се обраћа потенцијалним корисницима који разматрају да ли да употребе овај алат и радозналима који желе да разумеју зашто су ствари онакве какве су.
Филозофија Слободног Софтвера је да се технологија заиста учини доступном свима. Али лиценцирање није једина брига: непреведени слободни софтвер је бескористан корисницима који не говоре енглески језик. Стога, имамо да одрадимо још посла како би софтвер био доступан свима.
Многи пројекти су добро разумели ову ситуацију и сада су сви убеђени у неопходност превођења свега. Ипак, само превођење представља огроман напор многих појединаца, отежан малим техничким потешкоћама.
На сву срећу, софтвер Отвореног Кода се уствари врло добро преводи употребом gettext свите алата. Они се користе за издвајање стрингова који треба да се преведу и за њихово представљање у стандардизованом формату (који се зове PO фајлови, или каталози превода). Појавио се читав екосистем алата који помажу преводиоцима да заиста преведу ове PO фајлове. gettext у време извршавања користи резултат превођења да крајњим корисницима прикаже преведене поруке.
Што се тиче документације, ситуација је још увек донекле разочаравајућа. На први поглед превођење документације може да изгледа лакше него превођење програма, јер се чини да је само потребно да ископирате изворни фајл документације и почнете да преводите садржај. Међутим, када се оригинална документација измени, праћење промена се брзо претвара у ноћну мору за преводиоце. Ако се ради ручно, овај задатак је непријатан и склон грешкама.
Застарели преводи су често гори од ситуације када уопште нема превода. Крајњи корисницу могу да буду заварани документацијом која описује старо понашање програма. Уз то, они не могу да имају директну интеракцију са одржаваоцима јер не говоре енглески језик. А одржаваоци такође не могу да поправе проблем јер не знају сваки језик на који је њихова документација преведена. Ове потешкоће, које су често последица лошег избора алата, могу да поткопају мотивацију преводиоца волонтера, чиме се проблем додатно погоршава.
Циљ po4a пројекта је да олакша рад преводиоцима документације. Тачније, он омогућава одржавање превода документације.
Идеја је да се искористи и прилагоди gettext приступ овом пољу. Као са gettext, текстови се издвајају из својих оригиналних локација и представљају преводиоцима као PO каталози превода. Преводиоци могу да искористе класичне gettext алате да прате рад који треба да се уради, сарађују и да се организују у тимове. po4a затим умеће преводе директно у структуру документације и тако прави преведене изворне фајлове који могу да се обраде и дистрибуирају на исти начин као и енглески фајлови. Сваки пасус који није преведен остаје на енглеском у излазном документу, па се на тај начин обезбеђује да крајњи корисници никада не виде застарели превод у документацији.
Ово аутоматизује већину незгодног посла у одржавању превода. Откривање пасуса које је потребно освежити постаје веома једноставно и процес је потпуно аутоматизован када је редослед елемента преуређен без даљих измена. Такође може да се користи и одређена верификација како би се умањила могућност грешака форматирања због којих би се документ искварио.
Молимо да такође погледате и ЧПП ниже у овом документу да бисте видели комплетнију листу добрих и лоших страна овог приступа.
Тренутно је овај приступ успешно имплементиран на неколико врста формата за форматирање текста:
Модул Locale::Po4a::Man(3pm) такође подржава и mdoc формат који користе BSD man стране (оне су такође прилично уобичајене и на Linux системима).
Тренутно су подржани само DebianDoc и DocBook DTD описи, али додавање подршке за неки нови је заиста једноставно. Чак је могуће да се употреби po4a на непознатом SGML DTD без измене кода достављајући неопходне информације преко командне линије. Погледајте Locale::Po4a::Sgml(3pm) за више детаља.
Модул Locale::Po4a::LaTeX(3pm) је тестиран са Python документацијом, књигом и неким презентацијама.
Ово подржава уобичајене формате који се користе за Генераторе Статичког Сајта, ПРОЧИТАЈМЕ, и остале системе документације. Погледајте Locale::Po4a::Text(3pm) за више детаља.
po4a тренутно подржава DocBook DTD (погледајте Locale::Po4a::Docbook(3pm) за више детаља) и XHTML.
У почетку, po4a је био изграђен око четири скрипте, од којих свака испуњава одређени задатак. po4a-gettextize(1) помаже код иницијалног успостављања превода и опционално, при конвертовању постојећих пројеката превода у po4a. po4a-updatepo(1) рефлектује промене на оригиналној документацији у одговарајуће po фајлове. po4a-translate(1) изграђује преведени изворни фајл из оригиналног фајла и одговарајућег PO фајла. Уз то, po4a-normalize(1) је углавном корисна за отклањање грешака у po4a парсерима, јер производи непреведени документ из оригиналног. Она олакшава да се уоче омашке које уноси процес парсирања.
Већини пројеката су довољне могућности po4a-updatepo(1) и po4a-translate(1), али се показало да је употреба ових скрипти компликована и склона грешкама. Ако је документација која се преводи издељена у неколико изворних фајлова, постаје тешко да се PO фајлови одржавају ажурни и да се коректно изграде фајлови документације. Као одговор, испоручен је све-у-једном алат: po4a(1). Овај алат узима конфигурациони фајл који описује структуру пројекта превођења: локацију PO фајлова, листу фајлова који треба да се преведу, опције које треба да се користе, и уз то потпуно аутоматизује процес. Када позовете po4a(1), он и ажурира PO фајлове и регенерише фајлове превода за које је то потребно. Ако је све већ ажурно, po4a(1) не врши измену ни над једним фајлом.
Остатак овог одељка даје преглед начина употребе интерфејса скрипти у po4a. Већина корисника ће вероватно радије да користи све-у-једном алат који је описан документацији за po4a(1).
Схема која следи даје преглед начина на који свака po4a скрипта може да се користи. Овде је мастер.doc име дато као пример документације која треба да се преведе; XX.doc је тај исти документ преведен на језик XX док је doc.XX.po каталог превода за тај документ на језику XX. Аутори документације ће углавном да се баве са мастер.doc (што може да буде manстрана, XML документ, asciidoc фајл или нешто слично); преводиоци ће углавном да се фокусирају на PO фајл, док ће крајњи корисници да виде само фајл XX.doc.
мастер.doc | V +<-----<----+<-----<-----<--------+------->-------->-------+ : | | : {превођење} | { ажурирање мастер.doc } : : | | : XX.doc | V V (опционално) | мастер.doc ->-------->------>+ : | (нови) | V V | | [po4a-gettextize] doc.XX.po -->+ | | | (стари) | | | | ^ V V | | | [po4a-updatepo] | V | | V превод.pot ^ V | | | doc.XX.po | | | (fuzzy) | { превођење } | | | | ^ V V | | {ручно уређивање} | | | | | V | V V doc.XX.po --->---->+<---<-- doc.XX.po додатак мастер.doc (иницијални) (ажуриран) (опционално) (ажуриран) : | | | : V | | +----->----->----->------> + | | | | | V V V +------>-----+------<------+ | V [po4a-translate] | V XX.doc (ажуриран)
Ова схема је компликована, али у пракси, једном када се пројекат постави и конфигурише, користи се само њен десни део (који укључује po4a-updatepo(1) и po4a-translate(1)).
Леви део приказује како po4a-gettextize(1) може да се употреби за конверзију постојећег пројекта превода у po4a инфраструктуру. Ова скрипта узима оригинални документ и његов документ његовог превода, па покушава да изгради одговарајући PO фајл. Таква ручна конверзија је прилично незграпна (за више детаља, погледајте po4a-gettextize(1) документацију), али је неопходно да се обави само једном како би се конвертовали ваши постојећи преводи. Ако немате никакве преводе за конверзију, можете да заборавите на све ово и да се фокусирате на десни део схеме.
У врху десног дела је приказана акција оригиналног аутора, освежавање документације. Средњи десни део приказује аутоматизоване акције скрипте po4a-updatepo(1). Нови материјал се издваја и пореди са постојећим преводом. За делове који се нису изменили користиће се претходни превод, док се делимично измењени делови повезују са претходним преводом помоћу „fuzzy” ознаке која означава да превод мора да се ажурира. Нови или доста измењени материјал се оставља непреведен.
Затим, ручно уређивање означава акцију преводилаца, који мењају PO фајлове како би обезбедили преводе за сваки оригинални стринг и пасус. Ово може да се обави било употребом специјализованог едитора као што је GNOME Translation Editor, KDE-ов Lokalize или poedit, било употребом платформе за локализацију на мрежи као што је weblate или pootle. Резултат превода је скуп PO фајлова, по један за сваки језик. За више детаља, молимо вас погледајте gettext документацију.
Доњи део слике приказује како po4a-translate(1) креира преведени изворни документ из мастер.doc оригиналног документа и doc.XX.po каталога превода који су преводиоци ажурирали. Поново се искоришћава структура документа, док се оригинални садржај замењује својим одговарајућим преводом. Необавезно, може да се употреби додатак како би се превод допунио неким додатним текстом. Ово се често користи да се дода име преводиоца финалном документу. Погледајте ниже за још детаља.
Као што је напоменуто раније, програм po4a(1) комбинује у један позив ефекте одвојених скрипти, ажурирање PO фајлова и преведеног документа. Основна логика остаје неизмењена.
Ако користите po4a(1), нема неког посебног корака да се започне превод. Потребно је само да наведете језике у конфигурационом фајлу, и недостајући PO фајлови се аутоматски креирају. Наравно, тада преводилац мора да обезбеди преводе за сав садржај који постоји у вашим документима. po4a(1) такође креира POT фајл, то јест фајл PO шаблона. Потенцијални преводиоци могу да преведу ваш пројекат на нови језик тако што промене име овом фајлу и напишу превод на свој језик.
Ако бисте радије да користите индивидуалне скрипте, требало би да на начин као што следи употребите po4a-gettextize(1) и креирате POT фајл. Овај фајл затим може да се копира у XX.po и тако започне нови превод.
$ po4a-gettextize --format <формат> --master <мастер.doc> --po <превод.pot>
Мастер документ се користи као улаз, док је POT фајл излаз овог процеса.
За ово се користи скрипта po4a-updatepo(1) (за детаље, молимо да погледате њену документацију):
$ po4a-updatepo --format <формат> --master <нови_мастер.doc> --po <стари_doc.XX.po>
Мастер документ се користи као улаз, док се PO фајл ажурира: он је уједно и улаз и излаз.
Једном када завршите са превођењем, хоћете да добијете преведену документацију и да је дистрибуирате корисницима заједно уз оригиналну. Да бисте то урадили, употребите програм po4a-translate(1) на следећи начин:
$ po4a-translate --format <формат> --master <мастер.doc> --po <doc.XX.po> --localized <XX.doc>
И мастер и PO фајлови се користе као улаз, док је локализовани фајл излаз овог процеса.
Додавање новог текста преводу је вероватно једина ствар која је једноставнија на дуже стазе у случају када фајлове преводите ручно :). Ове се дешава када желите да додате допунски одељак преведеном документу, који не одговара никаквом садржају оригиналног документа. Класични случај употребе је за одавање признања преводилачком тиму, као и да се наведе начин за пријаву проблема који се тичу превода.
Са po4a, морате да наведете додатак фајлове, на које концептуално може да се гледа као на закрпе које се примењују над локализованим документом након обраде. Сваки додатак мора да се достави као посебан фајл, чији формат је међутим, веома различит у односу на класичне закрпе. Прва линија је линија заглавља, која дефинише тачку уметања додатка (нажалост са криптичном синтаксом -- погледајте ниже) док се остатак фајла умеће дословно на одређену позицију.
Линија заглавља мора да почне са стрингом PO4A-HEADER:, након чега следи листа кључ=вредност поља раздвојених са тачка запета знацима.
На пример, следеће заглавље декларише додатак који мора да се постави на сам крај превода.
PO4A-HEADER: mode=eof
Ствари постају компликованије када додатни садржај желите да поставите у средину документа. Наредно заглавље декларише додатак који у превод мора да се постави након XML одељка који садржи стринг "У вези овог документа".
PO4A-HEADER: position=У вези овог документа; mode=after; endboundary=</section>
У пракси, када покушава да примени додатак, програм po4a тражи прву линију која задовољава "position" аргумент (то може да буде регизраз). Не заборавите да po4a овде разматра преведени документ. Ова документација је на српском језику, али ваша линија би вероватно требало да изгледа као што следи, у случају да намеравате да свој додатак уметнете у француски превод.
PO4A-HEADER: position=À propos de ce document; mode=after; endboundary=</section>
Онда када се у циљном документу пронађе "position", програм po4a тражи следећу линију након "position" која се подудара са наведеним "endboundary". Додатак се умеће непосредно иза те линије (јер смо задали endboundary, тј. границу на којој се завршава текући одељак).
Потпуно исти ефекат би могао да се добије следећим еквивалентним заглављем:
PO4A-HEADER: position=У вези овог документа; mode=after; beginboundary=<section>
Овде програм po4a тражи у преводу прву линију која се подудара са "<section"> након линије која се подудара са "У вези овог документа", и умеће додатак испред те линије, јер смо задали beginboundary, тј. границу која означава почетак наредног одељка. Тако да ова линија заглавља захтева да се додатак постави иза одељка који садржи "У вези овог документа", и обавештава програм po4a да одељка започиње линијом која садржи ознаку "<section">. Ово је еквивалентно са претходним примером јер, у суштини, оно што заиста желите је да уметнете овај додатак иза "/section"> или испред "<section">.
Можете такође да поставите режим уметања mode на вредност "before", са сличном семантиком: комбиновање "mode=before" са "endboundary" ће да постави додатак непосредно иза пронађене границе, последње потенцијалне граничне линије испред "position". Комбиновање "mode=before" са "beginboundary" ће да постави додатак непосредно испред пронађене границе, последње потенцијалне граничне линије испред "position".
Режим | Врста границе | Употребљена граница | Место уметања гледано у односу на границу ========|===============|=============================|=========================================== 'before'| 'endboundary' | последња испред 'position' | Непосредно иза изабране границе 'before'|'beginboundary'| последња испред 'position' | Непосредно испред изабране границе 'after' | 'endboundary' | прва иза 'position' | Непосредно иза изабране границе 'after' |'beginboundary'| прва иза 'position' | Непосредно испред изабране границе 'eof' | (ништа) | нема | Крај фајла
Савети и трикови у вези додатака
PO4A-HEADER: position=У вези овог документа; mode=after; beginboundary=<section> PO4A-HEADER: position=У вези овог документа ; mode=after; beginboundary=<section>
Примери додатака
.SH "AUTHORS"
Требало би да изаберете приступ у два корака постављањем mode=after. Затим би требало да сузите претрагу на линију након AUTHORS регуларним изразом за аргумент position. Затим би требало да пронађете почетак наредног одељка (нпр. ^\.SH) помоћу регуларног израза за аргумент beginboundary. Дакле:
PO4A-HEADER:mode=after;position=AUTHORS;beginboundary=\.SH
PO4A-HEADER:mode=after;position=Права умножавања Велики Даса, 2004;beginboundary=^
PO4A-HEADER:mode=after;position=У вези овог документа;beginboundary=ЛажнаPo4aГраница
Детаљнији пример
Оригинални документ (POD форматиран):
|=head1 NAME | |dummy - a dummy program | |=head1 AUTHOR | |me
Затим, следећи додатак ће обезбедити да се одељак (на француском) у вези преводиоца дода на крај фајла (на француском "TRADUCTEUR" значи "TRANSLATOR", а "moi" значи "me").
|PO4A-HEADER:mode=after;position=AUTEUR;beginboundary=^=head | |=head1 TRADUCTEUR | |moi |
Да бисте уметнули свој додатак испред AUTHOR, употребите следеће заглавље:
PO4A-HEADER:mode=after;position=NOM;beginboundary=^=head1
Ово функционише јер је наредна линија која се подудара са beginboundary /^=head1/ иза одељка "NAME" (преведено на "NOM" у француском), она која наводи ауторе. Дакле, додатак ће да се постави између ова два одељка. Приметите да ако се касније дода још један одељак између NAME и AUTHOR одељака, програм po4a ће погрешно да постави додатак испред тог новог одељка.
Да бисте ово спречили, исти резултат можете да постигнете употребом mode=before:
PO4A-HEADER:mode=before;position=^=head1 AUTEUR
Ово поглавље ће да вам представи кратак преглед унутрашњих процеса у програму po4a, тако да нам можете са више самопоуздања помоћи да га одржавамо и унапређујемо. Такође може да вам помогне да разумете зашто не ради нешто што очекујете, као и да вам представи начине за решавање ваших проблема у раду са програмом.
Архитектура програма po4a је објектно оријентисана. Класа Locale::Po4a::TransTractor(3pm) је заједнички предак за све po4a парсере. Ово чудно име је последица чињенице да је она у исто време задужена и за превођење документа и за издвајање стрингова.
Формалније речено, она узима документ који треба да се преведе као и PO фајл који садржи преводе који треба да се користе као улаз, а генерише два одвојена излаза: други PO фајл (произашао као резултат издвајања преводивих стрингова из улазног документа), и преведени документ (са истом структуром као и улазни документ, али са свим преводивим стринговима замењеним садржајем улазног PO). Ево графичке представе овога:
Улазни документ --\ /---> Излазни документ \ TransTractor:: / (преведен) +-->-- parse() --------+ / \ Улазни PO --------/ \---> Излазни PO (издвојен)
Ова мала кост је срж целе po4a архитектуре. Ако изоставите улазни PO и излазни документ, добијате po4a-gettextize. Ако доставите оба улаза и одбаците излазни PO, добијате po4a-translate. Да би се обезбедило решење у једном кораку, са једним конфигурационим фајлом, програм po4a позива TransTractor двапут, а између ова два TransTractor позива обавља позив алата msgmerge -U. За више детаља, молимо погледајте Locale::Po4a::TransTractor(3pm).
Следи веома делимична листа пројеката који за своју документацију у продукцији користе po4a. Ако свој пројекат желите да додате на ову листу, само нам пошаљите мејл (или Merge захтев).
Овај пројекат обезбеђује инфраструктуру за превођење многих manстраница на различите језике, спремне за интеграцију у неколико главних дистрибуција (Arch Linux, Debian и из њега изведене, Fedora).
Ја га лично изговарам као pouah <https://en.wiktionary.org/wiki/pouah>, што је француска ономатопејска реч коју користимо уместо бљак :) Вероватно имам чудан смисао за хумор :)
Колико знам, постоје само два таква:
Он може да ради само са XML форматом, и само са одређеним DTD. Посебно нисам задовољан начином на који обрађује листе, које на крају постају један велики msgid. Када листа постане велика, залогај постаје тежак за гутање.
Главне предности програма po4a над њима је једноставност уметања додатног садржаја (која је тамо још гора) и могућност постизања gettextизације.
- https://docs.kde.org/stable5/en/kdesdk/lokalize/project-view.html - http://www.debian.org/intl/l10n/
Али није све тако сјајно, овај приступ има и неке лоше стране са којима морамо да се носимо.
Један од мојих снова би био да некако интегришемо po4a у Gtranslator или Lokalize. Када се фајл документације отвори, стрингови се аутоматски издвоје, и преведени фајл + po фајл могу да се упишу на диск. Ако успемо да урадимо MS Word (TM) модул (или макар RTF) можда би га чак користили и професионални преводиоци.
Дени Барбије <barbier,linuxfr.org> Мартин Квинсон (mquinson#debian.org)
2020-12-09 | Po4a Алати |