PO4A-GETTEXTIZE(1p) | Strumenti Po4a | PO4A-GETTEXTIZE(1p) |
po4a-gettextize - converte un documento originale (e la sua traduzione) in un file PO
po4a-gettextize -f formato -m master.doc -l XX.doc -p XX.po
(XX.po è l'output, tutti gli altri sono input)
po4a (PO for anything - N.d.T. PO per tutto) semplifica la manutenzione delle traduzioni della documentazione usando i classici strumenti forniti da gettext. La caratteristica principale di po4a è che separa la traduzione dei contenuti dalla struttura del relativo documento. Fare riferimento alla pagina po4a(7) per un'introduzione a questo progetto.
Lo script po4a-gettextize aiuta a convertire le traduzioni già esistenti in un flusso di lavoro basato su po4a. Effettua il salvataggio della traduzione esistente in modo che sia pronta per la conversione a po4a, e quindi non serve più usarlo dopo la conversione del progetto. Questo noioso processo è spiegato in dettaglio nella sezione seguente 'Convertire la traduzione di un manuale a po4a'.
È necessario fornire sia un file master (ad es. la sorgente in inglese) sia un file tradotto esistente (ad es. un precedente tentativo di traduzione senza po4a). Se si fornisce più di un file master o di traduzione, verranno utilizzati in sequenza, ma potrebbe essere più semplice gettext-izzare ciascuna pagina o capitolo separatamente e quindi utilizzare msgmerge per unire tutti i file PO prodotti. Fate come volete.
Se il documento master contiene dei caratteri non ASCII, il file PO generato sarà in UTF-8. Se il documento master è completamente in ASCII, il PO generato userà la codifica del documento tradotto in ingresso.
po4a-gettextize sincronizza il master i e file localizzati per estrarre i loro contenuti e metterli in un file PO. Il contenuto del master file produce i msgid mentre i contenuti dei file localizzati danno i msgstr. Questo processo è un po' fragile: la N-esima stringa del file tradotto si suppone sia la traduzione dell'N-esima stringa nell'originale.
La gettext-izzazione funziona meglio se si riesce a recuperare la versione esatta del documento originale che è stato utilizzato per la traduzione. Anche così, potrebbe essere necessario giocherellare con i file master e localizzati per allineare la loro struttura se è stata modificata dal traduttore originale, quindi si consiglia di lavorare su copie dei file originali.
Internamente, ogni analizzatore po4a riporta il tipo di sintassi di ogni stringa estratta. Questo è il modo in cui la desincronizzazione viene rilevata durante la fase di gettext-izzazione. Nell'esempio mostrato sotto, è molto improbabile che la quarta stringa nella traduzione (di tipo 'chapter') sia la traduzione della quarta stringa nell'originale (di tipo 'paragraph'). È più probabile che un nuovo paragrafo sia stato aggiunto all'originale, o che due paragrafi nell'originale siano stati fusi assieme nella traduzione.
Originale Traduzione capitolo capitolo paragrafo paragrafo paragrafo paragrafo paragrafo chapter capitolo paragrafo paragrafo paragrafo
po4a-gettextize diagnostica in modo prolisso qualsiasi desincronizzazione della struttura rilevata. Quando ciò accade, è necessario modificare manualmente i file per aggiungere paragrafi falsi o rimuovere alcuni contenuti in uno dei documenti (o entrambe le cose) per correggere le disparità segnalate, fino a quando la struttura di entrambi i documenti non corrisponde perfettamente. Di seguito alcuni trucchi per recuperare il più possibile della traduzione esistente.
Se si è abbastanza fortunati da avere le strutture di entrambi i documenti che combaciano perfettamente, si lavorerà senza intoppi e si otterranno risultati in pochi secondi. Altrimenti, si scoprirà il perché questo processo ha un nome così brutto :). In ogni caso, la gettext-izzazione spesso è sempre più veloce che ritradurre tutto daccapo. L'autore della documentazione ha gettext-izzato l'intera traduzione della documentazione Perl in un giorno malgrado molti problemi di sincronizzazione. Data la quantità di testo (2MB di testo originale), la traduzione senza il recupero delle vecchie traduzioni avrebbe richiesto diversi mesi di lavoro. Inoltre, questo brutto lavoro è il prezzo da pagare per ottenere in seguito la comodità di po4a. Una volta fatta la conversione, la sincronizzazione tra documenti master e le loro traduzioni sarà per sempre completamente automatica.
Dopo una corretta gettext-izzazione, i documenti prodotti si dovrebbero controllare manualmente per le disparità non rilevate e gli errori silenziosi, come spiegato di seguito.
Suggerimenti e trucchi per il processo di gettext-izzazione
La gettext-izzazione si ferma non appena viene rilevata una desincronizzazione. Quando ciò accade, bisogna modificare i file quel tanto che basta per riallinearne le strutture. po4a-gettextize è piuttosto prolisso quando qualcosa non funziona: indica le stringhe che non corrispondono, la loro posizione nel testo, e il tipo di ognuna di esse. Inoltre, il file PO generato fino a quel punto viene salvato in gettextization.failed.po per consentirne la successiva analisi.
Ecco alcuni altri trucchi per alleviare questo noioso lavoro e assicurarsi che non si distrugga buona parte del precedente lavoro di traduzione:
Allo stesso modo, due paragrafi possono venire uniti assieme nel POD quando la riga di separazione contiene alcuni spazi, o quando non c'è una riga vuota tra la riga =elemento e il contenuto dell'elemento stesso.
Qualsiasi file prodotto da po4a-gettextize dovrebbe essere rivisto manualmente, anche quando lo script viene terminato correttamente. Si dovrebbe scorrere il file PO, assicurandosi che msgid e msgstr corrispondano effettivamente. Non è ancora necessario assicurarsi che la traduzione sia perfettamente corretta, poiché tutte le voci sono comunque contrassegnate come traduzioni fuzzy. Bisogna solo verificare la presenza di evidenti problemi di corrispondenza poiché le traduzioni con corrispondenza errata verranno scaricate nei passaggi successivi mentre (è probabile) si desideri salvarle.
Fortunatamente, questo passaggio non richiede la padronanza delle lingue di destinazione poiché si desidera solo riconoscere elementi simili in ogni msgid e nel corrispondente msgstr. In quanto madrelingua francese, inglese e un po' di tedesco, l'autore di questa guida può farlo almeno per tutte le lingue europee, mentre non può dire una parola della maggior parte di queste lingue. A volte riesco a rilevare problemi di corrispondenza nelle lingue non latine osservando la lunghezza delle stringhe, le strutture delle frasi (la quantità di punti di interrogazione corrisponde?) e altri indizi, ma preferisco che qualcun altro riveda la traduzione di quelle lingue.
Se si rileva una mancata corrispondenza, modificare i file originale e di traduzione come se po4a-gettextize segnalasse un errore e riprovare. Una volta che si ha un file PO decente per la traduzione precedente, eseguire il backup fino a quando po4a non funziona correttamente.
Il modo più semplice per configurare po4a è scrivere un file di configurazione po4a.conf e utilizzare il programma integrato po4a (po4a-updatepo e po4a-translate sono deprecati). Si prega di controllare la sezione "FILE DI CONFIGURAZIONE" nella documentazione po4a(1) per maggiori dettagli.
Quando po4a viene eseguito per la prima volta, la versione corrente dei documenti master verrà usata per aggiornare i file PO contenenti le vecchie traduzioni salvate tramite gettext-izzazione. Ciò può richiedere molto tempo, perché molti dei msgid prodotti dalla gettext-izzazione non corrispondono esattamente agli elementi del file POT creato dai file master recenti. Ciò costringe gettext a cercare quello più simile utilizzando un algoritmo computazionalmente pesante di similitudine di stringa. Ad esempio, la prima esecuzione della traduzione francese della documentazione Perl (file PO da 5,5 MB) ha richiesto circa 48 ore (sì, due giorni), mentre le successive solo pochi secondi.
Dopo questa prima esecuzione, i file PO sono pronti per essere esaminati dai traduttori. Tutte le voci sono state contrassegnate come fuzzy nel file PO dalla po4a-gettext-izzazione, imponendo così la loro attenta revisione prima dell'uso. I traduttori devono: esaminare ogni voce per verificare che la traduzione salvata corrisponda effettivamente al testo originale corrente, aggiornare la traduzione ove necessario, rimuovere i marcatori fuzzy.
Una volta rimossi un numero sufficiente di marcatori fuzzy, po4a inizierà a generare i file di traduzione su disco e sarà il momento di spostare il flusso di lavoro di traduzione alla produzione. Alcuni progetti trovano utile affidarsi a weblate per coordinare traduttori e manutentori, ma questo va oltre lo scopo di po4a.
po4a(1), po4a-normalize(1), po4a-translate(1), po4a-updatepo(1), po4a(7).
Denis Barbier <barbier@linuxfr.org> Nicolas François <nicolas.francois@centraliens.net> Martin Quinson (mquinson#debian.org)
Danilo Piazzalunga <danilopiazza@libero.it> Marco Ciampa <ciampix@posteo.net>
Copyright 2002-2022 by SPI, inc.
Questo programma è software libero; è lecito ridistribuirlo o modificarlo secondo i termini della licenza GPL (vedere il file COPYING).
2023-01-03 | Strumenti Po4a |