| PO4A.7(1) | User Contributed Perl Documentation | PO4A.7(1) |
Po4a - Rahmenwerk zur Übersetzung von Dokumentation und anderen Materialien
Po4a (PO für alles) erleichtert die Pflege von Dokumentationsübersetzungen mittels der klassischen Gettext-Werkzeuge. Die Hauptfunktionalität von Po4a ist, dass sie die Übersetzung des Inhaltes von der Dokumentenstruktur trennt.
Dieses Dokument dient als Einführung in das Po4a-Projekt mit einem Fokus auf mögliche Benutzer, die überlegen, ob sie dieses Werkzeug verwenden sollten und den Neugierigen, die verstehen möchten, warum die Dinge so sind, wie sie sind.
Die Philosophie Freier Software ist es, die Technik wirklich für jeden verfügbar zu machen. Aber Lizenzierung ist nicht die einzige Betrachtung: nicht übersetzte Freie Software ist für nicht englisch sprechende Personen nutzlos. Daher haben wir noch einiges zu tun, Software für jede Person verfügbar zu machen.
Von den meisten Projekten wird diese Situation sehr gut verstanden und jeder ist jetzt von der Notwendigkeit, alles zu übersetzen, überzeugt. Allerdings stellt die eigentliche Übersetzung einen riesengroßen Aufwand durch viele Beteiligte dar, die zudem von kleinen technischen Schwierigkeiten behindert werden.
Dankenswerterweise ist Open-Source-Software mittels der Gettext-Werkzeugsammlung sehr gut übersetzt. Diese Werkzeuge werden zum Entnehmen der zu übersetzenden Zeichenketten aus einem Programm verwandt und dann werden diese Zeichenketten in einem standardisierten Format dargestellt (genannt PO-Dateien oder Übersetzungskataloge). Ein gesamtes Ökosystem an Werkzeugen ist entstanden, um Übersetzern beim eigentlichen Übersetzen dieser PO-Dateien zu helfen. Das Ergebnis wird dann von Gettext zur Laufzeit verwandt, um dem Endbenutzer die übersetzten Meldungen anzuzeigen.
Im Hinblick auf Dokumentation ist die Situation allerdings immer noch etwas entäuschend. Anfangs erscheint die Übersetzung der Dokumentation leichter als die Übersetzung eines Programms, da es so aussieht, als müssten Sie nur das Ursprungsdokument kopieren und anfangen, den Inhalt zu übersetzen. Wenn allerdings das Ursprungsdokument verändert wird, wird die Nachverfolgung der Änderungen schnell zu einem Albtraum für Übersetzer. Falls dies manuell erfolgt, ist die Aufgabe unschön und fehlerbehaftet.
Veraltete Übersetzungen sind oft schlimmer als gar keine. Endbenutzer können durch Dokumentation, die veraltetes Verhalten des Programms beschreibt, verwirrt werden. Sie können zudem nicht direkt mit dem Betreuer in Kontakt treten, da sie kein Englisch sprechen. Zusätzlich kann der Betreuer keine Probleme beheben, da er nicht jede Sprache spricht, in die seine Dokumentation übersetzt ist. Diese Schwierigkeiten, die oft durch schlechte Werkzeuge hervorgerufen werden, können die Motivation für freiwillige Übersetzer unterminieren, wodurch das Problem weiter verschlimmert wird.
Das Ziel des Po4a-Projektes ist es, die Arbeit der Dokumentenübersetzer zu erleichtern. Insbesondere macht es die Dokumentenübersetzungen pflegbar.
Die Idee besteht darin, den Gettext-Ansatz für dieses Feld wiederzuverwenden und anzupassen. Wie bei Gettext werden Texte aus ihren ursprünglichen Orten herausgelöst und den Übersetzern als PO-Übersetzungskataloge dargestellt. Die Übersetzer können die klassischen Gettext-Werkzeuge wirksam einsetzen, um die zu erledigende Arbeit zu überwachen, zusammenzuarbeiten und sich als Teams zu organisieren. Po4a fügt dann die Übersetzung direkt in die Dokumentationsstruktur ein, um übersetzte Quelldateien zu erstellen, die dann genau wie die englischen Dateien verarbeitet und verteilt werden können. Jeder Absatz, der nicht übersetzt ist, verbleibt im entstehenden Dokument auf englisch, wodurch sichergestellt ist, dass die Endbenutzer niemals veraltete Übersetzungen in der Dokumentation sehen.
Dies automatisiert den größten Teil der Routinearbeit bei der Wartung von Übersetzungen. Es wird sehr leicht, die zu aktualisierenden Absätze zu erkennen und der Prozess ist vollständig automatisiert, wenn Elemente ohne weitere Änderungen neu sortiert werden. Es können auch spezielle Überprüfungen verwandt werden, um die Möglichkeit von Formatierungsfehlern zu verringern, die zu einem defekten Dokument führen würden.
Bitte lesen Sie auch die FAQ weiter unten in diesem Dokument für eine komplette Liste der Vor- und Nachteile dieser Vorgehensweise.
Derzeit wurde diese Vorgehensweise erfolgreich für mehrere Arten von Textformatierungsformaten umgesetzt:
Das Modul Locale::Po4a::Man(3pm) unterstützt das Format »mdoc«, das von den BSD-Handbuchseiten verwandt wird (diese sind auch unter Linux recht häufig anzutreffen).
Siehe Locale::Po4a::AsciiDoc für Details.
Siehe Locale::Po4a::Pod für Details.
Derzeit werden nur die DebianDoc- und DocBook-DTD unterstützt, aber das Hinzufügen einer Unterstützung für eine neue DTD ist wirklich leicht. Es ist sogar möglich, Po4a für eine unbekannte SGML-DTD zu verwenden, ohne den Code zu verändern, indem die benötigten Informationen auf der Befehlszeile übergeben werden. Lesen Sie Locale::Po4a::Sgml(3pm) für weitere Details.
Das Modul Locale::Po4a::LaTeX(3pm) wurde mit der Python-Dokumentation, einem Buch und ein paar Präsentationen ausprobiert.
Dies unterstützt das häufige in »Static Site Generators«, READMEs und anderen Dokumentationssystemen verwandte Format. Siehe Locale::Po4a::Text(3pm) für Details.
Derzeit werden die DocBook-DTD (siehe Locale::Po4a::Docbook(3pm) für weitere Details) und XHTML von Po4a unterstützt.
Siehe Locale::Po4a::BibTex für Details.
Siehe Locale::Po4a:Docbook für genauere Details.
Siehe Locale::Po4a:Guide für genauere Details.
Siehe Locale::Po4a::Wml für genauere Details.
Siehe Locale::Po4a::Yaml für genauere Details.
Siehe Locale::Po4a::RubyDoc für genauere Details.
Siehe Locale::Po4a:Halibut für genauere Details.
Siehe Locale::Po4a::Ini für genauere Details.
Am einfachsten verwenden Sie dieses Werkzeug in Ihrem Projekt, indem Sie eine Konfigurationsdatei für das Programm po4a schreiben und nur mit diesem Programm interagieren. Bitte lesen Sie dessen Dokumentation in po4a(1). Der Rest dieses Abschnitts stellt eine detailliertere Beschreibung für fortgeschrittenere Benutzer von Po4a bereit, die ihr Verständnis vertiefen möchten.
Lesen Sie auf jeden Fall vor diesem sehr detaillierten Abschnitt erst po4a(1), um einen vereinfachten Überblick über den Po4a-Arbeitsablauf zu bekommen. Kommen Sie hierher zurück, wenn Sie das vollständige, gruselige Bild mit fast allen Datails bekommen möchten.
Im nachfolgende Schema steht master.dok als Beispielname für die zu übersetzende Dokumentation; XX.dok das gleiche Dokument übersetzt in die Sprache XX während doc.XX.po der Übersetzungskatalog für das Dokument in der Sprache XX ist. Dokumentationsautoren kümmern sich hauptsächlich um master.dok (dies kann eine Handbuchseite, ein XML-Dokument, eine AsciiDoc-Datei usw. sein); die Übersetzer kümmern sich hauptsächlich um die PO-Dateien, während die Endbenutzer nur die Datei XX.dok sehen werden.
Übergänge mit eckigen Klammern wie "[po4a updates po]" stellen die Ausführung eines Po4a-Werkzeugs dar, während Übergänge mit geschweiften Klammern wie "{Aktualisierung von Master.dok}" eine händische Veränderung der Projektdateien darstellt.
Master.dok
|
V
+<-----<----+<-----<-----<--------+------->-------->-------+
: | | :
{Übersetzung} | {Aktualisierung von Master.dok} :
: | | :
XX.dok | V V
(optional) | Master.dok ->-------->------>+
: | (neu) |
V V | |
[po4a-gettextize] dok.XX.po--->+ | |
| (alt) | | |
| ^ V V |
| | [po4a aktualisiert po] |
V | | V
Übersetzung.pot ^ V |
| | dok.XX.po |
| | (unscharf) |
{Übersetzung} | | |
| ^ V V
| | {manuelle Bearbeitung} |
| | | |
V | V V
dok.XX.po --->---->+<---<---- doc.XX.po Addendum Master.dok
(anfänglich) (aktuell) (optional) (aktuell)
: | | |
: V | |
+----->----->----->------> + | |
| | |
V V V
+------>-----+------<------+
|
V
[po4a aktualisiert Übersetzungen]
|
V
XX.dok
(aktuell)
Wiederum ist dieses Schema übermäßig kompliziert. Lesen Sie po4a(1) für einen vereinfachten Überblick.
Der linke Teil stellt dar, wie po4a-gettextize(1) verwandt werden kann, um ein bestehendes Übersetzungsprojekt in die Po4a-Infrastruktur zu überführen. Dieses Skript akzeptiert ein Ursprungsdokument und sein übersetztes Gegenstück und versucht, eine entsprechende PO-Datei daraus zu bauen. Eine solche manuelle Umwandlung ist recht beschwerlich (lesen Sie die Dokumentation von po4a-gettextize(1) für weitere Details), sie wird aber nur einmalig notwendig, um Ihre bestehende Übersetzungen zu überführen. Falls Sie keine Übersetzungen überführen müssen, können Sie diesen Schritt ignorieren und sich auf den rechten Teil des Schemas konzentrieren.
Ganz oben rechts wird die Aktion der Ursprungsautors dargestellt, der die Dokumentation aktualisiert. Der mittel-rechte Teil stellt die automatischen Aktualisierungen der Übersetzungsdateien dar: Das neue Material wird herausgelöst und mit der bestehenden Übersetzung verglichen. Die vorherige Übersetzung wird für unveränderte Teile verwandt, während teilweise geänderte Teile mit der vorherigen Übersetzung mit einer »fuzzy«-Markierung verbunden sind, die anzeigt, dass die Übersetzung aktualisiert werden muss. Neues oder stark verändertes Material verbleibt unübersetzt.
Dann stellt der Block manuelle Bearbeitung die Aktionen der Übersetzer dar, die die PO-Dateien verändern, um Übersetzungen für jede Ursprungszeichenkette und jeden Absatz bereitzustellen. Dies kann entweder mit einem speziellen Editor wie dem GNOME-Übersetzungseditor, KDEs Lokalize oder poedit erfolgen, oder mittels einer Online-Lokalisierungsplattform wie Weblate oder Pootle. Das Übersetzungsergebnis ist eine Gruppe von PO-Dateien, eine pro Sprache. Bitte lesen Sie die Gettext-Dokumentation für weitere Details.
Der untere Teil der Abbildung zeigt, wie po4a ein übersetztes Quelldokument aus dem ursprünglichen Dokument master.doc und dem Übersetzungskatakog doc.XX.po, der durch die Übersetzer aktualisiert wurde, erstellt. Die Struktur des Dokuments wird wiederverwandt, während der ursprüngliche Inhalt durch sein übersetztes Gegenstück ersetzt wird. Optional kann ein Addendum verwandt werden, um einigen Extratext zu der Übersetzung hinzuzufügen. Dies wird oft dazu verwandt, den Namen des Übersetzers zum finalen Dokument hinzuzufügen. Sie finden Details hierzu weiter unten.
Beim Aufruf aktualisiert po4a die Übersetzungsdateien und die übersetzen Dokumentationsdateien automatisch.
Falls Sie auf der grünen Wiese anfangen, müssen Sie nur eine Konfigurationsdatei für Po4a schreiben und das wars. Die wichtigen Vorlagen für die fehlenden Dateien werden automatisch erstellt und erlauben es Ihren Beitragenden, Ihr Projekt in ihre Sprache zu übersetzen. Lesen Sie bitte po4a(1) für eine Schnellstartanleitung und alle Details.
Falls Sie bereits eine bestehende Übersetzung haben, d.h. eine Dokumentationsdatei, die manuell übersetzt wurde, können Sie den Inhalt in Ihren Po4a-Arbeitsablauf mittels po4a-gettextize integrieren. Diese Aufgabe ist ein bisschen mühselig, aber sobald Ihr Projekt in den Po4a-Arbeitsablauf konvertiert ist, wird alles automatisch aktualisiert.
Sobald eingerichtet reicht der Aufruf von po4a, um sowohl die Übersetzungs-PO-Dateien als auch die übersetzten Dokumente zu aktualisieren. Sie können "--no-translations" an po4a übergeben, um die PO-Dateien nicht zu aktualisieren (und somit nur die Übersetzungen zu aktualisieren). Dies entspricht grob den einzelnen Skripten po4a-updatepo und po4a-translate, die jetzt veraltet sind (siehe »Warum die einzelnen Skripte veraltet sind« in der nachstehenden FAQ).
Hinzufügen von neuem Text zu der Übersetzung ist wahrscheinlich das einzige, was langfristig bei der manuellen Übersetzung einfacher ist :). Dies kommt vor, wenn Sie einen zusätzlichen Abschnitt zu dem übersetzten Dokument hinzufügen möchten, der nicht zu Inhalten im Ursprungsdokument passt. Der klassische Anwendungsfall ist die Danksagung an das Übersetzungs-Team und die Information, wie übersetzungsspezifische Fehler berichtet werden sollen.
Mit Po4a müssen Sie addendum-Dateien angeben, die konzeptionell als Patches angesehen werden können, die auf das lokalisierte Dokument nach der Verarbeitung angewandt werden. Jedes Addendum muss als separate Datei bereitgestellt werden, wobei das Format sich allerdings deutlich von klassischen Patches unterscheidet. Die erste Zeile ist eine Kopfzeile, die den Einschubpunkt des Addendums definiert (mit einer unglücklicherweise kryptischen Syntax -- siehe unten), während der Rest der Datei unverändert an der festgelegten Position eingefügt wird.
Die Kopfzeile muss mit der Zeichenkette PO4A-HEADER: beginnen, gefolgt von einer durch Semikola getrennten Liste von Schlüssel=Wert-Paaren.
Beispielsweise erklärt die folgende Kopfzeile, dass ein Addendum ganz am Ende der Übersetzung abgelegt werden muss.
PO4A-HEADER: mode=eof
Die Dinge werden komplexer, wenn Sie den zusätzlichen Inhalt in der Mitte des Dokuments hinzufügen wollen. Die folgende Kopfzeile erklärt, dass nach dem XML-Abschnitt, der die Zeichenkette Über dieses Dokument in der Übersetzung enthält, ein Addendum abgelegt werden muss.
PO4A-HEADER: position=Über dieses Dokument; mode=after; endboundary=</section>
In der Praxis wird Po4a beim Versuch, ein Addendum anzuwenden, nach der ersten Zeile, die auf das Argument "Position" passt, suchen ("Position" kann ein regulärer Ausdruck sein). Vergessen Sie nicht, dass Po4a hier das übersetzte Dokument betrachtet. Das Ursprungsdokument ist auf Englisch, aber Ihre Zeile sollte wahrscheinlich wie folgt aussehen, falls Sie möchten, dass sie auf die französische Übersetzung des Dokuments angewandt wird.
PO4A-HEADER: position=À propos de ce document; mode=after; endboundary=</section>
Sobald die "Position" im Zieldokument gefunden wurde, sucht Po4a für die nächste Zeile nach der "Position", die auf das bereitgestellte "endboundary" passt. Das Addendum wird direkt nach dieser Zeile eingefügt (da wir eine endboundary bereitstellten, d.h. eine Begrenzung, die den aktuellen Abschnitt beendet).
Der genau gleiche Effekt könnte mit den nachfolgenden Kopfzeilen erreicht werden, die äquivalent sind:
PO4A-HEADER: position=Über dieses Dokument; mode=after; beginboundary=<section>
Hier sucht Po4a in der Übersetzung nach der ersten Zeile, die auf "<section>" passt und nach der auf "Über dieses Dokument" passenden Zeile liegt, und fügt das Addendum vor dieser Zeile ein, da wir ein beginboundary bereitgestellt haben, d.h. eine Begrenzungsmarkierung, die den Anfang des nächsten Abschnitts markiert. Daher verlangt diese Kopfzeile, dass das Addendum nach dem Abschnitt, der "Über dieses Dokument" enthält, gesetzt wird, und weist Po4a an, dass dieser Abschnitt mit einer Zeile, die die Markierung "<section>" enthält, beginnt. Dies ist zum vorherigen Beispiel äquivalent, da Sie in Wirklichkeit möchten, dass dieses Addendum entweder nach "</section>" oder vor "<section>" hinzugefügt wird.
Sie können den Einfüge-Modus auch auf den Wert "before" setzen, mit einer ähnlichen Semantik: Kombinierung von "mode=before" mit einem "endboundary" wird das Addendum genau nach der passenden Begrenzung setzen. Dies ist die letzte mögliche Begrenzungszeile vor der "Position". Kombinierung von "mode=before" mit einer "beginboundary" setzt das Addendum genau vor die passende Begrenzung. Dies ist die letzte mögliche Begrenzungszeile vor der "Position".
Modus | Begrenzungsart | Verwandte Begrenzung | Einfügepunkt im Vergleich zur Begrenzung ========|================|=======================|========================================= 'before'| 'endboundary' | letzte vor 'Position' | direkt nach der ausgewählten Begrenzung 'before'|'beginboundary' | letzte vor 'Position' | direkt vor der ausgewählten Begrenzung 'after' | 'endboundary' | erste nach 'Position' | direkt nach der ausgewählten Begrenzung 'after' |'beginboundary' | erste nach 'Position' | direkt vor der ausgewählten Begrenzung 'eof' | (keine) | n.Z. | Dateiende
Tipps und Tricks rund um Addenda
PO4A-HEADER: position=Über dieses Dokument; mode=after; beginboundary=<section>
PO4A-HEADER: position=Über dieses Dokument ; mode=after; beginboundary=<section>
Addenda-Beispiele
.SH "AUTOREN"
Sie sollten den zweischrittigen Zugang durch Setzen von mode=after wählen. Dann sollten Sie mit dem regulären Argumentenausdruck Position die Suche auf die Zeile nach AUTOREN eingrenzen. Dann sollten Sie eine Übereinstimmung mit dem Anfang des nächsten Abschnittes (d.h. ^\.SH) mit dem regulären Argumentenausdruck beginboundary erzielen. Mit anderen Worten:
PO4A-HEADER:mode=after;position=AUTOREN;beginboundary=\.SH
PO4A-HEADER:mode=after;position=Copyright Großer Kerl, 2004;beginboundary=^
PO4A-HEADER:mode=after;position=Über dieses Dokument;beginboundary=FakePo4aBoundary
Ein ausführlicheres Beispiel
Originaldokument (POD-formatiert):
|=head1 BESCHREIBUNG | |dummy - Ein Platzhalterprogramm | |=head1 AUTOR | |ich
Dann wird das folgende Addendum sicherstellen, dass ein Abschnitt (auf Französisch) über den Übersetzer an das Ende der Datei hinzugefügt wird (auf Französisch heißt »ÜBERSETZER« »TRADUCTEUR« und »moi« heißt »ich«).
|PO4A-HEADER:mode=after;position=AUTEUR;beginboundary=^=head | |=head1 TRADUCTEUR | |moi |
Um Ihr Addendum vor dem AUTOR einzufügen, verwenden Sie die folgende Kopfzeile:
PO4A-HEADER:mode=after;position=NOM;beginboundary=^=head1
Dies funktioniert, da die nächste auf das beginboundary "/^=head1/" passende Zeile nach dem Abschnitt »BESCHREIBUNG« (übersetzt zu »NOM« auf Französisch) diejenige ist, die die Autoren deklariert. Daher wird das Addendum zwischen beide Abschnitte gelegt. Beachten Sie: Falls später ein anderer Abschnitt zwischen den Abschnitten NAME und AUTHOR hinzugefügt wird, wird Po4a das Addendum fehlerhafterweise vor den neuen Abschnitt legen.
Um dies zu vermeiden, können Sie das gleiche mittels mode=before erreichen:
PO4A-HEADER:mode=before;position=^=head1 AUTEUR
Dieses Kapitel gibt Ihnen einen kurzen Überblick über die Interna von Po4a, so dass Sie sich sicherer fühlen, es zu warten und zu verbessern. Es könnte Ihnen auch dabei helfen, zu verstehen, warum es nicht das tut, was Sie erwarten, und wie Sie Ihre Probleme beheben können.
Im Herzen des Po4a-Projekt ist die Klasse Locale::Po4a::TransTractor(3pm) der gemeinsame Vorfahr von allen Auswertungsklassen. Dieser merkwürdige Name ist der Tatsache zu verdanken, dass er gleichzeitig für das Übersetzen des Dokuments und das Extrahieren von Zeichenketten zuständig ist.
Förmlicher ausgedrückt nimmt es ein Dokument zum Übersetzen plus eine PO-Datei, die die Übersetzungen enthält, als Eingabe, während es zwei getrennte Ausgaben erzeugt: Eine weitere PO-Datei (die das Ergebnis des Extrahierens übersetzbarer Zeichenketten vom Eingabedokument ist) und einem übersetzen Dokument (mit der gleichen Struktur, wie der aus der Eingabe, bei der aber alle übersetzbaren Zeichenketten durch den Inhalt der Eingabe-PO-Datei ersetzt wurden). Hier eine grafische Darstellung davon:
Eingabedokument -- \ /---> Ausgabedokument
\ TransTractor:: / (übersetzt)
+-->-- parse() --------+
/ \
Eingabe-PO-Datei---/ \---> Ausgabe-PO-Datei
(extrahiert)
Dieser kleine Knochen ist der Kern der Po4a-Architektur. Falls Sie sowohl die Eingabe bereitstellen und die Ausgabe-PO ignorieren, erhalten Sie po4a-translate. Falls Sie stattdessen das Augabedokument ignorieren, erhalten Sie po4a-updatepo. po4a verwendet einen ersten TransTractor, um eine aktuelle Ausgabe-POT-Datei zu erhalten (und ignoriert die Ausgabedokumente), ruft msgmerge -U auf, um die Übersetzungs-PO-Dateien auf Platte zu aktualisieren und baut einen zweiten TransTractor mit diesen aktualisierten PO-Dateien, um die Ausgabedokumente zu aktualisieren. Kurz gesagt, po4a stellt eine integrierte Lösung bereit, alles notwendige mittels einer einzigen Konfigurationsdatei zu aktualisieren.
po4a-gettextize verwendet auch zwei TransTractoren, aber auf eine andere Art: Es baut einen TransTractor pro Sprache und baut dann eine neue PO-Datei mittels der Msgids des ursprünglichen Dokuments als Msgids und den Msgids des übersetzten Dokuments als Msgstrs. Es bedarf großer Sorgfalt sicherzustellen, dass alle Zeichenketten, die so zueiander kommen auch tatsächlich zueinander passen, wie in po4a-gettextize(1) beschrieben.
Alle Po4a-Formatauswerter sind auf dem TransTractor implementiert. Einige von ihnen sind sehr einfach, wie die für Text, Markdown und AsciiDoc. Sie laden die Zeilen nacheinander mittels TransTractor::shiftline() und sammeln den Inhalt des Absatzes oder was auch immer auf. Sobald eine Zeichenkette komplett ausgewertet ist, verwendet der Auswerter TransTractor::translate() um (1) diese Zeichenkette zu der Ausgabe-PO-Datei hinzuzufügen und (2) die Übersetzung aus der Eingabe-PO-Datei zu erhalten. Der Auswerter schiebt das Ergebnis mittels TransTractor::pushline() in die Ausgabedatei.
Einige andere Auswerter sind komplexer, da sie auf externe Auswerter angewiesen sind, um das Eingabedokument auszuwerten. Die Auswerter für XML, HTML, SGML und Pod bauen auf den SAX-Auswerter auf. Sie erklären Rücksprünge zu Ereignissen wie »Ich habe einen neuen Titel mit folgendem Inhalt gefunden«, um gemäß des Eingabeinhalts mittels TransTractor::translate() und TransTractor::pushline() das Ausgabedokument und die Ausgabe-POT-Dateien zu aktualisieren. Der Yaml-Auswerter ist ähnlich aber anders: er serialisiert eine durch den Auswerter YAML::Tiny erzeugte Datenstruktur. Daher schlägt das Yaml-Modul von Po4a beim Erklären der Referenzzeilen fehl: der Ort jeder Zeichenkette in der Eingabedatei wird durch den Auswerter nicht aufgehoben, so dass nur »$filename:1« als Zeichenkettenort bereitgestellt werden kann. Die SAX-orientierten Auswerter verwenden »globals« und andere Tricks, um den Dateinamen und die Zeilennummer von Referenzen zu speichern.
Ein besonderes Problem tritt durch Dateikodierungen und BOM-Markierungen auf. Einfache Auswerter können das Problem ignorieren, um das sich TransTractor::read() kümmert (intern verwandt, um die Zeilen eines Eingabedokuments zu erhalten), aber Module, die sich auf einen externen Auswerter Auswerter verlassen, müssen sicherstellen, dass alle Dateien mit einen geeigneten PerlIO-Decoding-Layer gelesen werden. Am einfachsten öffen sie die Datei selbst und stellen einen Filehandle oder direkt die gesamte Zeichenkette an den externen Auswerter bereit. Schauen Sie in Pod::read() und Pod::parse() für ein Beispiel. Der vom TransTractor gelesene Inhalt wird ignoriert, aber ein frischer Filehandle wird an das externe Auswerteprogramm übergeben. Der wichtige Teil ist der Modus "<:encoding($charset)", der an die Perl-Funktion open() übergeben wird.
Die Klasse Locale::Po4a::Po(3pm) kümmert sich um das Laden und verwenden von PO- und POT-Dateien. Im wesentlichen kann eine Datei gelesen, Einträge hinzugefügt, Übersetzungen mit der Methode gettext() erhalten und die PO in eine Datei geschrieben werden. Fortgeschrittenere Funktionalitäten wie das Zusammenführen einer PO-Datei mittels einer POT-Datei oder das Überprüfen einer Datei werden an msgmerge bzw. msgfmt delegiert.
Selbst wenn Sie in der Vergangenheit noch nie zu einem Open-Source-Projekt beigetragen haben, sind Sie willkommen: Wir helfen Ihnen gerne und beraten Sie gerne. Da uns Mitarbeitende fehlen, versuchen wir eine Willkommensinfrastruktur zu schaffen, indem wir die Dokumentation und die automatischen Tests verbessern, um Ihnen Zuversicht beim Beitragen zum Projekt zu geben. Bitte lesen Sie die Datei CONTRIBUTING.md für weitere Details.
Es folgt eine unvollständige Liste von Projekten, die Po4a für ihre Dokumentation im Einsatz haben. Falls Sie Ihre Projekt in diese Liste aufgenommen haben möchten, schicken Sie uns auf Englisch eine E-Mail (oder einen »Merge Request«).
Dieses Projekt stellt die Infrastruktur zur Übersetzung vieler Handbuchseiten in verschiedene Sprachen bereit, mit Integration in viele große Distributionen (Arch Linux, Debian und abgeleitete, Fedora).
Ich persönlich spreche es als pouah <https://en.wiktionary.org/wiki/pouah> aus, was auf Französich lautmalerisch anstelle von »Bäh« verwandt wird :) Vielleicht habe ich einen merkwürdigen Humor :)
Tatsächlich sind po4a-updatepo und po4a-translate zugunsten po4a veraltet. Dies liegt daran, dass po4a als direkter Ersatz für diese Skripte verwandt werden kann und es hier eine Menge an doppelten Code gibt. Die einzelnen Skripte sind rund 150 Code-Zeilen, während das Programm po4a 1200 Zeilen lang ist, daher machen sie eine Menge zusätzliches neben den gemeinsamen Interna. Der doppelte Code führt dazu, dass Fehler in beiden Versionen auftreten und zwei Korrekturen benötigen. Ein Beispiel für eine solche Doppelung sind die Fehler #1022216 in Debian und das Problem #442 in GitHub, die beide die exakt gleiche Korrektur hatten, aber die eine in po4a und die andere in po4a-updatepo.
Langfristig würde ich gerne die einzelnen Skripte entfernen und nur eine Version des Codes verwalten. Die einzelnen Skripte werden auf jeden Fall nicht mehr verbessert, daher wird nur po4a neue Funktionalitäten bekommen. Damit sei aber angemerkt, dass es keine Dringlichkeit für das Veralten gibt. Ich habe vor, die einzelnen Skripte so lange wie möglich beizubehalten, mindestens bis 2030. Falls Ihr Projekt 2030 immer noch po4a-updatepo und po4a-translate verwendet, könnten Sie ein Problem haben.
Es könnte auch sein, dass wir die Veraltung dieser Skripte irgendwann aufheben, falls eine Restrukturierung die Code-Dopplung auf Null reduziert. Falls Sie dazu eine Idee (oder besser: einen Patch) haben, würden wir uns über Ihre Hilfe freuen.
Es gibt eine Reihe davon. Hier ist eine unvollständige Liste und weitere Werkzeuge erscheinen am Horizont.
Es kann nur XML und eine spezielle DTD handhaben. Der Verfasser ist ziemlich unglücklich mit der Handhabung von Listen, die in einer großen Msgid enden. Wenn die Liste groß wird, wird es schwerer, mit dem großen Stück umzugehen.
Die Hauptvorteile von Po4a demgegenüber sind die Erleichterung beim Hinzufügen zusätzlichen Inhalts (was dort sogar schlechter ist) und die Fähigkeit, Gettext zu verwenden.
- https://docs.kde.org/stable5/en/kdesdk/lokalize/project-view.html
- http://www.debian.org/intl/l10n/
Aber nicht alles ist rosig und diese Herangehensweise hat auch einige Nachteile, die bewältigt werden müssen.
Es wäre traumhaft, wenn jemand Po4a in Gtranslator oder Lokalize einbinden würde. Wenn eine Dokumentationsdatei geöffnet wird, werden die Zeichenketten automatisch extrahiert. Wenn sie gespeichert wird, kann eine übersetzte Datei + PO-Datei auf die Platte geschrieben werden. Falls es fertiggebracht wird, ein MS-Word-Modul™ (oder zumindest RTF) zu erstellen, können es sogar professionelle Übersetzer nutzen.
Denis Barbier <barbier,linuxfr.org> Martin Quinson (mquinson#debian.org)
| 2024-08-06 | perl v5.38.2 |