Gentoo Websites Logo
Go to: Gentoo Home Documentation Forums Lists Bugs Planet Store Wiki Get Gentoo!
Bug 117691 - [de] Translation to the UTF-8 guide
Summary: [de] Translation to the UTF-8 guide
Status: RESOLVED FIXED
Alias: None
Product: Doc Translations
Classification: Unclassified
Component: [DE] (show other bugs)
Hardware: All Linux
: High normal (vote)
Assignee: Jan Hendrik Grahl (RETIRED)
URL:
Whiteboard:
Keywords:
Depends on:
Blocks:
 
Reported: 2006-01-03 19:49 UTC by Norman Golisz
Modified: 2006-02-20 20:58 UTC (History)
1 user (show)

See Also:
Package list:
Runtime testing required: ---


Attachments
Translated utf-8 document (german) (utf-8.xml,28.29 KB, text/plain)
2006-02-15 08:30 UTC, Norman Golisz
Details

Note You need to log in before you can comment on or make changes to this bug.
Description Norman Golisz 2006-01-03 19:49:20 UTC
It's a translation to the UTF-8 guide (http://www.gentoo.org/doc/en/utf-8.xml

Start of xml-code.
----------

<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd">
<html lang="de">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=UTF-8">
<link title="new" rel="stylesheet" href="/css/main.css?d=20051010" type="text/css">
<link REL="shortcut icon" HREF="http://www.gentoo.org/favicon.ico" TYPE="image/x-icon">
<title>Gentoo Linux Dokumentation
--
  UTF-8 mit Gentoo Linux</title>
</head>
<body style="margin:0px;" bgcolor="#ffffff"><table width="100%" border="0" cellspacing="0" cellpadding="0">
<tr><td valign="top" height="125" bgcolor="#45347b"><a href="/"><img border="0" src="/images/gtop-www.jpg" alt="Gentoo Logo"></a></td></tr>
<tr><td valign="top" align="right" colspan="1" bgcolor="#ffffff"><table border="0" cellspacing="0" cellpadding="0" width="100%"><tr>
<td width="99%" class="content" valign="top" align="left">
<br><h1>UTF-8 mit Gentoo Linux</h1>
<form name="contents" action="http://www.gentoo.org">
<b>Inhalt</b>:
        <select name="url" size="1" OnChange="location.href=form.url.options[form.url.selectedIndex].value" style="font-family:sans-serif,Arial,Helvetica"><option value="#doc_chap1">1. Zeichens
Comment 1 Norman Golisz 2006-01-03 19:49:20 UTC
It's a translation to the UTF-8 guide (http://www.gentoo.org/doc/en/utf-8.xml

Start of xml-code.
----------

<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd">
<html lang="de">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=UTF-8">
<link title="new" rel="stylesheet" href="/css/main.css?d=20051010" type="text/css">
<link REL="shortcut icon" HREF="http://www.gentoo.org/favicon.ico" TYPE="image/x-icon">
<title>Gentoo Linux Dokumentation
--
  UTF-8 mit Gentoo Linux</title>
</head>
<body style="margin:0px;" bgcolor="#ffffff"><table width="100%" border="0" cellspacing="0" cellpadding="0">
<tr><td valign="top" height="125" bgcolor="#45347b"><a href="/"><img border="0" src="/images/gtop-www.jpg" alt="Gentoo Logo"></a></td></tr>
<tr><td valign="top" align="right" colspan="1" bgcolor="#ffffff"><table border="0" cellspacing="0" cellpadding="0" width="100%"><tr>
<td width="99%" class="content" valign="top" align="left">
<br><h1>UTF-8 mit Gentoo Linux</h1>
<form name="contents" action="http://www.gentoo.org">
<b>Inhalt</b>:
        <select name="url" size="1" OnChange="location.href=form.url.options[form.url.selectedIndex].value" style="font-family:sans-serif,Arial,Helvetica"><option value="#doc_chap1">1. Zeichensätze</option>
<option value="#doc_chap2">2. UTF-8 einrichten</option>
<option value="#doc_chap3">3. Programmunterstützung</option></select>
</form>
<p class="chaphead"><span class="chapnum"><a name="doc_chap1">1. </a></span>Zeichensätze</p>
<p class="secthead"><a name="doc_chap1_sect1">Was ist ein Zeichensatz?</a></p>

<p>
Computer verstehen den Text nicht als solches, stattdessen wird jedes Zeichen
durch eine Zahl repräsentiert. Traditionell war die Zeichentabelle mit den
entsprechenden Zuordnungen aufgrund technischer Begrenzungen in ihrer Größe
beschränkt.
</p>

<p class="secthead"><a name="doc_chap1_sect2">Die Geschichte der Zeichensätze</a></p>

<p>
Der verbreiteste (oder der zumindest weitgehend meist akzeptierte) Zeichensatz
ist <b>ASCII</b> (American Standard Code for Information Interchange). Er wird
weitesgehend als erfolgreichster Softwarestandard überhaupt anerkannt und wurde
1986 vom American National Standards Institute standadisiert (ANSI X3.4,
RFC 20, ISO/IEC 646:1991, ECMA-6).
</p>

<p>
ASCII nutzt Bitmuster mit sieben Binärziffern, welche einen Dezimalzahlenraum
von 0 bis 127 zulassen. Darunter befinden sich 32 unsichtbare Steuerzeichen,
die meisten zwischen 0 und 31, mit dem letzten Steuerzeichen DEL bzw. Entf bei 127.
Die Zeichen von 32 bis 126 sind sichtbare Zeichen: darunter ein Leerzeichen, Satzzeichen,
Buchstaben und Zahlen.
</p>

<p>
Das achte Bit in ASCII wurde ursprünglich als Prüfbit genutzt. Falls dies nicht
gewünscht ist, wird es mit einer 0 belegt. Das bedeutet, dass jedes Zeichen in
ASCII durch ein einzelnes Byte repräsentiert wird.
</p>

<p>
ASCII reichte zur Kommunikation im modernen Englisch aus, in anderen
europäischen Sprachen jedoch, die weitere Zeichen nutzen, wurde es schwierig.
Aus diesem Umstand wurden die ISO-8859-Standards entwickelt, welche zum einen
abwärtskompatibel zu ASCII sind, zum anderen das achte Bit für weitere 127 Zeichen
nutzen. Die Begrenzungen von ISO-8859 wurden schnell ersichtlich, mittlerweile
gibt es 15 Varianten des ISO-8859-Standards (8859-1 bis 8859-15). Um die
Interoperabilität zwischen den Zeichensätzen weiter zu erschweren, wurde
in einigen Microsoft Windows-Versionen Windows-1252 eingesetzt, eine Obermenge
von ISO-8859-1, jedoch unterscheidet diese sich in vielerlei Hinsicht. All diese
Zeichensätze behalten dennoch ASCII-Kompatibilität.
</p>

<p>
Die benötigte Entwicklung von komplett verschiedenen Single-Byte-Zeichensätzen
für nicht-lateinische Alphabete, wie EUC (Extended Unix Coding) für
Japanisch und Koreanisch stiftete noch mehr Konfusion, während andere
Betriebssysteme weiterhin andere Zeichensätze für die gleiche Sprache nutzten,
beispielsweise Shift-JIS und ISO-2022-JP. Benutzer, die die Darstellung von
kyrillischen Zeichen wünschten, hatten die Wahl zwischen KOI8-R für Russisch
und Bulgarisch, oder KOI8-U für Ukrainisch und anderen kyrillischen
Zeichensätzen (z.B. der nicht erfolgreiche ISO-8859-5- und Windows-1251-Satz).
Diese Zeichensätze sind größtenteils nicht ASCII-kompatibel.
</p>

<p>
Dies führte zu Verwirrungen und beinahe zur Unfähigkeit mehrsprachiger
Kommunikation, besonders zwischen verschiedenen Alphabeten. Nun kommt Unicode.
</p>

<p class="secthead"><a name="doc_chap1_sect3">Was ist Unicode?</a></p>

<p>
Unicode durchbricht die traditionelle Single-Byte-Grenze der Zeichensätze.
Der Zeichensatz nutzt 17 Ebenen von 65.536 Code Points und ermöglicht ein Maximum
von 1.114.112 Zeichen. Die erste Ebene wird "Basic Multilingual Plane" oder BMP
bezeichnet und beinhaltet alles was Sie je brauchen werden. Viele nahmen
fälschlicherweise an, dass Unicode ein 16-Bit-Zeichensatz sei.
</p>

<p>
Unicode wurde auf verschiedene Weise abgebildet, aber die meist verbreitesten
sind <b>UTF</b> (Unicode Transformation Format) und
<b>UCS</b> (Universal Character Set).
Die Nummer hinter UTF gibt die Zahl der Bits in einer Einheit an, während die
Nummer hinter UCS die Zahl der Bytes anigbt. Aufgrund der sauberen 8-Bit-Basis
von UTF-8, ist er der weitverbreiteste und deutet den Austausch von
Unicode-Text. Er ist daher Thema dieses Dokuments.
</p>

<p class="secthead"><a name="doc_chap1_sect4">UTF-8</a></p>

<p>
UTF-8 ist ein variabellanger Zeichensatz, was in diesem Beispiel bedeutet,
dass er 1 bis 4 Byte pro Symbol nutzt. So wird das erste UTF-8-Byte zur
ASCII-Dekodierung genutzt, dies ermöglicht volle Abwärtskompatibilität zu
ASCII. UTF-8 bedeutet, dass ASCII- und lateinische Zeichen austauschbar sind,
mit einer kleinen Verbesserung der Datengröße, da nur das erste Bit genutzt
wird. Benutzer der östlichen Alphabete wie die Japaner, welche einen höheren
Zahlenbereich zugeschrieben bekommen, dürften hingegen über die 50% zusätzliche
Datenredundanz unglücklich sein.
</p>

<p class="secthead"><a name="doc_chap1_sect5">Was UTF-8 für Sie tun kann</a></p>

<p>
UTF-8 erlaubt ihnen in einer standardkonformen und international
akzeptierten, mehrsprachigen Umgebung zu arbeiten, mit einer vergleichsweise
kleinen Datenredundanz. UTF-8 ist daher der bevorzugte Weg nicht-ASCII-Zeichen
über das Internet, Email, IRC und nahezu jedem anderen Medium zu übertragen.
Trotzdessen stehen einige Menschen UTF-8 in der Online-Kommunikation schmähend
gegenüber. Es ist daher immer ratsam, die Hinweise in Channels, Mailinglisten,
oder Usenet-Gruppen zu beachten, bevor man <span class="emphasis">nicht-ASCII</span>
UTF-8 verwendet.
</p>

<p class="chaphead"><span class="chapnum"><a name="doc_chap2">2. </a></span>UTF-8 einrichten</p>
<p class="secthead"><a name="doc_chap2_sect1">Benutzen oder Erstellen von UTF-8-Locales</a></p>

<p>
Jetzt, wo Sie die Hintergründe zu Unicode verstanden haben, sind Sie
bereit auf ihrem System UTF-8 zu benutzen.
</p>

<p>
Die Grundvorraussetzung UTF-8 nutzen zu können, ist eine installierte Version
von glibc mit National Language Support. Dazu brauchen Sie
<span class="path">/etc/locales.build</span> in Kombination mit dem USE-Flag
<span class="code">userlocales</span>. Es würde den Rahmen dieses Dokuments
sprengen, die Funktionsweise der Datei zu erläutern. Glücklicherweise ist sie
gut dokumentiert und nochmal im
<a href="/doc/de/guide-localization.xml#doc_chap3_sect3">
Gentoo Localisation Guide</a> erläutert.
</p>

<p>
Nun werden wir überprüfen, ob schon UTF-8-Locales installiert sind, oder sie
erst erstellen müssen.
</p>

<a name="doc_chap2_pre1"></a><table class="ntable" width="100%" cellspacing="0" cellpadding="0" border="0">
<tr><td bgcolor="#7a5ada"><p class="codetitle">Befehlsauflistung 2.1: Überprüfen von existierenden UTF-8-Locales</p></td></tr>
<tr><td bgcolor="#ddddff"><pre>
<span class="comment">(Ersetzen Sie "en_GB" mit der gewünschten Locale-Einstelllung)</span>
# <span class="input">locale -a | grep 'en_GB'</span>
en_GB
en_GB.UTF-8
</pre></td></tr>
</table>

<p>
In der Ausgabe muss das Resultat mit einem Suffix wie
<span class="code">.UTF-8</span> vorkommen, andernfalls müssen wir eine
UTF-8-kompatible Locale erstellen.
</p>

<table class="ncontent" width="100%" border="0" cellspacing="0" cellpadding="0"><tr><td bgcolor="#bbffbb"><p class="note"><b>Notiz: </b>
Führen Sie die nachfolgenden Befehle nur aus, wenn Sie keine UTF-8-kompatible
Locale für ihre Sprache zur Verfügung haben.
</p></td></tr></table>

<a name="doc_chap2_pre2"></a><table class="ntable" width="100%" cellspacing="0" cellpadding="0" border="0"> 
<tr><td bgcolor="#7a5ada"><p class="codetitle">Befehlsauflistung 2.2: Eine UTF-8-Locale erstellen</p></td></tr>
<tr><td bgcolor="#ddddff"><pre>
<span class="comment">((Ersetzen Sie "en_GB" mit der gewünschten Locale-Einstelllung)</span>
# <span class="input">localedef -i en_GB -f UTF-8 en_GB.UTF-8</span>
</pre></td></tr>
</table>

<p>
Ein weiterer Weg eine UTF-8-Locale zu erstellen, ist diese in
<span class="path">/etc/loacles.build</span> hinzuzufügen und
<span class="code">glibc</span> mit dem USE-Flag
<span class="code">userlocales</span> neu zu kompilieren.
</p>

<a name="doc_chap2_pre3"></a><table class="ntable" width="100%" cellspacing="0" cellpadding="0" border="0">
<tr><td bgcolor="#7a5ada"><p class="codetitle">Befehlsauflistung 2.3: Zeile in /etc/locales.build</p></td></tr>
<tr><td bgcolor="#ddddff"><pre>
en_GB.UTF-8/UTF-8
</pre></td></tr>
</table>

<p class="secthead"><a name="doc_chap2_sect2">Die Locales einstellen</a></p>

<p>
Es muss eine Umgebungsvariable gesetzt werden, damit die neuen
UTF-8-Locales genutzt werden können: <span class="code">LC_ALL</span>
(diese Variable überschreibt auch gleich die <span class="code">LANG</span>-
Einstellung). Es gibt hier wieder einige Möglichkeiten sie zu setzen.
Manche Menschen bevorzugen die Einstellung nur für bestimmte Nutzer zu
übernehmen; in diesem Falle muss sie in deren
<span class="path">~/.profile</span> gesetzt werden (wenn
<span class="code">/bin/sh</span> genutzt wird),
<span class="path">~/.bash_profile</span> oder
<span class="path">~/.bashrc</span> (wenn
<span class="code">/bin/bash</span> genutzt wird).
</p>

<p>
Andere bevorzugen die Einstellung global zu übernehmen. Dies empfiehlt der
Autor besonders, wenn <span class="path">/etc/init.d/xdm</span> genutzt
wird, da das Init-Skript den Displaymanager und den Desktop startet, bevor
irgendwelche zuvor erwähnten Shell-Startup-Dateien gelesen werden. So wird
sichergestellt, dass sich die Variablen vorher in der Umgebung befinden.
</p>

<p>
Um die Einstellung global zu übernehmen, muss
<span class="path">/etc/env.d/02locale</span> bearbeitet werden.
Die Datei sollte wie folgt aussehen:
</p>

<a name="doc_chap2_pre4"></a><table class="ntable" width="100%" cellspacing="0" cellpadding="0" border="0">
<tr><td bgcolor="#7a5ada"><p class="codetitle">Befehlsauflistung 2.4: Beispiel /etc/env.d/02locale</p></td></tr>
<tr><td bgcolor="#ddddff"><pre>
<span class="comment">(Wie immer "en_GB.UTF-8" entsprechend ersetzen)</span>
LC_ALL="en_GB.UTF-8"
</pre></td></tr>
</table>

<p>
Als Nächstes muss die Umgebung mit den Änderungen aktualisiert werden.
</p>

<a name="doc_chap2_pre5"></a><table class="ntable" width="100%" cellspacing="0" cellpadding="0" border="0">
<tr><td bgcolor="#7a5ada"><p class="codetitle">Befehlsauflistung 2.5: Aktualisierung der Umgebung</p></td></tr>
<tr><td bgcolor="#ddddff"><pre>
# <span class="input">env-update</span>
&gt;&gt;&gt; Regenerating /etc/ld.so.cache...
 * Caching service dependencies ...
# <span class="input">source /etc/profile</span>
</pre></td></tr>
</table>

<p>
Nun führen Sie <span class="code">locale</span> ohne Argumente aus, um zu sehen,
ob wir die korrekten Variablen in unserer Umgebung haben.
</p>

<a name="doc_chap2_pre6"></a><table class="ntable" width="100%" cellspacing="0" cellpadding="0" border="0">
<tr><td bgcolor="#7a5ada"><p class="codetitle">Befehlsauflistung 2.6: Überprüfen der Locales in der Umgebung</p></td></tr>
<tr><td bgcolor="#ddddff"><pre>
# <span class="input">locale</span>
LANG=
LC_CTYPE="en_GB.UTF-8"
LC_NUMERIC="en_GB.UTF-8"
LC_TIME="en_GB.UTF-8"
LC_COLLATE="en_GB.UTF-8"
LC_MONETARY="en_GB.UTF-8"
LC_MESSAGES="en_GB.UTF-8"
LC_PAPER="en_GB.UTF-8"
LC_NAME="en_GB.UTF-8"
LC_ADDRESS="en_GB.UTF-8"
LC_TELEPHONE="en_GB.UTF-8"
LC_MEASUREMENT="en_GB.UTF-8"
LC_IDENTIFICATION="en_GB.UTF-8"
LC_ALL=en_GB.UTF-8
</pre></td></tr>
</table>

<p>
Das ist alles. Sie nutzen jetzt UTF-8-Locales. Die nächste Hürde ist die
Konfiguration der Programme, die Sie täglich nutzen.
</p>

<p class="chaphead"><span class="chapnum"><a name="doc_chap3">3. </a></span>Programmunterstützung</p>

<p>
Als Unicode anfing in der Softwarewelt Bedeutung zu erlangen, waren
Multi-Byte-Zeichensätze unpassend zu Sprachen wie C, in welcher viele der
heutigen Programme geschrieben sind. Auch heute noch, sind einige Programme
nicht in der Lage, mit UTF-8 entsprechend umzugehen. Glücklicherweise sind es
die wenigsten.
</p>

<p class="secthead"><a name="doc_chap3_sect2">Dateinamen, NTFS, und FAT</a></p>

<p>
Es existieren mehrere NLS-Optionen im Linux-Kernelkonfigurationsmenü, aber es
ist wichtig sich nicht beirren zu lassen. Für den größten Teil müssen Sie nur
die UTF-8-NLS-Unterstützung in den Kernel einbauen und die NLS-Standardoption
nach utf8 abändern.
</p>

<a name="doc_chap3_pre1"></a><table class="ntable" width="100%" cellspacing="0" cellpadding="0" border="0">
<tr><td bgcolor="#7a5ada"><p class="codetitle">Befehlsauflistung 3.1: Kernelkonfigurationsschritte für UTF-8-NLS</p></td></tr>
<tr><td bgcolor="#ddddff"><pre>
File Systems --&gt;
  Native Language Support --&gt;
    (utf8) Default NLS Option
    &lt;*&gt; NLS UTF8
    <span class="comment">&lt;*&gt; alle Zeichensätze die Sie in ihren
    FAT-Dateisystemen, oder Joilet-CD-ROMs nutzen.)</span>
</pre></td></tr>
</table>

<p>
Falls Sie vorhaben, NTFS-Partitionen zu mounten, sollten Sie eine
<span class="code">nls</span>-Option mit mount spezifizieren.
Falls Sie FAT-Partitionen mounten wollen, muss die
<span class="code">codepage</span>-Option angegeben werden.
Optional können Sie eine Standard-Codepage für FAT in der
Linux-Kernelkonfiguration definieren. Bedenken Sie, dass die
<span class="code">codepage</span>-Option welche Sie mit mount angeben, die
Standardeinstellung des Kernels überschreibt.
</p>

<a name="doc_chap3_pre2"></a><table class="ntable" width="100%" cellspacing="0" cellpadding="0" border="0">
<tr><td bgcolor="#7a5ada"><p class="codetitle">Befehlsauflistung 3.2: FAT-Einstellungen in der Kernelkonfiguration</p></td></tr>
<tr><td bgcolor="#ddddff"><pre>
File Systems --&gt;
  DOS/FAT/NT Filesystems  --&gt;
    (437) Default codepage for fat
</pre></td></tr>
</table>

<p>
Sie sollten es vermeiden,
<span class="code">Default iocharset for fat</span> mit UTF-8 zu setzen, da es
nicht empfohlen wird. Stattdessen sollten Sie die Option utf8=true mitgeben,
wenn Sie FAT-Partitionen mounten. Für weitere Informationen, lesen Sie die
Manpage zu mount (<span class="code">man mount</span>) und die
Kerneldokumentation
(<span class="path">/usr/src/linux/Documentation/filesystems/vfat.txt</span>).
</p>

<p>
Zur Änderung der Enkodierung der Dateinamen, kann
<span class="code">app-text/convmv</span> genutzt werden.
</p>

<a name="doc_chap3_pre3"></a><table class="ntable" width="100%" cellspacing="0" cellpadding="0" border="0">
<tr><td bgcolor="#7a5ada"><p class="codetitle">Befehlsauflistung 3.3: Beispiel zur Nutzung von convmv</p></td></tr>
<tr><td bgcolor="#ddddff"><pre>
# <span class="input">emerge --ask app-text/convmv</span>
<span class="comment">(Befehlsformat)</span>
# <span class="input">convmv -f &lt;current-encoding&gt; -t utf-8 &lt;filename&gt;</span>
<span class="comment">(Ersetzen Sie iso-8859-1 mit dem Zeichensatz welches gerade genutzt wird)</span>
# <span class="input">convmv -f iso-8859-1 -t utf-8 filename</span>
</pre></td></tr>
</table>

<p>
Um den <span class="emphasis">Inhalt</span> von Dateien zu ändern, nutzen Sie
das Hilfstool <span class="code">iconv</span>, welches mit
<span class="code">glibc</span> dabei ist:
</p>

<a name="doc_chap3_pre4"></a><table class="ntable" width="100%" cellspacing="0" cellpadding="0" border="0">
<tr><td bgcolor="#7a5ada"><p class="codetitle">Befehlsauflistung 3.4: Beispiel zur Nutzung von iconv</p></td></tr>
<tr><td bgcolor="#ddddff"><pre>
<span class="comment">(Ersetzen Sie iso-8859-1 mit dem Zeichensatz welches gerade genutzt wird)</span>
<span class="comment">(Überprüfen Sie, ob die Ausgabe in Ordnung ist)</span>
# <span class="input">iconv -f iso-8859-1 -t utf-8 filename</span>
<span class="comment">(Konvertieren Sie eine Datei und leiten Sie dessen Ausgabe in eine neue Datei)</span>
# <span class="input">iconv -f iso-8859-1 -t utf-8 filename &gt; newfile</span>
</pre></td></tr>
</table>

<p>
<span class="code">app-text/recode</span> kann für diesen Zweck ebenso genutzt
werden.
</p>

<p class="secthead"><a name="doc_chap3_sect3">Die Systemkonsole</a></p>

<table class="ncontent" width="100%" border="0" cellspacing="0" cellpadding="0"><tr><td bgcolor="#ffffbb"><p class="note"><b>Wichitg: </b>
Sie brauchen &gt;=sys-apps/baselayout-1.11.9 für Unicode in der Konsole.
</p></td></tr></table>

<p>
Um UTF-8 in der Konsole zu aktivieren, müssen Sie
<span class="path">/etc/rc.conf</span> editieren und
<span class="code">UNICODE="yes"</span> setzen, zudem sollten Sie die Kommentare
in dieser Datei lesen -- es ist wichtig, eine Schrift zu finden, welche einen
möglichst großen Zeichenvorrat hat, wenn Sie vorhaben, Unicode größtenteils
einzusetzen.

<p>
Die <span class="code">KEYMAP</span>-Variable, welche in
<span class="path">/etc/conf.d/keymaps</span> gesetzt wird, sollte ein Unicode-Layout
spezifizieren.
</p>

<a name="doc_chap3_pre5"></a><table class="ntable" width="100%" cellspacing="0" cellpadding="0" border="0">
<tr><td bgcolor="#7a5ada"><p class="codetitle">Befehlsauflistung 3.5: Beispiel /etc/conf.d/keymaps (Auszug)</p></td></tr>
<tr><td bgcolor="#ddddff"><pre>
<span class="comment">(Ändern Sie "uk" entsprechend ihrem lokalen Layout ab)</span>
KEYMAP="uk"
</pre></td></tr>
</table>

<p class="secthead"><a name="doc_chap3_sect4">Ncurses und Slang</a></p>

<table class="ncontent" width="100%" border="0" cellspacing="0" cellpadding="0"><tr><td bgcolor="#bbffbb"><p class="note"><b>Notiz: </b>
Ignorieren Sie alle Erwähnungen von Slang in dieser Sektion, wenn Sie es nicht
installiert haben, oder nicht nutzen.
</p></td></tr></table>

<p>
Es ist ratsam <span class="code">unicode</span> zu ihren globalen USE-Flags in
<span class="path">/etc/make.conf</span> hinzuzufügen und die Pakete
<span class="code">sys-libs/ncurses</span> und, sofern installiert,
<span class="code">sys-libs/slang</span> erneut zu installieren. Dies erledigt
Portage automatisch, wenn Sie ihr System aktualisieren:
</p>

<a name="doc_chap3_pre6"></a><table class="ntable" width="100%" cellspacing="0" cellpadding="0" border="0">
<tr><td bgcolor="#7a5ada"><p class="codetitle">Befehlsauflistung 3.6: Aktualisieren des Systems</p></td></tr>
<tr><td bgcolor="#ddddff"><pre>
# <span class="input">emerge --update --deep --newuse world</span>
</pre></td></tr>
</table>

<p>
Nachdem die USE-Flags geändert wurden, müssen alle Pakete neu installiert werden,
welche von Ncurses oder Slang abhängen. Das Tool das wir nutzen
(<span class="code">revdep-rebuild</span>) ist Teil des
<span class="code">gentoolkit</span>-Pakets.
</p>

<a name="doc_chap3_pre7"></a><table class="ntable" width="100%" cellspacing="0" cellpadding="0" border="0">
<tr><td bgcolor="#7a5ada"><p class="codetitle">Befehlsauflistung 3.7: Neukompilieren der Programme, welche von Ncurses oder Slang abhängen</p></td></tr>
<tr><td bgcolor="#ddddff"><pre>
# <span class="input">revdep-rebuild --soname libncurses.so.5</span>
# <span class="input">revdep-rebuild --soname libslang.so.1</span>
</pre></td></tr>
</table>

<p class="secthead"><a name="doc_chap3_sect5">KDE, GNOME und Xfce</a></p>

<p>
Alle großen Desktop Environments bieten volle Unicode-Unterstützung und bedürfen
kein weiteren Einstellungen, welche nicht schon in diesem Guide behandelt wurden.
Der Grund dafür ist, dass die eingesetzten grafischen Toolkits (Qt oder GTK+2)
UTF-8-gerüstet sind. Folglich sollte jede Applikation, die auf einer dieser
Toolkits aufbaut, UTF-8-gerüstet sein.
</p>

<p>
Ausnahmen bilden Xlib und GTK+1. GTK+1 erfordert eine ISO-10646-1 FontSpec in
~/.gtkrc, zum Beispiel
<span class="code">-misc-fixed-*-*-*-*-*-*-*-*-*-*-iso10646-1</span>. Desweiteren
benötigen Anwendungen, welche Xlib oder Xaw nutzen, eine ähnliche FontSpec,
andernfalls verweigern sie ihren Dienst.
</p>

<table class="ncontent" width="100%" border="0" cellspacing="0" cellpadding="0"><tr><td bgcolor="#bbffbb"><p class="note"><b>Notiz: </b>
Falls Sie noch eine Version vom Gnome-Kontrollzenter 1 haben, nutzen Sie diesen
stattdessen. Wählen Sie von dort irgendeine ISO-10646-1.
</p></td></tr></table>

<a name="doc_chap3_pre8"></a><table class="ntable" width="100%" cellspacing="0" cellpadding="0" border="0">
<tr><td bgcolor="#7a5ada"><p class="codetitle">Befehlsauflistung 3.8: Beispiel ~/.gtkrc (für GTK+1) definiert eine Unicode-kompatible Schrift</p></td></tr>
<tr><td bgcolor="#ddddff"><pre>
style "user-font"
{
    fontset="-misc-fixed-*-*-*-*-*-*-*-*-*-*-iso10646-1"
}
widget_class "*" style "user-font"
</pre></td></tr>
</table>

<p>
Sollte eine Anwendung Unterstützung für sowohl Qt, als auch GTK+2 bieten, wird die
GTK+2-GUI allgemein bessere Ergebnisse mit Unicode liefern.
</p>

<p class="secthead"><a name="doc_chap3_sect6">X11 und Schriften</a></p>

<table class="ncontent" width="100%" border="0" cellspacing="0" cellpadding="0"><tr><td bgcolor="#ffffbb"><p class="note"><b>Wichtig: </b>
<span class="code">x11-base/xorg-x11</span> hat eine weit bessere Unterstützung für Unicode als XFree86 und wird <span class="emphasis">wärmstens</span> empfohlen.
</p></td></tr></table>

<p>
TrueType-Schriften bieten Unterstützung für Unicode und die meisten mit Xorg
mitgelieferten Schriften haben eine beeindruckende Zeichenunterstützung, wenn auch
offensichtlich nicht jedes einzelne für Unicdoe existierende Zeichen mit dieser
Schrift verfügbar ist. Um Schriften zu erstellen (einschließlich des Bitstream Vera-Satzes)
, welche Unterstützung für ostasiatische Buchstaben bieten, müssen Sie
<span class="code">cjk</span> zu ihren USE-Flags hinzufügen. Einige andere Anwendungen
nutzen dieses Flag, daher ist es ratsam sie dauerhaft in den Einstellungen zu belassen.
</p>

<p>
Auch sind mehrere Schriftpakete in Portage Unicode-gerüstet.
</p>

<a name="doc_chap3_pre9"></a><table class="ntable" width="100%" cellspacing="0" cellpadding="0" border="0">
<tr><td bgcolor="#7a5ada"><p class="codetitle">Befehlsauflistung 3.9: Optional: Installation weiterer Unicode-gerüsteten Schriften</p></td></tr>
<tr><td bgcolor="#ddddff"><pre>
# <span class="input">emerge terminus-font intlfonts freefonts cronyx-fonts corefonts</span>
</pre></td></tr>
</table>

<p class="secthead"><a name="doc_chap3_sect7">Window Manager und Terminal-Emulatoren</a></p>

<p>
Window Manager, welche nicht auf GTK oder Qt basieren, haben allgemein eine sehr gute
Unicode-Unterstützung, da sie zum Handhaben der Schriften oft die Xft-Bibliothek nutzen.
Falls ihr Window Manager kein Xft nutzt, bleibt ihnen immernoch die in der vorherigen
Sektion erwähnte FontSpec als Unicode-Schrift.
</p>

<p>
Terminal-Emulatoren, welche Xft nutzen und Unicode unterstützen, sind schwieriger zu
bekommen. Abgesehen von Konsole und gnome-terminal, sind die besten Optionen in Portage
<span class="code">x11-terms/rxvt-unicode</span>,
<span class="code">xfce-extra/terminal</span>,
<span class="code">gnustep-apps/terminal</span>,
<span class="code">x11-terms/mlterm</span>, oder das einfache
<span class="code">x11-terms/xterm</span>, sofern es mit dem
<span class="code">unicode</span>-USE-Flag kompiliert wurde und mit
<span class="code">uxterm</span> aufgerufen wird.
<span class="code">app-misc/screen</span> unterstützt ebenfalls UTF-8, dazu muss es mit
<span class="code">screen -U</span> aufgerufen werden, oder das Folgende wird zur
<span class="path">~/.screenrc</span> hinzugefügt:
</p>

<a name="doc_chap3_pre10"></a><table class="ntable" width="100%" cellspacing="0" cellpadding="0" border="0">
<tr><td bgcolor="#7a5ada"><p class="codetitle">Befehlsauflistung 3.10: ~/.screenrc für UTF-8</p></td></tr>
<tr><td bgcolor="#ddddff"><pre>
defutf8 on
</pre></td></tr>
</table>

<p class="secthead"><a name="doc_chap3_sect8">Vim, Emacs, Xemacs und Nano</a></p>

<p>
Vim bietet volle UTF-8-Unterstützung und hat eine eingebaute UTF-8-Dateierkennung. Für
weitere Informartionen in Vim, rufen Sie <span class="code">:help mbyte.txt</span> auf.
</p>

<p>
Emacs 22.x und höher haben ebenfalls volle UTF-8-Unterstützung. Xemacs 22.x bietet noch
keine Unterstützung für das Kombinieren von Zeichen.
</p>

<p>
Ältere Versionen des Emacs und/oder Xemacs können eine Installation von
<span class="code">app-emacs/mule-ucs</span> und/oder
<span class="code">app-xemacs/mule-ucs</span> erfordern. Fügen Sie folgenden Code zu
ihrer <span class="path">~/.emacs</span> hinzu, um Unterstützung für CJK-Sprachen in
UTF-8 zu haben.
</p>

<a name="doc_chap3_pre11"></a><table class="ntable" width="100%" cellspacing="0" cellpadding="0" border="0">
<tr><td bgcolor="#7a5ada"><p class="codetitle">Befehlsauflistung 3.11: Emacs CJK UTF-8-Unterstützung</p></td></tr>
<tr><td bgcolor="#ddddff"><pre>
(require 'un-define)
(require 'jisx0213)
(set-language-environment "Japanese")
(set-default-coding-systems 'utf-8)
(set-terminal-coding-system 'utf-8)
</pre></td></tr>
</table>

<p>
Nano hat bisher noch keine Unterstützung für Unicode, auch wenn es schon lange in Planung
ist. Mit Glück, wird es sich in Zukunft ändern. Zum Zeitpunkt des Schreibens, hat Nano's
CVS UTF-8-Unterstützung und sollte beim nächsten Release dabei sein.
</p>

<p class="secthead"><a name="doc_chap3_sect9">Shells</a></p>

<p>
Zur Zeit bietet die <span class="code">bash</span> volle Unicode-Unterstützung durch die
GNU Readline Library. Nutzer der Z-Shell sind in einer etwas schlechteren Position --
kein Teil der Shell bietet Unicde-Unterstützung, auch wenn momentan Bemühungen unternommen
werden, Multi-Byte-Zeichen zu unterstützen.
</p>

<p>
Die C-Shell, <span class="code">tcsh</span> und <span class="code">ksh</span> unterstützen
kein UTF-8.
</p>

<p class="secthead"><a name="doc_chap3_sect10">Irssi</a></p>

<p>
Irssi bietet UTF-8-Unterstützung, auch wenn es einer zusätzlichen Einstellung bedarf.
</p>

<a name="doc_chap3_pre12"></a><table class="ntable" width="100%" cellspacing="0" cellpadding="0" border="0">
<tr><td bgcolor="#7a5ada"><p class="codetitle">Befehlsauflistung 3.12: Aktivieren von UTF-8 in Irssi</p></td></tr>
<tr><td bgcolor="#ddddff"><pre>
/set term_type UTF-8
</pre></td></tr>
</table>

<p>
Für Channels, in denen nicht-ASCII-Zeichen durch nicht-UTF-8-Zeichen ausgewechselt werden,
kann der Befehl <span class="code">/recode</span> verwendet werden, um diese Zeichen
umzuwandeln. Tippen Sie <span class="code">/help recode</span> ein, für mehr Informationen.
</p>

<p class="secthead"><a name="doc_chap3_sect11">Mutt</a></p>

<p>
Der Mutt MUA (Mail User Agent) hat sehr gute Unicode-Unterstützung. Um UTF-8 mit Mutt
zu nutzen, fügen Sie die folgende Zeile zu ihrer <span class="path">~/.muttrc</span>
hinzu:
</p>

<a name="doc_chap3_pre13"></a><table class="ntable" width="100%" cellspacing="0" cellpadding="0" border="0">
<tr><td bgcolor="#7a5ada"><p class="codetitle">Befehlsauflistung 3.13: ~/.muttrc für UTF-8</p></td></tr>
<tr><td bgcolor="#ddddff"><pre>
set send_charset="utf8" <span class="comment">(ausgehender Zeichensatz)</span>
set charset="utf8"      <span class="comment">(anzuzeigender Zeichensatz)</span>
</pre></td></tr>
</table>

<table class="ncontent" width="100%" border="0" cellspacing="0" cellpadding="0"><tr><td bgcolor="#bbffbb"><p class="note"><b>Notiz: </b>
Es kann vorkommen, dass Sie weiterhin ein '?' sehen, wenn Sie Mails mit Mutt lesen. Das
ist ein Ergebnis aus falschen Einstellungen des Mailklienten, den der Sender benutzt.
Sie können da nicht viel tun, außer das Sie die betreffende Person bitten, den Klienten
so einzustellen, dass der korrekte Zeichensatz spezifiziert wird.
</p></td></tr></table>

<p>
Mehr Informationen finden Sie in der <a href="http://wiki.mutt.org/index.cgi?MuttFaq/Charset">Mutt Wiki</a>.
</p>

<p class="secthead"><a name="doc_chap3_sect12">Less</a></p>

<p>
Wir alle nutzen wohl <span class="code">more</span> oder <span class="code">less</span>
häufiger mit <span class="code">|</span>, um die Ausgabe eines Befehls korrekt zu sehen,
wie beispielsweise <span class="code">dmesg | less</span>. Während
<span class="code">more</span> nur die Shell braucht, um UTF-8-gerüstet zu sein, braucht
<span class="code">less</span> eine gesetzte Umgebungsvariable
<span class="code">LESSCHARSET</span>. Diese stellt sicher, dass die Zeichen korrekt
dargestellt werden und wird in <span class="path">/etc/profile</span> oder
<span class="path">~/.bash_profile</span> gesetzt. Starten Sie den Editor ihrer Wahl
und fügen Sie einer der beiden erwähnten Dateien die folgende Zeile hinzu.
</p>

<a name="doc_chap3_pre14"></a><table class="ntable" width="100%" cellspacing="0" cellpadding="0" border="0">
<tr><td bgcolor="#7a5ada"><p class="codetitle">Befehlsauflistung 3.14: Setzen der Umgebungsvariable für less</p></td></tr>
<tr><td bgcolor="#ddddff"><pre>
LESSCHARSET=utf-8
</pre></td></tr>
</table>

<p class="secthead"><a name="doc_chap3_sect13">Man</a></p>

<p>
Manpages sind integraler Bestandteil eines jeden Linuxsystems. Um sicherzustellen, dass
Unicode in ihren Manpages korrekt dargestellt wird, editieren Sie
<span class="path">/etc/man.conf</span> und ersetzen eine Zeile wie unten gezeigt.
</p>

<a name="doc_chap3_pre15"></a><table class="ntable" width="100%" cellspacing="0" cellpadding="0" border="0">
<tr><td bgcolor="#7a5ada"><p class="codetitle">Befehlsauflistung 3.15: Änderung der man.conf für Unicode-Unterstützung</p></td></tr>
<tr><td bgcolor="#ddddff"><pre>
<span class="comment">(Dies ist die alte Zeile)</span>
NROFF           /usr/bin/nroff -Tascii -c -mandoc
<span class="comment">(Ersetzen Sie die obere mit der unteren Zeile)</span>
NROFF           /usr/bin/nroff -mandoc -c
</pre></td></tr>
</table>

<p class="secthead"><a name="doc_chap3_sect14">elinks und links</a></p>

<p>
Dies sind oft genutzte Textbrowser und wir sollten zeigen, wie Sie deren Unicode-Unterstützung
aktivieren. Für <span class="code">elinks</span> und <span class="code">links</span>
gibt es zwei Wege, um dies zu realisieren. Einer besteht darin, die Setup-Option des Browsers
zu nutzen, der andere darin, die Konfigurationsdatei zu editieren. Um die Option durch den
Browser zu setzen, öffnen Sie eine Seite mit <span class="code">elinks</span> oder
<span class="code">links</span> und drücken <span class="code">Alt+S</span>, um das
Setup-Menü aufzurufen. Dann wählen Sie Terminal Options, oder drücken
<span class="code">T</span>. Scrollen Sie runter und wählen Sie die letzte Option
<span class="code">UTF-8 I/O</span> durch drücken der Enter-Taste. Dann speichern Sie ab
und verlassen das Menü. Bei <span class="code">links</span> müssen Sie
<span class="code">Alt+S</span> wiederholt drücken und anschließend
<span class="code">S</span>, um zu speichern. Die Methode mit der Konfigurationsdatei wird
unten gezeigt.
</p>

<a name="doc_chap3_pre16"></a><table class="ntable" width="100%" cellspacing="0" cellpadding="0" border="0">
<tr><td bgcolor="#7a5ada"><p class="codetitle">Befehlsauflistung 3.16: Aktivieren von UTF-8 für elinks/links</p></td></tr>
<tr><td bgcolor="#ddddff"><pre>
<span class="comment">(Für elinks, editieren Sie /etc/elinks/elinks.conf oder ~/.elinks/elinks.conf und
fügen die folgende Zeile hinzu)</span>
set terminal.linux.utf_8_io = 1

<span class="comment">(Für links, editieren Sie ~/.links/links.cfg und fügen die folgende Zeile hinzu)</span>
terminal "xterm" 0 1 0 us-ascii utf-8
</pre></td></tr>
</table>

<p class="secthead"><a name="doc_chap3_sect15">Alles austesten</a></p>

<p>
Es gibt eine Vielzahl an UTF-8-Testseiten.
<span class="code">net-www/w3m</span>,
<span class="code">net-www/links</span>, <span class="code">net-www/elinks</span>,
<span class="code">net-www/lynx</span> und alle Mozilla-basierenden Browser (einschließlich
Firefox) unterstützen UTF-8. Konqueror und Opera bieten ebenfalls volle
UTF-8-Untestützung.
</p>

<p>
Wenn Sie einen der Textbrowser verwenden, stellen Sie sicher, dass das Terminal das Sie
einsetzen, Unicode-gerüstet ist.
</p>

<p>
Falls Sie einige Zeichen als Boxen mit Buchstaben, oder Zahlen dargestellt bekommen, bedeutet
das, dass die eingesetze Schrift kein geeignetes Zeichen für das Symbol zur Verfügung hat.
Stattdessen wird eine Box mit dem zum UTF-8-Symbol gehörenden Hex-Code angezeigt.
</p>

<ul>
  <li>
    <a href="http://www.w3.org/2001/06/utf-8-test/UTF-8-demo.html">Eine W3C
    UTF-8-Testseite</a>
  </li>
  <li>
    <a href="http://titus.uni-frankfurt.de/indexe.htm?/unicode/unitest.htm">
    Eine UTF-8-Testseite der Universität Frankfurt</a>
  </li>
</ul>

<p class="secthead"><a name="doc_chap3_sect16">Eingabemethoden</a></p>

<p>
<span class="emphasis">Dead Keys</span> werden genutzt, um in X Zeichen einzugeben,
welche nicht auf ihrer Tastatur vorhanden sind. Das funktioniert, wenn Sie die rechte
Alt-Taste (in einigen Ländern AltGr) und eine weitere Taste aus dem nicht-alphabetischen
Teil der Tastatur links von der Eingabe-Taste einmal drücken, loslassen und dann einen
Buchstaben drücken. Der <span class="emphasis">Dead Key</span> sollte ihn modifizieren.
Eingaben könenn desweiteren durch gleichzeitiges Drücken der Shift-Taste beeinflusst
werden.
</p>

<p>
Um Dead Keys in X zu aktivieren, brauchen Sie ein Layout, welches diese unterstützt.
Die meisten europäischen Layouts haben bereits Dead Keys in der Standardausführung.
Wie auch immer, dies trifft nicht auf nordamerikanische Layouts zu. Auch wenn es einen
gewissen Grad an Unbeständigkeit zwischen den Layouts gibt, scheint der einfachste Weg
zu sein, beispielsweise ein Layout der Form "en_US" statt "us" zu nutzen. Das Layout wird
in <span class="path">/etc/X11/xorg.conf</span> bestimmt, zum Beispiel so:
</p>

<a name="doc_chap3_pre17"></a><table class="ntable" width="100%" cellspacing="0" cellpadding="0" border="0">
<tr><td bgcolor="#7a5ada"><p class="codetitle">Befehlsauflistung 3.17: Ausschnitt der /etc/X11/xorg.conf</p></td></tr>
<tr><td bgcolor="#ddddff"><pre>
Section "InputDevice"
    Identifier "Keyboard0"
    Driver     "kbd"
    Option     "XkbLayout" "en_US" <span class="comment"># Statt einfach nur "us"</span>
    <span class="comment">(Weitere Xkb-Optionen hier)</span>
EndSection
</pre></td></tr>
</table>

<table class="ncontent" width="100%" border="0" cellspacing="0" cellpadding="0"><tr><td bgcolor="#bbffbb"><p class="note"><b>Notiz: </b>
Die vorherigen Änderungen müssen Sie nur durchführen, wenn Sie ein nordamerikanisches
Layout nutzen, oder ein anderes Layout, bei welchem die Dead Keys nicht funktionieren.
Europäische Nutzer sollten funktionierende Dead Keys haben, ohne etwas zu ändern.
</p></td></tr></table>

<p>
Diese Änderung wird erst nach einem Neustart des X-Servers wirksam. Um sie sofort
durchzusetzen, nutzen Sie das Tool <span class="code">setxkbmap</span>, zum Beispiel so:
<span class="code">setxkbmap en_US</span>.
</p>

<p>
Es ist vermutlich einfacher Dead Keys anhand von Beispielen zu beschreiben.
Auch wenn die Ergebnisse lokal abhängig sind, sollten die Konzepte die gleichen sein.
Die Beispiele beinhalten UTF-8, um sie darzustellen müssen Sie ihrem Browser entweder
mitteilen, die Seite als UTF-8 anzuzeigen, oder aber Sie haben bereits UTF-8-Locales
konfiguriert.
</p>

<p>
Wenn ich AltGr und einmal [ drücke, loslasse und dann a drücke, erhalte ich 'á'. Wenn ich
AltGr und einmal [ drücke und dann e, erhalte ich 'ë'. Wenn ich einmal AltGr und ; drücke,
erhalte ich 'á' und wenn ich AltGr und ; drücke, dann loslasse, erhalte ich 'é'.
</p>

<p>
Durch gleichzeitiges Drücken von AltGr, Shift und [, dann loslasse und a drücke, erhalte
ich ein skandinavisches 'å'. Wenn ich AltGr, Shift und [ drücke und
<span class="emphasis">nur</span> [ loslasse, dann nochmals drücke, erhalte ich '&#730;'.
Auch wenn es aussieht wie eines, dieses (U+02DA) ist nicht das gleiche wie ein Grad-Symbol
(U+00B0). Das funktioniert für andere Akzente, welche mit Dead Keys produziert werden 
AltGr und [, nur [ loslassen, dann nochmals drücken, produziert '¨'.
</p>

<p>
AltGr kann allein mit alphabetischen Tasten benutzt werden. Beispielsweise wird durch
Drücken von AltGr und m ein kleines griechisches mu produziert: 'µ'. AltGr und s produzieren
ein scharfes s oder esszet: 'ß'. Wie einige europäische Nutzer erwarten würden
(weil es auf ihren Tastaturen aufgedruckt ist), produziert AltGr und 4 (oder E, abhängig vom
Tastaturlayout) ein Eurozeichen, ''.
</p>

<p class="secthead"><a name="doc_chap3_sect17">Ressourcen</a></p>

<ul>
  <li>
    <a href="http://www.wikipedia.com/wiki/Unicode">The Wikipedia entry for
    Unicode</a>
  </li>
  <li>
    <a href="http://www.wikipedia.com/wiki/UTF-8">The Wikipedia entry for
    UTF-8</a>
  </li>
  <li><a href="http://www.unicode.org">Unicode.org</a></li>
  <li><a href="http://www.utf-8.com">UTF-8.com</a></li>
  <li><a href="http://www.ietf.org/rfc/rfc3629.txt">RFC 3629</a></li>
  <li><a href="http://www.ietf.org/rfc/rfc2277.txt">RFC 2277</a></li>
  <li>
    <a href="http://www.tbray.org/ongoing/When/200x/2003/04/26/UTF">Characters vs.
    Bytes</a>
  </li>
</ul>

<br><p class="copyright">
    Die Inhalte dieses Dokuments sind unter der <a href="http://creativecommons.org/licenses/by-sa/2.5/deed.de">Creative Commons -
    Namensnennung / Weitergabe</a> Lizenz lizenziert.
  </p>
<!--
  <rdf:RDF xmlns="http://web.resource.org/cc/"
      xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#">
  <License rdf:about="http://creativecommons.org/licenses/by-sa/2.5/">
     <permits rdf:resource="http://web.resource.org/cc/Reproduction" />
     <permits rdf:resource="http://web.resource.org/cc/Distribution" />
     <requires rdf:resource="http://web.resource.org/cc/Notiz" />
     <requires rdf:resource="http://web.resource.org/cc/Attribution" />
     <permits rdf:resource="http://web.resource.org/cc/DerivativeWorks" />
     <requires rdf:resource="http://web.resource.org/cc/ShareAlike" />
  </License>
  </rdf:RDF>
--><br>
</td>
<td width="1%" bgcolor="#dddaec" valign="top"><table border="0" cellspacing="4px" cellpadding="4px">
<tr><td class="topsep" align="center"><p class="altmenu"><a title="Eine Drucker-freundliche Ansicht betrachten" class="altlink" href="/doc/en/utf-8.xml?style=printable">Print</a></p></td></tr>
<tr><td align="center" class="topsep"><p class="alttext">Aktualisiert 4. Januar 2006</p></td></tr>
<tr><td align="left" class="topsep"><p class="alttext"><b>Zusammenfassung: </b>
Diese Einführung zeigt ihnen, nach Aufzeigen der Vorteile von Unicode, insbesondere
von UTF-8, wie Sie den UTF-8-Zeichensatz einrichten und mit ihrem Gentoo Linux
System benutzen.
</p></td></tr>
<tr><td align="left" class="topsep"><p class="alttext">
  <b><a class="altlink" href="mailto:slarti@gentoo.org">Thomas Martin</a></b>
<br><i>Autor</i><br><br>
  <b><a class="altlink" href="mailto:devil@gentoo.org.ua">Alexander Simonov</a></b>
<br><i>Contributor</i><br><br>
  <b><a class="altlink" href="mailto:fox2mike@gentoo.org">Shyam Mani</a></b>
<br><i>Bearbeiter</i><br></p></td></tr>
  <b><a class="altlink" href="mailto:norman.golisz@arcor.de">Norman Golisz</a></b>
<br><i>Übersetzer</i><br><br>
<tr lang="en"><td align="center" class="topsep">
<p class="alttext"><b>Donate</b> to support our development efforts.
        </p>
<form action="https://www.paypal.com/cgi-bin/webscr" method="post">
<input type="hidden" name="cmd" value="_xclick"><input type="hidden" name="business" value="paypal@gentoo.org"><input type="hidden" name="item_name" value="Gentoo Linux Support"><input type="hidden" name="item_number" value="1000"><input type="hidden" name="image_url" value="/images/paypal.png"><input type="hidden" name="no_shipping" value="1"><input type="hidden" name="return" value="http://www.gentoo.org"><input type="hidden" name="cancel_return" value="http://www.gentoo.org"><input type="image" src="http://images.paypal.com/images/x-click-but21.gif" name="submit" alt="Make payments with PayPal - it's fast, free and secure!">
</form>
</td></tr>
<tr lang="en"><td align="center" class="topsep">
<a href="http://www.vr.org"><img src="/images/vr-ad.png" width="125" height="144" alt="Gentoo Centric Hosting: vr.org" border="0"></a><p class="alttext"><a href="http://www.vr.org/">VR Hosted</a></p>
</td></tr>
<tr lang="en"><td align="center" class="topsep">
<a href="http://www.tek.net" target="_top"><img src="/images/tek-gentoo.gif" width="125" height="125" alt="Tek Alchemy" border="0"></a><p class="alttext"><a href="http://www.tek.net/">Tek Alchemy</a></p>
</td></tr>
<tr lang="en"><td align="center" class="topsep">
<a href="http://www.sevenl.net" target="_top"><img src="/images/sponsors/sevenl.gif" width="125" height="144" alt="SevenL.net" border="0"></a><p class="alttext"><a href="http://www.sevenl.net/">SevenL.net</a></p>
</td></tr>
<tr lang="en"><td align="center" class="topsep">
<a href="http://www.phparch.com/bannerclick.php?AID=68&amp;BID=1&amp;BT=127929" target="_top"><img src="/images/phpa-gentoo.gif" width="125" height="144" alt="php|architect" border="0"></a><p class="alttext"><a href="http://www.phparch.com/bannerclick.php?AID=68&amp;BID=1&amp;BT=127929">php|architect</a></p>
</td></tr>
<tr><td align="center" class="topsep"></td></tr>
</table></td>
</tr></table></td></tr>
<tr><td colspan="2" align="right" class="infohead">
      Copyright 2001-2005 Gentoo Foundation, Inc.  Questions, Comments?  Email <a class="highlight" href="mailto:www@gentoo.org">www@gentoo.org</a>.
    </td></tr>
</table></body>
</html>

----------
End of xml-code.
Comment 2 Łukasz Damentko (RETIRED) gentoo-dev 2006-01-03 19:51:52 UTC
Please choose "Create a New Attachment" option in this bug and add the guide in there.
Comment 3 Łukasz Damentko (RETIRED) gentoo-dev 2006-01-03 19:56:15 UTC
It's worth mentioning that you have translated HTML file, not an XML one.
You have to move all the content to file which is here:
http://www.gentoo.org/doc/en/utf-8.xml?passthru=1
(you can use "wget -O utf-8.xml http://www.gentoo.org/doc/en/utf-8.xml?passthru=1" to download it)

It's good to contact lead translator for your language (grahl@gentoo.org) before you do any work, cause it may lead to such problems and real waste of time...
Comment 4 Jan Hendrik Grahl (RETIRED) gentoo-dev 2006-01-04 09:05:04 UTC
Will be merged with the original xml file and committed at the end of next week.
Thanks for you help, Norman.
Comment 5 Norman Golisz 2006-02-15 08:30:47 UTC
Created attachment 79852 [details]
Translated utf-8 document (german)

I attached the XML version of the document.
Comment 6 Xavier Neys (RETIRED) gentoo-dev 2006-02-15 08:42:10 UTC
Comment on attachment 79852 [details]
Translated utf-8 document (german)

Much appreciated. Thanks.
Comment 7 Jan Hendrik Grahl (RETIRED) gentoo-dev 2006-02-15 11:08:35 UTC
I realize I said "next week" and it became next month due to other files but the proofread version is 90% done in the gentoo.de repository. Effort wasted.
Comment 8 Jan Hendrik Grahl (RETIRED) gentoo-dev 2006-02-20 20:58:27 UTC
done