Go to:
Gentoo Home
Documentation
Forums
Lists
Bugs
Planet
Store
Wiki
Get Gentoo!
Gentoo's Bugzilla – Attachment 62343 Details for
Bug 97524
[cs] utf-8.xml
Home
|
New
–
[Ex]
|
Browse
|
Search
|
Privacy Policy
|
[?]
|
Reports
|
Requests
|
Help
|
New Account
|
Log In
[x]
|
Forgot Password
Login:
[x]
doc/cs/utf-8.xml
utf-8.xml (text/plain), 26.60 KB, created by
Jan Kundrát (RETIRED)
on 2005-06-30 11:41:36 UTC
(
hide
)
Description:
doc/cs/utf-8.xml
Filename:
MIME Type:
Creator:
Jan Kundrát (RETIRED)
Created:
2005-06-30 11:41:36 UTC
Size:
26.60 KB
patch
obsolete
><?xml version='1.0' encoding="UTF-8"?> ><!-- $Header$ --> ><!DOCTYPE guide SYSTEM "/dtd/guide.dtd"> > ><guide link="/doc/cs/utf-8.xml" lang="cs"> ><title>PoužÃvánà UTF-8 v Gentoo</title> > ><author title="Author"> > <mail link="slarti@gentoo.org">Thomas Martin</mail> ></author> ><author title="Contributor"> > <mail link="devil@gentoo.org.ua">Alexander Simonov</mail> ></author> ><author title="Editor"> > <mail link="fox2mike@gentoo.org">Shyam Mani</mail> ></author> ><author title="PÅekladatel"> > <mail link="finn@sendmail.cz">Jan Nárovec</mail> ></author> > ><abstract> >Tento návod po vysvÄtlenà výhod Unicode, konkrétnÄ kódovánà UTF-8, ukazuje, >jak nastavit a použÃvat znakovou sadu Unicode UTF-8 ve vaÅ¡em Gentoo Linuxu. ></abstract> > ><!-- The content of this document is licensed under the CC-BY-SA license --> ><!-- See http://creativecommons.org/licenses/by-sa/2.5 --> ><license /> > ><version>2.6</version> ><date>2005-06-25</date> > ><chapter> ><title>Kódovánà znaků</title> ><section> ><title>Co je to kódovánà znaků?</title> ><body> > ><p> >PoÄÃtaÄe samy o sobÄ nerozumà textům. Každý znak je reprezentován >ÄÃslem. Každá sada ÄÃsel reprezentujÃcà pÃsmena a znaky (známá jako kódovánà >nebo znaková sada) bývala omezená kvůli limitům v poÄÃtaÄové technice. ></p> > ></body> ></section> ><section> ><title>Historie kódovánà znaků</title> ><body> > ><p> >NejobvyklejÅ¡Ãm (nebo alespoÅ nejuznávanÄjÅ¡Ãm) kódovánÃm je <b>ASCII</b> >(American Standard Code for Information Interchange). Je považováno za >nejúspÄÅ¡nÄjšà softwarový standard vůbec. SouÄasné ASCII bylo standardizováno >v roce 1986 (ANSI X3.4, RFC 20, ISO/IEC 646:1991, EMCA-6) Americkým >ústavem pro národnà standardizaci (American National Standards Institute). ></p> > ><p> >ASCII je výluÄnÄ sedmibitové, což znamená, že použÃvá ÄÃsla >reprezentovatelná sedmi ÄÃslicemi dvojkové soustavy, tedy ÄÃsla >v rozsahu od nuly do 127 v desÃtkové soustavÄ. Ta zahrnujà >dvaatÅicet netisknutelných ÅÃdicÃch kódů, z nichž vÄtÅ¡ina ležà mezi 0 a >31, poslednà ÅÃdicà znak DEL neboli delete ležà na pozici ÄÃslo 127. Znaky >s ÄÃsly 32 až 126 jsou tisknutelné: mezera, interpunkÄnà znaménka, >znaky anglické abecedy a ÄÃsla. ></p> > ><p> >Osmý bit byl v ASCII původnÄ použÃván jako paritnà ke zjišťovánà chyb. >Pokud to nenà potÅeba, je jeho hodnota nulová. To znamená, že v ASCII >je každý znak reprezentován jednÃm bajtem. ></p> > ><p> >AÄkoliv ASCII dostaÄovalo pro komunikaci v modernà angliÄtinÄ, problémy >nastávaly v ostatnÃch evropských jazycÃch, které obsahujà akcentované >znaky. Aby se vyhovÄlo jejich potÅebám, byly vytvoÅeny standardy ISO 8859. >Byly zpÄtnÄ kompatibilnà s ASCII, neponechávaly vÅ¡ak osmý bit prázdný, >ale použÃvaly jej ke zpÅÃstupnÄnà dalÅ¡Ãch 127 znaků v každém kódovánÃ. >Brzy se projevila omezenà standardů ISO 8859, v souÄasnosti existuje >patnáct variant tohoto standardu (8859-1 až 8859-15). Mimo rozsah znaků >kompatibilnÃch s ASCII Äasto nastávajà problémy se znaky, které jsou >reprezentovány týmž ÄÃslem. Aby byla situace jeÅ¡tÄ složitÄjÅ¡Ã, >v nÄkterých verzÃch MS Windows je pro východoevropské jazyky použÃváno >kódovánà Windows-1250. Je podobné ISO 8859-2, pÅesto existujà nÄkteré >odliÅ¡nosti. VÅ¡echny tyto sady jsou zpÄtnÄ kompatibilnà s ASCII. ></p> > ><p> >PotÅeba vytvoÅenà úplnÄ odliÅ¡ného jednobajtového kódovánà pro jazyky >nepoužÃvajÃcà latinku, napÅ. EUC (Extended Unix Coding), které je použÃváno >pro japonÅ¡tinu a korejÅ¡tinu (a omezenÄ i ÄÃnÅ¡tinu), vytvoÅila dalšà zmatky, >protože různé operaÄnà systémy stále použÃvaly odliÅ¡ná kódovánà pro tyto >jazyky, napÅ. Shift-JIS a ISO-2022-JP. Uživatelé, kteÅà si chtÄli >prohlédnout text psaný cyrilicÃ, si museli vybrat mezi KOI-8R pro Rusko a >Bulharsko a KOI-8U pro Ukrajinu, pÅÃp. neúspÄÅ¡ným ISO 8859-5 nebo Äastým >Windows-1251. VÅ¡echna tato kódovánà byla nekompatibilnà s ASCII >(aÄkoliv KOI-8 má znaky ve shodném poÅadà jako latinka, takže pokud je osmý >bit odstranÄn, text je na ASCII terminálu stále dekódovatelný). ></p> > ><p> >To vedlo ke zmatkům a také k témÄÅ nulové možnosti vÃcejazyÄné >komunikace, zvláštÄ mezi jazyky s různými abecedami. VÃtejte ve svÄtÄ >Unicode. ></p> > ></body> ></section> ><section> ><title>Co je Unicode?</title> ><body> > ><p> >Unicode je zbaveno tradiÄnÃho jednobajtového omezenÃ. PoužÃvá 17 "úrovnÃ" >o 65 536 kódech a dokáže tak popsat až 1 114 112 >znaků. Mnozà majà mylnou pÅedstavu, že Unicode je 16bitové kódovánÃ, protože >prvnà úroveÅ, tzv. "Basic Multilingual Plane" (BMP), popisuje témÄÅ vÅ¡e, co >kdy budete potÅebovat. ></p> > ><p> >Unicode je kódováno mnoha způsoby, dva nejÄastÄjšà jsou <b>UTF</b> (Unicode >Transformation Format) a <b>UCS</b> (Universal Character Set). ÄÃslo za >znaky UTF udává poÄet bitů v jednotce, zatÃmco ÄÃslo za znaky UCS udává >poÄet bajtů. NejrozÅ¡ÃÅenÄjÅ¡Ãm způsobem kódovánà textů v Unicode se pro >svou osmibitovou strukturu stalo UTF-8, které je popisováno v tomto >dokumentu. ></p> > ></body> ></section> ><section> ><title>UTF-8</title> ><body> > ><p> >UTF-8 je kódovánà s promÄnnou délkou, což v tomto pÅÃpadÄ znamená, >že symbol je zakódován jednÃm až ÄtyÅmi bajty. Tzn. prvnà bajt UTF-8 je >použit pro kódovánà ASCII, takže znaková sada je zpÄtnÄ kompatibilnà >s ASCII. V UTF-8 jsou kódy znaků anglické abecedy shodné s >odpovÃdajÃcÃmi ASCII kódy, ale jsou o jeden bit delÅ¡Ã. Uživatelé východnÃch >abeced (napÅ. japonÅ¡tiny), které dostaly vyššà rozsahy bajtů, nebudou pÅÃliÅ¡ >Å¡tastnÃ, protože to pro nÄ znamená 50% nadbyteÄnost v jejich datech. ></p> > ></body> ></section> ><section> ><title>ÄÃm pro vás může být UTF-8 užiteÄné</title> ><body> > ><p> >UTF-8 vám umožnà pracovat ve standardizovaném a mezinárodnÄ akceptovaném >vÃcejazyÄném prostÅedÃ, s pomÄrnÄ nÃzkou redundancà dat. UTF-8 je >upÅednostÅovaný způsob pÅenosu jiných než ASCII znaků po internetu, pÅes >email, IRC nebo témÄÅ libovolné jiné médium. PÅesto Åada lidà považuje UTF-8 >v online komunikaci za nesluÅ¡né. PÅed použitÃm <e>ne-ASCII</e> znaků je >vždy dobré znát postoj k UTF-8 v dané poÅ¡tovnà konferenci, IRC >kanálu nebo Usenetové skupinÄ. ></p> > ></body> ></section> ></chapter> > ><chapter> ><title>Nastavenà UTF-8 v Gentoo Linuxu</title> ><section> ><title>Nalezenà nebo vytvoÅenà locales v UTF-8</title> ><body> > ><p> >TeÄ, když rozumÃte základnÃm principům Unicode, jste pÅipraven zaÄÃt >použÃvat ve svém systému UTF-8. ></p> > ><p> >ZákladnÃm pÅedpokladem pro použÃvánà UTF-8 je pÅÃtomnost glibc >s podporou národnÃch jazyků (national language support). DoporuÄeným >způsobem je soubor <path>/etc/locales.build</path> v kombinaci >s USE flagem <c>userlocales</c>. VysvÄtlenà použità tohoto souboru >pÅesahuje rámec tohoto dokumentu, naÅ¡tÄstà vÅ¡ak je tento soubor dobÅe >dokumentován v nÄm obsaženými komentáÅi. Jeho použità je také >vysvÄtleno v <uri >link="/doc/en/guide-localization.xml#doc_chap3_sect3">Gentoo Localisation >Guide</uri>. ></p> > ><p> >Dále musÃme vÄdÄt, jestli je pro náš jazyk UTF-8 lokalizace pÅÃtomna, nebo >zda ji musÃme vytvoÅit. ></p> > ><pre caption="Nalezenà existujÃcÃh UTF-8 lokalizacÃ"> ><comment>(NahraÄte "cs_CZ" pÅÃpadným jiným oznaÄenÃm lokalizace)</comment> ># <i>locale -a | grep 'cs_CZ'</i> >cs_CZ >cs_CZ.UTF-8 ></pre> > ><p> >Z výstupu tohoto pÅÃkazu jsou důležité výsledky s pÅÃponou ><c>.UTF-8</c>. Pokud takový výsledek neexistuje, musÃme vytvoÅit lokalizaci >kompatibilnà s UTF-8. ></p> > ><note> >NásledujÃcà kód spusÅ¥te jen v pÅÃpadÄ, že pro svůj jazyk nemáte UTF-8 >lokalizaci. ></note> > ><pre caption="Tvorba UTF-8 lokalizace"> ><comment>(NahraÄte "cs_CZ pÅÃpadným jiným oznaÄenÃm lokalizace)</comment> ># <i>localedef -i cs_CZ -f UTF-8 cs_CZ.UTF-8</i> ></pre> > ><p> >DalÅ¡Ãm způsobem jak pÅidat UTF-8 lokalizaci je doplnit ji do souboru ><path>/etc/locales.build</path> a pÅekompilovat <c>glibc</c> >s nastaveným USE flagem <c>userlocales</c>. ></p> > ><pre caption="Åádek v /etc/locales.build"> >cs_CZ.UTF-8/UTF-8 ></pre> > ></body> ></section> ><section> ><title>Nastavenà lokalizace</title> ><body> > ><p> >PÅed použitÃm UTF-8 lokalizace musà být nastavena jedna promÄnná prostÅedÃ: ><c>LC_ALL</c> (tato promÄnná pÅepÃÅ¡e nastavenà dané promÄnnou <c>LANG</c>). >Existuje vÃcero způsobů jejÃho nastavenÃ; nÄkomu vyhovuje mÃt UTF-8 >nastaveno pouze pro vybraného uživatele, pak je nastavenà pÅÃtomno >v souboru <path>~/.profile</path> (pokud použÃváte <c>/bin/sh</c>), ><path>~/.bash_profile</path> nebo <path>~/.bashrc</path> (pokud použÃváte ><c>/bin/bash</c>). ></p> > ><p> >Jinà dávajà pÅednost globálnÃmu nastavenà lokalizace. ZvláštnÃm pÅÃpadem, >pro který autor zejména toto nastavenà doporuÄuje, je použÃvánà ><path>/etc/init.d/xdm</path>, protože tento startovacà skript spouÅ¡tà >správce oken dÅÃve, než jsou naÄteny výše zmÃnÄné inicializaÄnà soubory >shellů, tedy i pÅed nastavenÃm vÅ¡ech promÄnných prostÅedÃ. ></p> > ><p> >GlobálnÄ by mÄla být lokalizace nastavena souborem ><path>/etc/env.d/02locale</path>. Tento soubor by mÄl vypadat zhruba jako >ten následujÃcÃ: ></p> > ><pre caption="Ukázkový soubor /etc/env.d/02locale"> ><comment>(Jako vždy si "cs_CZ.UTF-8" upravte podle svého)</comment> >LC_ALL="cs_CZ.UTF-8" ></pre> > ><p> >Dále musà být prostÅedà po zmÄnÄ aktualizováno. ></p> > ><pre caption="Aktualizace prostÅedÃ"> ># <i>env-update</i> >>>> Regenerating /etc/ld.so.cache... > * Caching service dependencies ... ># <i>source /etc/profile</i> ></pre> > ><p> >Nynà spusÅ¥te <c>locale</c> bez argumentů, abyste si ovÄÅili, že máte >v prostÅedà správnÄ nastaveny promÄnné: ></p> > ><pre caption="Kontrola nové lokalizace v prostÅedÃ"> ># <i>locale</i> >LANG= >LC_CTYPE="cs_CZ.UTF-8" >LC_NUMERIC="cs_CZ.UTF-8" >LC_TIME="cs_CZ.UTF-8" >LC_COLLATE="cs_CZ.UTF-8" >LC_MONETARY="cs_CZ.UTF-8" >LC_MESSAGES="cs_CZ.UTF-8" >LC_PAPER="cs_CZ.UTF-8" >LC_NAME="cs_CZ.UTF-8" >LC_ADDRESS="cs_CZ.UTF-8" >LC_TELEPHONE="cs_CZ.UTF-8" >LC_MEASUREMENT="cs_CZ.UTF-8" >LC_IDENTIFICATION="cs_CZ.UTF-8" >LC_ALL=cs_CZ.UTF-8 ></pre> > ><p> >ToÅ¥ vÅ¡e. TeÄ použÃváte UTF-8 lokalizaci a dalšà pÅekážkou je nastavenà bÄžnÄ >použÃvaných aplikacÃ. ></p> > ></body> ></section> ></chapter> > ><chapter> ><title>Podpora v aplikacÃch</title> ><section> ><body> > ><p> >Když Unicode zaÄal ve svÄtÄ softwaru nabÃrat na sÃle, vÃcebajtové znakové >sady nebyly vhodné pro jazyky jako C, v nichž je napsáno mnoho bÄžnÄ >použÃvaných programů. JeÅ¡tÄ dnes nejsou nÄkteré programy správnÄ pracovat >s UTF-8. VÄtÅ¡ina naÅ¡tÄstà ano! ></p> > ></body> ></section> ><section> ><title>Jména souborů, NTFS a FAT</title> ><body> > ><p> >V linuxovém jádÅe je nÄkolik voleb souvisejÃcÃch s NLS, nenechte >se jimi vÅ¡ak zmást. Jedinou vÄcÃ, kterou je tÅeba udÄlat, je pÅidat podporu >pro UTF-8 do vaÅ¡eho jádra a nastavit výchozà NLS na utf-8. ></p> > ><pre caption="Kroky pro nastavenà podpory UTF-8 v jádÅe"> >File Systems --> > Native Language Support --> > (utf8) Default NLS Option > <*> NLS UTF8 > <comment>(Také oznaÄte <*> ostatnà znakové sady, které použÃváte > na vaÅ¡ich FATkách nebo kompaktnÃch discÃch.)</comment> ></pre> > ><p> >Pokud máte v úmyslu pÅipojovat oddÃly s NTFS, můžete se hodit >parametr pÅÃkazu mount <c>nls=</c>. Dalšà informace naleznete >v manuálové stránce (<c>man mount</c>). ></p> > ><p> >Na zmÄnu kódovánà jmen souborů můžete použÃt <c>app-text/convmv</c>. ></p> > ><pre caption="Example usage of convmv"> ># <i>emerge --ask app-text/convmv</i> ># <i>convmv -f souÄasné-kódovánà -t utf-8 název-souboru</i> ></pre> > ><p> >Na zmÄnu kódovánà <e>obsahu</e> souboru, použijte program <c>iconv</c>, >který je souÄástà <c>glibc</c>: ></p> > ><pre caption="Example usage of iconv"> ><comment>(zamÄÅte iso-8859-2 za pÅÃpadné jiné kódovánÃ, z nÄjž bude >text pÅevádÄt)</comment> ><comment>(Zkontrolujte správnost výstupu)</comment> ># <i>iconv -f iso-8859-2 -t utf-8 název-souboru</i> ><comment>(Pro pÅevedenà do jiného kódovánà je tÅeba vytvoÅit nový >soubor)</comment> ># <i>iconv -f iso-8859-2 -t utf-8 název-souboru > název-nového-souboru</i> ></pre> > ><p> >Týž úÄel splnà i <c>app-text/recode</c>. ></p> > ></body> ></section> ><section> ><title>Konzole</title> ><body> > ><impo> >Pro zprovoznÄnà Unicode na konzoli budete potÅebovat >>=sys-apps/baselayout-1.11.9. ></impo> > ><p> >Editacà <path>/etc/rc.conf</path>, konkrétnÄ nastavenÃm ><c>UNICODE="yes"</c>, umožnÃte použÃvánà UTF-8 na konzoli. PÅeÄtÄte si >komentáÅe v tomto souboru — pokud chcete opravdu využÃvat >Unicode, je důležité mÃt pÃsmo, které obsahuje dostateÄný poÄet znaků. ></p> > ><p> >PromÄnná <c>KEYMAP</c>, nastavená v <path>/etc/conf.d/keymaps</path>, >by mÄla mÃt pÅiÅazenu klávesovou mapu podporujÃcà Unicode. ></p> > ><pre caption="Example /etc/conf.d/keymaps snippet"> ><comment>(ZamÄÅte "cz" za vámi použÃvanou mapu)</comment> >KEYMAP="cz" ></pre> > ></body> ></section> ><section> ><title>Ncurses a Slang</title> ><body> > ><note> >Pokud nemáte Slang nainstalován nebo jej nepoužÃváte, ignorujte v této >sekci veÅ¡keré zmÃnky o nÄm. ></note> > ><p> >Je rozumné pÅidat <c>unicode</c> k vaÅ¡im USE flagům >v <path>/etc/make.conf</path> a znovu pÅeložit <c>sys-libs/ncurses</c> >a <c>sys-libs/slang</c>, pokud je tÅeba: ></p> > ><pre caption="Instalace knihoven ncursis a slang"> ><comment>(Pomocà --oneshot zabránÃme pÅidánà tÄchto knihoven do world >souboru.)</comment> ># <i>emerge --oneshot sys-libs/ncurses sys-libs/slang</i> ></pre> > ><p> >Po zmÄnÄ USE flagů je tÅeba také pÅekompilovat balÃÄky, které jsou >s tÄmito knihovnami slinkované. Nástroj, který pro to použÃváme, se >jmenuje <c>revdep-rebuild</c> a je souÄástà balÃÄku <c>gentoolkit</c>. ></p> > ><pre caption="PÅekompilovánà programů slinkovaných s ncurses nebo >slang"> ># <i>revdep-rebuild --soname libncurses.so.5</i> ># <i>revdep-rebuild --soname libslang.so.1</i> ></pre> > ></body> ></section> ><section> ><title>KDE, GNOME a Xfce</title> ><body> > ><p> >VÅ¡echna hlavnà desktopová prostÅedà plnÄ podporujà Unicode a nenà kvůli nim >tÅeba nastavovat nic, než to, co je již v této pÅÃruÄce popsáno — >to dÃky knihovnám, na nichž jsou založena, a které již s UTF-8 >poÄÃtajÃ. Z toho plyne, že i vÅ¡echny aplikace napsané pomocà tÄchto >knihoven by mÄly pracovat s UTF-8 bez problémů. ></p> > ><p> >Výjimky z tohoto pravidla jsou dány knihovnami Xlib a GTK+1. GTK+1 musà >mÃt v souboru ~/.gtkrc nastaveno pÃsmo s kódovánÃm iso-10646-1, >napÅÃklad <c>-misc-fixed-*-*-*-*-*-*-*-*-*-*-iso10646-1</c>. Také aplikacÃm, >které použÃvajà Xlib nebo Xaw, je tÅeba nastavit pÃsmo podporujÃcà Unicode. ></p> > ><note> >Pokud máte ovládacà centrum gnome1, použijte radÄji k výbÄru patÅiÄného >pÃsma jej. ></note> > ><pre caption="PÅÃklad souboru ~/.gtkrc (pro GTK+1) s nastavenÃm pÃsma >kompatibilnÃho s Unicode"> >style "user-font" >{ > fontset="-misc-fixed-*-*-*-*-*-*-*-*-*-*-iso10646-1" >} >widget_class "*" style "user-font" ></pre> > ><p> >Pokud program nabÃzà rozhranà v Qt i GTK+2, bude druhé z nich >pravdÄpodobnÄ dávat lepšà výsledky pÅi použità Unicode pÃsma. ></p> > ></body> ></section> ><section> ><title>X11 a pÃsma</title> ><body> > ><impo> ><c>x11-base/xorg-x11</c> podporuje Unicode lépe než Xfee86 a je <e>silnÄ</e> >doporuÄován. ></impo> > ><p> >PÃsma ve formátu TrueType podporujà Unicode a vÄtÅ¡ina fontů dodávaných >s X.org obsahuje impozantnà poÄet znaků, samozÅejmÄ ale ne každou >literu, která je definována v Unicode. K vytvoÅenà pÃsem (vÄetnÄ >Bitstream Vera) s podporou východoasijských jazyků v X musÃte mÃt >nastaven USE flag <c>cjk</c>. Tento flag využÃvá i spousta dalÅ¡Ãch programů, >může tedy být užiteÄné nastavit jej permanentnÄ. ></p> > ><p> >Také Åada pÃsem obsažených v Portage podporuje Unicode. ></p> > ><pre caption="Nepovinné: doinstalovánà dalÅ¡Ãch pÃsem podporujÃcÃch Unicode"> ># <i>emerge terminus-font intlfonts freefonts cronyx-fonts corefonts</i> ></pre> > ></body> ></section> ><section> ><title>Správci oken a emulátory terminálu</title> ><body> > ><p> >Okennà správci, které nejsou založeny na GTK nebo Qt obecnÄ podporujà >Unicode jen chabÄ, protože Äasto pro pÅistupujà k fontům >prostÅednictvÃm Xft. Pokud váš správce oken nepoužÃvá Xft, můžete použÃt >specifikaci pÃsma, jak je zmÃnÄno v pÅedchozà sekci. ></p> > ><p> >Emuátory terminálu, jež použÃvajà Xft a podporujà Unicode, je tÄžšà nalézt. >KromÄ programů Konsole a gnome-terminal je nejlepšà volbou ><c>x11-terms/rxvt-unicode</c>, <c>xfce-extra/terminal</c>, ><c>gnustep-apps/terminal</c>, <c>x11-terms/mlterm</c>, ><c>x11-terms/mrxvt</c> nebo prostý <c>x11-terms/xterm</c> pÅeložený >s USE flagem <c>unicode</c> a spuÅ¡tÄný pÅÃkazem <c>uxterm</c>. ><c>app-misc/screen</c> podporuje UTF-8 také, pokud je spuÅ¡tÄn pÅÃkazem ><c>screen -u</c> nebo pokud je do <path>~/.screenrc</path> vložen >následujÃcà Åádek. ></p> > ><pre caption="~/.screenrc pro UTF-8"> >defutf8 on ></pre> > ></body> ></section> ><section> ><title>Vim, Emacs, Xemacs a Nano</title> ><body> > ><p> >Vim, Emacs a Xemacs plnÄ podporujà UTF-8 a dokážà též rozpoznat soubory >s textem v kódovánà UTF-8. Ve Vimu zÃskáte bližšà informace pÅÃkazem ><c>:help mbyte.txt</c>. ></p> > ><p> >Editor Nano v souÄasnosti nepodporuje UTF-8, aÄkoliv je to již delšà >dobu v plánu. PÅi troÅ¡e Å¡tÄstà se v budoucnu doÄkáme zmÄny. V dobÄ >psanà tohoto dokumentu je podpora UTF-8 v CVS a mÄla by být souÄástà >dalšà verze. ></p> > ></body> ></section> ><section> ><title>Shelly</title> ><body> > ><p> ><c>Bash</c> v souÄasné dobÄ plnÄ podporuje Unicode prostÅednictvým >knihovny GNU readline. Uživatelé Z shellu jsou v horšà pozici — >žádná jeho Äást nepodporuje Unicode, aÄkoliv je vyvÃjena mimoÅádná snaha >pÅidat podporu pro vÃcebajtové znaky. ></p> > ><p> >C shell, <c>tcsh</c> ani <c>ksh</c> nepodporujà UTF-8 vůbec. ></p> > ></body> ></section> ><section> ><title>Irssi</title> ><body> > ><p> >Irssi od verze 0.8.10 plnÄ podporuje UTF-8, uživatel vÅ¡ak musà nastavit >pÅÃsluÅ¡nou volbu. ></p> > ><pre caption="Povolenà UTF-8 v Irssi"> >/set term_charset UTF-8 ></pre> > ><p> >Na kanálech, na nichž jsou Äasto použÃvány jiné než ASCII znaky v jiném >kódovánà než UTF-8, může být ke konverzi použit pÅÃkaz <c>/recode</c>. VÃce >informacà zÃskáte pÅÃkazem <c>/help recode</c>. ></p> > ></body> ></section> ><section> ><title>Mutt</title> ><body> > ><p> >PoÅ¡tovnà klient Mutt podporuje Unicode velmi dobÅe. Pro nastavenà UTF-8 >v Muttu, vložte následujÃcà Åádky do <path>~/.muttrc</path>: ></p> > ><pre caption="~/.muttrc pro UTF-8"> >set send_charset="utf8" <comment>(odchozà znaková sada)</comment> >set charset="utf8" <comment>(zobrazovaná znaková sada)</comment> ></pre> > ><note> >I nadále se mohou pÅi zobrazovánà dopisů objevovat otaznÃky. To je kvůli >tomu, že nÄkteÅà lidé použÃvajà poÅ¡tovnà klienty, které neoznamujà použité >kódovánÃ. S tÃm nelze mnoho dÄlat, jedinÄ požádat odesilatele, aby si >správnÄ nastavil svůj poÅ¡tovnà program. ></note> > ><p> >Bližšà informace najdete na <uri >link="http://wiki.mutt.org/index.cgi?MuttFaq/Charset">Mutt Wiki</uri>. ></p> > ></body> ></section> ><section> ><title>Less</title> ><body> > ><p> >Na prohlÞenà výstupu programů se Äasto použÃvá <c>more</c> nebo <c>less</c> >spolu s <c>|</c>, napÅÃklad <c>dmesg | less</c>. ZatÃmco pÅÃkaz <c>more</c> >potÅebuje jen shell podporujÃcà UTF-8, <c>less</c> musà mÃt pro správné >zobrazenà Unicode znaků nastavenu promÄnnou prostÅedà <c>LESSCHARSET</c>. To >lze nastavit v <path>/etc/profile</path> nebo ><path>~/.bash_profile</path>. SpusÅ¥te svůj oblÃbený editor a pÅidejte >následujÃcà Åádek do jednoho z výše zmÃnÄných souborů. ></p> > ><pre caption="Nastavenà promÄnné LESSCHARSET pro less"> >LESSCHARSET=utf-8 ></pre> > ></body> ></section> ><section> ><title>Man</title> ><body> > ><p> >Manuálové stránky jsou nedÃlnou souÄástà libovolného linuxového stroje. >NahraÄte nÞe uvedený Åádek souboru <path>/etc/man.conf</path>, abyste >zajistili správné zobrazenà manuálových stránek. ></p> > ><pre caption="Ãprava souboru man.conf pro podporu Unicode"> ><comment>(Původnà Åádek)</comment> >NROFF /usr/bin/nroff -Tascii -c -mandoc ><comment>(NahraÄte tÃmto výše uvedený Åádek)</comment> >NROFF /usr/bin/nroff -mandoc -c ></pre> > ></body> ></section> ><section> ><title>elinks a links</title> ><body> > ><p> >Jde o obecnÄ použÃvané textové webové prohlÞeÄe, takže se podÃvejme, >jak v nich nastavit podporu pro UTF-8. Jsou dva způsoby, jak podporu >nastavit: buÄ prostÅednictvÃm položky Nastavenà (Setup) pÅÃmo >v prohlÞeÄi, nebo upravenÃm konfiguraÄnÃho souboru. V prohlÞeÄi >se stiskem <c>Alt+N</c> (nebo <c>Alt+S</c>, pokud s vámi program >komunikuje anglicky) dostanete do nabÃdky NastavenÃ. V nà vyberte >položku Nastavenà terminálu (Terminal options), popÅ. stisknÄte klávesu ><c>T</c>. V oknÄ zaÅ¡krtnÄte klávesou Enter volbu <c>UTF-8 I/O</c>. Pak >nastavenà uložte a opusÅ¥te menu. V linksu musÃte znovu pÅejÃt do >nabÃdky Nastavenà a nastavenà uložit stiskem klávesy <c>S</c>. KonfiguraÄnà >soubor je uveden nÞe. ></p> > ><pre caption="Povolenà UTF-8 v elinksu/linksu"> ><comment>(Pro nastavenà elinksu upravte /etc/elinks/elinks.conf nebo >~/.elinks/elinks.conf a pÅidejte následujÃcà Åádek)</comment> >set terminal.linux.utf_8_io = 1 > ><comment>(Pro nastavenà linksu upravte ~/.links/links.cfg a pÅidejte >následujÃcà Åádek)</comment> >terminal "xterm" 0 1 0 us-ascii utf-8 ></pre> > ></body> ></section> ><section> ><title>VyzkouÅ¡enÃ</title> ><body> > ><p> >Existuje spousta stránek testujÃcÃch UTF-8. ProhlÞeÄe <c>net-www/w3m</c>, ><c>net-www/links</c>, <c>net-www/elinks</c>, <c>net-www/lynx</c> a vÅ¡echny >prohlÞeÄe založené na Mozille (vÄetnÄ Firefoxu) plnÄ podporujà UTF-8, >stejnÄ jako Konqueror a Opera. ></p> > ><p> >PoužÃváte-li nÄkterý z textových prohlÞeÄů, ovÄÅte si, že opravdu >použÃváte terminál podporujÃcà Unicode. ></p> > ><p> >Pokud jsou nÄkteré znaky zobrazeny jako ÄtvereÄky obsahujÃcà pÃsmena Äi >ÄÃsla, znamená to, že vámi použÃvané pÃsmo neobsahuje pÅÃsluÅ¡nou literu, >která je pro zobrazenà daného UTF-8 znaku potÅeba. NamÃsto toho je zobrazen >ÄtvereÄek s ÄÃslem symbolu v Å¡estnáctkové soustavÄ. ></p> > ><ul> > <li> > <uri > link="http://www.w3.org/2001/06/utf-8-test/UTF-8-demo.html">ZkuÅ¡ebnà > stránka W3C pro UTF-8</uri> > </li> > <li> > <uri > link="http://titus.uni-frankfurt.de/indexe.htm?/unicode/unitest.htm"> > ZkuÅ¡ebnà stránka UTF-8 Frankfurtské univerzity</uri> > </li> ></ul> > ></body> ></section> ><section> ><title>Vstupnà metody</title> ><body> > ><p> >Znaky, které neobsahuje vaÅ¡e klávesnice, v X mohou být zadávány pomocà >tzv. <e>mrtvých kláves</e>. Ty fungujà tak, že nejprve stisknete napÅÃklad >klávesu s háÄkem spolu s modifikátorem Shift >(Shift+ ̌) a následnÄ klávesu se znakem, jemuž háÄek pÅÃslušà >— mrtvá klávesa onen znak modifikuje. ></p> > ><p> >K povolenà mrtvých kláves v X potÅebujete rozloženà klávesnice, které >je podporuje. VÄtÅ¡ina evropských rozloženà standardnÄ mrtvé klávesy obsahuje. >To ale nenà pravda na rozloženà použÃvaném v Severnà Americe. AÄkoliv >existujà nesrovnalosti mezi rozloženÃmi, jako nejjednoduššà ÅeÅ¡enà se jevà >použità napÅ. názvu "en_US" mÃsto "us". Rozloženà se nastavuje >v <path>/etc/X11/xorg.conf</path>: ></p> > ><pre caption="Ãryvek souboru /etc/X11/xorg.conf"> >Section "InputDevice" > Identifier "Keyboard0" > Driver "kbd" > Option "XkbLayout" "en_US" <comment># Lépe než jen "us"</comment> > <comment>(Dalšà nastavenà Xkb mohou následovat)</comment> >EndSection ></pre> > ><note> >PÅedchozà zmÄna musà být provedena pokud použÃváte severoamerické rozloženà >nebo takové rozloženÃ, u nÄjž mrtvé klávesy dÄlajà problémy. EvropÅ¡tà >uživatelé by již mÄli mÃt funkÄnà mrtvé klávesy. ></note> > ><p> >ZmÄny se projevà po novém spuÅ¡tÄnà X serveru. Pro okamžité uplatnÄnà zmÄn >použijte <c>setxkbmap</c>, napÅ. <c>setxkbmap en_US</c> ></p> > ><p> >Nejlepšà je ukázat mrtvé klávesy na pÅÃkladech. AÄkoliv jsou výsledky >závislé na lokálnÃm nastavenÃ, systém zůstává shodný. PÅÃklady obsahujà >UTF-8, takže abyste je mohli shlédnout, musÃte buÄ svému prohlÞeÄi sdÄlit, >že stránka je v kódovánà UTF-8, nebo mÃt již UTF-8 funkÄnÃ. ></p> > ><p> >Pokud stisknu AltGr souÄasnÄ s Shiftem a klávesu 0 (ne na numerické >klávesnici!) a následnÄ stisknu o, bude výsledkem Å. Pokud stisknu AltGr, >Shift spolu s klávesou 0 a následnÄ u, dostanu ű. Stisknu-li AltGr >s Äárkou (´) a posléze o, dostanu Å; AltGr s Äárkou a následné a >dá Ä. ></p> > ><p> >Chceme-li zÃskat Å¡panÄlské ñ, je tÅeba stisknout nejsprve kombinaci >AltGr+Shift+1 a následnÄ klávesu n. Stisknu-li klávesy AltGr, Shift a >klávesu 4 (na hornà ÅadÄ kláves) a pokud následnÄ povolÃm a znovu stisknu ><e>jen</e> ÄtyÅku, dostanu háÄek (Ë). To funguje jen pro akcenty psan= >pomocà mrtvých kláves. ></p> > ><p> >Klávesa AltGr může být použita s alfanumerickými klávesami samostatnÄ. >NapÅÃklad AltGr a L vytvoÅà Å. AltGr a E dá znak evropské mÄny: â¬. ></p> > ></body> ></section> ><section> ><title>Odkazy</title> ><body> > ><ul> > <li> > <uri link="http://cs.wikipedia.org/wiki/Unicode">Stránka Wikipedie > o Unicode</uri> > </li> > <li> > <uri link="http://cs.wikipedia.org/wiki/UTF-8">Stránka Wikipedie > o UTF-8</uri> > </li> > <li><uri link="http://www.unicode.org">Unicode.org</uri></li> > <li><uri link="http://www.utf-8.com">UTF-8.com</uri></li> > <li><uri link="http://www.ietf.org/rfc/rfc3629.txt">RFC 3629</uri></li> > <li><uri link="http://www.ietf.org/rfc/rfc2277.txt">RFC 2277</uri></li> > <li> > <uri > link="http://www.tbray.org/ongoing/When/200x/2003/04/26/UTF">Znaky vs. > bajty</uri> > </li> ></ul> > ></body> ></section> ></chapter> ></guide>
You cannot view the attachment while viewing its details because your browser does not support IFRAMEs.
View the attachment on a separate page
.
View Attachment As Raw
Actions:
View
Attachments on
bug 97524
: 62343