Line 0
Link Here
|
|
|
1 |
<?xml version='1.0' encoding="UTF-8"?> |
2 |
<!-- $Header: /var/www/www.gentoo.org/raw_cvs/gentoo/xml/htdocs/doc/en/utf-8.xml,v 1.45 2006/10/06 18:35:52 nightmorph Exp $ --> |
3 |
<!DOCTYPE guide SYSTEM "/dtd/guide.dtd"> |
4 |
|
5 |
<guide link="/doc/hu/utf-8.xml" lang="hu"> |
6 |
<title>UTF-8 használata Gentoo alatt</title> |
7 |
|
8 |
<author title="Szerző"> |
9 |
<mail link="slarti@gentoo.org">Thomas Martin</mail> |
10 |
</author> |
11 |
<author title="Közreműködő"> |
12 |
<mail link="devil@gentoo.org.ua">Alexander Simonov</mail> |
13 |
</author> |
14 |
<author title="Szerkesztő"> |
15 |
<mail link="fox2mike@gentoo.org">Shyam Mani</mail> |
16 |
</author> |
17 |
<author title="Fordító"> |
18 |
<mail link="mrprise@gmail.com">Lukács Árpád</mail> |
19 |
</author> |
20 |
<author title="Lektor"> |
21 |
<mail link="alephlg@gmail.com" >Lónyai Gergely</mail> |
22 |
</author> |
23 |
|
24 |
<abstract> |
25 |
Ez a leírás a Unicode, pontosabban az UTF-8 előnyeinek bemutatása után |
26 |
ismerteti az UTF-8-as Unicode karakterek használatát Gentoo Linux alatt. |
27 |
</abstract> |
28 |
|
29 |
<!-- The content of this document is licensed under the CC-BY-SA license --> |
30 |
<!-- See http://creativecommons.org/licenses/by-sa/2.5 --> |
31 |
<license /> |
32 |
|
33 |
<version>2.23</version> |
34 |
<date>2006-10-06</date> |
35 |
|
36 |
<chapter> |
37 |
<title>Karakterkódolások</title> |
38 |
<section> |
39 |
<title>Mi az a karakterkódolás?</title> |
40 |
<body> |
41 |
|
42 |
<p> |
43 |
A számítógépek nem értik meg a szöveget önmagukban, inkább számokat használnak |
44 |
a karakterek ábrázolására. Hagyományosan, az összes korábban betűk |
45 |
és karakterek ábrázolására használt számhalmaz (ezeket kódolási rendszernek, |
46 |
kódolásnak vagy karakterkészletnek nevezzük) mérete korlátozva volt a |
47 |
számítógépek hardvere miatt. |
48 |
</p> |
49 |
|
50 |
</body> |
51 |
</section> |
52 |
<section> |
53 |
<title>A karakterkódolások történelme</title> |
54 |
<body> |
55 |
|
56 |
<p> |
57 |
A legelterjedtebb (de legalábbis a legjobban elfogadott) karakterkészlet |
58 |
az <b>ASCII</b> (American Standard Code for Information Interchange). Széles |
59 |
körben azt tartják, hogy az ASCII a legsikeresebb szoftverszabvány. A mai |
60 |
ASCII 1986-ban lett szabványosítva (ANSI X3.4, RFC 20, ISO/IEC 646:1991, |
61 |
ECMA-6) az Amerikai Nemzeti Szabványügyi Hivatal által. |
62 |
</p> |
63 |
|
64 |
<p> |
65 |
Az ASCII szigorúan 7 bites, ami azt jelenti, hogy 7 biten ábrázolható |
66 |
bitsorozatokat használ. Ez 0 és decimális 127 közötti értékek ábrázolását teszi |
67 |
lehetővé. Ebből 32 nem látható vezérlőkarakter, a legtöbbjük 0 és 31 között |
68 |
található, a végjel karakterrel, a DEL vagy törlés a 127-es. 32 és 126 közötti |
69 |
karakterek láthatóak: a szóköz, írásjelek, Latin betűk és számok. |
70 |
</p> |
71 |
|
72 |
<p> |
73 |
A 8. bitet az ASCII-ban eredetileg paritásbitként használták hibaellenőrzéshez. |
74 |
Ha ez nem kívánatos, értéke 0. Ez azt jelenti, hogy az ASCII-val minden |
75 |
karakter egy byte-on ábrázolható. |
76 |
</p> |
77 |
|
78 |
<p> |
79 |
Habár az ASCII elegendő volt az angol nyelven folyó kommunikációhoz, más |
80 |
ékezetes európai nyelveken a dolgok nem voltak ilyen egyszerűek. Ezen próbáltak |
81 |
segíteni az ISO 8859-es szabványok, melyek kompatibilisek maradtak az |
82 |
ASCII-vel, de az üresen hagyott 8. bitet, kódolásonként további 127 karakter |
83 |
ábrázolására használták. Hamarosan kiderültek az ISO8859-es szabványok korlátai |
84 |
is. Jelenleg 15 változata van az ISO 8859-es szabványnak (8859-1-estől a |
85 |
8859-15-ösig ). Az ASCII-kompatilibis byte-tartományukon kívül, gyakran |
86 |
ütköznek a byte-ok által képviselt betűk ezekben a karakterkészletben. A |
87 |
Microsoft Windows némely verziója a Windows-1252-t használta a Nyugat-Európai |
88 |
nyelvekhez, még jobban megnehezítve ezzel a karakterkódolások közötti |
89 |
együttműködést. Ez az ISO 8859-1 kibővítése, de számos dologban eltér attól. |
90 |
Ennek ellenére mindegyik megőrizte az ASCII kompatibilitást. |
91 |
</p> |
92 |
|
93 |
<p> |
94 |
A nem latin ábécék számára szükségszerűen kifejlesztett teljesen eltérő egy |
95 |
byte-os kódolás, mint az EUC (Extended Unix Coding), amelyet a japán és a |
96 |
koreai (ill. kismértékben a kínai) nyelvekhez használtak, tovább fokozták a |
97 |
zűrzavart. Ezalatt egyes operációs rendszerek még mindig eltérő |
98 |
karakterkészletet használtak ugyanahhoz a nyelvhez, például a Shift-JIS és az |
99 |
ISO-2022-JP. Azoknak a felhasználóknak akik cirill írásjeleket szerettek volna |
100 |
megjeleníteni, választaniuk kellett a KOI8-R amely az orosz és a bulgár |
101 |
nyelvekhez ill. a KOI8-U amely az ukránhoz, valamint a sikertelen ISO 8859-5 és |
102 |
a közös Windows-1251 készletek között. Ezek a karakterkészletek már csak |
103 |
nyomokban voltak ASCII kompatibilisek (habár a KOI8 kódolások a cirill |
104 |
karaktereket a latin ábécé sorrendjében tartalmazták, így a 8. bit figyelmen |
105 |
kívül hagyásával a szöveg olvasható volt egy ASCII terminálokon, igaz hogy a |
106 |
kis és a nagybetűk fel voltak cserélve). |
107 |
</p> |
108 |
|
109 |
<p> |
110 |
Mindez zűrzavarhoz vezetett és szinte teljesen ellehetetlenítette a többnyelvű |
111 |
kommunikációt, különösen eltérő ábécével rendelkező nyelvek között. Jöhet a |
112 |
Unicode! |
113 |
</p> |
114 |
|
115 |
</body> |
116 |
</section> |
117 |
<section> |
118 |
<title>Mi az a Unicode?</title> |
119 |
<body> |
120 |
|
121 |
<p> |
122 |
A Unicode szakít a karakterkészletek egy byte-os méretkorlátbeli hagyományával. |
123 |
17 darab "síkot" használ amelyek egyenként 65,536 kódot tartalmaznak a |
124 |
maximálisan elérhető 1,114,112 karakter leírásához. Mivel az első sík, |
125 |
ismertebb nevén "Basic Multilingual Plane" vagy BMP tartalmaz mindent amire |
126 |
valaha szükség lehet, sokan azt a téves következtetést vonták le, hogy a |
127 |
Unicode egy 16 bites karakterkészlet. |
128 |
</p> |
129 |
|
130 |
<p> |
131 |
A Unicode többféle megjelenítési módjai közül a legelterjedtebb az <b>UTF</b> |
132 |
(Unicode Transformation Format) és a <b>UCS</b> (Universal Character |
133 |
Set). A rövidítés utáni szám az UTF esetében bitben, míg az UCS-nék byte-ban |
134 |
adja meg az egység méretét. Az UTF-8-ról szól ez az írás, amely tisztán 8 bites |
135 |
voltának köszönhetően a Unicode-os szövegekkel történő információcsere |
136 |
legelterjedtebb eszközévé vált. |
137 |
</p> |
138 |
|
139 |
</body> |
140 |
</section> |
141 |
<section> |
142 |
<title>Az UTF-8</title> |
143 |
<body> |
144 |
|
145 |
<p> |
146 |
Az UTF-8 egy változó hosszúságú karakterkódolás, amely ebben az esetben azt |
147 |
jelenti, hogy egy-egy szimbólumot 1-4 byte jelöl. Az első UTF-8 byte az ASCII |
148 |
kódolására szolgál, teljesen ASCII kompatibilissé téve a karakterkészletet. Ez |
149 |
azt jelenti, hogy az ASCII és a latin karakterek átalakíthatóak úgy, hogy az |
150 |
adatok mérete csak kis mértékben növekedjen. A keleti ábécék használói számára |
151 |
nem ilyen rózsás a helyzet, mivel az ő karaktereik magasabb tartományba |
152 |
kerültek és ez 50%-os redundanciát eredményez az adataikban. |
153 |
</p> |
154 |
|
155 |
</body> |
156 |
</section> |
157 |
<section> |
158 |
<title>Mire jó az UTF-8?</title> |
159 |
<body> |
160 |
|
161 |
<p> |
162 |
Az UTF-8 segítségével egy a szabványoknak teljesen megfelelő és nemzetközileg |
163 |
elfogadott többnyelvű környezetben dolgozhatsz, viszonylag kevés ismétlődő |
164 |
adattal. Az UTF-8 az ajánlott módja nem ASCII karakterek továbbításának az |
165 |
Interneten, emailben, IRC-n és szinte minden egyéb médián. Ennek ellenére sok |
166 |
ember sértésnek veszi az UTF-8-at az online kommunikációban. A legjobb ha |
167 |
először mindig tájékozódunk az adott csatornán, levelező listán vagy Usenet |
168 |
csoporton arról, hogy hogyan viszonyulnak az UTF-8-hoz, mielőtt |
169 |
<e>nem ASCII</e> UTF-8-at kezdünk el ott használni. |
170 |
</p> |
171 |
|
172 |
</body> |
173 |
</section> |
174 |
</chapter> |
175 |
|
176 |
<chapter> |
177 |
<title>Az UTF-8 beállítása Gentoo Linux alatt</title> |
178 |
<section> |
179 |
<title>Az UTF-8 lokálok megkeresése vagy előállítása</title> |
180 |
<body> |
181 |
|
182 |
<p> |
183 |
Most, hogy megismerted a Unicode mögötti elveket, készen állsz arra, hogy |
184 |
használni kezdjed az UTF-8-at a saját gépeden. |
185 |
</p> |
186 |
|
187 |
<p> |
188 |
Az UTF-8 alapfeltétele, hogy olyan glibc verzió legyen telepítve amely már |
189 |
támogatja a lokalizációt. Ennek beállítása a <path>/etc/locale.gen</path> |
190 |
állományban lehetséges. A fájl használatának részletes ismertetése meghaladná |
191 |
ennek a leírásnak a kereteit. Bővebben a |
192 |
<uri link="/doc/en/guide-localization.xml#doc_chap3_sect3">Gentoo Linux honosítási útmutató</uri>-ban |
193 |
olvashatsz róla. |
194 |
</p> |
195 |
|
196 |
<p> |
197 |
Következő lépésként ki kell derítenünk, hogy létezik-e a nyelvünkhöz UTF-8 |
198 |
lokál vagy készítenünk kell egyet. |
199 |
</p> |
200 |
|
201 |
<pre caption="Létező UTF-8 lokál keresése"> |
202 |
<comment>(A "hu_HU" helyére írd be a kívánt lokál beállításodat)</comment> |
203 |
# <i>locale -a | grep 'hu_HU'</i> |
204 |
hu_HU |
205 |
hu_HU.UTF-8 |
206 |
</pre> |
207 |
|
208 |
<p> |
209 |
A parancs kimenetében az <c>.UTF-8</c>-ra végződő sort kell keresnünk. Ha nem |
210 |
látunk ilyet, akkor készítenünk kell egy UTF-8 kompatilibis lokált. |
211 |
</p> |
212 |
|
213 |
<note> |
214 |
A következő parancsokat csak abban az esetben hajtsd végre, ha nincs még |
215 |
beállítva a nyelvedhez UTF-8 lokál. |
216 |
</note> |
217 |
|
218 |
<pre caption="UTF-8 lokál készítése"> |
219 |
<comment>(A "hu_HU"-t cseréld ki a kívánt lokálra)</comment> |
220 |
# <i>localedef -i hu_HU -f UTF-8 hu_HU.UTF-8</i> |
221 |
</pre> |
222 |
|
223 |
<p> |
224 |
A lokál hozzáadásának másik módja az, ha beleírjuk a |
225 |
<path>/etc/locale.gen</path> file-ba és kiadjuk a <c>locale-gen</c> parancsot, |
226 |
amely előállítja a szükséges lokálokat. |
227 |
</p> |
228 |
|
229 |
<pre caption="A szükséges sor a /etc/locale.gen állományban"> |
230 |
hu_HU.UTF-8 UTF-8 |
231 |
</pre> |
232 |
|
233 |
</body> |
234 |
</section> |
235 |
<section> |
236 |
<title>A lokál beállítása</title> |
237 |
<body> |
238 |
|
239 |
<p> |
240 |
Az új UTF-8 lokál használatához be kell állítani a <c>LANG</c> környezeti |
241 |
változót, (ez felülbírálható az <c>LC_ALL</c> beállításával is). A változó |
242 |
beállítására több lehetőség is van. Néhányan inkább csak egy felhasználó |
243 |
számára szeretnének beállítani UTF-8 környezetet, ebben az esetben a |
244 |
<path>~/.profile</path> (ha <c>/bin/sh</c>-t használsz), |
245 |
<path>~/.bash_profile</path> vagy <path>~/.bashrc</path> (ha <c>/bin/bash</c>-t |
246 |
használsz) állományokban kell a beállítást elvégezni. |
247 |
</p> |
248 |
|
249 |
<p> |
250 |
Mások inkább globálisan állítják be a lokált. Ezt a szerző abban a speciális |
251 |
esetben amikor az <path>/etc/init.d/xdm</path>-et használjuk különösen |
252 |
javasolja, mivel ez az initszkript a fent említett shellek beállításainak a |
253 |
feldolgozása előtt indítja el az ablakkezelőt, még mielőtt bármelyik környezeti |
254 |
változó értéket kapna. |
255 |
</p> |
256 |
|
257 |
<p> |
258 |
A lokál globális beállítása az <path>/etc/env.d/02locale</path> állományban |
259 |
tehető meg. A tartalma ilyesmi: |
260 |
</p> |
261 |
|
262 |
<pre caption="Az /etc/env.d/02locale"> |
263 |
<comment>(Mint mindig, a "hu_HU.UTF-8" helyett a saját lokálodat kell írnod) |
264 |
</comment> |
265 |
LANG="hu_HU.UTF-8" |
266 |
</pre> |
267 |
|
268 |
<note> |
269 |
<c>LANG</c> helyett <c>LC_ALL</c>-t is írhatsz, amellyel a lokálod minden |
270 |
kategóriára érvényes lesz, beleértve a számok és a pénzek megjelenítését is. |
271 |
Néhány ritka esetben azonban ez gondokat okozhat. Azonban a legtöbb |
272 |
felhasználó nem fog problémába ütközni az <c>LC_ALL</c> használatakor. |
273 |
Arról, hogy az <c>LC_ALL</c> beállításai milyen kategóriákra vannak hatással, |
274 |
részletesen olvashatsz a |
275 |
<uri link="http://www.gnu.org/software/libc/manual/html_node/Locale-Categories.html#Locale-Categories">GNU lokál oldalon</uri>. |
276 |
</note> |
277 |
|
278 |
<p> |
279 |
Következő lépésként érvénybe kell léptetni a környezeti változók értékének a |
280 |
változtatását. |
281 |
</p> |
282 |
|
283 |
<pre caption="A környezet frissítése"> |
284 |
# <i>env-update</i> |
285 |
>>> Regenerating /etc/ld.so.cache... |
286 |
* Caching service dependencies ... |
287 |
# <i>source /etc/profile</i> |
288 |
</pre> |
289 |
|
290 |
<p> |
291 |
A paraméter nélküli <c>locale</c> paranccsal ellenőrizheted a környezeti |
292 |
változók értékének helyességét: |
293 |
</p> |
294 |
|
295 |
<pre caption="Az új lokál ellenőrzése"> |
296 |
# <i>locale</i> |
297 |
LANG= |
298 |
LC_CTYPE="hu_HU.UTF-8" |
299 |
LC_NUMERIC="hu_HU.UTF-8" |
300 |
LC_TIME="hu_HU.UTF-8" |
301 |
LC_COLLATE="hu_HU.UTF-8" |
302 |
LC_MONETARY="hu_HU.UTF-8" |
303 |
LC_MESSAGES="hu_HU.UTF-8" |
304 |
LC_PAPER="hu_HU.UTF-8" |
305 |
LC_NAME="hu_HU.UTF-8" |
306 |
LC_ADDRESS="hu_HU.UTF-8" |
307 |
LC_TELEPHONE="hu_HU.UTF-8" |
308 |
LC_MEASUREMENT="hu_HU.UTF-8" |
309 |
LC_IDENTIFICATION="hu_HU.UTF-8" |
310 |
LC_ALL=hu_HU.UTF-8 |
311 |
</pre> |
312 |
|
313 |
<p> |
314 |
Ez minden. Most már UTF-8 lokálokat használsz. A következő akadály azoknak a |
315 |
programoknak a beállítása amelyeket naponta használsz. |
316 |
</p> |
317 |
|
318 |
</body> |
319 |
</section> |
320 |
</chapter> |
321 |
|
322 |
<chapter> |
323 |
<title>Alkalmazások támogatása</title> |
324 |
<section> |
325 |
<body> |
326 |
|
327 |
<p> |
328 |
Amikor a Unicode először a szoftvervilág figyelmébe került, a több-byte-os |
329 |
karakterkészletek még nem nagyon voltak alkalmasak a programnyelvek pl. a C |
330 |
számára, amelyekben a leggyakrabban használt programok készültek. Még most |
331 |
is vannak olyan programok amelyek nem kezelik rendesen az UTF-8-at. |
332 |
Szerencsére a legtöbb program már igen! |
333 |
</p> |
334 |
|
335 |
</body> |
336 |
</section> |
337 |
<section> |
338 |
<title>Fájlnevek, NTFS és FAT</title> |
339 |
<body> |
340 |
|
341 |
<p> |
342 |
Fontos, hogy ne vesszünk el a Linux kernel beállításaiban található NLS opciók |
343 |
között! Többnyire elég az UTF-8 NLS támogatást a kernelbe fordítani és |
344 |
átállítani az alapértelmezett NLS opciót utf8-ra. |
345 |
</p> |
346 |
|
347 |
<pre caption="A kernel beállítása UTF-8-as NLS-re"> |
348 |
File Systems --> |
349 |
Native Language Support --> |
350 |
(utf8) Default NLS Option |
351 |
<*> NLS UTF8 |
352 |
<comment>(Jelöld be <*> a többi karakterkészletet is amelyeket a |
353 |
FAT fájlrendszereden vagy Joilet CD-ROM-jaidon használsz.)</comment> |
354 |
</pre> |
355 |
|
356 |
<p> |
357 |
Amennyiben NTFS particiókat is szeretnél majd csatolni a rendszerhez, |
358 |
a mount parancsnak az <c>nls=</c> opciót is meg kell majd adnod. FAT particiók |
359 |
esetében pedig a <c>codepage=</c> opciót. Ha akarod, a kernelben beállíthatsz |
360 |
egy alapértelmezett kódlapot a FAT számára. Ne feledd, hogy a mountnál |
361 |
megadott <c>codepage</c> opció felülbírálja a kernelben beállítottat! |
362 |
</p> |
363 |
|
364 |
<pre caption="A FAT beállítása a kernelben"> |
365 |
File Systems --> |
366 |
DOS/FAT/NT Filesystems --> |
367 |
(437) Default codepage for fat |
368 |
</pre> |
369 |
|
370 |
<p> |
371 |
Nem tanácsos a <c>Default iocharset for fat</c> értékét UTF-8-ra állítani. |
372 |
Helyette inkább az utf8=true opciót add meg amikor a FAT partíciókat a |
373 |
rendszerbe csatolod. További információkért add ki a <c>man mount</c> parancsot |
374 |
vagy fordulj a kernel leírásához a |
375 |
<path>/usr/src/linux/Documentation/filesystems/vfat.txt</path> szöveges |
376 |
állományban. |
377 |
</p> |
378 |
|
379 |
<p> |
380 |
A fájlnevek kódolásának megváltoztatásához a <c>app-text/convmv</c> használható. |
381 |
</p> |
382 |
|
383 |
<pre caption="Példa a convmv használatára"> |
384 |
# <i>emerge --ask app-text/convmv</i> |
385 |
<comment>(A parancs alakja)</comment> |
386 |
# <i>convmv -f <current-encoding> -t utf-8 <filename></i> |
387 |
<comment>(Az iso-8859-2 helyére azt a karakterkészletet kell írnod amelyről |
388 |
konvertálsz)</comment> |
389 |
# <i>convmv -f iso-8859-2 -t utf-8 fájlnév</i> |
390 |
</pre> |
391 |
|
392 |
<p> |
393 |
A fájlok <e>tartalmának</e> átkódolására az <c>iconv</c> segédprogram szolgál, |
394 |
amely a <c>glibc</c> része: |
395 |
</p> |
396 |
|
397 |
<pre caption="Példa az iconv használata"> |
398 |
<comment>(Az iso-8859-2 helyére azt a karakterkészletet kell írnod amelyről konvertálsz)</comment> |
399 |
<comment>(Az eredmény ellenőrzése)</comment> |
400 |
# <i>iconv -f iso-8859-2 -t utf-8 fájlnév</i> |
401 |
<comment>(A konvertáláshoz a kimenetet át kell irányítani egy új állományba)</comment> |
402 |
# <i>iconv -f iso-8859-2 -t utf-8 fájlnév > újfájl</i> |
403 |
</pre> |
404 |
|
405 |
<p> |
406 |
A <c>app-text/recode</c> szintét használható ilyen céllal. |
407 |
</p> |
408 |
|
409 |
</body> |
410 |
</section> |
411 |
<section> |
412 |
<title>A konzol</title> |
413 |
<body> |
414 |
|
415 |
<impo> |
416 |
Ahhoz, hogy Unicode-ot tudj használni a konzolon, a |
417 |
>=sys-apps/baselayout-1.11.9-ra van szükséged. |
418 |
</impo> |
419 |
|
420 |
<p> |
421 |
Az UTF-8 engedélyezéséhez az <path>/etc/rc.conf</path> állományba a |
422 |
<c>UNICODE="yes"</c> sort kell írnod. Olvasd el a megjegyzéseket is ebben a |
423 |
fájlban -- ahhoz, hogy a legtöbbet tudd kihozni a Unicode-ból, fontos, hogy |
424 |
olyan betűtípust használj amely a lehető legtöbb karaktert tartalmazza. |
425 |
</p> |
426 |
|
427 |
<p> |
428 |
A <path>/etc/conf.d/keymaps</path> állományban beállított <c>KEYMAP</c> |
429 |
változónak egy Unicode billentyűzet kiosztást kell tartalmaznia. |
430 |
</p> |
431 |
|
432 |
<pre caption="Példa /etc/conf.d/keymaps részlet"> |
433 |
<comment>(A "hu" helyett a saját helyi kiosztásodat írd)</comment> |
434 |
KEYMAP="hu" |
435 |
</pre> |
436 |
|
437 |
</body> |
438 |
</section> |
439 |
<section> |
440 |
<title>Ncurses és Slang</title> |
441 |
<body> |
442 |
|
443 |
<note> |
444 |
Ha nincs telepítve a gépeden a Slang vagy nem használod, hagyd |
445 |
figyelmen kívül a Slang-ról szóló részeket a következő fejezetben. |
446 |
</note> |
447 |
|
448 |
<p> |
449 |
Bölcs dolog ha hozzáadod a <c>unicode</c>-ot a globális USE flagekhez a |
450 |
<path>/etc/make.conf</path> állományban, aztán újraemerge-elned a |
451 |
<c>sys-libs/ncurses</c>-t és a <c>sys-libs/slang</c>-ot. A portage |
452 |
automatikusan elvégzi ezt amikor a rendszeredet frissíted: |
453 |
</p> |
454 |
|
455 |
<pre caption="A rendszer frissítése"> |
456 |
# <i>emerge --update --deep --newuse world</i> |
457 |
</pre> |
458 |
|
459 |
<p> |
460 |
Miután a USE flagben történt változtatásunk életbe lépett, újra kell |
461 |
fordítani azokat a csomagot amelyek használják a fenti két lib valamelyikét. |
462 |
Az erre szolgáló segédprogram (<c>revdep-rebuild</c>) a <c>gentoolkit</c> |
463 |
csomag része. |
464 |
</p> |
465 |
|
466 |
<pre caption="Ncurses-t vagy slang-ot használó programok újrafordítása"> |
467 |
# <i>revdep-rebuild --soname libncurses.so.5</i> |
468 |
# <i>revdep-rebuild --soname libslang.so.1</i> |
469 |
</pre> |
470 |
|
471 |
</body> |
472 |
</section> |
473 |
<section> |
474 |
<title>KDE, GNOME és Xfce</title> |
475 |
<body> |
476 |
|
477 |
<p> |
478 |
A főbb asztali környezetek teljes mértékben támogatják a Unicode-ot és |
479 |
csak annyi beállítást igényelnek amit ebben a leírásban találsz. Ez annak |
480 |
köszönhető, hogy azok a grafikus eszközök (a Qt és GTK+2) amelyekre ezek |
481 |
épülnek, már ismerik az UTF-8-at. Következésképpen, azok az alkalmazások |
482 |
amelyek ezeket használják alapból kezelik az UTF-8-at. |
483 |
</p> |
484 |
|
485 |
<p> |
486 |
Az Xlib és a GTK+1 kivétel a fenti szabály alól. A GTK+1-nek be kell |
487 |
állítanunk egy iso-10646-1 FontSpec-et a ~/.gtkrc állományban, például a |
488 |
<c>-misc-fixed-*-*-*-*-*-*-*-*-*-*-iso10646-1</c>. Továbbá azoknak az |
489 |
alkalmazásoknak is hasonló FontSpec-et kell beállítanod amelyek az Xlib-et |
490 |
vagy az Xaw-ot használják, különben nem fognak működni. |
491 |
</p> |
492 |
|
493 |
<note> |
494 |
Ha rendelkezel valamelyik gnome1 vezérlőközponttal, inkább azt használd a |
495 |
beállításhoz. Válaszd ki valamelyik iso10646-1-es betűtípust benne. |
496 |
</note> |
497 |
|
498 |
<pre caption="Példa ~/.gtkrc (GTK+1-heu) állomány, amely egy Unicode kompatilibis betűtípust ad meg"> |
499 |
style "user-font" |
500 |
{ |
501 |
fontset="-misc-fixed-*-*-*-*-*-*-*-*-*-*-iso10646-1" |
502 |
} |
503 |
widget_class "*" style "user-font" |
504 |
</pre> |
505 |
|
506 |
<p> |
507 |
Ha egy alkalmazás egyaránt támogatja a Qt-t és a GTK+2 GUI-t, a GTK+2 GUI |
508 |
általában jobb eredményt nyújt a Unicode-dal. |
509 |
</p> |
510 |
|
511 |
</body> |
512 |
</section> |
513 |
<section> |
514 |
<title>Betűtípusok X11 alatt</title> |
515 |
<body> |
516 |
|
517 |
<impo> |
518 |
Az <c>x11-base/xorg-x11</c> messze jobban támogatja a Unicode mint az XFree86, |
519 |
ezért ennek használata <e>erősen</e> ajánlott. |
520 |
</impo> |
521 |
|
522 |
<p> |
523 |
A TrueType betűtípusok támogatják a Unicode-ot és a legtöbb Xorg-ban található |
524 |
betűtípus lenyűgöző karaktertámogatással rendelkezik, habár, szemlátomást, nem |
525 |
minden a Unicode-ban elérhető karakterhez van megjeleníthető betű. Ahhoz, hogy |
526 |
kelet ázsiai betűtípusokat tudj használni az X-szel (beleértve a Bitsream Vera |
527 |
típust is), győződj meg arról, hogy a <c>cjk</c> USE flag be van állítva. Sok |
528 |
más programra is hatással van ez a flag, ezért érdemes tartósan beálítani. |
529 |
</p> |
530 |
|
531 |
<p> |
532 |
Továbbá a Portage-ben található jó néhány betűtípus csomag is támogatja a |
533 |
Unicode-ot. |
534 |
</p> |
535 |
|
536 |
<pre caption="Nem kötelező: További Unicode betűtípusok telepítése"> |
537 |
# <i>emerge terminus-font intlfonts freefonts cronyx-fonts corefonts</i> |
538 |
</pre> |
539 |
|
540 |
</body> |
541 |
</section> |
542 |
<section> |
543 |
<title>Ablakkezelők és terminál emulátorok</title> |
544 |
<body> |
545 |
|
546 |
<p> |
547 |
A nem GTK és Qt alapú ablakkezelők általában elég jó Unicode támogatással |
548 |
rendelkeznek, mivel gyakran az Xft programkönyvtárat használják a betűtípusok |
549 |
kezelésére. Ha az ablakkezelőd nem az Xft-t használja, még mindig beállíthatod |
550 |
az előző részben taglalt FontSpec-et Unicode-ra. |
551 |
</p> |
552 |
|
553 |
<p> |
554 |
Nagyon ritka az olyan terminál emulátor amely Xft-t használ és támogatja a |
555 |
Unicode-ot. A Konsole és a gnome-terminal mellett a legjobb választás a |
556 |
Portage-ben a <c>x11-terms/rxvt-unicode</c>, <c>xfce-extra/terminal</c>, |
557 |
<c>gnustep-apps/terminal</c>, <c>x11-terms/mlterm</c> vagy a sima |
558 |
<c>x11-terms/xterm</c> amennyiben a <c>unicode</c> USE flag-gel lett telepítve |
559 |
és <c>uxterm</c> névvel lett indítva. A <c>app-misc/screen</c> szintén |
560 |
támogatja az UTF-8-at, ha a <c>screen -U</c> formában indítod vagy ha a |
561 |
következőt beírod a <path>~/.screenrc</path> fájlba: |
562 |
</p> |
563 |
|
564 |
<pre caption="~/.screenrc UTF-8-hoz"> |
565 |
defutf8 on |
566 |
</pre> |
567 |
|
568 |
</body> |
569 |
</section> |
570 |
<section> |
571 |
<title>Vim, Emacs, Xemacs és Nano</title> |
572 |
<body> |
573 |
|
574 |
<p> |
575 |
A Vim teljes mértékben támogatja az UTF-8-at és felismeri az UTF-8 állományokat. |
576 |
További információkért add ki a <c>:help mbyte.txt</c> parancsot a vim-ben. |
577 |
</p> |
578 |
|
579 |
<p> |
580 |
Az Emacs 22.x és e feletti verziók szintén teljesen támogatják az UTF-8-at. |
581 |
Xemacs 22.x nem támogatja a karakterek kombinálását még. |
582 |
</p> |
583 |
|
584 |
<p> |
585 |
Az Emacs és/vagy az Xemacs alacsonyabb verzió számára lehetséges, hogy |
586 |
telepítened kell a <c>app-emacs/mule-ucs</c> és/vagy a |
587 |
<c>app-xemacs/mule-ucs</c> csomagokat és hozzá kell adnod a következő sorokat a |
588 |
<path>~/.emacs</path>, hogy a CJK nyelvek számára is elérhető legyen az UTF-8: |
589 |
</p> |
590 |
|
591 |
<pre caption="Emacs CJK UTF-8 támogatás"> |
592 |
(require 'un-define) |
593 |
(require 'jisx0213) |
594 |
(set-language-environment "Japanese") |
595 |
(set-default-coding-systems 'utf-8) |
596 |
(set-terminal-coding-system 'utf-8) |
597 |
</pre> |
598 |
|
599 |
<p> |
600 |
A Nano az 1.3.6-os verzió óta támogatja az UTF-8-at. |
601 |
</p> |
602 |
|
603 |
</body> |
604 |
</section> |
605 |
<section> |
606 |
<title>Parancssorok</title> |
607 |
<body> |
608 |
|
609 |
<p> |
610 |
Jelenleg csak a <c>bash</c> támogatja teljes körűen a Unicode-ot a GNU readline |
611 |
programkönyvtáron keresztül. A Z Shell használói némileg rosszabb helyzetben |
612 |
vannak -- részben sem támogatja a Unicode-ot, habár jelenleg is összefogott |
613 |
erőfeszítések folynak a több-byte-os karakterkészletek támogatásáért. |
614 |
</p> |
615 |
|
616 |
<p> |
617 |
A C shell, a <c>tcsh</c> és a <c>ksh</c> egyáltalán nem támogatja az UTF-8. |
618 |
</p> |
619 |
|
620 |
</body> |
621 |
</section> |
622 |
<section> |
623 |
<title>Irssi</title> |
624 |
<body> |
625 |
|
626 |
<p> |
627 |
Az Irssi teljesen támogatja az UTF-8-at, habár a felhasználónak kell ezt |
628 |
beállítania. |
629 |
</p> |
630 |
|
631 |
<pre caption="UTF-8 támogatás bekapcsolása az Irssi-ben"> |
632 |
/set term_charset UTF-8 |
633 |
</pre> |
634 |
|
635 |
<p> |
636 |
Azokon a csatornákon amelyeken gyakran keverednek nem ASCII karakterek nem |
637 |
UTF-8-as karakterekkel, a <c>/recode</c> parancs használható a konvertálásra. A |
638 |
<c>/help recode</c> parancs további információkat nyújt. |
639 |
</p> |
640 |
|
641 |
</body> |
642 |
</section> |
643 |
<section> |
644 |
<title>Mutt</title> |
645 |
<body> |
646 |
|
647 |
<p> |
648 |
A Mutt levelező nagyon jó Unicode támogatással rendelkezik. Ahhoz, hogy ezt |
649 |
használhasd nem kell semmit sem a konfigurációs állományokba írnod. A Mutt |
650 |
bármilyen módosítás nélkül Unicode felületet biztosít, ha az összes |
651 |
konfigurációs állományod UTF-8-as (az ehhez szükséges sorokat tartalmazzák a |
652 |
fájlok). |
653 |
</p> |
654 |
|
655 |
<note> |
656 |
Ennek ellenére a Mutt-tal olvasott leveleidben láthatsz '?' karaktereket. Ennek |
657 |
az az oka, hogy az emberek olyan levelező programot használnak amely nem közli |
658 |
a használt karakterkészletet. Ez ellen mást nem tudsz tenni, mint hogy megkéred |
659 |
őket, hogy állítsák be rendesen a levelezőjüket |
660 |
</note> |
661 |
|
662 |
<p> |
663 |
További információkat a |
664 |
<uri link="http://wiki.mutt.org/index.cgi?MuttFaq/Charset">Mutt Wiki</uri>-ben |
665 |
találhatsz. |
666 |
</p> |
667 |
|
668 |
</body> |
669 |
</section> |
670 |
<section> |
671 |
<title>Man</title> |
672 |
<body> |
673 |
|
674 |
<p> |
675 |
A Man minden Linux szerves részét képezi. Ahhoz, hogy a man-ban előforduló |
676 |
Unicode helyesen jelenjen meg, a <path>/etc/man.conf</path> állományt szerkeszd |
677 |
át a következő módon: |
678 |
</p> |
679 |
|
680 |
<pre caption="A man.conf módosítása a Unicode támogatásért"> |
681 |
<comment>(Ez az eredeti sor)</comment> |
682 |
NROFF /usr/bin/nroff -Tascii -c -mandoc |
683 |
<comment>(A fenti sort módosítsd erre)</comment> |
684 |
NROFF /usr/bin/nroff -mandoc -c |
685 |
</pre> |
686 |
|
687 |
</body> |
688 |
</section> |
689 |
<section> |
690 |
<title>Elinks és links</title> |
691 |
<body> |
692 |
|
693 |
<p> |
694 |
Lássuk, hogyan tudjuk rávenni ezeket a közkedvelt szöveges alapú böngészőket az |
695 |
UTF-8 támogatására! Erre két lehetőségünk is van az <c>elinks</c> és a |
696 |
<c>links</c> esetében. Egyrészt, elvégezhetjük a böngészőn belül a Setup |
697 |
menüben ill. át kézzel is módosíthatjuk a konfigurációs fájlt. Ahhoz, hogy a |
698 |
menüből tudjuk ezt beállítani, először meg kell nyitnunk egy weboldalt a |
699 |
<c>elinks</c>-ben vagy a <c>links</c>-ben, aztán az <c>Alt+S</c> |
700 |
gyorsbillentyűvel tudunk belépni a Setup menübe. Ott a Terminal options-t kell |
701 |
kiválasztani vagy megnyomni a <c>T</c> billentyűt. Válaszd ki a lista legutolsó |
702 |
opcióját, az <c>UTF-8 I/O</c>-t és nyomd meg az Enter billentyűt. A Save-vel |
703 |
tudod elmenteni a beállításokat és kilépni a menüből. A <c>links</c> esetében |
704 |
újra meg kell nyomnod az <c>Alt+S</c> billentyűkombinációt, utána pedig az |
705 |
<c>S</c> billentyűt a mentéshez. A konfigurációs fájl beállítása lentebb |
706 |
látható. |
707 |
</p> |
708 |
|
709 |
<pre caption="UTF-8 engedélyezése elinks/links böngészőkben"> |
710 |
<comment>(Az elinks-hez az /etc/elinks/elinks.conf vagy az ~/.elinks/ |
711 |
elinks.conf állományba kell a következő sort beleírnod)</comment> |
712 |
set terminal.linux.utf_8_io = 1 |
713 |
|
714 |
<comment>(A links-hez a ~/.links/links.cfg állományba kell az alábbi sort írnod)</comment> |
715 |
terminal "xterm" 0 1 0 us-ascii utf-8 |
716 |
</pre> |
717 |
|
718 |
</body> |
719 |
</section> |
720 |
<section> |
721 |
<title>Samba</title> |
722 |
<body> |
723 |
|
724 |
<p> |
725 |
A Samba programcsomag az SMB (Server Message Block) protokol implementációja |
726 |
UNIX rendszerekre, mint amilyen a Mac, a Linux vagy a FreeBSD. A protokolt |
727 |
gyakran Általános Internetes Fájlrendszerként (Common Internet File System, |
728 |
CIFS) is emlegetik. A Samba a NetBIOS rendszert is tartalamazza amely |
729 |
windows-os hálózatokon történő állománymegosztásra szolgál. |
730 |
</p> |
731 |
|
732 |
<pre caption="Az UTF-8 engedélyezése a Samba-ban"> |
733 |
<comment>(A következő sort add hozzá az /etc/samba/smb.conf konfigurációs |
734 |
állomány [global] részéhez)</comment> |
735 |
dos charset = 1255 |
736 |
unix charset = UTF-8 |
737 |
display charset = UTF-8 |
738 |
</pre> |
739 |
|
740 |
</body> |
741 |
</section> |
742 |
<section> |
743 |
<title>Az egész kipróbálása</title> |
744 |
<body> |
745 |
|
746 |
<p> |
747 |
Számos UTF-8 tesztoldalt találhatsz a neten. A <c>net-www/w3m</c>, a |
748 |
<c>net-www/links</c>, az <c>net-www/elinks</c>, a <c>net-www/lynx</c> és az |
749 |
összes Mozilla alapú böngésző (beleértve a Firefox-ot is) támogatja az UTF-8- |
750 |
at. A Konqueror és az Opera szintén teljes mértékben támogatja az UTF-8-at. |
751 |
</p> |
752 |
|
753 |
<p> |
754 |
Szöveges alapú böngészők használatakor legyél teljesen biztos abban, hogy |
755 |
Unicode-ot támogató terminált használsz. |
756 |
</p> |
757 |
|
758 |
<p> |
759 |
Ha bizonyos karakterek helyett kis négyzeteket látsz betűkkel vagy számokkal a |
760 |
belsejükben, az azt jelenti, hogy a beállított betűtípusod nem tartalmazza |
761 |
annak a szimbólumnak vagy jelnek a karakterét amelyet az UTF-8 megkíván. |
762 |
</p> |
763 |
|
764 |
<ul> |
765 |
<li> |
766 |
<uri link="http://www.w3.org/2001/06/utf-8-test/UTF-8-demo.html">A W3C |
767 |
UTF-8 tesztoldala</uri> |
768 |
</li> |
769 |
<li> |
770 |
<uri link="http://titus.uni-frankfurt.de/indexe.htm?/unicode/unitest.htm"> |
771 |
A Frankfurti Egyetem UTF-8-as tesztoldala</uri> |
772 |
</li> |
773 |
</ul> |
774 |
|
775 |
</body> |
776 |
</section> |
777 |
<section> |
778 |
<title>Beviteli módok</title> |
779 |
<body> |
780 |
|
781 |
<p> |
782 |
A <e>Dead keys</e> (Halott billentyűk) használható olyan karakterek bevitelére |
783 |
X alatt amelyek nem találhatóak meg a billentyűzeteden. Ezeket úgy tudod |
784 |
elérni, hogy megnyomod a jobb oldali Alt billentyűt (néhány országban ez az |
785 |
AltGr) és egyet az Entertől balra található nem betűt jelentő billentyűk közül |
786 |
valamelyiket, majd miután egyszerre felengedted őket megnyomsz egy betűt. A |
787 |
dead key módosítani fogja ezt. A bevitel tovább módosítható a Shift |
788 |
billentyűvel ha az AltGr és a módosító billentyűvel egy időben nyomod meg. |
789 |
</p> |
790 |
|
791 |
<p> |
792 |
A dead keyek használatához egy olyan layout-ra van szükséged amely támogatja |
793 |
azt. A legtöbb európai layout-ban már megtalálható a dead keys alapértelmezett |
794 |
változata. Azonban az Észak-Amerikai layoutokra. Habár van némi |
795 |
következetlenség a layoutok között, mégis az tűnik a legjobb megoldásnak ha |
796 |
például "en_US" formában használod az "us" helyett. A layoutot az |
797 |
<path>/etc/X11/xorg.conf</path> állományban lehet beállítani, ehhez hasonlóan: |
798 |
</p> |
799 |
|
800 |
<pre caption="/etc/X11/xorg.conf snippet"> |
801 |
Section "InputDevice" |
802 |
Identifier "Keyboard0" |
803 |
Driver "kbd" |
804 |
Option "XkbLayout" "en_US" <comment># Inkább így mint csak "us"</comment> |
805 |
<comment>(ide jöhet a többi Xkb opció)</comment> |
806 |
EndSection |
807 |
</pre> |
808 |
|
809 |
<note> |
810 |
A fenti módosítást csak akkor kell elvégezned, ha Észak-Amerikai vagy olyan |
811 |
egyéb layout-ot használsz amelyben nem működnek a dead keyek. Európai |
812 |
felhasználóknak működniük kell e nélkül is. |
813 |
</note> |
814 |
|
815 |
<p> |
816 |
Ez a változtatás az X szerver újraindítása után fog életbe lépni. A |
817 |
változtatások azonnali érvényesítéséhez a <c>setxkbmap</c> segédprogramot |
818 |
használhatod, pl. <c>setxkbmap en_US</c>. |
819 |
</p> |
820 |
|
821 |
<p> |
822 |
A dead keyeket a legkönnyebben talán példákon keresztül lehet megérteni. A |
823 |
végeredmény ugyan lokálfüggő, de az elv ugyanaz a lokáltól függetlenül. A |
824 |
példák UTF-8 karaktereket tartalmaznak, tehát a megtekintésükhöz meg kell |
825 |
mondanod a böngésződnek, hogy ezt az oldalt UTF-8-as oldalként jelenítse meg |
826 |
vagy előbb be kell állítanod egy UTF-8 lokált. |
827 |
</p> |
828 |
|
829 |
<p> |
830 |
Ha lenyomom az AltGr és a [ billentyűket egyszerre, majd miután felengedtem |
831 |
őket megnyomom az a billentyűt, 'ä' karaktert kapok. Ha az AltGr és a |
832 |
[ lenyomása után az e billentyűt nyomom le, ez 'ë' karaktert eredményez. Az |
833 |
AltGr és a ; lenyomásával 'á' karaktert, ha az AltGr és ; billentyűket nyomom |
834 |
le, majd felengedésük után megnyomom az e billentyűt 'é' karaktert kapok. |
835 |
</p> |
836 |
|
837 |
<p> |
838 |
Az AltGr, a Shift és a [ együttes lenyomásával, majd felengedésével és az utána |
839 |
történő a billentyű lenyomásával skandináv 'å' karaktert kapok. Hasonlóan ha |
840 |
lenyomom az AltGr, a Shift és a [ billentyűket, aztán ha felengedem <e>csak</e> |
841 |
a [ billentyűt, majd újra megnyomom, ez '˚' karaktert eredményez. Habár ez úgy |
842 |
néz ki mintha az lenne, ez (U+02DA) a karakter nem azonos a fok szimbólummal |
843 |
(U+00B0). Ez a többi dead key-jel előállítható ékezethez is használható - az |
844 |
AltGr és a [ egyszerre történő lenyomása után a [ felengedése és újbóli |
845 |
megnyomása '¨' karaktert eredményez. |
846 |
</p> |
847 |
|
848 |
<p> |
849 |
Az AltGr a csak betűket jelentő billentyűkkel is használható. Példuál AltGr és |
850 |
m a görög kis műt eredményezi: 'µ', az AltGr és s a német 13-as sz betűt: 'ß'. |
851 |
Ahogy azt a legtöbb európai felhasználó elvárja (mivel jelölve van a |
852 |
billentyűzetükön) az AltGr és a 4-es (vagy E, a billentyűzettől függően) az |
853 |
Euró szimbólumot '€' eredményezi. |
854 |
</p> |
855 |
|
856 |
</body> |
857 |
</section> |
858 |
<section> |
859 |
<title>További információk</title> |
860 |
<body> |
861 |
|
862 |
<ul> |
863 |
<li> |
864 |
<uri link="http://en.wikipedia.org/wiki/Unicode">A Wikipedia bejegyzése a Unicode-ról</uri> |
865 |
</li> |
866 |
<li> |
867 |
<uri link="http://en.wikipedia.org/wiki/UTF-8">A Wikipedia bejegyzése az UTF-8-ról</uri> |
868 |
</li> |
869 |
<li><uri link="http://www.unicode.org">A Unicode hivatalos oldala</uri></li> |
870 |
<li><uri link="http://www.utf-8.com">Az UTF-8 oldala</uri></li> |
871 |
<li><uri link="http://www.ietf.org/rfc/rfc3629.txt">RFC 3629</uri></li> |
872 |
<li><uri link="http://www.ietf.org/rfc/rfc2277.txt">RFC 2277</uri></li> |
873 |
<li> |
874 |
<uri |
875 |
link="http://www.tbray.org/ongoing/When/200x/2003/04/26/UTF">Karakterek vs. Bájtok</uri> |
876 |
</li> |
877 |
</ul> |
878 |
|
879 |
</body> |
880 |
</section> |
881 |
</chapter> |
882 |
</guide> |