Go to:
Gentoo Home
Documentation
Forums
Lists
Bugs
Planet
Store
Wiki
Get Gentoo!
Gentoo's Bugzilla – Attachment 50658 Details for
Bug 81159
[Finnish] Initial Translation: utf-8.xml
Home
|
New
–
[Ex]
|
Browse
|
Search
|
Privacy Policy
|
[?]
|
Reports
|
Requests
|
Help
|
New Account
|
Log In
[x]
|
Forgot Password
Login:
[x]
utf-8.xml
utf-8.xml (text/plain), 21.80 KB, created by
Flammie Pirinen (RETIRED)
on 2005-02-07 13:18:24 UTC
(
hide
)
Description:
utf-8.xml
Filename:
MIME Type:
Creator:
Flammie Pirinen (RETIRED)
Created:
2005-02-07 13:18:24 UTC
Size:
21.80 KB
patch
obsolete
><?xml version='1.0' encoding="UTF-8"?> ><!-- $Header: /var/cvsroot/gentoo/xml/htdocs/doc/en/utf-8.xml,v 1.1 2005/02/03 12:36:39 neysx Exp $ --> ><!DOCTYPE guide SYSTEM "/dtd/guide.dtd"> > ><guide link="/doc/en/utf-8.xml" lang="fi"> ><title>UTF-8:n käyttö Gentoo-järjestelmässä</title> > ><author title="Tekijä"> > <mail link="slarti@gentoo.org">Thomas Martin</mail> ></author> ><author title="Avustaja"> > <mail link="devil@gentoo.org.ua">Alexander Simonov</mail> ></author> ><author title="Vastuullinen kääntäjä"> > <mail link="flammie@gentoo.org">Flammie Pirinen</mail> ></author> > ><abstract> >Tässä oppaassa kerrotaan kuinka UTF-8-merkistökoodaus asetataan käytettäväksi >Gentoo-järjestelmään. Lisäksi kerrotaan jotain yleistä tietoa Unicoden ja >erityisesti UTF-8:n hyödyistä. ></abstract> > ><license /> > ><version>1.0</version> ><date>2005-02-03</date> > ><chapter> ><title>Merkistökoodaukset</title> ><section> ><title>Mitä merkistökoodauksella tarkoitetaan?</title> ><body> > ><p> >Tietokoneethan eivät ymmärrä tekstiä sinänsä. Sen sijaan ne käsittelevät >merkkejä numeroina. Perinteisesti tapaa joilla numerot on yhdistetty >aakkostoihin (eli merkistökoodausta, engl. character set encoding) >on jouduttu rajoittamaan tietokoneiden laitteistorajoitteiden mukaan. ></p> > ></body> ></section> ><section> ><title>Merkistökoodausten historiaa</title> ><body> > ><p> >Yleisin (tai laajimmin hyväksytty) merkistökoodaus tunnetaan ><b>ASCII</b>na (engl. American Standard Code for Information Interchange). >Moderni ASCII-järjestelmä standardoitiin 1986 (ANSI X3.4, RFC 20, >ISO/IEC 646:1991 ja ECMA-6 -standardit). ></p> > ><p> >ASCII-järejstelmä on rajoitettu 7 bittiin merkkiä kohti, eli sen merkit >esitetään desimaalinumeroilla 0:sta 127:ään. Näihin kuuluu 33 näkymätöntä >ohjausmerkkiä, lukuarvoilla 0â31 ja 127 (joka on DEL eli delete). Merkit >32â126 ovat näkyviä käyttömerkkejä: välilyönti, välimerkit ja latinalaiset >aakkoset (aâz) sekä numerot. ></p> > ><p> >ASCIIssa tavun kahdeksatta bittiä käytettiin alunperin ns. pariteettibittinä >virheentarkastuksessa, tai jos tällaista ei tarvittu, se jätettiin väistämättä >nollaksi. Joka tapauksessa, kaikki ASCII-koodaukset käyttivät yhden tavun >jokaista merkkiä kohden. ></p> > ><p> >Vaikka ASCII riitti hyvin moderniin englanninkieliseen käyttöön, on tietysti >selvää ettei se ollut käytännöllinen edes muissa Eurooppalaisissa >kielissä, joissa saattoi tarvita kummallisia pilkkuja aiden ja oiden päälle tai >vaikkapa aksenttejakin. ISO 8859 -standardisarja kehitettiin korjaamaan tätä >ongelmaa. Se oli taaksepäin yhteensopiva ASCIIn kanssa, mutta sen sijaan että >kahdeksas bitti olisi ollut tyhjä, sitä käytettiin hyödyksi ja näin saatiin >käyttöön 127 uutta merkkipaikkaa. Myös tämä oli rajoittunutta, ja jo Euroopan >käyttöön kehitettiin 16 erilaista merkistökoodausta (vastaavasti ISO 8859-1:stä >ISO 8859-16:een). ASCII-alueen ulkopuolella näiden koodausten merkit menivät >päällekkäin, ja käyttivät siis keskenään eri merkkejä samoille lukuarvoille. >Lisäksi soppaa tuli sotkemaan lopulta Microsoft Windows -järjestelmien >Länsi-Eurooppalainen Windows-1252-koodaus, joka oli ISO 8859-1:n johdos, >mutta kuitenkin erilainen. Kaikki nämä koodaukset kuitenkin olivat yhteensopivia >ASCIIn kanssa. ></p> > ><p> >Kielissä joissa käytetään jotain muita kuin latinalaista aakkostoa tarvittiin >kokonaan erilaisia koodaustapoja, kuten EUC:tä (engl. Extended Unix Coding) >japanissa ja koreassa (ja vähemmin kiinassakin). Tämä oli toki >omiaan aiheuttamaan lisää sekaannusta, kun samat käyttöjärjestelmät >käyttivät myös eri merkistökoodauksia samoille kielille, kuten >Shift-JISsiä ja ISO-2022-JP:tä japanille. Kyrillisten kirjainten kanssa >käyettiin joko KOI8-R-koodausta venäjälle ja bulgarialle sekä KOI8-U-koodausta >ukrainalle tai vaikkapa huono-onnisempaa ISO 8859-5-koodausta, tai sitten >Windowsin windows-1251-koodausta. Kaikki nämä koodaukset olivat jo >täysin ristiriidassa ASCII-merkistön kanssa (vaikkapa KOI8 asetti >kyrilliset merkit latinalaiseen aakkosjärjestykseen, joten ASCIIksi >tulkittunakin KOI8 vaikutti englantilaisittain translitteroidulta tekstiltä). ></p> > ><p> >Kaikki tämä on johtanut nyttemmin siihen, että monikielinen, aakkostojakin >sotkeva, kommunikaatio netitse on parhaimmillaankin ongelmallista. Sittenpä >yritetään siirtyä Unicodeen. ></p> > ></body> ></section> ><section> ><title>Mikä kumman unicode?</title> ><body> > ><p> >Unicode-järjestelmässä luovuttiin tavurajoituksista merkistökoodauksille, >sillä jopa kaksitavuinenkin koodaus jäisi vain 65 536:een merkkiin rajoitetuksi. >Vaikka tuo tuntuukin suurehkolta luvulta, se on todettu riittämättömäksi >kaikille kirjoitusmerkeille joita erikoisalat, kuten matematiikka, saattaisivat >käyttää. ></p> > ><p> >Unicode-määritykset muunnetaan tietokoneiden merksitökoodeiksi useilla tavoilla, >mutta eniten käytössä lienevät <b>UTF</b> (engl. Unicode Transformation Format) >ja <b>UCS</b> (engl. Universal Character Set). Näiden aliluokissa UTF:n >perään merkitään bittien määrä pienimmässä merkkiesityksessä ja UCS:n perään >merkitään tavujen määrä kaikissa merkkiesityksissä. UTF-8 on ehkäpä >laajimmin levinnyt tapa koodata Unicode-merkkejä, ehkäpä koska se on helpoiten >yhteensopiva vanhojen 8-bittisten kanssa. Ja UTF-8 on myös tämän dokumentin >keskeisin aihe. ></p> > ></body> ></section> ><section> ><title>UTF-8</title> ><body> > ><p> >UTF-8 koodaa merkit vaihtelevapituisiin jaksoihin, mikä tässä tapauksessa >tarkoittaa, että se käyttää 1:stä 4:ään tavua merkkiä kohden. Yksitavuiset >merkit koodaavat ASCII-merkkejä täysin alaspäin yhteensopivasti vanhan >ASCII-merkistön kanssa. Tämän takia UTF-8:a ja ASCII:ta voi käyttää täysin >sekaisin kun pysytään ASCII-merkistössä. Suuri osa Itä-Aasialaisten >ei-latinalaisten merkistöjen käyttäjistä ei pidä UTF-8:aa hyvänä ratkaisuna, >sillä useimmiten siitä aiheutuu jopa 50 %:n koon lisäys tekstidataan. ></p> > ></body> ></section> ><section> ><title>Mitä hyötyä UTF-8:sta on käyttäjälle?</title> ><body> > ><p> >UTF-8 mahdollistaa standardin omaiset kansainvälisesti toimivat >käyttöympäristöt, suhteellisen pienellä vaivalla. UTF-8 olisi paras tapa >käyttää ASCII-merkistön ulkopuolisia merkkejä netissä, meileissä, irkissä ja >muuallakin, mutta siltikin monissa paikoissa UTF-8:aa ei vielä pidetä >hyväksyttynä tapana. Kannattaa yleensäkin ottaa selvää sopiiko UTF-8:aa käyttää >irkkikanavalla, meililistalla tai Usenetin nyyssiryhmässä ennen kuin ärsyttää >ihmisiä sillä. Keskimäärin sanottakoon, että sekä suomalaisilla irkkikanavilla, >että sfnetissä vielä vuonna 2005 on yleisehkö käytäntö UTF-8:aa vastaan pikemmin >kuin sen puolesta. ></p> > ></body> ></section> ></chapter> > ><chapter> ><title>UTF-8:n käyttö Gentoossa</title> ><section> ><title>Sopivien UTF-8-localejen löytäminen</title> ><body> > ><p> >Nyt kun tiedossa on Unicode-järjestelmän perusteet, voidaan alkaa käyttämään >UTF-8:aa järjestelmässä. ></p> > ><p> >Esiehtona UTF-8:n käytölle on glibc käännettynä kielituin. Suositeltu tapa >tehdä tämä on asettaa tiedosto <path>/etc/locales.build</path> >ja USE-flägi <c>userlocales</c>. Tässä dokumentissa ei kerrota enempää tästä >prosessista, mutta se on hyvin dokumentoituna vaikkapa <uri >link="/doc/fi/guide-localization.xml#doc_chap3_sect3"> Gentoon >paikallisasetusoppaassa</uri>. ></p> > ><p> >Seuraavaksi pitää selvittää mikä UTF-8 locale on saatavilla suomeksi, vai >pitääkö luoda uusi: ></p> > ><pre caption="UTF-8 localen etsiminen"> ># <i>locale -a | grep 'fi_FI'</i> >fi_FI >fi_FI@euro >fi_FI.iso88591 >fi_FI.iso885915@euro >fi_FI.utf8 ></pre> > ><p> >Tästä tulosteesta voidaan helposti napata se kohta, jossa on pääte ><c>.utf8</c>. Jollei mikään pääte muistuta merkkijonoa ><c>.utf8</c>, pitää luoda uusi locale joka sisältää sen. ></p> > ><note> >Seuraava kannattaa suorittaa vain jos UTF-8-localea ei ole saatavilla. ></note> > ><pre caption="UTF-8-localen luonti"> ># <i>localedef -i fi_FI -f UTF-8 fi_FI.utf8</i> ></pre> > ></body> ></section> ><section> ><title>Localen asettaminen</title> ><body> > ><p> >Vaikka joku saattaisi haluta käyttää UTF-8:aa järjestelmänlaajuisena, >ei tämän oppaan kirjoittaja suosittele sitä root-käyttäjän ympäristöön. >Sen sijaan olisi parempi asettaa localetieto käyttäjän tiedostoon ><path>~/.profile</path> (tai C shellin käyttäjille tiedostoon ><path>~/.login</path>). ></p> > ><note> >Jos et tiedä mitä tiedostoa käyttää, kokeile <path>~/.profile</path>a. >Samoin jos et ole varma seuraavista koodilistauksista, käytä Bourne >shellin versiota. ></note> > ><pre caption="Localen asettaminen ympäristöön Bourne shelleissä"> >export LANG="fi_FI.utf8" ></pre> > ><pre caption="Localen asettaminen ympäristöön C shelleissä"> >setenv LANG "fi_FI.utf8" ></pre> > ><p> >Uloskirjautuminen ja takaisin sisäänkirjautuminen saavat nuo ympäristömuutokset >voimaan, tai sitten on mahdollista käyttää komentoa source tiedostoon ><path>~/.profile</path> tai <path>~/.login</path> konsolilta. ></p> > ></body> ></section> ></chapter> > ><chapter> ><title>Ohjelmistotuki</title> ><section> ><body> > ><p> >Unicoden alkuaikoina, monitavuiset merkistökoodaukset eivät toimineet hyvin >C:n tyyppisissä ohjelmointikielissä, joita suuri osa tavallisimmista ohjelmista >käytti. Nykyäänkään kaikki ohjelmat eivät osaa UTF-8:aa ihan täydellisesti, >onneksi valtaosa kuitenkin hallitsee jo sen. ></p> > ></body> ></section> ><section> ><title>Tiedostonimet, NTFS ja FAT</title> ><body> > ><p> >Kernelissä on useita NLS-valintoja, mutta niistä ei pidä hämääntyä! Enimmikseen >pärjää, kun lisää UTF-8:n NLS-tukiin ja asettaa oletus-NLS:ksi utf8. ></p> > ><pre caption="Kernelin asetukset UTF-8-tuelle"> >File Systems --> > Native Language Support --> > (utf8) Default NLS Option > <*> NLS UTF8 > <comment>(Also <*> other character sets that are in use in > your FAT filesystems or Joilet CD-ROMs.)</comment> ></pre> > ><p> >Jos käytät NTFS-osioita koneellasi, saattaa niille olla tarpeen >antaa optio <c>nls=</c> liittämisen yhteydessä. Lisätietoja tästä löytyy >mansivulta: <c>man mount</c>. ></p> > ><p> >Tiedostonimien koodauksen muuttamisessa <c>app-text/convmv</c> voi >osoittautua näppäräksi. ></p> > ><pre caption="Esimerkki convmv:n käytöstä"> ># <i>emerge --ask app-text/convmv</i> ># <i>convmv -f koodaus -t utf-8 tiedostonimi</i> ></pre> > ><p> >Tiedostojen sisältöä muutetaan vastaavasti vaikkapa <c>iconv</c>-sovellukella, >joka tulee <c>glibc</c>:n mukana. ></p> > ><pre caption="Esimerkki iconvin käytöstä"> ><comment>(vaihda iso-8859-1 miksi koodaukseksi tahansa haluatkin)</comment> ><comment>(Tarkasta tuloste virheiltä)</comment> ># <i>iconv -f iso-8859-1 -t utf-8 filename</i> ><comment>(Tuloste pitää tehdä ensin uuteen tiedostoon)</comment> ># <i>iconv -f iso-8859-1 -t utf-8 filename > newfile</i> ></pre> > ><p> ><c>app-text/recode</c>a voi myös käyttää tähän hommaan. ></p> > ></body> ></section> ><section> ><title>Konsoli</title> ><body> > ><impo> >Unicode toimii konsolilla vain sys-apps/baselayout-1.11.9:llä >tai uudemmilla. ></impo> > ><p> >UTF-8-tuki saadaan konsolille asettamalla tiedostoon <path>/etc/rc.conf</path> ><c>UNICODE="yes"</c>, ja lukemalla muukin osa tiedostosta tarkkaan. Oikean >fontin valinta on tärkeää unicoden käytölle. ></p> > ><p> >Tiedoston <path>/etc/conf.d/keymaps</path> asetuksessa <c>KEYMAP</c> >pitäisi olla Unicode-näppäimistökartta asetettuna. Tämän saa aikaan lisäämällä >-u näppäimistökartan alkuun. ></p> > ><pre caption="/etc/conf.d/keymapsin muokkaus"> >KEYMAP="-u fi-latin9" ></pre> > ></body> ></section> ><section> ><title>Ncurses ja Slang</title> ><body> > ><note> >Ohita Slang tässä osiossa jollet käytä sitä tai tarvitse sitä. ></note> > ><p> ><c>Unicode</c> on hyvä lisätä <path>/etc/make.conf</path>in USE-flägeihin, >ja asentaa (uudelleen) <c>sys-libs/ncurses</c> ja <c>sys-libs/slang</c> >jos tarpeellista: ></p> > ><pre caption="ncursesin ja slangin asennus"> ><comment>(Kirjastoja ei lisätä worldiin kun käytetään valitsinta --oneshot)</comment> ># <i>emerge --oneshot --verbose --ask sys-libs/ncurses sys-libs/slang</i> ></pre> > ><p> >Tämän jälkeen pitää myös uudelleenasentaa ohjelmat jotka käyttävät näitä >kirjastoja, jotta USE-muutokset tulevat käytetyiksi. ></p> > ><pre caption="ncursesia ja slangia käyttävien ohjelmien uudelleenasentaminen"> ># <i>revdep-rebuild --soname libncurses.so.5</i> ># <i>revdep-rebuild --soname libslang.so.1</i> ></pre> > ></body> ></section> ><section> ><title>KDE, GNOME ja Xfce</title> ><body> > ><p> >Kaikki suuremmista työpöytäympäristöistä tukevat Unicodea täysin, eivätkä >tarvitse enempiä asetuksia kuin mitä on jo annettu. Tämä seuraa siitä, >että graafisten ympäristöjen ohjelmointikirjastot (Qt ja GTK+2) ovat >UTF-8-yhteensopivia. Samoin kaikki Qt- ja Gtk+2-pohjaiset sovellukset >tukevat nyt UTF-8:aa suoraan. ></p> > ><p> >Poikkeuksena tulevat Xlibin ja GTK+1:n päälle rakennetut ohjelmat. GTK+1 >tarvitsee iso-10646-1-fontin FontSpec-tyyppisenä määrityksenä tiedostoon ><path>~/.gtkrc</path>, kuten esimerkiksi: ><c>-misc-fixed-*-*-*-*-*-*-*-*-*-*-iso10646-1</c>. >Xlibiä ja Xawia käyttävät sovellukset tarvinnevat vastaavan asetuksen omiin >asetuksiinsa, muutoin ne eivät välttämättä toimi. ></p> > ><note> >Jos koneella on Gnome 1:n control center -sovellus, sitä voi käyttää fontin >muuttamiseen huomattavasti helpommin: tarvitsee vain valita iso10646-1 listasta. ></note> > ><pre caption="Unicode-fontin lisäys ~/.gtkrc:hen (GTK+1:ä varten)"> >style "user-font" >{ > fontset="-misc-fixed-*-*-*-*-*-*-*-*-*-*-iso10646-1" >} >widget_class "*" style "user-font" ></pre> > ><p> >Jos sovelluksessa on sekä Qt että GTK+2 -tuet, GTK+2-tuki antaa paremman >lopputuloksen Unicoden kanssa. ></p> > ></body> ></section> ><section> ><title>X11 ja fontit</title> ><body> > ><impo> ><c>x11-base/xorg-x11</c> tukee Unicodea paremmin kuin >XFree86 ja on <e>erittäin</e> suositeltava ratkaisu tässä >tapauksessa. ></impo> > ><p> >Truetype-fonteissa on sinänsä jo tuki Unicodelle, ja useimmisa Xorgin mukana >tulevissa fonteissa on suhteellisen kattava valikoima. Tietenkään kaikkia >Unicoden merkkejä ei ole helposti käsillä perusfonteissa. Joihinkin fontteihin >(mukaanlukien Bitstream Verat) tuen Itä-Aasialaisiin merkistöihin X:ll saa >asettamalla <c>cjk</c>-USE-flägin. Monet ohjelmistotkin käyttävät tätä >flägiä, joten saattaa olla kannatavaa merkitä se yleisiin USE-asetuksiin, jos >sitä tarvitsee. ></p> > ><p> >Useat fonttipaketit Portagessa sisältävät Unicodea: ></p> > ><pre caption="Vaihtoehtoista: muiden Unicode-fonttien asennus"> ># <i>emerge terminus-font intlfonts freefonts cronyx-fonts corefonts</i> ></pre> > ></body> ></section> ><section> ><title>Ikkunointimanagerit ja terminaaliemulaattorit</title> ><body> > ><p> >Myös ikkunointimanagerit jotka eivät pohjaudu GTK:hon tai Qt:hen sisältävät >hyvän Unicode-tuen, ja usein käyttävät Xft-kirjastoa fonttien käsittelyyn. >Ne ikkunointimanagerit, jotka eivät käytä Xft:tä, saattavat silti toimia >aiemmin mainituilla FontSpec-asetuksilla Unicode-fonteille. ></p> > ><p> >Terminaaliemulaattoreit Xft-tuella ja Unicode-tuella on hieman hankalampi >löytää. Konsolen ja gnome-terminalin lisäksi hyviä valintoja Portagessa ovat ><c>x11-terms/rxvt-unicode</c>, <c>xfce-extra/terminal</c>, ><c>app-gnustep/terminal</c>, <c>x11-terms/mlterm</c>, <c>x11-terms/mrxvt</c> tai >vanha kunnon <c>x11-terms/xterm</c> <c>unicode</c>-USE-flägillä varustettuna. >Xterm saattaa pitää käynnistää komennolla <c>uxterm</c>. ><c>app-misc/screen</c> tukee myös UTF-8:aa: ><c>screen -u</c> käynnistää UTF-8-tilan, tai >sen voi myös lisätä asetustiedostoon ><path>~/.screenrc</path>: ></p> > ><pre caption="~/.screenrc:n asettaminen UTF-8:aa varten"> >defutf8 on ></pre> > ></body> ></section> ><section> ><title>Vim, Emacs, Xemacs ja Nano</title> ><body> > ><p> >Vim, Emacs ja Xemacs sisältävät täyden UTF-8-tuen, ja pystyvät automaattisesti >tunnistamaan jotkin UTF-8-tiedostot. Vimin UTF-8-tuesta saa lisätietoa >komennolla <c>:help >mbyte.txt</c>. ></p> > ><p> >Nanossa ei ole tällä hetkellä mitään UTF-8-tukea, mutta se on ollut >suunnitteilla jonkin aikaa. Tämä tullee muuttumaan siis tulevaisuudessa, itse >asiassa tämänhetkisessä CVS-versiossa on jo UTF-8-tuki, ja hyvällä tuurilla >se sisältyy seuraavaan julkaisuversioon. ></p> > ></body> ></section> ><section> ><title>Shellit</title> ><body> > ><p> >Nykyisin <c>bash</c> sisältää täyden Unicode-tuen GNUn readline-kirjaston >kautta. Z shellin käyttäjillä tilanne on huonompi, yhtään Unicode-tukea >ei löydy nykyisistä versioista, mutta monitavuisten merkkien käsittelytukea >työstetään tällä hetkellä. ></p> > ><p> >C shellissä, <c>tcsh</c>:ssa ja <c>ksh</c>:ssa ei ole mitään >UTF-8-tukea tällä hetkellä. ></p> > ></body> ></section> ><section> ><title>Irssi</title> ><body> > ><p> >Irssi tukee UTF-8:aa täysin, tosin se vaatii erillisen asetuksen: ></p> > ><pre caption="UTF-8-tuen lisääminen irssiin"> >/set term_charset UTF-8 ></pre> > ><p> >Kanavilla joissa käytetään monia merkistöjä, <c>/recode</c>-komento auttaa >merkkimuunnoksissa. Lisätietoa tästä saa komennolla <c>/help recode</c>. ></p> > ></body> ></section> ><section> ><title>Mutt</title> ><body> > ><p> >Muttissa on hyvä Unicode-tuki. UTF-8:n saa päälle >lisäämäällä <path>~/.muttrc</path>:hen seuraavaa. ></p> > ><pre caption="~/.muttrc:n muokkaaminen UTF-8-yhteensopivaksi"> >set send_charset="utf8" <comment>(lähetysten merkistökoodaus)</comment> >set charset="utf8" <comment>(näytön merkistökoodaus)</comment> ></pre> > ><note> >Tämänkin jälkeen meileissä saattaa esiintyä ?:jä, ja se yleensä johtuu >jonkin vanhemman Latin-merkistön (ISO 8859) käytöstä. Saattaa olla kannattavaa >opastaa muita käyttämään UTF-8-postituksia ja osoittaa heille >IETF RFC 2277 luettavaksi (viiteluettelo on dokumentin lopussa). >Huomaa kuitenkin, että erityisesti monilla postituslistoilla UTF-8 ei ole >hyväksytty vaihtoehto. Kannattaa siis aina etukäteen varmistaa sopiva >merkistökoodaus postituksiin ennen kuin käyttää UTF-8:aa. ></note> > ><p> >Lisätietoa aiheesta on <uri >link="http://wiki.mutt.org/index.cgi?MuttFaq/Charset"> Mutt WikiWikissä</uri>. ></p> > ></body> ></section> ><section> ><title>Testaaminen</title> ><body> > ><p> >Netissä on lukuisia UTF-8-testisivustoja. <c>net-www/w3m</c>, ><c>net-www/links</c>, <c>net-www/elinks</c>, <c>net-www/lynx</c> ja >Mozilla-pohjaiset selaimet tukevat UTF-8:aa, kuten Konquerorkin. ></p> > ><p> >Tekstipohjaisissa selaimissa tulee kuitenkin varmistaa, että myös terminaali >on Unicode-yhteensopiva. ></p> > ><p> >Jos jotkin merkeistä näkyvät laatikkoina, joissa on ehkä numeroita ja kirjaimia >sisällä, se tarkoittaa, että fonteista puuttuu vastaava merkki, ja laatikossa >on merkin UTF-8-koodi. ></p> > ><ul> > <li> > <uri link="http://www.w3.org/2001/06/utf-8-test/UTF-8-demo.html">W3C:n > UTF-8 testsivu</uri> > </li> > <li> > <uri link="http://titus.uni-frankfurt.de/indexe.htm?/unicode/unitest.htm"> > Frankfurtin yliopiston UTF-8-testisivu</uri> > </li> ></ul> > ></body> ></section> ><section> ><title>Tekstinsyöttö</title> ><body> > ><p> ><e>Kuolleet näppäimet</e> (engl. dead keys) auttavat joidenkin merkkien >muodostamista näppäimistöltä. Nämä toimivat niin, että näppäimistöltä syötetään >jokin kuolleista merkeistä, kuten suomalaisen standardinäppäimistön enterin >ja backspacen vasemmalla puolella olevat merkit, ja perään jokin >aakkosnumeerinen merkki, niin alussa syötetty merkki muuttaa jäljempänä >syötetyn. Näin voidaan lisätä vaikkapa aksentteja latinalaisiin aakkosiin >tai kirjoittaa potenssiin korotettuja numeroita Unicode-tyyliin. ></p> > ><p> >Kuolleiden näppäinten toiminta riippuu käytetystä näppäinkartoista. >Useimmissa eurooppalaisissa ne ovat oletusarvoisesti mukana. >Pohjois-Amerikkalaisissahan näitä ei kuitenkaan ole. Helpoiten tämän saa >kuitenkin amerikanenglantilaiseen näppäinkarttaan käyttämällä en_US-karttaa >us-kartan asemesta, esimerkiksi ><path>/etc/X11/xorg.conf</path>issa. ></p> > ><pre caption="/etc/X11/xorg.conf"> >Section "InputDevice" > Identifier "Keyboard0" > Driver "kbd" > Option "XkbLayout" "fi" > <comment>(Muita Xkb-asetuksia tarvittaessa)</comment> >EndSection ></pre> > ><p> >Tämä muutos tulee voimaan X:n uudelleenkäynnistyksessä. Sen voi myös ottaa >käyttöön heti <c>setxkbmap</c>-komennolla: <c>setxkbmap fi</c>. ></p> > ><p> >Tässä vielä muutamia esimerkkejä kuolleista näppäimistä. Vaikka nämä >vaihtelevatkin eri näppäinasetuksilla, käytäntö on yleensä sama. ></p> > ><p> >Painamalla ensin backspacen vasemmalla puolella olevaa >kuollutta aksenttia ´ ja >sitten aata, saadaan á. Painamalla samaa aksenttia ´ ja eetä saadaan >vastaavasti é. Shiftillä saadaan gravis-aksentti Ì ja sen voi yhdistää >vastaavasti vaikka oohon ò. ></p> > ><p> >Painamalla AltGr ja backspacen vasemmalla puolella olevaa aksenttinäppäintä >saadaan kuollut caron ¸ , jota voi käyttää vaikkapa ranskassa: ç. Jos >samaa kuollutta näppäintä paina kahdesti, tai yhdistää välilyöntiin, saa >aikaan pelkän aksentin tai tarkkeen, kuten akuutit ja gravikset edellä, >kannattaa kuitenkin huomata, että tällaisia merkkejä ei yleensä käytetä >tekstissä vaikka ne näyttäisivät samalta kuin jokin muu symboli, esimerkiksi >kaksi aksenttia ei korvaa lainausmerkkiä eikä ruotsalaisen åån rengas sovi >astemerkiksi. ></p> > ><p> >Myös AltGr:n avulla saadaan aikaan hyvin paljon merkkejä, esimerkiksi >suomalaisessa näppäimistössä hattu-s Å¡ tulee AltGr+s yhdistelmästä, ja hattu-z ž >vastaavasti AltGr+z. Ãng-äänteen merkki Å on geen alla ja mikron >myy µ on ämmässä. ></p> > ></body> ></section> ><section> ><title>Viitteitä</title> ><body> > ><ul> > <li> > <uri link="http://fi.wikipedia.com/wiki/Unicode">Wikipedian > Unicode-artikkeli</uri> > </li> > <li> > <uri link="http://fi.wikipedia.com/wiki/UTF-8">Wikipedian > UTF-8-artikkeli</uri> > </li> > <li><uri link="http://www.unicode.org">Unicode.org</uri></li> > <li><uri link="http://www.utf-8.com">UTF-8.com</uri></li> > <li><uri link="http://www.ietf.org/rfc/rfc3629.txt">RFC 3629</uri></li> > <li><uri link="http://www.ietf.org/rfc/rfc2277.txt">RFC 2277</uri></li> ></ul> > ></body> ></section> ></chapter> ></guide>
You cannot view the attachment while viewing its details because your browser does not support IFRAMEs.
View the attachment on a separate page
.
View Attachment As Raw
Actions:
View
Attachments on
bug 81159
: 50658