För världens ABC gör han 1:or och 0:or



MICHAEL EVERSON, en 40-årig typograf som bor i Dublin, anser sig vara välsignad eftersom han har hittat sitt livsverk: att vara en alfabetiker för alla världens folk. Mr. Eversons största projekt hittills – ett bidrag till en ny version av Unicode 4.0, en internationell standard för datorisering av text – cementerar hans rykte.

Hans uppdrag har tagit honom till Kabul, Afghanistan och Helsingfors, Finland; till Peking, Tokyo och Redmond, Wash. Hans hus i Dublin är en helgedom för hans besatthet av varje skriftsystem som människor är kända för att ha skapat -- 148 av vilka Mr. Everson säger att han kan använda för att skriva sitt namn. I korridoren finns en ikon av helgonen Cyril och Methodius (Kyril tillskrivs ofta att ha uppfunnit det kyrilliska alfabetet) och en sida från ett Maghreb-manuskript från Nordafrika.

Han har ett foto av en sten inskriven med ogham, ett gammalt irländskt alfabet som ser ut som hashmärken, i en silverram. Hans kontorsstol, parkerad framför en Macintosh G4-dator som heter Cyril, är klädd med mörkblått tyg prickat med egyptiska hieroglyfer. Runt hans skrivbord finns hyllor tunga med böcker om ursprunget till kilskrift och andra skriftsystem.

Han är dock fortfarande förtjust i det romerska alfabetet. ''Av alla alfabet är det det bästa,'' sa han i en telefonintervju.

Under de senaste 10 åren har Mr. Everson, som har amerikanskt och irländskt medborgarskap, spelat en avgörande roll i utvecklingen av Unicode, som kan ses som datorålderns Rosetta-sten. Mr. Everson förklarar Unicode som ''ett stort, gigantiskt teckensnitt som ska innehålla alla bokstäver i alla alfabet i alla språk i världen.''

En mer teknisk förklaring av Unicode är denna: När Mr. Everson skickar e-post i ogham, skickar hans dator inte ogham-brev genom etern. Istället sänds strängar med 0:or och 1:or, och när de kommer till en väns dator genererar de samma ogham-bokstäver som Mr. Everson skrev på skärmen. Unicode är huvudlistan som finns i båda datorerna och översätter enskilda bokstäver och symboler till strängar med 0:or och 1:or och tillbaka igen. De flesta aktuella programvaror är Unicode-kompatibla, vilket innebär att denna masterlista över alla världens skrivsystem har byggts in i operativsystem, webbläsare och mjukvara.

Koden som tilldelas alla 96 000 tecken hanteras endast av programmerare i dess nakna form, medan datoranvändare (och ibland leverantörer) installerar de specifika typsnitt som representerar ett specifikt alfabet. Ett teckensnitt gör ett språk läsbart för människor; Unicode gör ett teckensnitt läsbart för datorer.

De flesta inser inte ens att Unicode fungerar. ''Unicode är som VVS'', sa Rick McGowan, vice vd för Unicode Consortium. ''Ändå är det det mest långtgående och ambitiösa flerspråkiga projektet i historien.''

Det är på grund av Unicode som bloggare kan fundera på arabiska och domännamn kan finnas på kinesiska, eller att analytiker från National Security Agency kan leta igenom Internet efter rapporter om de senaste hoten i östafrikanska tidningar. ''På grund av Unicode'', sa Mr. McGowan, ''kan du slänga ner en vaniljdator i ett kafé var som helst i världen och låta vilken användare som helst på vilket språk som helst gå fram till den och använda den för att komma åt. webben.''

Mr. McGowan var en medlem av gruppen av datavetare och lingvister som satte sig för att skapa systemet 1990 för att lösa ett framväxande problem.

vad kallar du en bild utan bakgrund

Eftersom ett växande antal användare ville skriva på sina egna språk på sina maskiner, hade företag utvecklat metoder för att datorisera text som inte förekom i det romerska alfabetet. Med internets framväxt blev problemet mer komplicerat eftersom det inte fanns någon garanti för att alla dessa maskiner skulle kunna dela textdata. Utan en delad standard skapade tillverkare och till och med regeringar isolerade öar av data, var och en med sin egen standard, och varje dator skulle behöva anpassas till det skrivsystem som ägaren ville använda. Många användare kunde inte skriva e-post, bygga webbplatser eller söka i databaser på sina egna språk och alfabet.

Lösningen var Unicode, en internationell standard för teckenkodning. (Teckenkodning är helt enkelt vilket system som helst som överför textinformation; morsekod är ett exempel.) Förra månaden publicerades den senaste versionen av standarden, Unicode Standard Version 4.0. Den innehåller kodningar (det vill säga unika strängar med 0:or och 1:or) för cirka 96 000 bokstäver och symboler. Cirka 70 000 av dem är kinesiska tecken. Unicode innehåller också stöd för 54 andra skrivsystem, från mongoliska till thailändska till gotiska till kyrilliska.

Mr. Everson sa att han hade arbetat med cirka 5 000 av dessa karaktärer. Version 4.0 innehåller tecken för Linear B (som han designade typsnittet för) och andra antika medelhavsalfabet som främst används av forskare.

Så omfattande som version 4.0 verkar, är den fortfarande inte komplett, och nästan 100 skrivsystem återstår att koda. Mr. Everson förföljs av utsikten att Unicode kanske aldrig blir färdig. ''Föreställ dig hur du skulle känna om ditt namn var François, men det fanns ingen ç tillgänglig,'' sa Mr. Everson. ''Du skulle bli irriterad över att din telefonräkning kom adresserad och stavade ditt namn fel. Tänk dig nu om ditt språk använde ett helt annat alfabet och du inte kunde använda datorer alls på grund av det. Det är en fråga om mänskliga rättigheter, egentligen.''

En ofullständig Unicode är dock en hotande möjlighet. Nu när skrivsystemen på de stora datormarknaderna är kodade börjar datorföretagen som en gång backade Unicode-projektet ifrågasätta kostnaden. För att säkerställa att de återstående skrivsystemen ingår har ett projekt vid namn Script Encoding Initiative inrättats vid University of California i Berkeley för att rekrytera forskare och ansöka om medel från privata stiftelser för att anställa Mr. Everson på heltid.

Ett resultat av det minskande intresset från den privata sektorn är att sätta press på Mr. Everson att slutföra stora projekt. ''De säger, 'Här, Michael, kan du göra egyptiska?' Det är liksom, nej. Egyptiska är på min lista, egyptiska är svårt, och det är stort.''

För att betala räkningarna arbetar Mr. Everson som sättare. Han sätter för närvarande typ för ''Gargantua'' av Rabelais, på irländska. Andra anmärkningsvärda projekt inkluderar den första publiceringen av hela Nya testamentet på korniska, såväl som en engelsk-kornisk ordbok.

Men Mr. Everson erkänner att han dras mest till kodningsarbetet. 'Det är bäst för mig i mitt liv att bli uppsluppen av en besatthet av skrivsystem, eftersom jag är utomordentligt väl lämpad att hantera det', sa han.

Mr. Everson lockades först till avlägsna platser och språk av J.R.R. Tolkien, som han först läste som 13-åring bosatt i Tucson. (Mr. Everson sa att han fortfarande har en ''mjuk plats'' för Tengwar, ett av alfabeten som Tolkein uppfann för sina påhittade språk sindarin och quenya.) ''Sagan om ringen'' ledde honom till Anglo -Saxon och den episka dikten ''Beowulf'' som han bestämde sig för att översätta från fornengelska vid 14 års ålder. Från sin kopia av ''Beowulf''-manuskriptet övade han på att kopiera anglosaxiska bokstäver med en kalligrafipenna.

Sedan tog han examen till att designa typsnitt på sin Macintosh, med georgiska och kyrilliska, sedan Devanagari. Efter att ha känt sig missnöjd med forskarskolan vid U.C.L.A., flyttade han till Irland 1989 och började skriva för sitt uppehälle samtidigt som han designade exotiska typsnitt för skrivsystem inklusive Cherokee, ogham och Sinhala.

1993 såg han en begäran från Unicode-konsortiet om revisioner som involverade några arkaiska skript, varav en var ogham. ''Det var som, ooh, det här är irländskt, låt oss titta närmare på det,'' mindes Mr. Everson. Han skickade också kommentarer om burmesiska, etiopiska, Yi och singalesiska. 'Jag började tidigt,' sa han. ''Jag ​​kastade mig precis in.''

Samtidigt, på Unicode-kontoren i Silicon Valley, blev människor imponerade av arbetet av denna släkting okända i Irland. Mr. McGowan minns det första förslaget han fick från Mr. Everson, om en speciell karaktär i ogham. Första gången de träffades var Mr. McGowan så fängslad av Mr. Eversons charm och lärdomar att han sparade sin namnskylt. 'Michael är en ganska speciell kille,' sa han. ''Han skrev också månaden med en romersk siffra. Jag tyckte det var roligt.''

Mr. Eversons kunskap om världens skrivsystem har gjort honom oumbärlig för Unicode. 'Vid det här laget är Michael förmodligen världens ledande expert på datorkodning av skript,' sa McGowan. ''Ingen annan kommer i närheten av att ha hans detaljerade kunskap om så många skript och hur de är, eller bör kodas.''

Deborah Anderson, en forskare vid lingvistikavdelningen vid Berkeley som leder Script Encoding Initiative, ger Mr. Everson kredit för att få in de flesta av de mindre kända skrivsystemen i Unicode. Hans 220 förslag eller tekniska dokument, sa hon, gör honom ''utan tvekan till den mest produktiva Unicode-författaren som finns.''

Hur exotiskt ämnet än är så är själva verket ganska torrt. Det går ut på att hitta auktoritativa texter, sätta ihop exempel och söka experter och sedan arbeta med dem för att avgöra hur många karaktärer det ska finnas och hur de ska se ut.

'Det är en sak att vara en specialist som läser ugaritiska,' sa Everson. ''Det är en annan sak att vara en person som kan ta reda på de väsentliga bitarna i skrivsystemet när det gäller hur Unicode fungerar.''

Han tar en anmärkningsvärt lång syn på effekten av sitt arbete. 'Det finns tillfredsställelse i att veta att arbetet med att analysera och koda dessa språk, när det väl är klart, aldrig kommer att behöva göras igen,' sa han. ''Detta kommer att användas under de kommande tusen åren.''

tangentbordets piltangenter fungerar inte

Mr. Everson verkar också njuta av de mänskliga interaktionerna. Han är stolt över att arbeta med barnbarnet till Osman Yusuf Kaynandid, som uppfann det osmanska manuset i Somalia 1922. Han berättar också gärna om hur han träffade presidenten för Tibetan Calligraphy Society vid ett Unicode-möte i Köpenhamn. Mr. Everson hade hjälpt organisationen att se till att Tibetan ingick i standarden. Presidenten visade Mr. Everson hur man skriver sitt namn på tibetanska med en överstrykningspenna.

''Han tackade mig'' sa Mr. Everson med vördnad. ''Jag ​​kunde inte tro det, eftersom hans organisation har funnits i över tusen år.''

Låser upp koden

För att inkludera skript och tecken i Unicode-standarden ges varje tecken en hexadecimal kodposition -- det vill säga en som använder en bas-16 notation, som innehåller siffrorna 0 till 9 och bokstäverna A till F. Tecknet uppe till höger, från Cherokee, är 13E3. Den koden destilleras sedan till 1:or och 0:or.

Representerade ovan är, översta raden, Limbu, Linear B, Cherokee; andra raden, Tai Le, cypriotisk, ogham; tredje raden, Osmania, Ugaritic, Tibetan; nedre raden, tagalog, singalesisk, gotisk.