Speciale tekens typen in Windows, Linux en macOS

Marco den Teuling
1

Inhoudsopgave

De meeste computergebruikers voelen zich achter het toetsenbord op veilig terrein. Bij het intypen van speciale tekens zijn er echter een paar valkuilen, en dan komt wat achtergrondkennis van typografie en tekensets goed van pas. Hoe zit het nu eigenlijk met typen van die bijzondere tekens?

Letters, cijfers en algemene leestekens zijn op een toetsenbord nog wel te vinden, maar soms heb je speciale tekens nodig – of dat nu bij tekstdocumenten of op sociale media is. Gewoonlijk gebruik je dan tekens die makkelijk in te typen zijn, maar dat is typografisch soms verkeerd. Als twee tekens op elkaar lijken, zijn ze nog niet hetzelfde.

In 2020 mag je ervan uitgaan dat de meeste toepassingen overweg kunnen met teksten in de Unicode-­tekenset. Die is zo groot dat hij naast tekens voor bijna alle levende (en dode) talen ook tal van speciale tekens omvat. Geen toetsenbord dat op een bureau moet passen kan een toets bieden voor elk van die tekens. Dat is echter ook niet nodig. Elk teken heeft een code die gespecificeerd kan worden in hexadecimale of decimale notatie. De komma heeft bijvoorbeeld de decimale code 0044, wat hexadecimaal overeenkomt met 002c (hexadecimale getallen worden gemarkeerd met een voorafgaande 0x, dus 0x002c).

Een complete Unicode-tabel met zoekfunctie vind je op de (Engelstalige) website van Compart.

Alle tekens die niet makkelijk via het toetsenbord bereikbaar zijn, kunnen via hun Unicode-code rechtstreeks op desktopbesturingssystemen worden gegenereerd, zij het met beperkingen. Bij ­MacOS moet je eerst bij de Systeemvoorkeuren onder ‘Toetsenbord / Invoerbronnen’ de toetsenbordindeling ‘Unicode Hex-invoer’ toevoegen en vervolgens activeren. Daarna kun je een hexcode intypen terwijl je de Optie-­toets ingedrukt houdt. Typ de cijfers op het numerieke toetsenblok met extra voorloopnullen bij een code korter dan vier tekens. Voor de komma wordt dat bijvoorbeeld 0 0 2 c.

Bij Linux-desktops die gebaseerd zijn op Qt en GTK werkt dat zonder instellen door de Ctrl- en Shift-toetsen ingedrukt te houden en U 0 0 2 c in te typen (alle cijfers op het numerieke toetsenblok). Het teken verschijnt nadat je Ctrl en Shift hebt losgelaten. Bij Windows is het intypen van Unicode allesbehalve intuïtief en veel van wat je daarover op internet leest, klopt helaas niet.

Speciale route voor Windows

Overal in Windows kun je met de Alt-toets ingedrukt een decimale code tussen 0033 en 0255 intypen uit een Unicode-tabel (van voren aangevuld met nullen). Voor de komma dus bijvoorbeeld met de Alt-toets ingedrukt, 0044. Toen Windows werd omgezet naar Unicode, bleven er echter resten uit het vorige millennium achter. In feite gaat het bij de Alt-codes namelijk niet om Unicode, maar om de tekenset Windows-1252, die grotendeels overeenkomt met het begin van de Unicode-tabel. Er zijn afwijkingen in het bereik van 0128 tot 0159. Daar zijn andere tekens gedefinieerd, zoals het euroteken (0128).

Het wordt echter pas echt verwarrend met alle Unicode-adressen boven de 0255. Daar is namelijk geen standaard systeem­verwerking en programma’s kunnen afwijkend reageren. Sommige negeren in dat geval het laatste cijfer, andere rekenen met modulo 256, weer andere kunnen wel met die Unicode-­tekens overweg. Gelukkig is dat laatste van toepassing op de meeste tekstverwerkingsprogramma’s ­(inclusief WordPad). Als je tekens zoekt, kan dat met het ­systeemprogramma ­‘Speciale tekens’, waarin je tekens kunt selecteren en kopiëren. Daar zie je ook het Unicode-adres in hexa­decimale notatie.

speciale tekens typen Windows

Bij Windows zie je bij ‘Speciale tekens’ de Unicode-naam en de hexadecimale waarde. Als je die rechtstreeks wilt invoeren, moet je in het register aan de slag.

Maar ook als Windows-gebruiker kun je een uniforme en systeembrede invoer bereiken. Maak in de registersleutel ‘HKEY_CURRENT_USER\Control Panel\­Input Method\’ een item aan van het type Teken­reeks (REG_SZ) met de naam ‘EnableHexNumpad’ en de waarde 1, en start je de computer opnieuw op. Houd de Alt-toets ingedrukt om een teken in te voeren en typ vervolgens + op het cijferblok, gevolgd door het viercijferige hexadecimale adres (weer aangevuld met voorloopnullen). Dat is bijvoorbeeld bij een promilleteken (‰) + 2 0 3 0. De klassieke Windows-procedure (zonder een plusteken en met decimale adressen) blijft werken. Die kun je gebruiken als de nieuwe methode niet werkt, zoals bij laptops zonder echt numeriek toetsenblok.

In de tabel op het eind staan de hexadecimale en decimale codes in Unicode voor de in dit artikel genoemde vaak door elkaar gehaalde speciale tekens, evenals de afwijkingen in Windows-1252. Voor sommige tekens zijn er ook toetscombinaties die afhankelijk zijn van het besturingssysteem. Op mobiele apparaten kun je ook werken met sommige Unicode-tekens, maar daarvoor heb je een alternatief virtueel toetsenbord nodig. Dergelijke apps vind je voor iOS en Android in de App Store (zoals UniChar) en de Play Store (Unicode Pad).

Foute vrienden

Vooral de apostrof moet vechten voor zijn plaats en wordt vaak vervangen door vergelijkbare symbolen. De hoge komma is typografisch correct, zoals je in hoge resolutie kunt bewonderen op de cover van een nummer van c’t, linksboven in het logo. Hij ziet eruit als een komma die omhoog geschoven is en de Unicode-code 8217 (0x2019) heeft. Bij Windows-1252 wordt hij gecodeerd met 0146 (‘enkel aanhalings­teken rechts’). Als het niet anders kan, mag je de apostrof vervangen door een klein verticaal streepje (‘, 0039, 0x0027), op een Nederlands (VS-internationaal) toetsenbord is dat ‘ en daarna een spatie. Andere accenttekens op een toetsenbord zijn vaak verkeerd. Die zijn bedoeld voor talen zoals het Frans, in combinatie met klinkers, en hebben niets te maken met de apostrof. Ook het symbool dat wordt gebruikt voor de Engelse lengtemaat voet en de boogminuut voor lengte- en breedtegraden (8242, 0x2032) lijkt alleen op het eerste gezicht op de apostrof.

Om je even te laten pauzeren – zoals hier – heb je het gedachtestreepje. Typografisch is dat een zogenaamd en-streepje, met ervoor en erna een spatie. Een fout die je op websites vaak tegenkomt, is dat dit wordt vervangen door een koppelteken, maar dat is duidelijk korter en eigenlijk niet op zijn plaats. Alleen het Unicode-teken 8211 (0x2013) is correct, bij Windows-1252 vind je het via 0150. Bij veel tekst­verwerkers en e-mailprogramma’s is het echter voldoende om twee koppeltekens in te typen (omgeven door spaties), die de autocorrectie dan vervangt door het juiste teken. Hetzelfde teken hoort ook in aan­duidingen zoals ‘Open: 8–10 uur’.

Een populaire fout wordt gemaakt bij rekenkundige symbolen. Het maalteken (×), dat hoort bij vermenigvuldigingen (3 × 3 = 9) en afmetingen (2 × 3 × 4 meter), wordt vaak voor het gemak vervangen door een kleine of hoofdletter ‘x’. Daar is het Unicode-­teken 0215 (0x00d7) correct.

Nu er zoveel aanleiding is om over kooldioxide te schrijven, is het ook de moeite waard om het teken voor het subscript twee te kennen (8322, 0x2082). Het is tenslotte CO2, en niet CO2 of CO2.

Pietjes precies

Je kunt de wens om altijd de typografisch correcte tekens te gebruiken echter ook overdrijven. Een koppelteken (0045, 0x002d) is bijvoorbeeld, als je het heel precies neemt, niet het minteken (8722, 0x2212) dat je bij berekeningen moet gebruiken. In tegenstelling tot het duidelijke verschil tussen een en-­streepje en een koppelteken is het verschil daartussen echter nauwelijks zichtbaar. Ook voor de drie punten die als weglatingsteken (ellips) worden gebruikt, (…) is er een eigen teken (8230, 0x2026), waarin de stippen iets dichter bij elkaar staan. Maar drie gewone punten zijn ook niet verkeerd. Zo zijn er nog veel meer voorbeelden te noemen. De middenpunt (·) (0183, 0x00b7) kan ook van pas komen. Hij staat niet op de basislijn en je kunt hem bijvoorbeeld op een poster of in een menu als een interessant alternatief voor de komma gebruiken: Vis · Vlees · Groenten.

Voor dagelijks gebruik is het handig om de codes of toetscombinaties voor de meest voorkomende ­tekens (en-streepje, apostrof) te onthouden of om de tabel digitaal (of lekker ouderwets op een post-it) bij de hand te houden. Je kunt ook deze online zoekmachine voor Unicode-karakters raadplegen.

Speciale tekens

Teken Unicode decimaal Windows-1252 Unicode hexadecimaalToetscombinaties
Apostrof821701460x2019macOS: Option + Shift + #
Linux: Alt Gr + Shift + N
Vervanging voor apostrof003900390x0027bij indeling VS-international:
‘ + spatie
Vermenigvuldigingsteken021502150x00d7Linux: Alt Gr + komma
En-streepje
(gedachtestreep)
821101500x2013Linux: Alt Gr + minteken
Drie punten/ellips82300x2026Linux: Alt Gr + punt

(Jan Mahn en Marco den Teuling, c’t magazine)

 


Blijf op de hoogte van de nieuwste informatie en tips!
Schrijf je in voor de nieuwsbrief:

Ontvang elke week het laatste IT-nieuws, de handigste tips en speciale aanbiedingen.

 

Lees uitgebreide achtergrondinfo op je gemak in c’t 12/2024

Meer over

Software

Deel dit artikel

Marco den Teuling
Marco den TeulingHad als eerste eigen computer ooit een 16-bit systeem, waar van de 48 kilobyte toch echt niet ‘genoeg voor iedereen’ was. Sleutelt graag aan pc’s, van de hardware tot het uitpluizen van de BIOS-instellingen. Vindt ‘Software as a Service’ een onbedoeld ironische naamgeving.

Lees ook

Met Raspberry Pi port knocking de computers in je netwerk beveiligen

Iedereen die een computer of server met het openbare internet verbindt, wordt al snel het doelwit van hackers. Sommige wetenschappers gaan ervan uit d...

Je Raspberry Pi op afstand bedienen? Zo krijg je het voor elkaar met SSH!

De Raspberry Pi op afstand bedienen is handig en kan op verschillende manieren. Via SSH is het makkelijkste op te zetten, we laten zien hoe.

1 Praat mee
avatar
  Abonneer  
nieuwsteoudste
Laat het mij weten wanneer er
Pieter Dorhout
Lezer
Pieter Dorhout

In Microsoft Office kun je gemakkelijker internationale tekens typen als je het toetsenbord VS international gebruikt, iets wat de meeste Nederlandse gebruiker doen, zoals shift-tilde + n voor een Spaanse ñ. Zie daartoe https://support.microsoft.com/nl-nl/topic/sneltoetsen-voor-internationale-tekens-108fa0c1-fb8e-4aae-9db1-d60407d13c35