Priemgetallen en geheimschrift

Al eeuwenlang zijn de "ondeelbare getallen" onderzocht. Daarbij gaat het om precies te zijn om natuurlijke getallen (meestal vanaf de $2$ ) die alleen door zichzelf en door $1$ zijn te delen. Ze heten priemgetallen en hebben bijzondere eigenschappen. Bovendien worden ze tegenwoordig ingezet bij het versleutelen van internetverkeer...

Inhoud:

Priemgetallen
De grote zoektocht
Modulorekenen
Geheimschriften
Enigma
Onbreekbare code
Internetverkeer

Priemgetallen

Een priemgetal is een getal dat alleen deelbaar is door $1$ en door zichzelf.
$7$ is een voorbeeld van een priemgetal.
$1$ wordt niet meegeteld, $2$ is het eerste priemgetal.
$8$ is een voorbeeld van een getal dat niet priem is: het is ook deelbaar door $2$ en $4$ .
De eerste priemgetallen zijn `2, 3, 5, 7, 11, 13, 17, 19, 23, 29, 31, 37, 41, …`
Priemgetallen zijn al heel lang bekend. Ze werden beschouwd als de "onbreekbare bouwstenen" van de getallen. Dat komt omdat elk natuurlijk getal groter dan 1 op precies één manier als product van priemgetallen te schrijven is.

Bijvoorbeeld: `520 = 2^3 * 3 * 7 * 31`.

Elk natuurlijk getal bestaat uit zo'n product van priemfactoren. Je kunt de priemfactoren van een getal vinden door het telkens door de priemgetallen `2, 3, 5, 7, 11, 13`, enz., te delen tot er een priemgetal over blijft.
De grote Griekse wiskundige Euklides bewees dit al zo'n 2200 jaar geleden in zijn beroemde boek "De Elementen".
Hij stelde ook dat er oneindig veel priemgetallen zijn.
Het bewijs van die stelling is een klassiek voorbeeld van een "indirect bewijs".

De grote zoektocht

Priemgetallen hebben de mens altijd gefascineerd vanwege hun bijzondere eigenschappen en omdat ze moeilijk te vinden zijn. Van heel grote getallen is het namelijk heel tijdrovend om vast te stellen of het priemgetallen zijn of niet. Om er achter te komen of bijvoorbeeld een getal als `40432171` een priemgetal is, moet je onderzoeken of er een kleiner getal is (maar groter dan `1`) waar je het door kunt delen.
De meest gebruikelijke manier om priemgetallen te vinden is de zeef van Erathostenes. Daarbij zet je eerst alle natuurlijke getallen vanaf `2` op een rijtje. Vervolgens "zeef" je alle getallen die je kunt delen door `2` er uit, vervolgens alle getallen die je kunt delen door `3`, daarna alle getallen die je kunt delen door `5` (`4` is al weg gezeefd!), enzovoort. En hoewel een computer dat tegenwoordig behoorlijk snel kan, blijft het voor grote getallen onbegonnen werk. Want ze lijken wel steeds verder uit elkaar te liggen naarmate je bij grotere getallen komt.

Hier een paar prangende vragen rond priemgetallen:

Er zijn oneindig veel priemgetallen, maar naarmate je verder op de getallenlijn komt, wordt hun dichtheid kleiner. Is er een maat voor die dichtheid?
Er bestaan paren priemgetallen, bijvoorbeeld `11` en `13`, `17` en `19`, `29` en `31`, `41` en `43`. Bestaan die paren tot in het oneindige?
Veel mensen hebben geprobeerd een formule voor priemgetallen te vinden, maar dat is niet gelukt. Bijvoorbeeld is `n^2 + n + 41` (met `n = 0,1,2,3,4,5,...`) een formule die veel priemgetallen oplevert, maar hij werkt in ieder geval al niet voor `n = 41`.
De wiskundige Goldbach vermoedde dat elk even getal de som was van twee priemgetallen, bijvoorbeeld: `24 = 11 + 13`, `36 = 17 + 19`, enz. Er is nog geen tegenvoorbeeld gevonden, maar bewezen is dit "vermoeden van Goldbach" nog niet!
De Franse wiskundige Marin Mersenne zocht alle priemgetallen van de vorm `2^n - 1 `, met `n = 0,1,2,3,4,5,...`. Hij vond veel van die Mersenne-priemgetallen, maar kwam niet verder in zijn onderzoek dan `n = 257`.
Het leek er op dat `2^n - 1 ` een priemgetal is als `n` zelf priem is, maar in 1536 vond Hudalricus Regius dat dit niet waar is voor `n = 11`: `2^11 - 1 = 2047 = 23 * 89`. Het blijkt nu dat het zelfs maar heel zelden is dat `2^n - 1 ` een priemgetal is. Tot dusver zijn er slechts 39 van deze getallen gevonden en de grootste is momenteel `2^(13.466.917) - 1`, een getal van maar liefst 4.053.496 cijfers! Wel geldt andersom dat als `2^n - 1` een priemgetal is, dat dan `n` ook een priemgetal moet zijn. Kijk maar eens bij de website van de wereldwijde zoektocht naar Mersenne-priemgetallen!

Maar waarom is het interessant genoeg om een hele zoektocht is naar zo groot mogelijke priemgetallen te houden dat heel wat computerrekentijd aan wordt besteed?
Dat heeft te maken met de manieren waarop het tegenwoordige internetverkeer in elkaar zit. Allerlei instellingen en bedrijven willen berichten en transacties naar elkaar en van hun klanten geheim houden voor derden. En daarbij spelen priemgetallen een rol.

Modulo rekenen

Het modulo rekenen is een uitbreiding van "klokrekenen".
Op de klok reken je namelijk met uren door weglaten van `12`-vouden: `9` uur `+ 7` uur = `4` uur (eigenlijk `16` uur). Er bestaan trouwens zoals je hiernaast ziet ook `24`-uurs klokken en trein-, bus- en tramdienstregelingen rekenen modulo `24`.

Zo kun je ook met andere natuurlijke getallen modulo rekenen. Je laat dan de veelvouden van dat getal weg.
Zo is `13 = 1 (text(mod.)12)` en `36 = 0 (text(mod.)12)`.
Daarin betekent `text(mod.)12` dat je veelvouden van `12` weglaat.
Ga na dat:
`7 + 8 (= 15) = 3 (text(mod.)12)`
`37- 18 (= 19) = 7 (text(mod.)12)`
`7 * 8 (= 56) = 8 (text(mod.)12)`

Je ziet dat optellen, aftrekken en vermenigvuldigen modulo `12` goed is te doen. Ook kun je aantonen dat je bij grote getallen eerst de `12`-vouden mag weglaten en dan pas één van deze bewerkingen uitvoeren. Bijvoorbeeld:
`37 - 18 =13(text(mod.)12) - 6(text(mod.)12) = 7 (text(mod.)12)`
Bewijs zelf dat dit algemeen voor deze drie bewerkingen opgaat.
Het betekent dat je voor rekenen `text(mod.)12` alleen tabellen nodig hebt voor de getallen `0, 1, 2, ..., 11`. Je krijgt zo een heel overzichtelijke vermenigvuldigtabel.

Delen is een heel ander verhaal...
Dat komt niet altijd op een geheel getal uit, dus heb je er in veel gevallen niet veel aan. Maar soms toch wel:
bij gewoon rekenen kun je een vermenigvuldiging met bijvoorbeeld 8 ongedaan maken door terugrekenen, dus delen door 8. Maar bij modulorekenen gaat dat niet zo simpel:
`7 * 8 (= 56) = 8 (text(mod.)12)`,
maar hoe kom je van `8 (text(mod.)12)` weer terug naar die `7`?

Je moet daarvoor op een andere manier tegen terugrekenen aankijken:
het terugrekenen vanuit een vermenigvuldiging met `8` doe je door vermenigvuldigen met het omgekeerde van `8`, namelijk `1//8`.
Je noemt `1//8` wel de inverse van 8.
Die inverse van `8` is het getal dat vermenigvuldigd met `8` precies `1` oplevert: `8 * 1/8 = 1`.
Daarom krijg je uit `7 * 8 = 56` ook de `7` terug door met de inverse van `8` te vermenigvuldigen: `7 * 8 * 1/8 =7 * 1 = 7`.

Maar hoe moet je nu terugrekenen in het modulosysteem?
Je moet dan dus de inverse van een getal `x` vinden.
En dat is het getal `y` dat vermenigvuldigt met `x` precies `1` oplevert:
als `x * y = 1 (text(mod.)12)`,
dan zijn `x` en `y` elkaars inverse bij rekenen modulo `12`.

Als je de vermenigvuldigtabel mod.12 nog eens bekijkt zie je dat de meeste getallen helemaal geen inverse hebben. Alleen `5`, `7` en `11` hebben een inverse en (toevallig) is de inverse van `5` gelijk aan `5`, die van `7` gelijk aan `7` en die van `11` gelijk aan `11`.
Zoek zelf maar eens uit welke getallen een inverse hebben bij bijvoorbeeld rekenen modulo `8`.
Je zult zien dat het getallen zijn die geen delers gemeen hebben met `8`.
En dat geldt in het algemeen: bij rekenen `text(mod.)z` hebben alleen getallen die geen delers gemeen hebben met `z` en groter zijn dan `3` een inverse. Je kunt die bepalen uit een vermenigvuldigtabel, al is dat wel veel werk bij grote getallen. (Misschien kun je een slimmere manier opzoeken of zelf bedenken?)

De zogenaamde Eulerfunctie `varphi(n)` geeft voor elk natuurlijk getal weer hoeveel kleinere natuurlijke getallen er zijn die geen priemfactor met `n` gemeen hebben.
Bijvoorbeeld: `varphi(8) = 4` want `1, 3, 5` en `7` hebben geen priemfactoren met `8` gemeen en `2`, `4` en `6` wel.
Voor een priemgetal `p` geldt natuurlijk `varphi(p) = p - 1`
Voor een product van twee priemgetallen `p * q` geldt: `varphi(p * q) = p * q - p - q + 1 = (p - 1)(q - 1)`.
(Dat kun je vast wel zelf bewijzen!)

Geheimschriften

Al heel lang worden geheimschriften gebruikt. De studie ervan heet cryptologie. Het schrijven van geheimschrift is cryptografie.

Eenvoudige codes

Julius Caesar had een gemakkelijk systeem ontdekt: hij verving elke letter door een letter die drie plaatsen verderop in het alfabet staat.

Je ziet dat elke letter zo wordt vervangen door één andere letter. Caesar had geen andere tekens nodig: de Romeinse cijfers zijn ook letters: 1 = I, 5 = V, 10 = X, 50 = L, 100 = C, 500 = D en 1000 = M. de andere getallen zijn combinaties van die letters.

Je noemt dit opschuiven van drie letters wel Caesarcode C3. Je kunt natuurlijk ook afspreken dat je steeds 5 letters opschuift: Caesarcode C5. En zo zijn er allerlei afspraken mogelijk.
In C3 wordt WISKUNDEWEB vertaalt in ZLVNXQGHZHE.
Dit noem je coderen, vercijferen, of versleutelen. De sleutel is de afspraak dat je C3 gebruikt.
Het weer terugvertalen naar de oorspronkelijke tekst (die heet wel klare tekst) noem je decoderen, ontcijferen, of ontsleutelen. Hier doe je dat door alle letters van de code weer 3 plaatsen terug te schuiven, Caesarcode C3.

Omdat alleen de verzender van het bericht en de ontvanger ervan weten welke sleutel is gebruikt, kunnen zij decoderen. Derden die de sleutel niet weten moeten moeite voor doen om te achterhalen wat de sleutel is. Dat noem je het kraken van een code.

De Caesarmethode is een voorbeeld van een code waarbij elk teken wordt vervangen door telkens hetzelfde andere teken. Dat heet monosyllabische substitutie.
Een ander voorbeeld daarvan is de zogenaamde Pigpen-code, waarvan je hier zowel de sleutel als WISKUNDEWEB in geheimschrift ziet.

Frequentie-analyse

Elke taal heeft een belangrijke eigenschap: niet alle letters komen even vaak voor.
Bijvoorbeeld in het Nederlands komt de E komt het meest voor, gevolgd door de A, enzovoorts. Alleen als spaties ook worden gecodeerd moet je er rekening mee houden dat die nog vaker voorkomen (na bijna elk woord).
Omdat de E het vaakst voorkomt zal bij monosyllabische substitutie in het geheimschrift het teken dat het vaakst voorkomt waarschijnlijk een E zijn (of een spatie!). Dus zoek je eerst naar het teken dat in je code het vaakst voorkomt.

Het aantal keren dat een teken voorkomt heet de frequentie van dat teken. Het tellen van het aantal keren dat de verschillende tekens in een tekst voorkomen heet een frequentieanalyse van die tekst. Je legt er dan een frequentieverdeling van de Nederlandse letters naast en vergelijkt de frequenties met elkaar. Je hebt er wel een behoorlijk grote lap tekst in code voor nodig, want anders zullen de frequenties niet overeenkomen. Bijvoorbeeld WISKUNDEWEB telt evenveel W"s als E"s en alle andere letters hebben een frequentie van 1; dat schiet niet op bij frequentieanalyse.

De Vigenére-code

Monosyllabische substitutie is dus bij grotere berichten niet erg veilig want gemakkelijk te kraken. In 1585 werd er een veiliger geheimschrift uitgevonden. De uitvinding van het nieuwe geheimschrift wordt toegeschreven aan de Fransman Blaise de Vigenére, je spreekt van Vigenérecode.
Daarbij wordt het Vigenérevierkant gebruikt. De sleutel is een afgesproken woord, het sleutelwoord.

Hoe codeer je nu WISKUNDEWEB?

Kies een sleutelwoord, bijvoorbeeld: CODE.
De letters van WISKUNDEWEB zoek je in de eerste rij. De letters van de sleutel CODE in de eerste kolom.
Je vervangt dan de W door de letter eronder die naast de C staat.
Je vervangt de I door de letter eronder die naast de O staat.

Enzovoort...
Je vindt: YWVOWBGEYSE.

Toevallig (omdat WISKUNDE 8 letters is en het codewoord 4 letters is) worden hier beide W"s door dezelfde letter Y vervangen. Maar dat is vrijwel nooit het geval, een letter kan nu worden vervangen door steeds verschillende letters omdat je van meerdere alfabetten gebruikt maakt. Probeer het maar uit...

Dit heet polyalfabetische substitutie.
Met frequentieanalyse alleen kun je deze code niet kraken, dus vele jaren dacht men dat hij onbreekbaar was. Het decoderen lukt alleen met behulp van het codewoord, ga zelf na hoe je dit moet doen.

In de negentiende eeuw werd een manier gevonden om de Vigenérecode te kraken. Aan de codering van het woord WISKUNDEWEB met het sleutelwoord CODE kun je zien hoe dit in zijn werk zou moeten gaan. Juist omdat het codewoord steeds opnieuw wordt gebruikt, krijgt de letters W die 4, of 8, of 16, of ... (veelvoud van 4) verder zitten dezelfde code.
In 1863 bedacht de Pruissische majoor Kasiski een systematische manier om deze code te kraken.
Hij gokte de lengte van het sleutelwoord, bijvoorbeeld vier tekens. Hij bekeek dan de frequentieverdeling van de letters om de vier tekens. Als het sleutelwoord inderdaad vier tekens is, vind je voor die letters ongeveer de frequentieverdeling die voor de taal in kwestie normaal is. Als het sleutelwoord niet vier tekens is, wordt de frequentieverdeling van die letters gelijkmatig: alle tekens ongeveer evenveel. En zo kun je door proberen de lengte van het sleutelwoord te weten komen en na wat puzzelen de code kraken.

Enigma

Na het kraken van de Vigenérecode was een nieuw systeem nodig.
In 1920 kwam de Amerikaan Edward Hebern met iets nieuws. Hij voorzag een typemachine van een draaiend wiel, dat er voor zorgt dat bij het intypen van een bepaalde letter een andere letter wordt afgedrukt. Hier zie je zijn prototype.

In de Tweede Wereldoorlog gebruikte de Duitse marine de Enigma codeermachine die erg op de Hebern-machine leek voor hun U-boten (onderzeeboten). Ze typten een bericht op de Enigma en schreven op welke lampjes (letters) er gingen branden. Daarna werd de versleutelde boodschap via een telegraaf doorgeseind.

De Enigma-machine was gebaseerd op een systeem van drie rotors die er voor zorgden dat de klare tekst werd gecodeerd. Die rotors draaiden ten opzichte van elkaar.
Eerst werd via een geheim codeboek de begininstelling van de Enigma gekozen, per dag een andere. Die begininstelling zorgde er bijvoorbeeld voor dat een ingetypte W door de eerste rotor veranderde in een P, waarna door de tweede de P in een M en door de derde de M in een A. Uiteindelijk werd de W dus een A. Typte je dan een opnieuw een letter W dan draaide de eerste rotor een slag, dus W wordt Q en dan wordt Q door de tweede rotor veranderd in N en N door de derde in B. Dus nu wordt W gecodeerd tot B. Zo wordt een letter elke keer veranderd in een andere letter. De rotors konden `26 * 26 * 26` posities ten opzichte van elkaar hebben.

De Britse geheime dienst was er veel aan gelegen om die code te breken. De wiskundige Alan Turing zat in het team dat zich ermee bezig hield. Dit leidde tot de uitvinding van de computer!
Meer over de Enigma vind je hier:

Onbreekbare code

Het principe van de volgende versleuteling is al in 1917 bedacht door Gilbert Sandford Vernam, een Amerikaans cryptograaf. In feite is zijn methode hetzelfde als die van Vigenére. Het probleem van het raden van de lengte van het sleutelwoord loste hij eenvoudig op door voor het "sleutelwoord" een verzameling willekeurige tekens te kiezen die even lang was als de klare tekst. Dit sleutelwoord stuurde hij ook niet mee: hij bedacht het systeem van "heen-en-weer-sturen" om te decoderen.
Je wilt weer het woord WISKUNDEWEB coderen. Je gebruikt de (geheime) sleutel BZAXDEFKPRW en codeert met het Vigenérevierkant. Dat levert op: XHSHXRIOLVX. Jij bent nu de verzender V en O is de ontvanger.

V heeft de sleuteltekst gekozen die O niet weet. V heeft het woord WISKUNDEWEB gecodeerd tot XHSHXRIOLVX.
V verzendt het geheimschrift naar O.
O codeert het ontvangen geheimschrift met het Vigenérevierkant en een eigen sleuteltekst (b.v. PEDMWQADEGH) en codeert daarmee V's geheimschrift tot: MLVTTHIRPBE.
V decodeert dit geheimschrift met zijn eigen sleuteltekst en vindt LMVWQDDHAKI dat hij naar O stuurt.
O decodeert het laatste ontvangen geheimschrift met zijn sleuteltekst. Als het goed is vindt hij het juiste woord WISKUNDEWEB.

Speel dit maar even na...

Bij de intrede van de computer is het systeem verder ontwikkeld.
Computers gebruiken vaak voor tekens de zogenaamde ASCII (American Standard Code for Information Interchange). Elk teken (byte) bestaat daarin uit 8 nullen of énen, 8 bits. Hier zie je de ASCII-tabel.
De codering van het woord WISKUNDEWEB doe je nu stap voor stap (zelf doen!).

Zoek op hoe het woord er in nullen en énen uitziet volgens de ASCII-tabel.
De sleuteltekst is elf willekeurige ASCII-tekens. (Denk er om dat de sleuteltekst altijd even lang moet zijn als de te coderen tekst!) Kies zelf een sleuteltekst en zet die ook om in ASCII.
Nu ga je deze twee rijen nullen en énen op de volgende manier versleutelen:
- Bekijk de eerste bit van beide rijen. Zijn beide gelijk (allebei 0 of allebei 1) dan wordt de eerste bit van de code ook een 0. Zijn beide niet gelijk, dan wordt de eerste bit van de code een 1.
- Daarna doe je hetzelfde met de twee tweede bits van beide rijen, enz.
- Zo bouw je een nieuwe rij van `11 * 8 = 88` nullen en énen op. Deze rij zet je weer met de ASCII-tabel om in de codetekst (elf tekens, elf bytes).
Je hebt nu een code voor het woord WISKUNDEWEB.
V is de verzender, O de ontvanger.
- V kiest een sleuteltekst die O niet weet. V heeft het woord WISKUNDEWEB gecodeerd.
- V verzendt het geheimschrift naar O.
- O codeert het ontvangen geheimschrift met een eigen sleuteltekst en stuurt V zijn geheimschrift.
- V decodeert dit geheimschrift met zijn eigen sleuteltekst en vind een nieuw woord dat hij naar O stuurt. (Decoderen gaat door nogmaals coderen!)
- O decodeert het laatste ontvangen geheimschrift met zijn sleuteltekst. Als het goed is vindt hij het juiste woord WISKUNDEWEB.

Deze Vernamcodering is in principe onbreekbaar. Het nadeel is dat je veel handelingen moet verrichten en steeds berichten heen en weer moet sturen: er is veel dataverkeer nodig!

Internetverkeer

Banken willen niet veel berichten heen en weer sturen als een klant betalingen moet doen. Dat kost tijd en dat vindt de klant hinderlijk en de bank te duur. Daarom gebruiken zij een coderingssysteem waarbij aan de kant van de gebruiker iedereen zijn betalingsopdracht kan vercijferen, maar alleen de bank in staat is om die opdracht ook weer te ontcijferen. De wiskundigen Rivest, Shamir en Adleman bedachten in 1978 een geschikt systeem dat RSA wordt genoemd. Het is gebaseerd op rekenen met priemgetallen en op modulo rekenen.

Hoe werkt nu RSA?

Stel je voor je wilt het woord WISKUNDEWEB coderen.

Eerst maak je van elk teken een getal door het om te zetten in de bijbehorende ASCII-code.
Nu kies je twee priemgetallen `p` en `q`.
Normaal gesproken worden daarvoor gigantisch grote getallen gekozen, maar dan wordt voor een eerste kennismaking het rekenwerk veel te lastig. Dus neem `p = 13` en `q = 23`.
Bereken het product: `N = p * q = 13 * 23 = 299`.
Verder bereken je: `M = (p - 1) * (q - 1) = 12 * 22 = 264`. (Dit is het aantal natuurlijke getallen dat geen priemfactoren met `p * q` gemeen heeft.)
Daarna kies je een getal tussen 3 en `M` in, dus tussen 3 en 299. Dit getal mag echter geen deler hebben die `M` ook heeft. Dit getal `S` is de coderingssleutel.
Bijvoorbeeld `S = 5` voldoet aan de voorwaarden.
Nu kun je aan het coderen met behulp van de getallen `S = 5` en `N = 299`.
Daartoe vertaal je elk teken van WISKUNDEWEB in ASCII-code: 87 73 83 75 85 78 68 69 87 69 66.
Doe elk teken tot de macht `5`. Vervolgens trek je er zo vaak mogelijk `299` van af. (Je berekent dus `B` (mod.299) waarin `B` het blokje voorstelt.)
Zet alles achter elkaar en je hebt je geheimschrift.

De getallen `N` en `S` vormen de publieke sleutel. Die mag iedereen weten, dus zo kan iedereen een bericht versleutelen.

Om het gecodeerde woord weer te decoderen heb je de decodeersleutel `D` nodig.
Die decodeersleutel moet voldoen aan `D * S = 1 (text(mod.) M)`, dus in dit geval aan `D * 5 = 1 (text(mod.)264)`.
(Bij het modulorekenen kun je nu nalezen waarom `S` een getal boven de 3 moest zijn en geen gemeenschappelijke delers met `M` mocht hebben.)
Deze `D` (hier dus bijvoorbeeld `53`) is de geheime sleutel die alleen bekend is aan degene die moet decoderen.

Je decodeert nu door de afzonderlijke cijfers van het geheimschrift tot de macht `D` te doen en er veelvouden van 299 (= `N`) van af te trekken.
Decodeer je gecodeerde woord WISKUNDEWEB en ga na dat je dit woord weer terug krijgt.

Math4all