2 questions sur le chiffre de Hill.

pornin

18/08/2005 à 10:22

According to Arnaud W. :

Pour fonctionner, il est nécessaire d'obtenir une matrice inversible
modulo 26 (ou 256 si l'espace des caractères à coder est sur 8 bits).
D'où ma première question : existe-t-il un algorithme relativement
performant pour générer une telle matrice (de manière pseudo-aléatoire
bien sûr) ? un algo plus performant que de choisir des coéficients
aléatoirement puis de tester si le déterminant est inversible
modulo 26 (ou 256) et si ce n'est pas le cas, refaire un tirage (ou
incrémenter les coéf les uns après les autres)...

La probabilité d'obtenir une matrice inversible avec des coefficients
aléatoires est assez haute (pas loin de 50% à chaque essai, qu'on
le fasse modulo 26 ou modulo 256), donc cette méthode de sélection
_est_ performante... Le point le plus lent est la vérification de
l'inversibilité de la matrice, ce qui se fait en O(n³) pour une matrice
n*n, ce qui n'est pas la mer à boire.

Ceci étant, il faut bien voir que cette méthode de chiffrement n'est pas
"sûre" : la combinaison est complètement linéaire. Dans le cas d'une
matrice 2*2, il suffit de connaître deux paquets clairs (donc quatre
caractères d'entrée) et les chiffrés correspondants pour reconstruire la
matrice, avec un banal pivot de Gauss. La linéarité transporte également
très bien les propriétés linéaires du texte clair, donc ça ouvre la
porte à toutes les attaques sur texte chiffré si l'information connue de
l'attaquant sur le texte clair est du type "c'est un texte en français"
ou encore "ce sont des octets mais leur huitième bit vaut 0 (texte
ASCII)". Plus généralement, si on groupe les caractères par blocs de n,
on utilise une matrice n*n, on a donc n² coefficients et la sécurité
passe par la fenêtre dès qu'on essaye de chiffrer plus de n² caractères.
En bref, on ferait mieux d'utiliser un One-Time Pad, qui fournit le
même niveau de sécurité mais est beaucoup plus simple à implémenter et
à utiliser...

Ma deuxième question est un peu différente : si j'ai une matrice non
inversible, et que je code un message avec le chiffre de Hill et cette
matrice, est-ce que j'obtiens un hachage cryptographique ?

De fait non, puisque ça reste linéaire et donc n'offre pas du tout les
garanties de sécurité qu'on attend d'une fonction de hachage.

Par ailleurs, une fonction de hachage est censée avoir une sortie de
taille fixe mais accepter des entrées de taille arbitraire. Autrement
dit, fournir (par exemple) 256 bits de sortie, et pas un de plus, même
si je fais rentrer 200 giga-octets de données.

--Thomas Pornin

According to Arnaud W. <ab6y5keot0gpy3h@jetable.net>:

Pour fonctionner, il est nécessaire d'obtenir une matrice inversible
modulo 26 (ou 256 si l'espace des caractères à coder est sur 8 bits).
D'où ma première question : existe-t-il un algorithme relativement
performant pour générer une telle matrice (de manière pseudo-aléatoire
bien sûr) ? un algo plus performant que de choisir des coéficients
aléatoirement puis de tester si le déterminant est inversible
modulo 26 (ou 256) et si ce n'est pas le cas, refaire un tirage (ou
incrémenter les coéf les uns après les autres)...

La probabilité d'obtenir une matrice inversible avec des coefficients
aléatoires est assez haute (pas loin de 50% à chaque essai, qu'on
le fasse modulo 26 ou modulo 256), donc cette méthode de sélection
_est_ performante... Le point le plus lent est la vérification de
l'inversibilité de la matrice, ce qui se fait en O(n³) pour une matrice
n*n, ce qui n'est pas la mer à boire.

Ceci étant, il faut bien voir que cette méthode de chiffrement n'est pas
"sûre" : la combinaison est complètement linéaire. Dans le cas d'une
matrice 2*2, il suffit de connaître deux paquets clairs (donc quatre
caractères d'entrée) et les chiffrés correspondants pour reconstruire la
matrice, avec un banal pivot de Gauss. La linéarité transporte également
très bien les propriétés linéaires du texte clair, donc ça ouvre la
porte à toutes les attaques sur texte chiffré si l'information connue de
l'attaquant sur le texte clair est du type "c'est un texte en français"
ou encore "ce sont des octets mais leur huitième bit vaut 0 (texte
ASCII)". Plus généralement, si on groupe les caractères par blocs de n,
on utilise une matrice n*n, on a donc n² coefficients et la sécurité
passe par la fenêtre dès qu'on essaye de chiffrer plus de n² caractères.
En bref, on ferait mieux d'utiliser un One-Time Pad, qui fournit le
même niveau de sécurité mais est beaucoup plus simple à implémenter et
à utiliser...

Ma deuxième question est un peu différente : si j'ai une matrice non
inversible, et que je code un message avec le chiffre de Hill et cette
matrice, est-ce que j'obtiens un hachage cryptographique ?

De fait non, puisque ça reste linéaire et donc n'offre pas du tout les
garanties de sécurité qu'on attend d'une fonction de hachage.

Par ailleurs, une fonction de hachage est censée avoir une sortie de
taille fixe mais accepter des entrées de taille arbitraire. Autrement
dit, fournir (par exemple) 256 bits de sortie, et pas un de plus, même
si je fais rentrer 200 giga-octets de données.

--Thomas Pornin

Vous avez filtré cet utilisateur ! Consultez son message

According to Arnaud W. :

Pour fonctionner, il est nécessaire d'obtenir une matrice inversible
modulo 26 (ou 256 si l'espace des caractères à coder est sur 8 bits).
D'où ma première question : existe-t-il un algorithme relativement
performant pour générer une telle matrice (de manière pseudo-aléatoire
bien sûr) ? un algo plus performant que de choisir des coéficients
aléatoirement puis de tester si le déterminant est inversible
modulo 26 (ou 256) et si ce n'est pas le cas, refaire un tirage (ou
incrémenter les coéf les uns après les autres)...

La probabilité d'obtenir une matrice inversible avec des coefficients
aléatoires est assez haute (pas loin de 50% à chaque essai, qu'on
le fasse modulo 26 ou modulo 256), donc cette méthode de sélection
_est_ performante... Le point le plus lent est la vérification de
l'inversibilité de la matrice, ce qui se fait en O(n³) pour une matrice
n*n, ce qui n'est pas la mer à boire.

Ceci étant, il faut bien voir que cette méthode de chiffrement n'est pas
"sûre" : la combinaison est complètement linéaire. Dans le cas d'une
matrice 2*2, il suffit de connaître deux paquets clairs (donc quatre
caractères d'entrée) et les chiffrés correspondants pour reconstruire la
matrice, avec un banal pivot de Gauss. La linéarité transporte également
très bien les propriétés linéaires du texte clair, donc ça ouvre la
porte à toutes les attaques sur texte chiffré si l'information connue de
l'attaquant sur le texte clair est du type "c'est un texte en français"
ou encore "ce sont des octets mais leur huitième bit vaut 0 (texte
ASCII)". Plus généralement, si on groupe les caractères par blocs de n,
on utilise une matrice n*n, on a donc n² coefficients et la sécurité
passe par la fenêtre dès qu'on essaye de chiffrer plus de n² caractères.
En bref, on ferait mieux d'utiliser un One-Time Pad, qui fournit le
même niveau de sécurité mais est beaucoup plus simple à implémenter et
à utiliser...

Ma deuxième question est un peu différente : si j'ai une matrice non
inversible, et que je code un message avec le chiffre de Hill et cette
matrice, est-ce que j'obtiens un hachage cryptographique ?

De fait non, puisque ça reste linéaire et donc n'offre pas du tout les
garanties de sécurité qu'on attend d'une fonction de hachage.

Par ailleurs, une fonction de hachage est censée avoir une sortie de
taille fixe mais accepter des entrées de taille arbitraire. Autrement
dit, fournir (par exemple) 256 bits de sortie, et pas un de plus, même
si je fais rentrer 200 giga-octets de données.

--Thomas Pornin

Arnaud W.

18/08/2005 à 11:14

1) Merci pour la réponse sur la génération de matrice inversible. La
méthode naive est donc suffisament performante.
2) Concernant la sécurité du chiffrement de Hill, j'avais bien
conscience que ce n'est pas le graal (et même loin de là),
j'implémente des algorithmes historiques dans un petit soft (en Java)
sans prétention.
3) Concernant la non inversibilité, j'aimerais e surtout savoir, si je
donne un message chiffré (avec des informations sur la langue
utilisée et la valeur de la clef-matrice par ex) avec une matrice non
inversible (suffisament grande), s'il y a une méthode pour retrouver
le texte clair plus performante que d'essayer toutes les valeurs
possibles pour le texte clair (ce qui est, à priori, un problème
complexe si la taille de la clef et le texte clair sont grands).

Je pars de l'idée que si la matrice est non inversible, on ne peut
trouver les solutions du système d'équations linéraires formés à
partir du texte chiffré et de la clef (fournie), n'est ce pas ?
D'ailleurs, peut être existe-t-il une technique de construction de la
matrice non inversible pour la rendre plus "résistante" ?

Arnaud W.

http://awr.free.fr

pornin

18/08/2005 à 17:44

According to Arnaud W. :

Je pars de l'idée que si la matrice est non inversible, on ne peut
trouver les solutions du système d'équations linéraires formés à
partir du texte chiffré et de la clef (fournie), n'est ce pas ?

Si, on peut trouver les solutions. Le problème est justement dans ce
"les". Quand la matrice est inversible, la solution est unique. Quand
elle n'est pas inversible, la solution n'est pas unique : l'espace des
solutions est un sous-espace affine dont le degré dépend du rang de la
matrice. Par pivot de Gauss (i.e. résolution "à la main"), on peut
arriver à extraire une base de ce sous-espace, qui permet d'énumérer
toutes les solutions de façon optimale.

Ce n'est pas de la sécurité : ça veut juste dire qu'avec une matrice
non inversible, plusieurs messages clairs donnent le même chiffré.
L'opération de déchiffrement est alors impossible dans toute sa
généralité, qu'on connaisse la matrice ou pas : de l'information a été
simplement détruite. C'est la même chose que de dire "on va chiffrer
en effaçant un caractère sur trois" (la matrice rajoute une transposition
jusque vers un sous-espace vectoriel mais tout cela est linéaire et
rapidement accessible à l'attaquant aussi).

Tout cela reste distinct d'une fonction de hachage, car dans
une fonction de hachage, la taille de la sortie doit être fixe,
indépendamment de celle de l'entrée.

--Thomas Pornin

Arnaud W.

19/08/2005 à 09:42

Merci pour cette réponse éclairée.

Les cours de math sont si loin...;o)

2 questions sur le chiffre de Hill.

4 réponses

Veuillez sélectionner un problème