Twitter iPhone pliant OnePlus 11 PS5 Disney+ Orange Livebox Windows 11

Sauvegarder les cookies avec wget ?

5 réponses
Avatar
bersyl91
Bonjour,

J'essaie désespérément de sauvegarder des cookies avec wget.

Apparemment, c'est très simple, il suffit de :

wget --save-cookies cookie.txt --keep-session-cookies http://tf1.fr
(par exemple).

L'ennui, c'est que, de cookies, point. Le fichier "cookie.txt" est bien
créé, mais il contient désespérément toujours les 90 mêmes octets :

# HTTP cookie file.
# Generated by Wget on 2009-07-30 12:33:09.
# Edit at your own risk.


J'ai demandé à un collègue qui m'a dit avoir eu le même comportement.
J'ai essayé d'utiliser curl qui sauvegarde très bien les cookies, mais
qui n'est pas récursif (j'ai besoin de cette fonctionnalité).

Bref : comment faire pour récupérer les cookies de toute une
arborescence web ?

Merci de votre attention.

--
Bernard Choppy

5 réponses

Avatar
Fabien LE LEZ
On Thu, 30 Jul 2009 12:52:21 +0200, bersyl91 :

wget --save-cookies cookie.txt --keep-session-cookies http://tf1.fr
(par exemple).



En effet, avec tf1.fr ça foire. Ça a probablement un rapport avec le
fait que la page http://tf1.fr ne renvoie pas de cookie.

En revanche, avec google.com ça marche bien.
Avatar
Mihamina Rakotomandimby
07/30/2009 01:52 PM, bersyl91:
Bref : comment faire pour récupérer les cookies de toute une
arborescence web ?



Je pencherais pour le site qui se comporte différemment selon les User-agent.
Fournir un User-agent plus populaire et voir si ça change quelquechose.
Avatar
bersyl91
Fabien LE LEZ a écrit :
En effet, avec tf1.fr ça foire. Ça a probablement un rapport avec le
fait que la page http://tf1.fr ne renvoie pas de cookie.



Oups !

En revanche, avec google.com ça marche bien.



Effectivement. Mais par exemple, orange.fr renvoie des cookies à curl
mais pas à wget. J'ai essayé en changeant la user_agent string, même
résultat. Une idée ?
Avatar
Fabien LE LEZ
On Fri, 31 Jul 2009 17:49:40 +0200, bersyl91 :

Effectivement. Mais par exemple, orange.fr renvoie des cookies à curl
mais pas à wget.



Une requête "GET /" sur l'hôte "orange.fr" ne renvoie pas de header
"Set-cookie".
En revanche, le code HTML renvoyé contient du code Javascript, qui
lui-même ajoute des cookies.
Curl a peut-être un interpréteur Javascript ?

Note : pour tes tests, je te conseille fortement d'utiliser l'option
--save-headers de wget, qui permet de vérifier si le serveur renvoie
effectivement des cookies.
Avatar
bersyl91
Fabien LE LEZ a écrit :
On Fri, 31 Jul 2009 17:49:40 +0200, bersyl91 :



Note : pour tes tests, je te conseille fortement d'utiliser l'option
--save-headers de wget, qui permet de vérifier si le serveur renvoie
effectivement des cookies.



Ok, je teste tout ça, merci bien.