[Aide, svp] Problèmes pr recherche par mots-clés dans archives perso (10Go zippés)

Le
lip
Salut,

Voilà j'aurais besoin de conseils :
Je stocke beaucoup d'articles de presse lus et sauvegardés à partir
d'internet depuis plusieurs années sous les formats suivants: html, htm,
doc, pdf

Jusqu'à présent, je faisais de temps en temps des recherches par mots-clés
par la fonction de windows "rechercher dans le texte" [F3]. Cà bourinait
pendant 20 minutes et çà arrivait à me trouver quelques fichiers.

En fait, chaque mois je zippais mes archives dans différents dossiers
standardisés (français/anglais) car cela me permettait de pouvoir
sauvegarder ces archives du mois sur CDROM et évitait de potentiels
problèmes d'erreurs (scandisk) sur mon disque dur. Car le problème n'est pas
la taille du texte en lui même mais tous les petits fichiers images
automatiquement logés dans les sauvegardes html qui se greffent et dont la
plupart ne me sont pas utiles.

Il y pas longtemps je me suis mis à utiliser le freeware "InfoRapid Search &
Replace" pour la recherche par mots-clés : génial! sauf que je viens de me
rendre compte que lors de recherches de mots-clés dans les fichiers "Zip",
il me fait la recherche (pendant environ 20 minutes pour 10 Go zippés) mais
il ne trouve pas les articles qui existent pourtant dans mes archives. Donc
je réalise du coup que la recherche de Windows [F3] me faisait la même chose
avec les fichiers zippés (alors qu'il me semblait avoir fait des tests et
que çà fonctionnait il y a plusieurs années)! ;-(

Pour l'exemple: J'ai essayé de dezippé un partie de mes fichiers archives
zippés :
De 40 fichiers zip (400Mb), j'arrive à une taille de 1,6 Go une fois
dézippés pour environ 200 000 fichiers.
Ainsi pour faire une recherche avec "InfoRapid Search & Replace" il me mets
environ 6 minutes.


Mes questions pour finir :

J'ai bien peur que mes 10 Go une fois dézippés, prennent 60 Go et que mon
disque dur seagate ne le supporte pas très lontgemps vu la mutliplication de
fichiers à prévoir (il contient déjà environ 600000 fichiers!)?
J'entends parlé de disque dur en serial Ata, serait-ce valable dans mon cas?

Je pensais aussi à acheter un disque dur plus rapide que 7200t/m (mais bon
c'est un peu cher à priori pour moi)?

Y-aurait-il un moyen de faire une indexation automatique de mes fichiers
d'archives qui me permettrait d'accélerer la vitesse de mes recherches par
mots-clés et en même temps de minimiser les problèmes de scandisk (j'ai
remarqué qu'ils pouvaient souvent survenir quand par exemple je sauvegardais
des articles d'un même site web et qu'il y avait les mêmes noms pour
certains petits fichiers images au sein du fichier principal html)?

Peut-être existerait-il un moyen de supprimer les fichiers images (gif, jpg)
inférieurs à 2Ko par exemple (même si cela ne ne supprimerait pas le nombre
de sous-dossiers qui comportent ces images) ?

Mille mercis par avance,
Lip

Mon ordi : WinXp, P2200AMD , 640MB RAM , DDur 1: Seagate 120Go 7200t (8Mb)
NTFS, Ddur 2: IBM 120Go 7200t(vieux) Win98se FAT32.
  • Partager ce contenu :
Vos réponses
Trier par : date / pertinence
lip
Le #920071
Salut VaN,

Piste logicielle :
Perso, j'utilise FileLocator Pro (vers EN, 30 jours d'essai ou licence
13$) qui recherche dans les zip, cab, pdf, doc avec affichage
contextuel du mot recherché.
http://www.mythicsoft.com/default.aspx


Merci je vais tester. ;-)

.../...
Peut-être existerait-il un moyen de supprimer les fichiers images (gif,
jpg)


inférieurs à 2Ko par exemple (même si cela ne ne supprimerait pas le
nombre


de sous-dossiers qui comportent ces images) ?
Recherche des fichiers par taille ayant < 2 Ko et les supprimer ?.



Oui çà marche j'arrive a supprimer les images en gif et jpg et autres css.
Mais les sous-dossiers correspondants à un fichier html sont toujours
présents sous Xp (NTFS) même si j'essaie de les sélectionner séparement [ce
n'était pas le cas il me semble win98Se].
Existet-t-il un moyen de supprimer ces sous-dossiers sans supprimer les
fichiers html ? J'ai essayer de ne garder que les html mais leurs
sous-dossiers j'ajoutent automatiquement. ;-(

Merci d'avance,
Lip


lip
Le #922643
Salut VaN,

Après différents tests voici ce que je pense de FilelocatorPro : Genial!
Autant rapide / un peu difficile à prendre en main au début mais très très
puissant. Cà marche même pour les fichiers zippés. ;-) J'en reviens pas. Cà
va m'éviter beaucoup de manip inutiles. Merci merci merci! :-)
En fait j'avais déjà essayer la version gratuite mais comme elle ne faisait
les zip, j'avais oublié de tester la version payante! Enfin là j'achèterai
ce shareware avec plaisir. ;-)

Toutefois, si un fichier pdf est bloqué par un password (afin de ne pas
pourvoir en copier le texte ou l'imprimer), FilelocatorPro ne pourra pas
chercher à l'intérieur alors qu'Adobe Acrobat Reader 6 y arrive (CTR+F. En
plus possibilité de rechercher un mot clé dans un dossier qui comporte
plusieurs fichiers pdf).

Au passage pour te remercier, j'en profite pour te faire part d'un freeware
que je trouve génial "PDF Speed" : il permet d'accélérer le démarrage de
Adobe Acrobat Reader. ;-)
cf. http://homepage.ntlworld.com/bootblock/files/prods/ar-speedup.zip
http://www.tnk-bootblock.co.uk/
Ne pas oublier de lire le fichier d'aide (à l'intérieur du zip) en anglais.
(il y par exemple un réglage (disable wisptis.exe) ds les options qui
m'évite le bugs d'acrobat reader si j'ai déjà chargé un fichier pdf avant
d'en ouvrir un autre directement sous mon browser web (j'utilise le freeware
génial MYIE2)).

.../...
Existet-t-il un moyen de supprimer ces sous-dossiers sans supprimer les
fichiers html ? J'ai essayer de ne garder que les html mais leurs
sous-dossiers j'ajoutent automatiquement. ;-(
C'est une bonne question.....très bonne mais qui aurait certainement

sa place dans un faux rhum causant de navigateur internet ou de ie,
par ex. car ici on aurait +tôt tendance à causer matos et optimisation
de matos.
Nan, à vrai dire je ne sais pas. ;)))


Je vais essayer de poster la question sur un autre forum. Je reposte la
réponse ici si je la trouve. ;-)
Merci encore,
Bon w-e,
Lip


lip
Le #938630
Salut VaN,

Existet-t-il un moyen de supprimer ces sous-dossiers sans supprimer les
fichiers html ? J'ai essayer de ne garder que les html mais leurs
sous-dossiers j'ajoutent automatiquement. ;-(
C'est une bonne question.....très bonne mais qui aurait certainement

sa place dans un faux rhum causant de navigateur internet ou de ie,
par ex. car ici on aurait +tôt tendance à causer matos et optimisation
de matos.
Nan, à vrai dire je ne sais pas. ;)))


Voilà la solution :
Explorateur Windows / outils /options/ affichage/ "gestion de page web et de
dossiers"

Voilà j'ai aussi trouvé un freeware + rapide à l'utilisation que filelocator
pro. En fait + lent au début pr créer un index (4 heures pr l'index dans mon
cas (800000 fichiers!) mais 30 secondes pour trouver les résultats au lieu
de 20 minutes par filelocator pro) :Wilbur
http://wilbur.redtree.com/index_fr.htm (une fois que l'on a compris comment
inclure ses propres dossiers ex: "E:moiZip*:*.htm" etc... puis fonction
rechercher/remplacer dans Word (ou wordpad) pour les autres extensions,
c'est fantastique!)

C'est un peu comme un google personalisé pour ses propres données! ;-)
A+
Lip


Poster une réponse
Anonyme