Comparer et épurer 2 fichiers de données

Le
aShtk
Tout d'abord bonjour,
Je m'appelle Bruno et, suite à de gros problèmes avec excel pour un travail,
je fais appel à vos précieuses lumières.

Je cherche à comparer 2 bases de données (listes d'entreprises avec plein
d'informations correspondantes).
J'ai donc 2 tableaux, avec les mêmes entêtes, mais pas le même nombre de
ligne.
Le premier tableau est notre fichier, il contient toutes les informations
dont nous disposons sur les entreprises voulues (adresse, raison sociale,
numéro de téléphone, dernière facture, etc etc.)

Le deuxième tableau est un fichier propre et mis à jour que l'on nous a
donné. Il contient la raison sociale, l'adresse, le numéro de téléphone, et
c'est tout (il y a les mêmes entêtes de colonne, mais les cellules sont
vides pour les autres données).

Et là, on arrive au problème :p
Je cherche à mettre à jour le tableau 1 à partir du nouveau : je
souhaiterais donc que les informations soient corrigées (par exemple en
partant de la raison sociale, que l'adresse et le numéro de téléphone soient
corrigés ou ajoutés), que les entreprises manquantes soient ajoutées, et que
les entreprises en trop soient mises en évidence dans le nouveau tableau
(par exemple en couleur). Il faut en même temps que le nouveau tableau
(tableau 3 sur une nouvelle feuille par exemple) tout propre tout neuf ne
supprime pas les anciennes informations importantes (les anciennes factures,
dernier achat, etc.) mais ne tienne compte que des colonnes qu'il faut
mettre à jour (en l'occurence toutes les cellules renseignées du tableau 2).
Un autre problème est que la raison sociale n'est pas toujours identique,
elle peut varier à quelque chose près (par exemple Bijouterie Montres trop
bien à la place de Montres trop bien tout court, ce qui risque de conduire à
un nombre très important de doublons etc.)

J'ai vraiment de mal à m'expliquer, c'est tellement dur de faire comprendre
le problème sans illustrations que si je n'ai pas été clair, je
récapitulerai tout, et j'accepte même d'être fouetté sur la place publique
si l'idée vous tente : - )

Je vous remercie beaucoup par avance de l'aide que vous pourrez m'apporter !
Bien cordialement,
Bruno C.
  • Partager ce contenu :
Vos réponses
Trier par : date / pertinence
FxM
Le #3993841
Bonjour,

Et cette mise à jour des fichiers de ton entreprise est rémunérée à
quelle hauteur ?

@+
FxM



Tout d'abord bonjour,
Je m'appelle Bruno et, suite à de gros problèmes avec excel pour un travail,
je fais appel à vos précieuses lumières.

Je cherche à comparer 2 bases de données (listes d'entreprises avec plein
d'informations correspondantes).
J'ai donc 2 tableaux, avec les mêmes entêtes, mais pas le même nombre de
ligne.
Le premier tableau est notre fichier, il contient toutes les informations
dont nous disposons sur les entreprises voulues (adresse, raison sociale,
numéro de téléphone, dernière facture, etc etc.)

Le deuxième tableau est un fichier propre et mis à jour que l'on nous a
donné. Il contient la raison sociale, l'adresse, le numéro de téléphone, et
c'est tout (il y a les mêmes entêtes de colonne, mais les cellules sont
vides pour les autres données).

Et là, on arrive au problème :p
Je cherche à mettre à jour le tableau 1 à partir du nouveau : je
souhaiterais donc que les informations soient corrigées (par exemple en
partant de la raison sociale, que l'adresse et le numéro de téléphone soient
corrigés ou ajoutés), que les entreprises manquantes soient ajoutées, et que
les entreprises en trop soient mises en évidence dans le nouveau tableau
(par exemple en couleur). Il faut en même temps que le nouveau tableau
(tableau 3 sur une nouvelle feuille par exemple) tout propre tout neuf ne
supprime pas les anciennes informations importantes (les anciennes factures,
dernier achat, etc.) mais ne tienne compte que des colonnes qu'il faut
mettre à jour (en l'occurence toutes les cellules renseignées du tableau 2).
Un autre problème est que la raison sociale n'est pas toujours identique,
elle peut varier à quelque chose près (par exemple Bijouterie Montres trop
bien à la place de Montres trop bien tout court, ce qui risque de conduire à
un nombre très important de doublons etc.)

J'ai vraiment de mal à m'expliquer, c'est tellement dur de faire comprendre
le problème sans illustrations que si je n'ai pas été clair, je
récapitulerai tout, et j'accepte même d'être fouetté sur la place publique
si l'idée vous tente : - )

Je vous remercie beaucoup par avance de l'aide que vous pourrez m'apporter !
Bien cordialement,
Bruno C.








aShtk
Le #3993661
Ca dépendra du temps passé. Me contacter en mp @ Il
faut enlever le _nospam_ évidemment
Merci

"FxM"
Bonjour,

Et cette mise à jour des fichiers de ton entreprise est rémunérée à quelle
hauteur ?

@+
FxM



Tout d'abord bonjour,
Je m'appelle Bruno et, suite à de gros problèmes avec excel pour un
travail,
je fais appel à vos précieuses lumières.

Je cherche à comparer 2 bases de données (listes d'entreprises avec plein
d'informations correspondantes).
J'ai donc 2 tableaux, avec les mêmes entêtes, mais pas le même nombre de
ligne.
Le premier tableau est notre fichier, il contient toutes les informations
dont nous disposons sur les entreprises voulues (adresse, raison sociale,
numéro de téléphone, dernière facture, etc etc.)

Le deuxième tableau est un fichier propre et mis à jour que l'on nous a
donné. Il contient la raison sociale, l'adresse, le numéro de téléphone,
et
c'est tout (il y a les mêmes entêtes de colonne, mais les cellules sont
vides pour les autres données).

Et là, on arrive au problème :p
Je cherche à mettre à jour le tableau 1 à partir du nouveau : je
souhaiterais donc que les informations soient corrigées (par exemple en
partant de la raison sociale, que l'adresse et le numéro de téléphone
soient
corrigés ou ajoutés), que les entreprises manquantes soient ajoutées, et
que
les entreprises en trop soient mises en évidence dans le nouveau tableau
(par exemple en couleur). Il faut en même temps que le nouveau tableau
(tableau 3 sur une nouvelle feuille par exemple) tout propre tout neuf ne
supprime pas les anciennes informations importantes (les anciennes
factures,
dernier achat, etc.) mais ne tienne compte que des colonnes qu'il faut
mettre à jour (en l'occurence toutes les cellules renseignées du tableau
2).
Un autre problème est que la raison sociale n'est pas toujours identique,
elle peut varier à quelque chose près (par exemple Bijouterie Montres
trop
bien à la place de Montres trop bien tout court, ce qui risque de
conduire à
un nombre très important de doublons etc.)

J'ai vraiment de mal à m'expliquer, c'est tellement dur de faire
comprendre
le problème sans illustrations que si je n'ai pas été clair, je
récapitulerai tout, et j'accepte même d'être fouetté sur la place
publique
si l'idée vous tente : - )

Je vous remercie beaucoup par avance de l'aide que vous pourrez
m'apporter !
Bien cordialement,
Bruno C.









Michel Gaboly
Le #3993581
Bonjour,

J"ai déjà été confronté à ce genre de choses.

Le temps nécessaire peut être très variable : en effet l'emploi d'a bréviations ("St" par exemple) dans un fichier et pas
l'autre rend apparemment différentes des données qui sont en fait les mêmes.

La comparaison implique de multiples cas particuliers à prendre en comp te quand il faut comparer des noms et des prénoms
(variantes dans l'orthographe des prénoms, "JP" au lieu de "Jean-Pierre ", tirets, ...)

Ici la situation paraît plus simple, si les comparaisons sont limitée s aux raisons sociales. Il faut faire une boucle
pour parcourir toutes les lignes du fichier "propre", et à chaque fois en reporter les données sur le fichier d'origine.

Quid des champs renseignés dans le fichier d'origine et pas dans le fic hier "propre" ? Faut-il considérer que ce sont
des infos obsolètes à effacer, ou des infos manquantes dans le fichie r propre ? Les 2 cas de figure existent probablement.

2 codes couleur devraient permettre de repérer les entreprises du fichi er initial qui n'ont pas été trouvées dans le
fichier propre (il suffit de mettre au départ une couleur de fond que l 'on ôte au fur et à mesure pour chaque ligne
traiter) et celles de ce dernier fichier non trouvées dans le fichier à corriger.

NB - les code couleurs évoqués peuvent être remplacés par des mis es en forme conditionnelles.

Globalement le temps dépend aussi de la quantité d'entreprises dans l e fichier ; en effet, il y aura sûrement des cas
particuliers à prendre en compte impliquant une intervention manuelle. C'est le nombre de ces cas qui va déterminer la
durée totale nécessaire.

A moins que le fichier ne comporte que quelques dizaines d'entreprise, il faut probablement y consacrer entre une
demi-journée à une journée, voire plus si les fichirers sont très importants, avec de nombreux cas particuliers.


Ca dépendra du temps passé. Me contacter en mp @ .fr Il
faut enlever le _nospam_ évidemment
Merci

"FxM"
Bonjour,

Et cette mise à jour des fichiers de ton entreprise est rémunéré e à quelle
hauteur ?

@+
FxM



Tout d'abord bonjour,
Je m'appelle Bruno et, suite à de gros problèmes avec excel pour un
travail,
je fais appel à vos précieuses lumières.

Je cherche à comparer 2 bases de données (listes d'entreprises av ec plein
d'informations correspondantes).
J'ai donc 2 tableaux, avec les mêmes entêtes, mais pas le même nombre de
ligne.
Le premier tableau est notre fichier, il contient toutes les informat ions
dont nous disposons sur les entreprises voulues (adresse, raison soci ale,
numéro de téléphone, dernière facture, etc etc.)

Le deuxième tableau est un fichier propre et mis à jour que l'on nous a
donné. Il contient la raison sociale, l'adresse, le numéro de té léphone,
et
c'est tout (il y a les mêmes entêtes de colonne, mais les cellule s sont
vides pour les autres données).

Et là, on arrive au problème :p
Je cherche à mettre à jour le tableau 1 à partir du nouveau : j e
souhaiterais donc que les informations soient corrigées (par exempl e en
partant de la raison sociale, que l'adresse et le numéro de télé phone
soient
corrigés ou ajoutés), que les entreprises manquantes soient ajout ées, et
que
les entreprises en trop soient mises en évidence dans le nouveau ta bleau
(par exemple en couleur). Il faut en même temps que le nouveau tabl eau
(tableau 3 sur une nouvelle feuille par exemple) tout propre tout neu f ne
supprime pas les anciennes informations importantes (les anciennes
factures,
dernier achat, etc.) mais ne tienne compte que des colonnes qu'il fau t
mettre à jour (en l'occurence toutes les cellules renseignées du tableau
2).
Un autre problème est que la raison sociale n'est pas toujours iden tique,
elle peut varier à quelque chose près (par exemple Bijouterie Mon tres
trop
bien à la place de Montres trop bien tout court, ce qui risque de
conduire à
un nombre très important de doublons etc.)

J'ai vraiment de mal à m'expliquer, c'est tellement dur de faire
comprendre
le problème sans illustrations que si je n'ai pas été clair, je
récapitulerai tout, et j'accepte même d'être fouetté sur la p lace
publique
si l'idée vous tente : - )

Je vous remercie beaucoup par avance de l'aide que vous pourrez
m'apporter !
Bien cordialement,
Bruno C.











--
Cordialement,

Michel Gaboly
www.gaboly.com



Michel Gaboly
Le #3993561
Bonjour,

J'ai déjà été confronté à ce genre de choses.

Le temps nécessaire peut être très variable : en effet l'emploi d'a bréviations ("St" par exemple) dans un fichier et pas
l'autre rend apparemment différentes des données qui sont en fait les mêmes.

La comparaison implique de multiples cas particuliers à prendre en comp te quand il faut comparer des noms et des prénoms
(variantes dans l'orthographe des prénoms, "JP" au lieu de "Jean-Pierre ", tirets, ...)

Ici la situation paraît plus simple, si les comparaisons sont limitée s aux raisons sociales. Il faut faire une boucle
pour parcourir toutes les lignes du fichier "propre", et à chaque fois en reporter les données sur le fichier d'origine.

Quid des champs renseignés dans le fichier d'origine et pas dans le fic hier "propre" ? Faut-il considérer que ce sont
des infos obsolètes à effacer, ou des infos manquantes dans le fichie r propre ? Les 2 cas de figure existent probablement.

2 codes couleur devraient permettre de repérer les entreprises du fichi er initial qui n'ont pas été trouvées dans le
fichier propre (il suffit de mettre au départ une couleur de fond que l 'on ôte au fur et à mesure pour chaque ligne
traitée) et celles de ce dernier fichier non trouvées dans le fichier à corriger.

NB - les code couleurs évoqués peuvent être remplacés par des mis es en forme conditionnelles.

Globalement le temps dépend aussi de la quantité d'entreprises dans l e fichier ; en effet, il y aura sûrement des cas
particuliers à prendre en compte impliquant une intervention manuelle. C'est le nombre de ces cas qui va déterminer la
durée totale nécessaire.

A moins que le fichier ne comporte que quelques dizaines d'entreprise, il faut probablement y consacrer entre une
demi-journée à une journée, voire plus si les fichiers sont trèsi mportants, avec de nombreux cas particuliers.


Ca dépendra du temps passé. Me contacter en mp @ .fr Il
faut enlever le _nospam_ évidemment
Merci

"FxM"
Bonjour,

Et cette mise à jour des fichiers de ton entreprise est rémunéré e à quelle
hauteur ?

@+
FxM



Tout d'abord bonjour,
Je m'appelle Bruno et, suite à de gros problèmes avec excel pour un
travail,
je fais appel à vos précieuses lumières.

Je cherche à comparer 2 bases de données (listes d'entreprises av ec plein
d'informations correspondantes).
J'ai donc 2 tableaux, avec les mêmes entêtes, mais pas le même nombre de
ligne.
Le premier tableau est notre fichier, il contient toutes les informat ions
dont nous disposons sur les entreprises voulues (adresse, raison soci ale,
numéro de téléphone, dernière facture, etc etc.)

Le deuxième tableau est un fichier propre et mis à jour que l'on nous a
donné. Il contient la raison sociale, l'adresse, le numéro de té léphone,
et
c'est tout (il y a les mêmes entêtes de colonne, mais les cellule s sont
vides pour les autres données).

Et là, on arrive au problème :p
Je cherche à mettre à jour le tableau 1 à partir du nouveau : j e
souhaiterais donc que les informations soient corrigées (par exempl e en
partant de la raison sociale, que l'adresse et le numéro de télé phone
soient
corrigés ou ajoutés), que les entreprises manquantes soient ajout ées, et
que
les entreprises en trop soient mises en évidence dans le nouveau ta bleau
(par exemple en couleur). Il faut en même temps que le nouveau tabl eau
(tableau 3 sur une nouvelle feuille par exemple) tout propre tout neu f ne
supprime pas les anciennes informations importantes (les anciennes
factures,
dernier achat, etc.) mais ne tienne compte que des colonnes qu'il fau t
mettre à jour (en l'occurence toutes les cellules renseignées du tableau
2).
Un autre problème est que la raison sociale n'est pas toujours iden tique,
elle peut varier à quelque chose près (par exemple Bijouterie Mon tres
trop
bien à la place de Montres trop bien tout court, ce qui risque de
conduire à
un nombre très important de doublons etc.)

J'ai vraiment de mal à m'expliquer, c'est tellement dur de faire
comprendre
le problème sans illustrations que si je n'ai pas été clair, je
récapitulerai tout, et j'accepte même d'être fouetté sur la p lace
publique
si l'idée vous tente : - )

Je vous remercie beaucoup par avance de l'aide que vous pourrez
m'apporter !
Bien cordialement,
Bruno C.











--
Cordialement,

Michel Gaboly
www.gaboly.com



Poster une réponse
Anonyme