3 éléments à savoir lors de l’importation de données

3 éléments à savoir lors de l'importation de donnéesIl arrive fréquemment que nos clients doivent importer leurs bases de données cdans un outil en ligne tel qu’un système de marketing courriel, un CRM ou autre.

L’importation de données présente souvent plusieurs défis et j’ai pensé partager avec vous 3 éléments essentiels à considérer pour faciliter l’importation de données dans vos outils en ligne.

Si comme plusieurs de nos clients l’importation de vos données est pour vous un défi, cet article vous permettra de mieux comprendre les éléments de base à considérer pour vous faciliter la vie.

Voici donc les 3 éléments à savoir.


1. Le format d’importation

Excel to CSVLe format le plus utilisé dans ce genre de situation est le .CSV (Comma Separated Value). Ne vous inquiétez pas, vous pouvez sauvegarder en format CSV à partir d’Excel!

Le format CSV contient uniquement des données brutes, en format texte, contrairement au format Excel qui peut;

  • Changer de format entre les versions (.xls, .xlsx)
  • Contenir plusieurs onglets
  • Contenir des informations et formules qui ne sont pas supportées dans le système où on veut importer ces données

Sauvegarder en CSV à partir d’Excel

  1. Vos données doivent être sur un seul onglet.
  2. « Sauvegarder sous » / « Autre format »
    Excel Save As (CSV)
  3. Dans le menu déroulant « Type de fichier », sélectionnez « CSV (Séparateur: point-virgule) (*.csv) »
    Excel Save As Type (CSV)

Problème possible avec les CSV

Comme il est rare d’avoir une solution parfaite, il peut quand même y avoir quelques problèmes d’associés au format CSV…

  • Délimiteur
    Caractère / méthode employée pour séparer les données. (colonne)
  • Encodage & jeu de caractères
    Méthode de conversion de caractères à bytes (01) & Ensemble de caractères utilisables (ABC)
    Ce problème apparaît habituellement suite à l’utilisation de caractères spéciaux comme les caractères accentués.

Puisque ces sujets sont complexes, je vais élaborer sur ces problèmes / solutions dans un autre article.


2. Consistance des données

Voici un exemple comprenant quelques erreurs de données
Exemple Excel problème donnée

Pour être en mesure de bien segmenter ou catégoriser vos données, elles doivent être constantes.

Si on regarde la colonne « Province » dans l’exemple, on se rend compte que Québec est écrit de plusieurs façons. Ce genre de problème arrive souvent quand on laisse les gens remplir eux-mêmes la province dans un champ texte plutôt que d’avoir un menu déroulant avec les choix.


3. Interprétation de vos données

Il arrive fréquemment qu’une liste contienne des données comme oui/non, homme/femme, langue, etc. Lorsque ceci survient, il est possible que le système où l’on veut importer nos données les interprète mal.

Par exemple, si on veut qu’il distingue les données d’un champ OUI et NON, il faut parler le même langage que le système pour qu’il comprenne nos données.

Champs oui / non

Ex.: Dans votre fichier Excel, vous avez un champ « PC » pour vous permettre de savoir, dans votre liste, quels abonnés ont un ordinateur de type PC pour envoyer des promotions en conséquence. Pour ce faire, vous avez mis un en-tête « PC » et pour chaque individu, vous avez inscrit oui / non.

Après votre importation, vous remarquez que le système n’a pas pris en compte ce champ.

Les champs oui / non (Boolean en language informatique) utilisent la plupart du temps le langage machine (0/1). Vous devez donc spécifier :

  • 0 pour non
  • 1 pour oui

Parfois les systèmes identifient et convertissent les synonymes comme « oui / non », « yes / no » mais c’est spécifique à chaque système, donc vous êtes mieux de vous informer sur le format supporté. Habituellement 0/1 est une valeur sûre.

S’il y a des synonymes, la plupart du temps ceux qui sont supportés sont anglophones (yes/no), (y/n).

Données spécifiques

Si vous avez des données que votre système hôte utilise dans son fonctionnement natif, comme la langue de votre client ou sa région, vous devez inscrire les données tel que le système hôte s’attend à les recevoir. C’est-à-dire que vous ne pouvez pas inscrire dans le champ « langue » des données comme « français/anglais » si votre système s’attend à recevoir cette information de cette façon: « fr/en ».

Vous devez donc vérifier le format de données supporté par votre système. En général, quand on veut bien faire les choses, on utilise un format standardisé (ISO) lorsque c’est possible.

À titre d’exemple, nos systèmes utilisent les formats standardisés suivants pour ces 2 champs.

Je vous suggère de bâtir vos données en utilisant des formats standardisés lorsque possible.


En terminant, je tiens à dire que ce premier article ne constitue qu’un survol des éléments de base à considérer lors de l’importation de données.

Pour les utilisateurs plus avancés, je proposerai prochainement d’autres billets sur le sujet qui me permettront  d’élaborer sur d’autres problèmes et solutions possibles pour des cas plus complexes. J’ai beaucoup d’information et d’études de cas à partager sur le sujet avec vous!

Si vous avez des questions ou voulez partager un cas, n’hésitez pas!

Laisser un commentaire

Votre adresse courriel ne sera pas publiée. Entrez votre nom, courriel et votre commentaire.

Vous pouvez utiliser ces balises et attributs HTML : <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code class="" title="" data-url=""> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong> <pre class="" title="" data-url=""> <span class="" title="" data-url="">