vendredi 26 avril 2013

tNormalizeSchema pour normaliser un groupe de colonnes avec Talend Open Studio


Aujourd'hui je vais vous présenter un composant Talend bien pratique disponible sur Talend Exchange.
Il fait gagner un temps fou lorsque l'on est confronté a cette problématique.
Il s'agit du tNormalizeSchema développé par jlolling

Voyons un cas concret pour mieux comprendre l’intérêt de ce composant.
Soit le jeu de données tabulaires suivant:

mardi 23 avril 2013

Solr : Améliorer l'indexation depuis un SGBD (Part 1)


Dans cette série d'articles, je vais vous montrer comment optimiser un maximum l'indexation de documents Solr depuis une base de données.

Objectif annoncé : passer de 15 docs/s à + de 1000.

Dans cette première partie, je vais aborder l'approche classique d'indexation Solr, le DataImport, ce qui préparera le terrain pour la suite.

L'idée étant de faire un moteur de recherche de clients à partir d'une GRC. Nous devrons pouvoir rechercher un client par un certain nombre de critères tels que la raison sociale, le téléphone, le siren, l'email et la/les adresse(s).