14.01.2014 Views

Segmentation of heterogeneous document images : an ... - Tel

Segmentation of heterogeneous document images : an ... - Tel

Segmentation of heterogeneous document images : an ... - Tel

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Notre contribution sur l’exist<strong>an</strong>t réside essentiellement d<strong>an</strong>s l’utilisation, ou<br />

l’adaptation, d’algorithmes empruntés aux méthodes d’apprentissage automatique<br />

de données, pour résoudre les cas les plus difficiles. Nous démontrons en<br />

effet un certain nombre d’améliorations : sur la séparation des colonnes de texte<br />

lorsqu’elles sont proches l’une de l’autre ; sur le risque de fusion d’au moins deux<br />

cellules adjacentes d’une même table ; sur le risque qu’une région encadrée fusionne<br />

avec d’autres régions textuelles, en particulier les notes de marge, même<br />

lorsque ces dernières sont écrites avec une fonte proche de celle du corps du texte.<br />

L’évaluation qu<strong>an</strong>titative, et la comparaison des perform<strong>an</strong>ces de notre méthode<br />

avec des algorithmes concurrents par des métriques et des méthodologies d’évaluation<br />

reconnues, sont également fournies d<strong>an</strong>s une large mesure.<br />

tel-00912566, version 1 - 2 Dec 2013<br />

ii

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!