Home

About

Advanced Search

Browse by Discipline

Scientific Societies

E-print Alerts

Add E-prints

E-print Network
FAQHELPSITE MAPCONTACT US


  Advanced Search  

 
Classement de caract`eres manuscrits 1 Presentation des donnees
 

Summary: Classement de caract`eres manuscrits
1 Pr´esentation des donn´ees
La reconnaissance de caract`eres manuscrits par un syst`eme automatis´e est
un probl`eme aux multiples applications : reconnaissance des codes postales,
cr´eation de petits syst`emes mobiles de saisie de texte (par exemple, pour les
ordinateurs de poche), num´erisation de documents manuscrits, ...
Les m´ethodes les plus performantes pour reconna^itre un caract`ere manus-
crit sont bas´ees sur des m´ethodes d'apprentissage statistique : leur principe
commun est de fonder leur pr´ediction sur la comparaison de l'image du ca-
ract`ere manuscrit `a classer `a d'autres images de caract`eres manuscrits pour
lesquels la nature du caract`ere est connue. Typiquement, si une image arrive
et qu'elle est tr`es similaire `a l'image de nombreux '1' de notre base d'appren-
tissage, l'algorithme classera l'image dans la cat´egorie '1'.
Les donn´ees consid´er´ees ici proviennent de la base MNIST (http://yann.
lecun.com/exdb/mnist/) sur laquelle des milliers de chercheurs ont travaill´e.
Elle est constitu´ee de 70 000 chiffres manuscrits au format 28 pixels par 28
pixels o`u chaque pixel est repr´esent´e par un niveau de gris allant de 1 `a 256
(i.e. un chiffre manuscrit est donc un vecteur de {1, . . . , 256}28×28
).
Dans ce TD, pour limiter le temps de calcul et la m´emoire n´ecessaire, nous

  

Source: Audibert, Jean-Yves - Département d'Informatique, École Normale Supérieure

 

Collections: Computer Technologies and Information Sciences