LightOn démontre la flexibilité de son modèle d'OCR en l'adaptant à la langue arabe via entraînement ciblé
Du lourd
LightOn démontre la flexibilité de LightOnOCR-2, son modèle de compréhension documentaire, en l'adaptant à l'arabe par fine-tuning. Cette extension repose sur un pipeline interne de génération de données synthétiques, conçu pour couvrir des langues encore peu représentées dans les outils OCR du marché. Cette démonstration repose sur un jeu de données composé de 12.000 pages synthétiques et de leurs transcriptions de référence, produit à l'aide d'une version modifiée du générateur de documents synthétiques de LightOn.
Le corpus couvre une diversité de situations documentaires : artefacts de numérisation, variations de polices, niveaux de résolution et types de documents. Le format de sortie reste celui utilisé pour l'entraînement de la variante bbox de LightOnOCR-2, avec détection des boîtes englobantes, qui permettent d'associer au texte sa localisation spatiale.
Défis spécifiques
L'OCR appliqué à l'arabe présente des défis spécifiques. L'écriture s'effectue de droite à gauche, les caractères se lient en cursive, et les jeux de données ouverts comme les modèles spécialisés demeurent plus rares que pour les langues latines. Pour les organisations qui traitent des archives, des documents administratifs, juridiques ou patrimoniaux en arabe, ces limites peuvent ralentir l'automatisation des chaînes documentaires.
Cette démonstration s'inscrit dans un mouvement plus large d'extensions du modèle à des domaines variés, comme en témoignent ses plus de 3 millions de téléchargements et les fine-tunings déjà réalisés par la communauté. Elle répond notamment aux besoins rencontrés au Moyen-Orient, où LightOn est déjà présent auprès d'acteurs publics et privés. Cette évolution s'inscrit dans la continuité du positionnement de LightOn : proposer des briques d'IA générative d'entreprise, ouvertes, maîtrisables et adaptées aux environnements sensibles.
LightOn met à disposition les guides nécessaires à la reproduction de ce fine-tuning sur son espace Hugging Face, afin de rendre cette approche accessible au plus grand nombre et adaptable à d'autres contextes documentaires...
Les informations et conseils rédigés par la rédaction de Boursier.com sont réalisés à partir des meilleures sources, même si la société Boursier.com ne peut en garantir l'exhaustivité ni la fiabilité. Ces contenus n'ont aucune valeur contractuelle et ne constituent en aucun cas une offre de vente ou une sollicitation d'achat de valeurs mobilières ou d'instruments financiers. La responsabilité de la société Boursier.com et/ou de ses dirigeants et salariés ne saurait être engagée en cas d'erreur, d'omission ou d'investissement inopportun.
- 0 vote
- 0 vote
- 0 vote
- 0 vote
- 0 vote