X (Twitter)

Tencent vient de publier en open source son dernier OCR natif de bout en bout : HunyuanOCR, 1B, avec un score OmniDocBench de 94,1, surpassant DeepSeek OCR et Gemini 3 Pro. Cette fonctionnalité couvre tous les scénarios, y compris la détection de texte, le traitement de documents complexes, l'extraction de sous-titres vidéo et la traduction de photos de bout en bout. La détection de texte prend en charge les images de rue, l'écriture manuscrite, les polices artistiques, les publicités, les factures, les captures d'écran et bien plus encore. Traitement de documents complexes : Sortie directe de tableaux/formules au format HTML/LaTeX La traduction photo de bout en bout prend en charge 14 langues. #OCR #OCRHunyuan

github：github.com/Tencent-Hunyua… HF：huggingface.co/tencent/Hunyua…

github：https://t.co/sBhWJoKHAS
HF：https://t.co/PgMlNQ3AQj

Fil de AIGCLINK (@aigclink)

Informations sur l'auteur

Contenu du fil