AIGCLINK (@aigclink): 腾讯刚刚开源了最新原生端到端OCR：HunyuanOCR，1B，OmniDocBench得分94.1，超DeepSeek OCR、Gemi…

Tencent は、最新のネイティブエンドツーエンド OCR である HunyuanOCR、1B をオープンソース化しました。OmniDocBench スコアは 94.1 で、DeepSeek OCR および Gemini 3 Pro を上回りました。この機能は、テキスト検出、複雑なドキュメント処理、ビデオの字幕抽出、エンドツーエンドの写真翻訳など、あらゆるシナリオをカバーします。テキスト検出、ストリートビュー、手書き、芸術的なフォント、広告、請求書、スクリーンショットなどをサポートします。複雑なドキュメント処理: 表/数式をHTML/LaTeXに直接出力エンドツーエンドの写真翻訳は14の言語をサポート #OCR #HunyuanOCR

github：github.com/Tencent-Hunyua… HF：huggingface.co/tencent/Hunyua…

github：https://t.co/sBhWJoKHAS
HF：https://t.co/PgMlNQ3AQj

AIGCLINK（@aigclink）のスレッド

作者情報

スレッド内容