論文を書いたりメモを取ったりするときに、複雑な数式、特に多層にネストされた積分記号や合計記号に遭遇すると、LaTeX コードを手動で入力するのは非常に面倒で、さらに面倒です。 数式画像の認識に重点を置き、それを直接 LaTeX コードに変換できるオープンソースの OCR モデルである Texo を検討してみてください。 このモデルはわずか2000万個のパラメータしか持たないにもかかわらず、認識精度は1億個規模のモデルに匹敵します。推論速度は非常に速く、ブラウザで直接実行して使用できます。 GitHub: https://t.co/wz5GQblS6U 主な機能: - 数式画像を LaTeX コードに素早く変換します。 - このモデルはパラメータが 2000 万個しかなく、推論速度が速く、ブラウザ操作をサポートしています。 - 完全に無料のオープンソースであり、コンシューマーグレードの GPU でトレーニングできます。 - 複数のテスト セットで 0.85 以上の BLEU スコアを達成しました。 - 完全なトレーニング コードと詳細な技術ドキュメントを提供します。 複数の使用方法が用意されており、ユーザーはオンラインで直接体験したり、ローカルに展開したりできるため、数式を頻繁に処理する必要がある学生に適しています。
スレッドを読み込み中
X から元のツイートを取得し、読みやすいビューを準備しています。
通常は数秒で完了しますので、お待ちください。
