手寫筆記拍照後想轉成可編輯的數位文檔,常規的OCR 只能識別文字內容,丟失了筆跡信息,而專業手寫板又需要額外設備。 最近在GitHub 上看到InkSight 這個Google 開源的手寫轉換系統,能把手寫筆記照片轉成向量筆跡,保留書寫軌跡的同時支援編輯和搜尋。 基於視覺轉換器(ViT)和mT5 編碼解碼架構,透過「閱讀」 和「書寫」 雙重訓練,讓模型既能理解手寫內容,又能還原書寫過程。 GitHub:https://t.co/5NqqdA8xRv 支援多語言識別,能處理各種背景和書寫風格,提供單字級和整頁文字兩種轉換模式。輸出的是向量格式數位筆跡,可以直接編輯、搜索,或匯入筆記應用程式。 在Hugging Face 提供線上演示和完整資料集,還有配套的Jupyter 範例程式碼,支援本地部署運行。
正在載入線程內容
正在從 X 取得原始推文,整理成清爽的閱讀畫面。
通常只需幾秒鐘,請稍候。
