Untitled attachment
https://media.mstdn.jp/media_attachments/files/113/382/382/122/593/100/original/3cfc633e21c10416.png
相変わらずOCR。MacOSのPreviewで文字を埋込んだPDFに別名保存するときの文字認識と、画面上で領域を選んでその場で認識された文字を比べてみると、後者(Live Text機能)の方が精度がよい。この精度の高いOCR機能を使ってコマンドラインでpdfファイルを処理するスクリプトがネット上にはいくつか紹介されているが、縦書きの場合にもうまくいくという例がなさそう。
GNU social JP is a social network, courtesy of GNU social JP管理人. It runs on GNU social, version 2.0.2-dev, available under the GNU Affero General Public License.
All GNU social JP content and data are available under the Creative Commons Attribution 3.0 license.