相変わらずOCR。MacOSのPreviewで文字を埋込んだPDFに別名保存するときの文字認識と、画面上で領域を選んでその場で認識された文字を比べてみると、後者(Live Text機能)の方が精度がよい。この精度の高いOCR機能を使ってコマンドラインでpdfファイルを処理するスクリプトがネット上にはいくつか紹介されているが、縦書きの場合にもうまくいくという例がなさそう。