にしし ふぁくとりー:西村文宏 個人サイト

No.3238 - 今日のひとことログ

更新

■LOG No.3238

にししふぁくとりーHOMEに掲載している「今日のひとこと」の過去ログ(掲載履歴)です。 RSS

No.3238 〔497文字〕 📖

昨年に購入した「一太郎2020 プラチナ版」には、ジャストシステム製のPDF編集ツールが3種類おまけに付いてくるのだが、このうち「JUST PDF4 データ変換」は、(PDFは関係なく)任意の画像ファイルからOCRでテキスト化する機能もあるのだと知って驚いた。
20210221181154-nishishi.jpg
さっき、何気なくタブレットでキャプチャした電子書籍の1ページを取り込んでみてテキスト化を試してみた。「どうせ『扱えません』的なエラーが出るのだろうな」と予想していたのだが、すんなりテキスト化できて驚いた。下記はAndroid端末上で、電子書籍の罫線(表組み)ページをキャプチャした画像を「JUST PDF4 データ変換」に取り込んだところ。
20210221181154-nishishi.png
これをMicrosoft Wordの.docx形式と一太郎の.jtd形式に変換してみたのが下図だ。表も問題ないし、テキストの日本語もほぼ正しい(1点だけ読点が「x」になっているが)。
20210221181143-nishishi.png 20210221182924-nishishi.png
こんなに有用なオマケだったとは今まで気付かなかった。「JUST PDF4」という名称が少々損をしているのではないか。なお、これは単品でも販売されているソフトである。
2020年12月
12345
6789101112
13141516171819
20212223242526
2728293031
2021年1月
12
3456789
10111213141516
17181920212223
24252627282930
31
2021年2月
123456
78910111213
14151617181920
21222324252627
28

Powered by てがろぐ Ver 4.5.1

--- 当サイト内を検索 ---