にしし ふぁくとりー:西村文宏 個人サイト

2021年2月21日の投稿[6件] - 今日のひとことログ

更新

■LOG 2021年2月21日の投稿[6件]

にししふぁくとりーHOMEに掲載している「今日のひとこと」の過去ログ(掲載履歴)です。 RSS

No.3241 〔58文字〕

はたらく細胞を見て以後、皮膚を引っ掻いて血が出てしまうと、妙に血小板ちゃんたちに申し訳なく思えてしまう。ごめんよう。

No.3240 〔23文字〕

もう、2月も下旬なのか……。いつの間に……?🤔

No.3239 〔381文字〕 📖

(承前) どの部分をOCRで文字として認識しているのかを表示するモードもあった。認識はほぼ正しい(リンゴやミカンの絵が「OQQ」と認識されている程度)が、必要に応じて認識範囲を手動で修正することもできるようだ。認識結果のテキストを直接編集することもできて、ここで編集しておけば編集結果を最終データとして出力できるっぽい。なかなか便利だ。無駄な改行もここで取り除いておけば楽かもしれない。
202102211927581-nishishi.png 20210221192758-nishishi.png 20210221193245-nishishi.png
縦書き・横書きの混在も問題なかった。2段組レイアウトでもちゃんと正しい順序で認識していることにちょっと驚いた(2枚目の画像)。罫線もないのに。テキスト認識は、フォントによって、カタカナの「ロ」が四角記号になったり、小さい「っ」や「ャ」が大きな「つ」や「ヤ」だと認識されている箇所はあったが。まあ、その辺はOCRならありがちなので仕方ないだろう。

No.3238 〔497文字〕 📖

昨年に購入した「一太郎2020 プラチナ版」には、ジャストシステム製のPDF編集ツールが3種類おまけに付いてくるのだが、このうち「JUST PDF4 データ変換」は、(PDFは関係なく)任意の画像ファイルからOCRでテキスト化する機能もあるのだと知って驚いた。
20210221181154-nishishi.jpg
さっき、何気なくタブレットでキャプチャした電子書籍の1ページを取り込んでみてテキスト化を試してみた。「どうせ『扱えません』的なエラーが出るのだろうな」と予想していたのだが、すんなりテキスト化できて驚いた。下記はAndroid端末上で、電子書籍の罫線(表組み)ページをキャプチャした画像を「JUST PDF4 データ変換」に取り込んだところ。
20210221181154-nishishi.png
これをMicrosoft Wordの.docx形式と一太郎の.jtd形式に変換してみたのが下図だ。表も問題ないし、テキストの日本語もほぼ正しい(1点だけ読点が「x」になっているが)。
20210221181143-nishishi.png 20210221182924-nishishi.png
こんなに有用なオマケだったとは今まで気付かなかった。「JUST PDF4」という名称が少々損をしているのではないか。なお、これは単品でも販売されているソフトである。

No.3237 〔47文字〕

最近ちょっと時間の使い方が下手くそすぎて困る。(´・ω・`) もうちょっとなんとかせねば……。

No.3236 〔270文字〕

WindowsでCドライブ直下にある隠しファイル「hiberfil.sys」のことを『休止状態(ハイバネーション機能)用のファイル』だと解説されている場合がよくあって、それ自体はその通りなのだが「Windows10の高速スタートアップ機能がそのハイバネーション機能を使っている」という説明が足りていない場合も多々ある気がする。コマンドプロンプトからpowercfg.exeを実行してハイバネーションを無効にすると、高速スタートアップ機能も無効になってしまうので注意が必要だ。もっとも起動ドライブがSSDの場合は、それでも良いかもしれないが。
2020年12月
12345
6789101112
13141516171819
20212223242526
2728293031
2021年1月
12
3456789
10111213141516
17181920212223
24252627282930
31
2021年2月
123456
78910111213
14151617181920
21222324252627
28

Powered by てがろぐ Ver 4.4.4

--- 当サイト内を検索 ---