校正沼

電子書籍を使った勉強法を研究しています。

現在の目標は電子書籍から自作教材を作ること。

この構想の各段階(以下、フェーズ)の概要は以下のようになっています。

自作教材構想

フェーズ1.本からテキストデータを抽出します

フェーズ2.抽出されたデータは誤字脱字だらけなので校正します

フェーズ3.テキスト形式の教材に編集します

フェーズ4.読み上げソフトで音声教材にします

筆者は各フェーズテストしてみたのですがどのフェーズも膨大な時間がかかることがわかりました。

以下に、テストした感想と進捗を報告します。

テスト結果と進捗状況

段階 コメント 進捗
フェーズ1.本の電子化 ScanSnapを使用。本をPDF化 順調
フェーズ2.校正 誤字脱字を人力で校正 難航
フェーズ3.編集 よりよく編集する余裕はない 改良は中止
フェーズ4.音声化 VOICEROID2を使用。 順調

フェーズ1とフェーズ4の本の電子化と音声読み上げといった作業は一工程1時間以内で済むので比較的簡単です。操作や設定をミスらなければ仕上がりも一定です。この2つの作業は順調です。

フェーズ2。例えば、本をスキャンすると10万字くらいのテキストデータが吐き出されることがあります。このデータの誤字脱字を校正しようとすると、空スペースを削除し、改行を整えるなど。図表までテキストで入力しようとしようとすると途方もない時間が必要になります。校正を助けてくれるアプリもありますが、ほとんどの修正は人力という印象でした。

フェーズ3。本の編集。よりよくするための編集を諦めました。プロが編集している紙の本や学習アプリより優れたものが作れないと思ったからです。こういう作業は時間的にも質的にも厳しい面がありました。

ファイル名の入力なども編集ですが、私が編集で力を入れていきたいことは、自分にとって扱いやすいデータに加工したり、スマホでも閲覧できるようにすることなど。

最後に

20冊以上の本をフェーズ4まで到達させたいのですが、校正にかかる労力と時間が問題となっています(校正の沼)。

今後、校正の沼を解決するためにOCRソフトの新調、誤字脱字の手間をへらす工夫を用意する等が課題。

本の電子化までなら手軽。

校正は重労働。