2016年10月1日土曜日

デジタル

昔の台本のテキストデータありませんか



あります!



でもフロッピーディスクだった



FDドライブあるよ!



フォーマットエラーだ



ワープロもあるよ!



AC電源ケーブルがないわ



僕ワープロ書院持ってます



データ呼び出せました!



入力途中のファイルでした…


 


なんだこの、拾う神と捨てる神が交互に現る、そんな様相は。一喜一憂×5=五喜五憂。


 


差分なー。FDのラベルにわざわざ「おぐまさん」って書いてあったからもしかしてとは思ったんだよな、おぐまさんが途中まで入力したのを台本差し替え来たときに「念のために」と思ってコピーFD作って打ち直しと続行作業は別FDで進めてた気がするもん、21年前。


 


で、未入力部分については新たになんとかしなきゃなんでしたが、Adobe Acrobat9のOCR機能が思ったよりいい仕事をしてくれたのでさほど労せずテキストデータが抜き出せそうである。


台本特有の分かち書きとか天野さん特有の記号が多いから修正箇所も多いのだけど、これ、フツーの文庫本とかの文章だったらかなりの精度なんじゃないかな。


ちなみにOCR君は記号の中で特に3点リーダーが苦手なようです。


あとなんかひらがなの「う」がかなり苦手なようです。ほぼ「、つ」と認識されてる。縦書きがネックなのか。それでも昔の中国製の花火の説明書きよりはよっぽど日本語ですね、じぬんをぐろぐろまわります的な、ね。


 



 


吉本芸人のテントさんの訃報に、フレッツADSLのCMを思い出す。西日本の話題ですね。


フレッツADSLは100メガ!というのをすごく刷り込まれたもんです。


100メガが100メガバイトではなく100メガビット(=12.5メガバイト)であることを知るのは、もっと後のことである。


 



 


ニュースアナウンサーが淡々と読み上げる「スケベニンゲンの海の眺めが発見されました」、響きの奇妙さにちょっとどきどきした。発見されたか。そうか。