OpenOffice/競馬の研究8

前章では入力方法の改善を試みました。しかしやはり多少でもプログラムの心得があるものにとっては非効率的に感じる作業です。

もっと自動化できないでしょうか。

楽するために苦労する、これが正しいプログラマーの姿です。

目次

SQLを使う

前章でも使用した、SQLの実行機能を利用します。INSERT文やUPDATE文を自動生成するプログラムを組めば、ある程度の入力作業を自動化できます。

単純な文字列生成ですのでプログラムとしてはさほど難しくありません。

元データの解析

紙媒体で配布される新聞ならともかく、web上で閲覧で居る資料であればデータのインポートは不可能ではありません。(難易度の違いはありますが)

HTML形式であれば色々な言語で作られているHTMLパーサのライブラリが使用できますし、PDF形式であればテキスト保存してしまえば読み込みは難しくないでしょう。

またインポートする場合には正規表現のライブラリが使えるとかなりのところで楽をすることができます。

webからのインポート

競馬情報を提供するようなサイトは、情報をデータベースから動的に作成していることが多いようです。機械的に作っているので、例えばこのようなソフトを使うと簡単に必要な情報を抽出することが可能です。


2007-10-29 komina