文字放送データベースサーバ構築

サンプルのダウンロード

○文字放送データベース
文字放送をパソコンで受信するメリットは受信したデータを利用していろいろなことができる点にある。文字放送電子新聞TTNewsは文字放送のデータを自由にカスタマイズしていろいろな利用形態にあった電子新聞をつくったり、プッシュ型情報スクリーンセーバーを作成するソフトであるが、データの自動テキストファイル化の機能ももっている。ここではこの機能を利用してサーバに自動的に受信・蓄積するテキスト型文字放送データベースを構築してみよう。文字放送は、通信代が必要ない上にデータの形式が番組によって比較的固定なので、自動的に蓄積されてゆくデータベースの構築にうってつけだ。ただしこうした利用はあくまでも個人的な利用に限られる。もちろん構築したデータベースを会社で利用したりインターネットに公開することはできない。また、基本的に文字放送自体が個人、家庭での受信に限られるのでネットワークを経由した受信・表示やデータ利用も家庭内LANの範囲内でということになる。

○文字放送自動テキスト化
文字放送データベースの構築は、自動実行ソフトウェアを使って、ChScan(受信ソフト)で受信し、TTNews(表示・出力ソフト)で蓄積、テキスト型データベースソフトでデータベース化するという手順になる。自動実行ソフトウェアはWindows95Plusに入っているシステムエージェントやWindows98で標準の「タスク」などが利用できる。データバックアップ(chdtbak.exe)というツールはオプションをつけて実行するとChScanをいろいろ制御できるので、筆者のサーバはシステムエージェントにこのソフトを登録して朝の6時から夜の12時まで3時間おきにすべての文字放送チャンネル(東京の1,4,6,10,12Chを10分づつ受信)を受信して最新の情報に更新するように指定してある。リアルタイム系の情報を除いてほぼ常に最新の情報を取り出せるようになっているといっていいだろう。テキスト取り出し・ファイル化のためには専用の定義ファイルを作ってTTNewsで実行させる必要がある。TTNewsには出力するテキストをユーザが自由にカスタマイズできる機能がある。番組によっていろいろな画面形式のデータがあり、さらに変更されることもあるのでこの機能は重要だ。基本的に文字放送のページデータからヘッダ(番組番号や日付などの情報)とタイトル、本文を3つの段落のテキストに変換し番組ごとにすべてのページデータをひとまとめにしたファイルを生成するのがいいようである(テキスト形式のマルチページモード)。デフォルトでは所定のディレクトリに日付をベースとしたファイル名でテキストが出力されているようになっている。システムエージェントに定義ファイルを実行させて自動的にTTNewsを呼び出すとどんどんウィンドウができてしまうのでウィンドウを自動終了させる必要がある。TTNewsには時間指定で自分自身を終了させる機能があるのでこの指定をしておく。さらには別なファイルを時間指定で呼び出すこともできるので、システムエージェントにすべてのファイルを登録する必要はない。例えば、経済ニュース(のための定義ファイル)をひとつ登録すれば、経済ニュースから国際ニュースを呼び出し、次に社会ニュースで終了するといったことができる。番組によってデータの更新時刻や間隔が違うので、ファイルの実行時刻は試行錯誤が必要だ。筆者はNHKのニュースとテレモの経済ニュース、国際ニュース(いづれも全国放送)を10時、16時、22時に出力するようにしている。

○データベースによる管理
さて、こうして毎日蓄積されてゆく文字放送テキストファイルを管理するデータベースだが、このテキストデータを自在にデータベース化するぴったりのデータベースソフトがMYDBというフリーウェア(S.Ito氏作)だ。NIFTYやインターネットからダウンロードできる。MYDBは、テキストファイルの記録場所を自動的にデータベースにする記事データベースで、記事に含まれるキーワードを基に記事の分類を行うことができる。データベース化された記事を閲覧するためのブラウザを持ち、キーワード検索等を用いて目的の記事を読むことができるようになっている。テキストデータならどんなデータでもデータベース化できるという優れものだ。データの分類の指定に自由度があるので定義ファイルを作成するのが少々難しいが、わかってしまえば文字放送テキストデータにまさにぴったしなのがわかるだろう。TTNewsで出力されるテキストからファイル名や各ページのヘッダ、タイトルなどの情報を使ってデータベース化した例が以下のようなものだ。毎日起動するたびにデータの更新がかかって新しいデータがデータベース化されているのがうれしい。
経済ニュースは「景気」で分類すると最近いかに頻繁にこの単語が出てくるかということがよくわかる。国際ニュースでは意外とロシア関係のニュースが善戦しているということも気づくことができた。また暇な主婦は芸能ニュースをデータベース化すればキャスターより詳しい予備知識をもってワイドショーを見ることができるだろう(梨本さんにはかなわないと思うが)。

○文字放送専用サーバ
最近は個人や家庭でネットワークを構築することが増えてきたので、ファイル、プリント、FAX、Web、ダイアルアップなどのサーバ機能やさらには連装CD-ROMサーバ、プロキシー(モデム・TAの共有、Webキャッシュ)といったものを実装した専用サーバを24時間稼動させているケースも多いだろう。かくいう筆者もその一人だ。筆者はこれを1000ドルPCの小型パソコンで構築している。家庭に置くサーバなどはファンが静かで筐体と電源が小さい、一人二人に奉仕する働き者であればいいと思っている。文字放送データベースはこれをさらに働き者にする絶好のアイテムだ。TVキャプチャーボードをサーバにいれるというのも意外といえば意外なのだがNetmeetingなどを使ってこれを遠隔操作できれば面白いのではないだろうか。