Business

ビジネス

明細データを持つことに意味がある

安達敏光
2009年8月3日 / 09:00
 
 
前回はデータウェアハウス(DWH)の4つの基本要件を紹介しました。

この基本要件以外にデータウェアハウスを価値あるものにする上で重要なポイントが、「明細データを持つ」ということです。

明細データとは

明細データとは、企業あるいはその業務システムで発生するアトミック(原子)レベルのデータのことです。素データともいいます。

小売業の例でいうと、レジのスキャナで読み取ったバーコードひとつひとつの内容が1件ずつのデータになっているものが、買上明細データです。銀行の場合ですと、給与振り込みとか残高照会、ATM での現金引き出し、電気代の自動引き落としなどの動きのすべてを記録したものを、取引明細データといいます。

このような明細データは、もともと、業務システム内部の処理のために一時的に保持されるもので、日次や月次の処理が終わって用済みになると、削除されるのがふつうです。(システムのバックアップ目的で一定期間テープ装置などにログを残していても、通常業務ではそのようなデータにアクセスすることはできません)

データウェアハウスは、今まで見捨てていた明細データを時系列で蓄積して、そこから情報を引き出せるようにします。

ただ、実際のデータウェハウスでは、入力された暗証番号など、セキュリティ上慎重な扱いが求められる情報は除外している場合が多いので、どうぞご安心を。そのかわり、暗証番号エラーなどがあったときは、エラーがあったことを示すレコードをデータウェアハウスに格納しています。

サマリーデータとは

かつては情報系システムといっても、たいてい明細データは保有していませんでした。月末時点での残高や在庫のデータ、それから、月および決算期ごとに取引金額や件数を集約(サマリー)したデータを保有していました。その理由はデータを保管するストレージが高価だったこと、保管したとしても、膨大なデータを実際に活用できるコンピュータパワーを手に入れることが、1990年代以前は困難だったからです。

明細データを使うメリット

サマリーデータからは抜け落ちてしまう貴重な情報を、明細データは含んでいます。

例えば、コンビニエンスストアの弁当の売れ行きを示すデータが、1時間単位にサマリーされたデータだったらどうでしょうか。

オフィス街の店ではおそらく11時30分を過ぎたころから13時くらいまでの間に、多くの弁当が完売するでしょう。仮に10種類の弁当を仕入れていたとします。さてどれが最も人気があったでしょうか?

もし、1時間単位のサマリーデータだったら、だいたいどの弁当も13時には売り切れていた、ということしかわからないでしょう。

実際は、最も人気のある弁当はあっという間に、12時過ぎ早々に品切れになっていたかも知れませんね。

そうすると、後から来たお客さんは、必然的に残った弁当から選択せざるを得ないわけで、その10分後には2番人気の弁当が売り切れる。そして次は3番人気の商品がなくなっていく。

こんなふうに、短い間にどんどん売れていく商品の様子をリアルに把握するためには、サマリーしていない明細データでないとだめなのです。

まあ、コンビニエンスストアの実際はデータに頼りっぱなしではダメで、お店の人の観察眼が重要と思いますが…。

サマリーデータと明細データ
サマリーデータと明細データ


銀行では、店員の観察力で勝負とばかり言っていられません。とりわけサラリーマン顧客の場合、給料は振り込み、各種料金は自動引き落とし、現金を下ろすのは ATM、というように、店員と対面で行う取引なんて、1年のうちに何回もありませんよね。

でも、日本の銀行では長い間、顧客の様子を見るのは月次データというのが慣習でした。つまり、月末残高と月中平均残高というのを主に見るのです。

確かに、4月の月末残高が2,100万円、5月月末残高が2,050万円、6月の月末残高が2,200万円というお客さんだったら、たぶんいつも2,000万円くらいのお金を預けていると想像しても、大きく違うことはないでしょう。

でも普通の若いサラリーマン層に多い月末残高30万円前後の人だったら、どうでしょうか。

ここにAさん、Bさん、2人の若手サラリーマンがいたとします。サマリーデータで見ると次のように見える2人です。

Aさん:5月の月末残高は25万円、月中平均残高は9万円。
Bさん:5月の月末残高は25万円。月中平均残高は11万円。

たったこれだけの情報で、2人の財政状態の違いをイメージできますか?

無理ですね。だいたい似たような2人かなぁ、としか言いようがないと思います。

もう少し気の利いたサマリーデータを持っている銀行だったら、月間の合計出金金額というサマリーデータを持っています。

Aさん:5月の総出金金額:約35万円。
Bさん:5月の総出金金額:約20万円。

これを見ると、Aさんのほうが多くのお金が出て行っていることがわかりますね。でも、それがなぜなのかまでは想像つきません。

それでは明細データで見るとどうでしょうか。

口座残高の推移
口座残高の推移
*クリックして拡大
 

Aさんは給料日直後には残高が30万円を超えますが、あっという間に ATM でお金を引き出したり、多額のクレジットカードの引き落としがあったりして、給料日前には残高が1,000円を切ってしまう、ギリギリの暮らしをしているようです。このような人には、カードローンのような商品を勧めすると、利用してもらえるかもしれません。

一方Bさんは給料日前でも残高は7万円をキープしていますし、しかも4月末と比べて5月末の残高が増えています。かなり堅実な生活をしていそうです。このような人にはカードローンは必要なくて、積立型の貯蓄商品に興味を持ってもらえそうですね。

このように明細データで見れば、サマリーデータでは判らなかった2人の財政状態あるいはライフスタイルの違いが、ずいぶん具体的にイメージできて、それぞれに適したセールストークを判断しやすくなります。

明細データとは、今回例にあげた小売業の POS や銀行オンラインデータのようなものに限りません。伝票や注文書で業務を行っているのでしたら、伝票や注文書単位のデータが明細データになります。データウェアハウスに明細データを蓄積して、他のデータと組み合わせると、意思決定の精度を高めたり、新しい発見につなげることができるのです。

記事提供:日本テラデータ株式会社
【関連記事】
データウェアハウスと単なるデータベースの違い
厳しい経済状況でも商談が進むデータウェアハウスとは何か
JBCC、電子配信が可能な給与明細書配信システムを販売

New Topics

Special Ad

ウマいもの情報てんこ盛り「えん食べ」
ウマいもの情報てんこ盛り「えん食べ」 「えん食べ」は、エンジョイして食べる、エンターテイメントとして食べものを楽しむための、ニュース、コラム、レシピ、動画などを提供します。 てんこ盛りをエンジョイするのは こちらから

Hot Topics

IT Job

Interviews / Specials

Popular

Access Ranking

Partner Sites