お役立ち情報・vol3

予測精度を上げるためのデータ収集と前処理のコツ
〜Garbage In, Garbage Out からの脱却〜

目次

  1. 第1章:何を予測したいのか?⽬的から逆算する調達データ収集戦略
  2. 第2章:「集める」から「⾃動で貯まる」へ:在庫データ管理から予測業務の新しい常識
article

関連記事

「なぜ勘に頼る発注は危険なのか?」

「ベテラン社員不在で業務が⽌まる前に今着⼿すべきデジタル化」

「予測精度を上げるためのデータ収集と前処理のコツ」

「需要予測サービスと購買サービスの使い分けで、調達業務をデータドリブンに。」

予測精度を上げるためのデータ収集と前処理のコツ
〜Garbage In, Garbage Out からの脱却〜

「AIを使えば、未来の売上や顧客の⾏動を正確に予測できる」
近年、ビジネスの世界ではAIや機械学習による「予測」への期待が急速に⾼まっています。しかし、最新の予測モデルを導⼊したにもかかわらず、「期待したほどの精度が出ない」という壁にぶつかるケースは少なくありません。なぜでしょうか?

その答えの多くは、モデルのアルゴリズムではなく、その⼿前にある「データ」そのものに隠されています。データ分析の世界には「Garbage In, Garbage Out」という有名な⾔葉があります。これは「ゴミを⼊れれば、ゴミしか出てこない」という意味。つまり、どれほど⾼度な予測モデルや機能・サービスを使ったとしても、投⼊するデータが不正確であったり、不⼗分であったりすれば、価値のある予測結果を得ることはできないのです。

多くの⼈がモデルの華やかな部分に⽬を奪われがちですが、実は予測プロジェクトの成否の約8 割は、地道な「データ収集」と「データ前処理」の⼯程で決まると⾔っても過⾔ではないと思います。

何を予測したいのか?⽬的から逆算する調達データ収集戦略

精度の⾼い調達予測の第⼀歩は、闇雲にデータを集めることではありません。「何を予測したいのか」という調達課題を明確に定義し、そこから逆算して必要なデータを戦略的に集めることが全ての始まりです。

データソースを集め・管理する。
必要なデータの仮説リストが完成したら、それらのデータがどこにあるのか(データソース)を探します。もしないので、あればそのデータを⽣み出す仕組みを準備する事が重要なのです。
データ収集のコツ:予測の⼟台を固める。
まずは、予測の基礎となるデータを集める段階です。質の⾼いデータを、適切な範囲と粒度で集めることが重要です。

関連するデータを可能な限り多⾓的に集める。
過去の販売実績や在庫データだけでなく、需要に影響を与える可能性のあるあらゆるデータを収集しましょう。
社内データ
販売・出荷実績: 最も基本的なデータです。商品別、店舗別、顧客属性別など、できるだけ細かい単位(SKU単位が理想)で収集します。
在庫データ: 現在の在庫数、発注点、リードタイム、安全在庫などのデータです。
商品マスタ: 商品のカテゴリ、価格、ライフサイクル(新商品、定番、終売など)の情報です。
販促データ: セール、キャンペーン、値引き、広告出稿などのイベント情報です。

データの「粒度」と「期間」を意識する
データの時間的な解像度(粒度)は、予測したい対象に合わせて統⼀することが重要です。
粒度の統⼀:
「⽇次」「週次」「⽉次」など、分析の⽬的に合わせてデータの粒度を揃えます。例えば、⽇次の販売実績データと⽉次の広告費データをそのまま組み合わせることはできません。
⼗分な期間の確保:
季節変動やトレンドを捉えるためには、最低でも2〜3年分の過去データがあると望ましいです。

⽋損値の対処:データの⽳を埋める
データの⼀部が⽋けている「⽋損値」は、必ず存在します。これを放置すると、正確な分析ができません。
⽋損の理由を探る: なぜデータが⽋損しているのか(例:システムの不具合、⼊⼒漏れ)をまず考えます。理由によって対処法が変わることがあります。

適切な⽅法で補完する:
平均値・中央値で補完: 最も簡単な⽅法ですが、データのばらつきを⼩さくしてしまう可能性があります。前後の値で補完: 時系列データの場合、直前または直後の値で埋める⽅法が有効なことがあります。
予測モデルで補完: 他のデータ項⽬の情報を使って、⽋損している値を予測して補完する⾼度な⽅法もあります。⾏ごと削除: ⽋損が⾮常に多い場合は、そのデータ⾏ごと削除することも選択肢の⼀つです。

上記のような⼿段でデータを集める事で、予測に必要なデータを収集する事で予測の精度は上げる事は可能なのです。
ただし、データを⼈海戦術で収集する事は、現実的に難しい場合も多いと思います。
その場合には、収集すべきデータを⾃動で集める仕組みづくりをすることが次に考えるべき事なのです。

「集める」から「⾃動で貯まる」へ:在庫データ管理から予測業務の新しい常識

需要予測の精度を上げるためには、正確な在庫データが不可⽋です。
しかし、多くの現場では、今なお「データを集める」という作業に多くの時間と労⼒が費やされています。⽇々の業務に追われながら、Excelファイルや紙の帳票からデータを転記し、集計する…これでは、データの⼊⼒ミスや収集漏れが発⽣するリスクも⾼まります。

そこで発想を転換し、「データを集める」のではなく、「業務を⾏うと同時にデータが⾃動で貯まる」仕組みを構築することが、これからの在庫管理のスタンダードです。これにより、データ収集の⼿間を劇的に削減し、常にリアルタイムで正確なデータを確保することが可能になります。

「データが⾃動で貯まる」仕組みの作り⽅
この仕組みを実現するための具体的なアプローチは、主に2つあります。

<システムの導⼊・連携による⾃動化>
最も効果的なのは、在庫管理に関連する業務プロセスをシステム化し、それらを連携させることです。

ハンディターミナルやRFID の活⽤:
⼊荷・出荷・棚卸しといった作業を、バーコードやICタグを読み取るだけで完結できるようにします。作業者は画⾯の指⽰に従って商品をスキャンするだけ。その操作ログが、そのまま「いつ」「誰が」「どの商品を」「いくつ」処理したかという正確な在庫データとして、システムに⾃動で記録されます。これにより、⼿作業による⼊⼒ミスはゼロになり、作業の標準化と効率化も同時に実現できます。

販売管理(POS)システムとの連携:
店舗のPOS レジで商品が売れた瞬間に、その情報が在庫管理システムに⾃動で反映されるようにします。これにより、リアルタイムでの販売実績と在庫数の変動を、⼈の⼿を介さずに把握できます。特売やキャンペーンによる急な需要増も、即座にデータとして捉えることが可能です。

⽣産管理・購買管理システムとの連携:
製造業であれば、⽣産の進捗や部品の使⽤状況を管理するシステムと連携します。また、発注データも購買管理システムから⾃動で取り込むことで、「いつ」「何を」「いくつ」発注したかという情報も、漏れなくデータとして蓄積されていきます。

<業務プロセスの⾒直しとルール化>
⾼価なシステム導⼊が難しい場合でも、業務プロセスの⾒直しとルール化によって、データ収集の⾃動化に近づけることは可能です。

⼊⼒フォーマットの統⼀:
複数の担当者がそれぞれ異なる形式でデータを⼊⼒していると、後⼯程での集計が⾮常に煩雑になります。部署や担当者ごとでバラバラになっているExcel のフォーマットを統⼀し、⼊⼒する項⽬やルール(例:⽇付はYYYY/MM/DD形式で⼊⼒する、商品名はマスタから選択する)を明確に定めるだけでも、データ活⽤の⼿間は⼤きく削減されます。

データ⼊⼒タイミングのルール化:
「⼊荷処理は商品が倉庫に到着した当⽇中に必ず⾏う」「棚卸しは毎週末の⾦曜⽇17時に実施する」といったように、データ⼊⼒のタイミングを業務ルールとして徹底します。これにより、データの鮮度を保ち、計上漏れを防ぎます。

まとめ

サプライチェーンの不確実性が増す現代において、精度の⾼い調達予測は、コスト削減、安定⽣産、そして経営の安定化に直結する強⼒な競争優位性となります。
その鍵は、⾼度なアルゴリズムの導⼊以前に、⾃社の⾜元にある調達データをいかに整備し、価値ある情報へと昇華させるかにかかっています。「Garbage In, Garbage Out」の原則を胸に、まずは「どの調達課題を解決したいか」という⽬的設定をする。そして、在庫データを「集める」という発想から脱却し、「⾃動で貯まる」仕組みを構築することは、単なる業務効率化以上の価値をもたらします。

予測精度の⾶躍的な向上:
常にリアルタイムで正確なデータが⼿元にあるため、需要予測モデルは常に最新の状況を学習し、より精度の⾼い予測を算出できるようになります。

データドリブンな意思決定の迅速化:
現場担当者から経営層まで、関係者全員が同じデータを⾒て議論できるようになります。これにより、勘や経験だけに頼らない、データに基づいた迅速な意思決定が可能になります。

付加価値業務へのシフト:
データ収集という単純作業から解放された従業員は、予測結果の分析や改善策の⽴案といった、より付加価値の⾼い業務に時間を使うことができるようになります。

在庫管理におけるデータ活⽤の第⼀歩は、⾼度な分析⼿法を学ぶことではありません。まずは、⽇々の業務の中にデータ収集を溶け込ませ、⼿間なく正確なデータが⾃然と蓄積されていく仕組みを整えること。とそのデータの粒度含めたデータ品質を維持する事。それこそが、競争⼒を⾼めるための最も確実な⼀歩となるのです。

ご参考

MPSEYES(需要予測クラウドサービス)では、在庫データの適切な管理、倉庫管理システムに付随するサービスなどデータ管理に着⽬した機能拡張を定期的に実践しています。
無料トライアルでぜひ最新のクラウドサービスをお試しください。

お問い合わせはこちらから 無料トライアルはこちらから