データクレンジングとは、収納方法を見直し、混沌状態のデータを整理整頓し、必要な情報を取得できる状態に戻すことを言います。
見なかった事にする前に、一度ためしてみませんか?
コストダウンを始め、あらゆる進歩をお約束します。
間違った分類をされている、なぜか品目のところに型番や仕様情報などが書かれているなど心当たりはありませんか?
データの補正をする前に、まずデータの収納方法、つまりはスキーマを見直します。
データベースよりデータを検索する際に本当に必要なプロパティー、不要なプロパティー、そして分類体系を吟味し直します。
スキーマとは、データの収納方法のルールをさします。
◆
Ex) 記入事項
◆
Ex) 仕訳方法
調達物品の標準化などより高度なクレンジングが目的の場合は、標準辞書に基づいたスキーマの作成という手段も有効です。
◆
Ex) ECALS,JIS規格,RossettaNet,eOTD等…
スキーマが決まったら、今度はマスタデータの修理を行います。
品名・型番・メーカ名等の表記をメーカカタログに準じた形式に修正する。
スキーマに沿ってデータを補正していき、足りない部分に関してはあらたに情報を追記する。
物品を仕様レベルで比較検討するには、入力データは統一された単位である必要があります。ばらばらの単位で入力されている場合はそれらを統一単位に置き換えましょう。
分類から検索を可能とするために、分類の見直しを行い正しい分類コードを付与しましょう。
調達コード、製造コード等々ひとつのデータ対してあらゆるコードが割り振られています。複数のコードで各部署に点在して管理するよりも、
誰が見ても理解できる社内共通コードを付与して一カ所で管理しませんか?
補正作業が終了したら、一意になる社内共通コードを付与します。