![]() 前へ |
![]() 次へ |
データ監査は、一連のデータ・ルールに対してデータを検証し、レコードがルールに準拠しているかどうかを判断するプロセスです。データ監査では、監査データに対してエラーがいくつ発生しているかを監査し、マークすることで、システム内のデータがどの程度ルールに準拠しているかを示す統計メトリックを収集します。データ監査により、定義されたデータ・ルールにデータが準拠していることを確認し、ビジネス・ルールに対する準拠性を追跡できます。
データ監査は、ビジネス要件を満たすデータ品質レベルを継続的に提供するための重要なツールです。不良データの突然の増加が検出された場合は、この増加を特定のイベントと関連付けて、考えられる根本的要因も特定できます。たとえば、新規データ・ソースを追加した場合や、データ・ソースやアプリケーションの変更によってシステムに影響がある場合などです。
Warehouse Builderを使用してデータを監視するには、最初に「データ・プロファイリングの実行」の説明に従ってデータ・ルールを検出または設計する必要があります。その後、データ監査を定義してスケジューリングするか、より大きなプロセス・フローにデータ監査を組み込みます。
データ監査は必要に応じて随時配布および実行できます。ただし、通常は、データ・ウェアハウスやERPシステムなどの運用環境においてデータの品質を監視するため、データ・ロードなどの更新後即時に、または定期的な間隔で、プロセス・フローの一部として監査の実行がスケジューリングされます。
データ監査のしきい値
データ監査では、しきい値を使用します。これによって、ルールに準拠しないレコードが大量に発生するとプロセス・フローが正常に進行せず、エラーまたは通知ストリームが発生するという事実に基づくロジックを作成できます。しきい値は、データ監査によって監査するデータ・ルールごとに指定できます。この値を使用して、定義した制限内にデータ・オブジェクトのデータが収まっているかどうかを判断できます。プロセスでは、このしきい値に基づいてアクションを選択できます。プロセス・フローでは、結果に基づき、この値およびブランチをテストできます。
たとえば、Employees表のデータを監査するデータ監査を作成するとします。この表には、emp_email_unique_ruleとemp_sal_min_ruleという2つのデータ・ルールが含まれます。これら両方のルールに対してしきい値として80%を指定します。つまり、Employees表の80%未満のデータがデータ・ルールに準拠しない場合、この表の監査は失敗します。
データ監査の監査結果
ルールに準拠しないレコードにしきい値を設定する以外にも、監査結果を取得し、分析を目的としてこれらを格納することもできます。データ監査を実行すると、複数の出力値が設定されます。これらの値の1つが監査結果です。監査結果により、データ監査の実行時に発生するデータ・ルール違反の範囲に関する情報が提供されます。