![]() 前へ |
![]() 次へ |
重み付けされた一致ルールにより、ルールに含まれる各属性に整数の重みを割り当てることができます。また、しきい値を指定する必要があります。各属性について、Match-Merge演算子により、その重みに類似度のスコアが乗算されてスコアの合計が計算されます。その合計がしきい値以上である場合、比較している2つのレコードは一致するとみなされます。
重み一致ルールは、多数の属性を比較する必要がある場合に非常に便利で、条件付きルールでは、1つの属性が異なっても不一致が発生する可能性はありませんが、条件付きルールでは発生する可能性があります。
重みルールは、暗黙的に類似度のアルゴリズムを呼び出し、2つの属性値を比較します。このアルゴリズムでは整数、および割合の値を0から100の間の値を戻します。割合の値は、2つの値の類似度を表します。値が100の場合、2つの値が同一であることを示し、値が0の場合はまったく類似していないことを示します。
類似度アルゴリズム
一致の判別に使用する方法。次のアルゴリズムから選択します。
Edit Distance: ある文字列から別の文字列への変換に必要な削除、挿入または置換の数が計算されます。
Jaro-Winkler: 「Edit Distance」アルゴリズムよりも改善された比較システムが使用されます。文字列の長さが考慮され、先頭にあるエラーほど大きなペナルティが適用されます。また、一般的な誤植も認識されます。
属性
特定の条件のテスト対象となる属性を識別します。任意の入力属性(INGRP1)から選択できます。
最大スコア
属性の重み値。「一致のための必須スコア」よりも大きい値を指定する必要があります。
空白の場合にスコア
レコードの1つが空の場合の類似度の値。
一致のための必須スコア
一致に必要な類似度を表す値。値100は2つの値が同一であることを示し、値0(ゼロ)は類似性がないことを示します。