重複チェックのアルゴリズム（２重ループ） - 【とんはじ】とんかつのはじっこ

仕事をしていると、相互チェック（重複エラーチェック）を実装することがある。しかし、アルゴリズムを考えるのが苦手だ。ここにメモとして残しておきたい。

画面イメージ

一覧形式の入力項目にエラーチェックを実装しようとする。

製品入庫登録

No.	製品番号	数量
1
2
3
4
5

仕様

①登録ボタンを押下後、製品番号が重複している場合、エラーを表示する。

エラーを画面上部に表示する場合

重複データを単純に知らせたい場合、画面の上部もしくはJavaScriptのalertでポップアップエラーを表示することがある。

製品入庫登録

No.	製品番号	数量
1
2
3
4
5

ソース

ボタンを押した時に呼び出される関数は、下記に記載。

function buttonfunction1() {
var ary = new Array(5);
ary[0] = document.getElementById('seiban1_1').value;
ary[1] = document.getElementById('seiban1_2').value;
ary[2] = document.getElementById('seiban1_3').value;
ary[3] = document.getElementById('seiban1_4').value;
ary[4] = document.getElementById('seiban1_5').value;
var count = 0;
var errorFlg = false;
for (i = 0; i < 5; i++) {
if (ary[i] == "") {
count++;
continue;
}
for (j = 0; j < 5; j++) {
if (i == j) {
continue;
}
if (ary[i] == ary[j]) {
errorFlg = true;
}
}
}
if (count == 5) {
document.getElementById('msg1').innerHTML = "<font color='red'>登録データがありません。</font>";
return;
}
if (errorFlg) {
document.getElementById('msg1').innerHTML = "<font color='red'>製品番号が重複しています。</font>";
} else {
document.getElementById('msg1').innerHTML = "登録しました。";
}
}

解説

大きな処理は３つ。

配列・変数の定義、重複判定処理、メッセージ・エラー表示。

これに付け加えて重複判定ではForの入れ子で実装している。

2～7行目　入力項目を配列にセット。
9行目　全てが空行か判定する変数（※１）
10行目　重複行があるか判定する変数（※２）
11行目　For文　全行判定します。
12～16行目　空行の場合、次の行に移る。空行判定変数（※１）にインクリメント。
17行目　For文　現在行との重複行を全行判定します。
18～20行目　自行の場合は、次の行に移る。
21～23行目　値が同じ場合、重複エラー変数（※２）をtrue。
26～29行目　空行判定変数（※１）が全行の場合、エラーを表示。処理終了。
31行目　重複エラー変数（※２）がtrueの場合、エラーを表示。
33行目　そうでない場合、登録成功。

今回は、全行が空行か判定を重複判定処理に組み込んでしまったが、これは重複判定処理の前に実装しておいたほうがいい。だって、入力行数が100行になったら、100×100=10,000回施行してしまう。

というわけでこれを改善していこう。

問題はなんだったのか？

上記のソースの問題は、行数がn行あると、試行回数がn²になってしまう。この考え方を計算量オーダーとか言ったりするが、これはまたの話。

さて、このことから重複計算処理になにかしらの手を加えなければならない。

ここで、机上デバッグしてみる。

机上デバッグ

ここでの机上デバッグは、ソースコードの妥当性というよりも変数遷移の書き出しをしてみるとする。

i = 0 のとき、
　j = 0 のとき、i 行と同じなので重複判定対象外。
　j = 1 のとき、i 行と重複判定。
　　・・・
　j = 4 のとき、i 行と重複判定。
i = 1 のとき、
　j = 0 のとき、i 行と重複判定。
　j = 1 のとき、i 行と同じなので重複判定対象外。
　j = 2 のとき、i 行と重複判定。
　　・・・
　j = 4 のとき、i 行と重複判定。
・・・
i = 4 のとき、
　j = 0 のとき、i 行と重複判定。
　j = 1 のとき、i 行と重複判定。
　　・・・
　j = 4 のとき、i 行と同じなので重複判定対象外。

かなり長くなってしまったが、おやおや、（i = 0, j = 1）の判定と（i = 1, j = 0）の判定は同じですよね？だって同じ配列なんですもん。

ということは、i = 1 のときは、j = 2 から判定すればいいんですよね？
（もしくは、i = 3 のときは 0,1,2を判定すればよい。）

重複判定処理　修正版①

重複判定を自行より大きい行とする場合。

for (i = 0; i < 5; i++) {
if (ary[i] == "") {
count++;
continue;
}
for (j = i + 1; j < 5; j++) {
if (ary[i] == ary[j]) {
errorFlg = true;
}
}
}

重複判定処理　修正版②

重複判定を自行までの行とする場合。

for (i = 0; i < 5; i++) {
if (ary[i] == "") {
count++;
continue;
}
for (j = 0 j < i; j++) {
if (ary[i] == ary[j]) {
errorFlg = true;
}
}
}

結論

修正版を使うと、ソースをステップ数（計算量オーダー）が減ってスリムに見えてくるようになりましたね。

次は、各行にエラーを表示する処理を考えます。

より計算量を減らす考え方はこちら

instery.hatenablog.com