オンライン・システム・ニュースレター No.16 (1988.11.24)


重複処理について


 ニュースレター14号でもお知らせしました重複レコードの処理について、現在までの状況を報告します。
 11月11日現在で各接続大学図書館から報告された重複レコードは報告書件数にして、197件(重複件数:和図書554件、洋図書212件、著者名典拠75件)となっ ています。また、これとは別にセンターにおいて重複レコードを見つけるプログラムを使用して発見した重複と思われるレコードの件数が1,154件(内訳:和図書575件、洋 図書242件、著者名典拠337件)あります。これらについてセンター側で再度チェックを行い、重複レコードとして統合しなければならないものについて、数回に分けて統合 作業を行いました。
 統合作業は次の手順で行っています。


[書誌レコードの重複の場合]


  1.  発見された重複データを比較し、削除するもの(以下、削除側)と残すもの(以下生き残り側)とに分別する。(IDの小さいものを残す)
  2.  1.で決定した組合せを重複処理用の入力データとしてパンチする。
  3.  2.でできた入力データをもとにデータチェックを行う。 この段階で、
    • 重複データそれぞれに同一参加組織、同一配置コードの所蔵レコードがないか
    • 重複が子書誌同士の場合、削除側に所蔵レコードがリンクされているか
    • 親書誌IDが異なっていないか
    • 生き残り側に典拠IDがあるか
     についてチェックする。
  4.  3.のチェックにおいて
    • 双子となる所蔵レコードがある場合はエラーとなり、処理対象から除外される。
    • 所蔵レコードがない場合はエラーとなり、処理対象から除外される。
    • 親書誌IDが異なっている場合には、統合後調整を行えるように警告を出す。
    • 生き残り側の典拠がオプションで、削除側がリンクされている場合には、削除側のデータ(標目形とID)を生き残り側のALフィールドに埋め込む。
     といった処理を行う。
  5. チェックを通過したものについて、削除側にリンクしている所蔵レコードを生き残り側に付けかえ(所蔵レコードの中の書誌IDの修正)、削除側の書誌をデータベー スより削除する。

[典拠レコードの重複の場合]


  1.  書誌の場合と同じ
  2.  書誌の場合と同じ
  3.  削除側が生き残り側と「からも見よ参照」関係にあるかチェックを行い、ある場合はエラーとして、処理対象から除外される。
  4.  チェックを通過したものについて、削除側にリンクしている書誌レコードがあればその書誌のリンクフィールドを生き残り側のデータを用いて書き直し(書誌レコード のリンクフィールドの修正)、削除側の典拠レコードをデータベースより削除する。

 なお、これらの処理の過程でエラーデータとなったものについては、各接続大学図書館に問い合わせを行っています。特に、双子所蔵(重複レコードそれぞれに同一参加組織、同一 配置コードの所蔵があるもの)については、所蔵データの統合及び削除側書誌にリンクされている所蔵レコードの削除をお願いしています。
 以上の処理が終了した後、生き残り側のレコード対して、データ修正、リンク付けかえ等の処理をセンター側で行っています。

 また、削除予定レコードのデータベースからの削除も、数回に分けて実施しました。
 この中には、書誌は削除予定レコードとなっているにもかかわらず、所蔵レコードがリンクされているものが若干数ありました。それらについては、単純な所蔵削除のし忘れかどう か判断できかねましたので、所蔵大学図書館へ問い合わせ、処理をお願いしました。

 11月11日現在で重複の統合処理、削除処理が終了した件数は次のとおりです。

 ┏━━━━━━━┳━━━━━━━━━━━┳━━━━━━━━━━━━━┓
 ┃       ┃  重複の統合処理  ┃削除予定レコードの削除処理┃
 ┣━━━━━━━╋━━━━━━━━━━━╋━━━━━━━━━━━━━┫
 ┃ 和 図 書 ┃      571    ┃      2,860     ┃
 ┣━━━━━━━╋━━━━━━━━━━━╋━━━━━━━━━━━━━┫
 ┃ 洋 図 書 ┃      399    ┃      1,678     ┃
 ┣━━━━━━━╋━━━━━━━━━━━╋━━━━━━━━━━━━━┫
 ┃ 著者名典拠 ┃       0    ┃       282     ┃
 ┣━━━━━━━╋━━━━━━━━━━━╋━━━━━━━━━━━━━┫
 ┃ 統一書名典拠┃       0    ┃        1     ┃
 ┗━━━━━━━┻━━━━━━━━━━━┻━━━━━━━━━━━━━┛