オンライン・システム・ニュースレター No.65 (1998.12.25)


目録システムにおける中国語,韓国・朝鮮語等の資料の扱い


目録システムにおける中国語,韓国・朝鮮語等の資料の扱い

 

・.目録システムの多言語対応に向けて

 目録システム(NACSIS-CAT)では,従来,中国語,韓国・朝鮮語等の資料については,簡体字やハングルのように,目録システムで扱えない文字があったため,暫定的な入力方法を示し,具体的な入力については各参加機関の判断に委ねてきました。そのために中国語,韓国・朝鮮語等の資料の登録が積極的には行われていませんでしたが,最近国際的に文字の規格が定められ,ようやく目録データの登録環境が整いつつあります。

 一方,新たな通信プロトコルCATPを用いた新CAT/ILLシステムは,各参加機関及び各システムベンダーの積極的な対応のおかげで順調に移行が進んでいます。この新システムの上で,さらに今後中国語,韓国・朝鮮語等の資料を取り扱えるようになります。

 目録システムの多言語対応についての基本的な考え方は,以下のとおりです。

    1. 簡体字やハングル等を扱うために,UCS(Universal multiple-octet coded Character Set:国際符号化文字集合)に対応したシステム及びデータベースを構築する。
    2. 現在暫定的に入力されているデータも,新システムで利用できるようにする。
    3. 新規に入力する作業を効率的にするため,参照MARCとして,中国語に対してはCHINA-MARC,韓国・朝鮮語に対してはKOR-MARCの導入を予定する。
    4. 各言語への対応の優先順位は,蔵書数によって決定する。したがって,まず中国語に対応し(平成12年から),その結果を踏まえて,韓国・朝鮮語に対応する。

 以下に,第一段階である中国語資料への対応の進捗状況と今後の予定を報告します。

 

・.中国語資料への対応

 平成7年度に「中国語資料データベース化検討ワーキンググループ」を設置し,中国語資料の取扱いについて,主に目録データの記録方法の面から検討を行ってきました。今回,その検討結果が,「中国語資料の取扱い(案)」(以下「検討案」という)としてまとまりました。

 この「検討案」に対し,各参加機関からの御意見を伺い,最終的に「目録情報の基準」「コーディングマニュアル」の改訂に反映させる予定です。

 また,平成12年1月から目録システムを中国語資料に対応させるために,システム面での準備も進めています。

 

  1. 「検討案」の概略(「検討案」は本号付録にあります)
  2.  「検討案」は,「基本方針」,「「目録情報の基準」の変更点」,「中国語資料用コーディングマニュアル」から構成されています。

     「基本方針」では,(1) 中国語資料について適用する目録規則は原則として「日本目録規則1987年版改訂版」とし,必要に応じて「中国文献編目規則」を適用すること,(2) 記述部分に関しては,転記の原則に従い,書かれたままの字体で記録すること,(3) 漢字の単語単位での検索を可能とするため,日本語ヨミの付与を必須とし,ピンインは,日本語ヨミとは別に記録することができること,(4) 古籍については,別ファイルを設定することはないが,入力規則を別に作成する予定であること,(5) 既存中国語資料データは,現在入力されている文字をそのままUCSに変換して,総合目録データベースに格納すること,の5点をうたっています。

     「「目録情報の基準」の変更点」では,上記の基本方針を具体的に運用していくに当たって,従来の「基準」にどのように反映させるかを示したものです。特に「中国語資料のヨミの表記及び分かち書き規則」は,これまでこのような形でまとまったものはないため,実作業を行う際に必須のものといえます。(ただし,この規則は,ヨミや分かちの標準化が目的ではなく,あくまで,検索のための便宜的な規則であることに留意してください。)また,「特殊文字・記号」では,UCSに収録された記号のうち,JIS X 0208:1997にあるもののみを使用することとし,従来のEXC文字に含まれていた「合成開始」等の記号は使用しないこととしています。

     「中国語資料用コーディングマニュアル」は,基本的なフィールド項目についてのみ今回の作業対象としました。「基準」の確定後,残った項目についての検討を継続する予定です。

     

  3. システム面での準備

 平成11年末にセンターの電子計算機の機種更新が予定されていますので,その機に目録所在情報データベース(総合目録データベース,参照ファイル)の文字コードとしてUCSを採用することを計画しています。その時点までに予定している事項を,以下に列記します。

  1. UCS対応漢字インデックス作成
  2.  このインデックスは, UCSの漢字(約2万字)を用いて記述されたデータの中から,求めるデータを効率的に探し出すために必要なツールです。データの検索・登録に使用できるようサーバに組み込まれます。

  3. 「その他のヨミ」フィールドの新設
  4.  ピンインを日本語ヨミとは別に記録するために,「その他のヨミ」フィールドを新設します。

  5. CHINA-MARCの導入
  6.  中国語資料の総合目録データベースへの効率的な入力を支援するため,参照MARCとしてCHINA-MARCを導入し,サービス開始時から提供します。併せて,総合目録データベースに既に登録されているデータのうち,ISBN等による同定でCHINA-MARCのデータと入替が可能なものについて,入替を行います。

  7. データベースのUCS変換

 総合目録データベース及び参照ファイルの文字コードを,UCSコードに変換します。これによってサーバ側はUCSコードとなりますが,参加機関側のクライアントの環境を考慮し,サーバからデータを出す際にクライアントの使用文字コードに変換する処理を組み込み,従来と同様のデータ表示を保証します。

 

 

  「検討案」への御意見をお寄せください。御意見は平成11年2月末日までメール又はFAXでお願いします。

 

送付先 : 学術情報センター事業部目録情報課

E-mail : chwg@op.nacsis.ac.jp

FAX  : 03(3944)7131

(図書目録情報係)