NACSIS-CAT/ILLニュースレター35号 (2012.6.29)


目録システムの正規化処理についての改修

  本誌34号(2012.1.10)でお知らせしましたとおり,特殊文字・特殊言語資料に関する取扱い及び解説,コーディングマニュアル抜粋集の公開に関連して,目録システムの正規化処理についての改修を行います。なお,サーバへの実装は,平成24年10月頃を予定しています。

  主な改修点は,以下のとおりです。

  1. 以下の文字種について,大文字小文字の正規化を行い,大文字・小文字いずれであっても検索を可能する。

    ・ギリシャ文字 U+0370〜U+03FF / U+1F00〜U+1FFE(の一部)
    ・コプト文字 U+03E2〜U+03EF / U+2C80〜U+2CFF
    ・キリル文字 U+0400〜U+04FF / U+0500〜U+0527 / U+A640〜U+A697(の一部)
    ・アルメニア文字 U+0531〜U+058F / U+FB13〜U+FB17
    ・グラゴル文字 U+2C00〜U+2C5E
    ・グルジア文字 U+10A0〜U+10FF / U+2D00〜U+2D2D
    ・ディザレット文字 U+10400〜U+1044F

  2. 複数の要素によって構成されている文字であって,個別の要素と文字全体についてそれぞれ文字コードが割り当てられているものは正規化・包摂を行う。


              ※データベースには,U+0BCAとして登録される



              ※データベースには,U+0A59として登録される


  3. 各文字種に固有の数字については,インデクスの正規化を行い,アラビア数字での検索を可能とする。

  4. 音標記号の付加された文字については,インデクスの正規化によって,音標記号の付加されない文字に揃え,いずれの文字においても検索を可能とする。







前ページへ
6

次ページへ