プログラミング言語 Ruby のための Unicode 正規化ライブラリの実装と評価  [in Japanese]

Access this Article

Search this Article

Abstract

国際的な文字コードとして幅広く利用されている Unicode には,様々な合成済み文字や結合文字が収録されている.例えば,アクセント付き文字や仮名の濁音,半濁音を表すには数通りの表現が存在する.このように意味的には等価な文字列でも,異なる表現が混在すると,テキストを処理する際に不都合が生じる.本研究では,これらの問題を解消するために Unicode で定められている正規化形式に準拠した Ruby ライブラリを実装する.ライブラリは基本機能として,文字列の四つの正規化の有無を判別,及び各正規化形式への変換を行う機能を提供する.さらに既存の正規化ライブラリにはない機能として,互換形式を指定した文字列の正規化を図り,W3C で推奨されている正規化形式 NFC による変換の高速化を実現する.

Journal

  • 第73回全国大会講演論文集

    第73回全国大会講演論文集 2011(1), 353-354, 2011-03-02

Codes

  • NII Article ID (NAID)
    170000088345
  • NII NACSIS-CAT ID (NCID)
    AN00349328
  • Text Lang
    JPN
  • Article Type
    Conference Paper
  • Data Source
    IPSJ 
Page Top