プログラミング言語 Ruby のための Unicode 正規化ライブラリの実装と評価

この論文にアクセスする

この論文をさがす

抄録

国際的な文字コードとして幅広く利用されている Unicode には,様々な合成済み文字や結合文字が収録されている.例えば,アクセント付き文字や仮名の濁音,半濁音を表すには数通りの表現が存在する.このように意味的には等価な文字列でも,異なる表現が混在すると,テキストを処理する際に不都合が生じる.本研究では,これらの問題を解消するために Unicode で定められている正規化形式に準拠した Ruby ライブラリを実装する.ライブラリは基本機能として,文字列の四つの正規化の有無を判別,及び各正規化形式への変換を行う機能を提供する.さらに既存の正規化ライブラリにはない機能として,互換形式を指定した文字列の正規化を図り,W3C で推奨されている正規化形式 NFC による変換の高速化を実現する.

収録刊行物

  • 第73回全国大会講演論文集

    第73回全国大会講演論文集 2011(1), 353-354, 2011-03-02

各種コード

  • NII論文ID(NAID)
    170000088345
  • NII書誌ID(NCID)
    AN00349328
  • 本文言語コード
    JPN
  • 資料種別
    Conference Paper
  • データ提供元
    IPSJ 
ページトップへ