Read/Search this Article
Abstract
企業の持つデータ資源を企業活動に有効活用するには、業務対応に個別に開発されてきたシステム間でのデータの流通を促進し、利用者が要求する情報を迅速に取り出せるようにすることが重要な課題となる。個々に開発されてきたシステム間では、 データの流通を阻害する原因として一般に次の問題を抱えている。(1)同じデータ項目を互いに持っていても、異なる名称であるため発見が難しい。(2)同じデータ項目であることがわかったとしても、異なる属性、異なるコード体系を持っため変換が必要である。データ流通を促進するためには、これらに該当するデータ項目を事前に検出し、標準化により名称、属性、コード体系等を統一しておくことが必要である。しかし、調査の対象とすべきデータ項目の数は1つの企業で数千〜数万に及ぶため、これを全て人手で行うには莫大な期間と工数が必要である。従って、全てのデータ項目を対象に類似のデータ項目(同一、もしくは同じコード体系とすべきデータ項目)のグループに分類するツールが望まれる。類似の名称を検索するツールは既にいくつか存在するが、従来のこの種のツールは指定の単語を含む名称を検索することを目的としており、上記の目的で用いるには効率が悪い。本稿では、データ項目をデータ項目の日本語名(以後、単に名称と記す)をもとに分類する方式を提案し、その効果を示す。
Journal
- 全国大会講演論文集 [List of Volumes]
-
全国大会講演論文集 第37回昭和63年後期(1), 435-436, 1988-09-12 [Table of Contents]
Information Processing Society of Japan (IPSJ)