検索結果を絞り込む

本文・本体へのリンク

検索結果 32 件

  • 階層構造を用いたダブル配列の圧縮法

    神田, 峻介, 泓田, 正雄, 森田, 和宏, 青江, 順一 第77回全国大会講演論文集 2015 (1), 693-694, 2015-03-17

    ...ダブル配列は,トライを2つの1次元配列BASEとCHECKを用いて効率的に実現する高速性に秀でたデータ構造であり,トライのノード間の遷移をO(1)で実現する.しかし,BASEの記憶領域がダブル配列における記憶効率の低下を招いている.本稿では,階層構造を用いることにより,BASEの記憶領域を削減し,ダブル配列の記憶量を圧縮する手法を提案する....

    情報処理学会

  • 近似直線を用いたダブル配列の圧縮法

    神田 峻介, 森田 和宏, 泓田 正雄, 青江 順一 情報処理学会研究報告. 情報学基礎研究会報告 2014 (11), 1-6, 2014-07-25

    トライ法とはキー検索を実現する手法のひとつであり,自然言語処理などにおいて幅広く活用されている.トライ法を実現するデータ構造としては,ダブル配列や LOUDS などがあげられる.ダブル配列は,トライのノード間の遷移を O(1) で実現する高速性を備えたデータ構造であるが,簡潔データ構造である LOUDS と比べ,記憶量は大きい.LOUDS …

  • ダブル配列におけるキー削除の効率化手法

    大野, 将樹, 森田, 和宏, 泓田, 正雄, 青江, 順一 情報処理学会論文誌 44 (5), 1311-1320, 2003-05-15

    ...除去できないため高い空間効率を維持できず,また削除コストが未使用要素数に依存するので,削除を連続するほど削除速度が低下するという問題がある.本論文では,トライの節のうち兄弟を持たない節が多くの割合を占めること,また,これらの節の遷移は容易に変更できるという特徴を利用し,削除を連続した場合でも空間使用率と削除速度を低下させない効率的なキー削除法を提案する.EDR日英単語辞書,WordNet英単語辞書,...

    情報処理学会 Web Site 被引用文献4件 参考文献9件

  • ダブル配列における動的更新の効率化アルゴリズム

    森田, 和宏, 泓田, 正雄, 大野, 将樹, 青江, 順一 情報処理学会論文誌 42 (9), 2229-2238, 2001-09-15

    トライ構造はキーの表記文字単位に構成された木構造を用いて検索するキー検索技法の1つであり,自然言語辞書を中心として広く用いられている.このトライ構造を実現するデータ構造として高速性とコンパクト性を満足するダブル配列法があるが,この手法は,キーの更新が頻繁に生じない検索法として確立しているため,動的検索法に比べて追加時間は高速であるとはいえず,また削除で生じる不要なノードや未使用要素により記憶量に…

    情報処理学会 Web Site 被引用文献6件 参考文献13件

  • キーワードの遅延抽出を考慮した文書検索構造の効率的構成法

    岡田, 真, 安藤, 一秋, 森田, 和宏, 青江, 順一 情報処理学会論文誌 41 (4), 1171-1179, 2000-04-15

    文書から抽出されたキーワードを索引表のキー(見出し)とする文書検索技術は非常によく利用されているが,複合語キーワードの的確な抽出技術は,依然として重要な課題となっている.しかし,抽出条件は利用目的に依存するので,キーワード候補の決定を検索段階まで遅延できれば,目的に応じたキーワード抽出と検索が実現できる.この課題に対して,本論文では,複数キーワードの文字列照合マシンAC(Aho and …

    情報処理学会 Web Site 被引用文献1件 参考文献17件

  • 複合語の分野連想語の効率的決定法

    辻 孝子, 泓田 正雄, 森田 和宏, 青江 順一 自然言語処理 7 (2), 3-26, 2000

    Although there are many kinds of research about text classification based on term information in the whole text, humans can recognize the field of a text by finding a small number of specific words …

    DOI Web Site Web Site 被引用文献2件 参考文献33件

  • トライ構造を用いた共起情報の効率的検索アルゴリズム

    森田, 和宏, 望月久稔, 山川, 善弘, 青江, 順一 情報処理学会論文誌 39 (9), 2563-2571, 1998-09-15

    ...自然言語辞書に構築される基本語彙は有限であるが,それら基本語の関係を定義することで,膨大な数の関係情報が作り出される.複合語,慣用表現,格関係などもこの関係情報の範疇に属し,これらを基本単語の共起情報と呼ぶ.共起情報を基本単語の並びとして格納すると,記憶効率が非常に悪くなるので,これら関係情報の効率的な記憶検索技法は重要な課題である.本論文では,基本単語からなる共起情報をトライ構造で効率的に記憶検索...

    情報処理学会 Web Site 参考文献13件

  • 格構造解析における概念階層の効率的判定アルゴリズム

    小山, 雅史, 泓田, 正雄, 岡田, 真, 青江, 順一 情報処理学会論文誌 39 (3), 551-558, 1998-03-15

    ...分類体系は,非常にシンプルな知識表現であり,その応用範囲は非常に広い.特に,自然言語文の格構造解析では,格スロットの制約条件として,この階層化された概念体系(以後概念階層と呼ぶ)による上位と下位関係の判定がよく利用される.しかしながら,階層が深くなり,また解析文が複雑になると,この判定コストが増加するので,判定処理の高速化は重要な課題である.本論文では,概念階層のデータ構造にトライ構造を導入して,判定効率...

    情報処理学会 Web Site 参考文献20件

  • 特徴ベクトルによる全文検索の一改善法

    有田, 健, 森田, 和宏, 溝渕, 昭二, 青江, 順一 情報処理学会論文誌 39 (3), 826-829, 1998-03-15

    ...特徴ベクトル法による全文検索の効率は,検索に不要な文書ブロックの転送をどれだけ排除できるかに依存するが,この排除率を保証したベクトル構成法の議論はない.本論文では,対象文書の文字列頻度を利用して,目標排除率を保証したベクトル構成法を提案する.同一ベクトル長では,提案手法が従来手法より排除率はつねに高くなることを,また排除率95%を達成する場合,提案手法のベクトル長は従来法の約1/6で実現できることを...

    情報処理学会 Web Site 参考文献5件

  • 大規模文書データに対する用例文の効率的検索アルゴリズム

    泓田, 正雄, 溝渕, 昭二, 獅々堀正幹, 青江, 順一 情報処理学会論文誌 38 (10), 2004-2013, 1997-10-15

    大量の用例文データから複数の索引要求に共通する用例文を検索する手法は,実例に基づく機械翻訳,文書管理システムにおいて必要不可欠な技法となってきている.しかしながら,これまでの用例文検索の研究は類似のとらえ方の議論が主であり,検索と絞り込みアルゴリズムは,従来からある文番号を直接比較する方法を適用するにとどまっているので,大規模データベースに対する実用的検索技法は十分に議論されていないのが現状であ…

    情報処理学会 Web Site 参考文献24件

  • パトリシアトライ構造の効率的な圧縮アルゴリズム

    獅々堀, 正幹, 住友, 徹, 岡田, 真, 青江, 順一 全国大会講演論文集 第55回 (ソフトウェア科学・工学), 255-256, 1997-09-24

    近年, 文書ソフトウェアの普及に伴い, 全文検索手法に関する研究が盛んに行われでいる。キーワード等の指定語以外の文字列を検索する手法としては, 文書内の半無限部分文字列(sistring)をパトリシアトライ構造に登録する手法が有名であるが, 索引部となるパトリシア構造を如何にコンパクトに圧縮するかが重要な問題となる。Jongeらは一般的な2進木トライ構造を圧縮する手法を提案したが, …

    情報処理学会

  • キーワード抽出を用いた文書自動分類手法

    岡田, 真, 小山, 雅史, 獅々堀, 正幹, 青江, 順一 全国大会講演論文集 第55回 (データベースとメディア), 210-211, 1997-09-24

    ...ここで, 文書があらかじめ分類されていると, 検索範囲が狭くなり, 検索効率は大幅に向上するという理由で, 文書分類は重要な研究テーマである。文書の分類手法は大きく2つに分けることができる。一つはあらかじめ人間が与えた分類に沿って文書を分類させる手法であり, もう一つは似たような文書をグループ化する事によって文書を自動的に分類する手法である。...

    情報処理学会

  • 文字列照合マシンを利用した複合語キーワードの効率的抽出法

    林, 淑隆, 中野, 英雄, 獅々堀正幹, 青江, 順一 情報処理学会論文誌 38 (4), 815-825, 1997-04-15

    ...本論文では,日本語文書から複合語キーワード(以後,キーワードと呼ぶ)を効率的に抽出する手法を提案する.本手法では,抽出条件に集合表現を導入した規則の記述を定義する.そして,規則集合の照合マシン(抽出マシンと呼ぶ)と候補語に対する部分文字列処理マシン(候補マシンと呼ぶ)を提案する.抽出マシンでは,包含関係に基づく照合アルゴリズムを提案し,候補マシンでは,候補語に対して部分文字列の関係が定義できる構成アルゴリズム...

    情報処理学会 Web Site 被引用文献3件 参考文献14件

  • 拡張ハッシュ法における部分文字列検索の設計と実現

    望月久稔, 森田, 和宏, 獅々堀正幹, 青江, 順一 情報処理学会論文誌 38 (2), 310-320, 1997-02-15

    ...ハッシュ関数とファイル構造を局所的に再構成し あふれを解消する拡張ハッシュ法は ハッシュ法の検索の高速性を維持し キー総数が予想できない分野にも応用できるが 任意の文字列を部分文字列として含むキーの検索を効率的に行うことはできない.本論文では 拡張ハッシュ法でこの部分文字列検索を実現するために まず 特徴ベクトルと呼ばれるビット列をハッシュ値として用いて トライを構成する.次に アクセスすべきバケット...

    情報処理学会 Web Site 被引用文献2件 参考文献18件

  • 類似用例文の効率的検索手法とその応用

    溝渕, 昭二, 泓田, 正雄, 獅々掘, 正幹, 青江, 順一 全国大会講演論文集 第53回 (人工知能と認知科学), 79-80, 1996-09-04

    ...機械翻訳や文書管理システムにおいて複数の検索要求に該当する用例文をいかに効率的に検索するかは,情報検索の分野で重要な研究課題の1つである.本稿では,用例文の絞り込みを高速化する手法として,文番号ベクトルを用いた手法を提案し,その応用として構築した多属性情報(表記・品詞・概念)を用いた用例検索システムを紹介する.そして,約21万の用例文に対する実験結果より,従来の手法に比べて1.6~4倍高速化することが...

    情報処理学会

  • トライ構造を用いた共起情報の効率的検索アルゴリズム

    森田, 和宏, 望月, 久稔, 獅々堀, 正幹, 青江, 順一 全国大会講演論文集 第53回 (人工知能と認知科学), 81-82, 1996-09-04

    ...システムとして有用な共起情報は膨大な数となり,それを格納する辞書の記憶倹約が必要不可欠となる.また,複合語に関しても,従来は複合語を基本単語に分割して記憶し,少ない語数で多くの複合語を扱う研究がなされてきた.しかし,この方法では複合語を一つの語として扱う事が困難であり,また,分割,復元のプロセスが複雑になりがちであった.そこで,本稿では二つの基本単語からなる共起単語(複合語も含める)を一つのトライ構造で効率的...

    情報処理学会

  • 日本語定型表現の分析と効率的照合アルゴリズム

    安藤 一秋, 辻 孝子, 獅々堀 正幹, 青江 順一 情報処理学会研究報告. NL,自然言語処理研究会報告 112 69-74, 1996-03-14

    ...提案手法により, 解析結果から利用したい多種多彩な情報を抽出して, 定型表現の規則を定義するだけで, 独自の定型表現の検出が行えるので, 解析エンジン汎用性と定型表現の独立性が維持でき, 開発と管理が効率的となる....

    被引用文献1件 参考文献11件

ページトップへ