山本 幹雄 YAMAMOTO MlKIO

ID:1000040210562

筑波大学システム情報系 (2015年 CiNii収録論文より)

Search authors sharing the same name

Articles:  1-20 of 125

  • Identifying Bilingual Synonymous Technical Terms from Japanese-Chinese Parallel Sentences  [in Japanese]

    龍 梓 , 董 麗娟 , 宇津呂 武仁 , 三橋 朋晴 , 山本 幹雄

    特許文書翻訳の過程において,専門用語の対訳辞書は重要な情報源であり,これまでに,対訳特許文書を情報源として,専門用語対訳対を自動獲得する手法の研究が行われてきた.その中でも有力な手法の1つとして,句に基づく統計的機械翻訳モデルを用いることにより,対訳特許文から学習されたフレーズテーブルとSVMを用いて,専門用語対訳対獲得を行う手法があげられる.しかし,この手法では,ある日本語専門用語の訳語推定の際 …

    IPSJ Journal 56(3), 960-971, 2015-03-15

    IPSJ 

  • Automatic Extraction of Blog Posts and Comments from Blog Pages  [in Japanese]

    吉田 光男 , 乾 孝司 , 山本 幹雄

    ブログページには,Web検索エンジンなど機械的にページを処理するシステムにおいてノイズになる部分が含まれる.そのため,ブログのコンテンツを利用するためには,コンテンツの抽出処理が必要になる.さらに,ブログのコンテンツは,ポストと呼ばれるブログの書き手によるコンテンツと,コメントと呼ばれるブログの読み手によるコンテンツに二分できる.ポストとコメントの存在はブログの特性の1つであり,ブログの特性を活用 …

    情報処理学会論文誌 54(12), 2502-2512, 2013-12-15

    IPSJ  IR 

  • Utilizing a Phrase Translation Table and Portion of Patent Families with No Parallel Sentences Extracted in Estimating Translation of Technical Terms  [in Japanese]

    Itsuki Toyota , Zi Long , Lijuan Dong , Takehito Utsuro , Mikio Yamamoto

    専門用語の対訳辞書は特許文書翻訳の過程において必要不可欠なものである.本論文では,日米パテントファミリーを情報源として,専門用語対訳辞書を生成する手法を提案する.従来より,日米パテントファミリーの対応特許文書中において,「背景」 および 「実施例」 の部分の日英対訳文対の対応付けを行い,これを情報源として専門用語の対訳辞書を生成する手法が提案されている.しかし,この方式では,対訳文対が抽出される部 …

    IPSJ SIG Notes 2013-NL-212(12), 1-8, 2013-07-11

  • Complaint sentence detection via automatic training data generation using sentiment lexicons and context coherence  [in Japanese]

    UMEZAWA Yusuke , INUI Takashi , YAMAMOTO Mikio

    近年のWebの普及により,Web上には商品やサービスについてのレビューが大量に存在する.このようなレビューからクレームを検知することができれば,ユーザにとっては不利益を未然に防ぐための情報として,企業にとってはマーケティングのための情報として,情報を活用することが期待できる.本研究では評価表現と文脈一貫性を利用して,Web上に存在する大量のレビューをもとに文レベルの教師データを自動獲得する方法を提 …

    IEICE technical report. Natural language understanding and models of communication 111(427), 47-52, 2012-01-26

    References (8)

  • Estimating Translation of Technical Terms Based on Phrase Translation Table and a Bilingual Lexicon  [in Japanese]

    MORISHITA Yohei , LIANG BING , UTSURO Takehito , YAMAMOTO Mikio

    本論文では,対訳文に対して,句に基づく統計的機械翻訳モデルを用いて訳語推定を行う手法,及び,既存の対訳辞書を利用した要素合成法を併用して,専門用語の訳語を推定する手法を提案する.提案手法では,翻訳知識源が異なる2種類の訳語推定手法により推定された訳語候補のうち信頼度の低い訳語候補を絞り込むタスクに対して,Support Vector Machines(SVM)を適用する.フレーズテーブルと要素合成 …

    The IEICE transactions on information and systems 93(11), 2525-2537, 2010-11-01

    References (12)

  • N-best Reranking Using Optimal Phrase Alignment for Statistical Machine Translation  [in Japanese]

    越川 満 , 内山 将夫 , 梅谷 俊治 , 松井 知己 , 山本 幹雄

    フレーズベース統計的機械翻訳では,連続する単語列(フレーズ)を翻訳の最小単位とした確率的規則に基づいて翻訳候補の順位付けを行い,最も確率の高い候補を出力とする.しかし,入力文のフレーズ区切りや翻訳前後の訳語関係(フレーズ対応)の組合せ数は膨大である.そのため,従来の統計的機械翻訳システムは,翻訳候補およびフレーズ区切り・対応に対して大胆な近似を行うことで探索空間を狭めており,厳密な確率の最大化をし …

    情報処理学会論文誌 51(8), 1443-1451, 2010-08-15

    IPSJ 

  • Automatic Extraction for Blog Posts and Comments using a Set of Blog Pages  [in Japanese]

    YOSHIDA MITSUO , INUI TAKASHI , YAMAMOTO MIKIO

    近年のブログの普及により,ブログのコンテンツを利用するサービスや研究が盛んになってきている.ブログのコンテンツは,ポストと呼ばれるブログの書き手によるコンテンツと,コメントと呼ばれるブログの読者によるコンテンツに大分する事ができる.ブログのコンテンツを利用する場合は,それらが別々に抽出できている事が望ましい.本論文では,ブログ記事集合を用いる事により,ポストとコメントを自動的に分離抽出する手法を提 …

    情報処理学会研究報告. データベース・システム研究会報告 149, T1-T8, 2009-11-20

    IR  References (13)

  • Primary content extraction from news pages without training data  [in Japanese]

    吉田 光男 , 山本 幹雄 , ヨシダ ミツオ , ヤマモト ミキオ

    近年のCMS の普及によりWeb ページにメニューや広告、著作権表示などが過剰に付加され、ページに占めるコンテンツ(主要部分)は縮小している。本論文では、事前に教師情報を準備する必要のない単純なアルゴリズムでWeb ページ群からコンテンツを抽出する手法を提案する。本手法は、Web ページをブロック(コンテンツ及び不要部分の最小単位)の集合であると考え、ある特定のページにのみ出現するブロックはコンテ …

    DBSJ journal 8(1), 29-34, 2009-06

    IR  Cited by (3)

  • Integrating Phrase Translation Table and a Bilingual Lexicon in Semi-Automatic Acquisition of Technical Term Translation Lexicon from Parallel Patent Documents  [in Japanese]

    MORISHITA YOHEI , UTSURO TAKEHITO , YAMAMOTO MIKIO

    本論文では,対訳特許文に対して,複数の訳語推定手法を併用し,高適合率で対訳専門用語を獲得する手法を提案する.提案手法では,フレーズベース統計的機械翻訳モデルを用いて訳語推定を行う手法と,既存の対訳辞書を利用した要素合成法を併用するアプローチをとる.翻訳知識源が異なる2種類の訳語推定手法を用いることで,訳語推定の適合率を改善することができた.また,Support Vector Machines (S …

    IPSJ SIG Notes 187, 91-98, 2008-09-17

    References (12) Cited by (2)

  • Statistical machine translation system using cross trigger model for patent sentences  [in Japanese]

    MATSUMOTO Kotomi , YAMAMOTO Mikio , UCHIYAMA Masao

    全国大会講演論文集 第70回(人工知能と認知科学), 189-190, 2008-03-13

    IPSJ  References (5)

  • Generating Technical Term Bilingual Lexicon from Parallel Patent Documents using a Phase Table and Compositional Translation Estimation  [in Japanese]

    MORISHITA Yohei , UTSURO Takehito , YAMAMOTO Mikio

    全国大会講演論文集 第70回(人工知能と認知科学), 81-82, 2008-03-13

    IPSJ  References (5)

  • Discriminative topic-sentiment analysis from unsupervised topic corpora  [in Japanese]

    SADAMITSU Kugatsu , FUKUTOMI Takahiro , YAMAMOTO Mikio

    評価文書に付与されているトピック情報を評価文書分類に利用することは有益であるが、本稿ではトピックモデルを用いて、トピックタグの付与されていない評価文書であっても、自動的にトピックを識別し評価文書分類を行う方法を提案する。Probabilistic Latent Semantic Analysis (PLSA)を用いてトピック構造をモデル化するが、モデルの学習を行う際には、トピック情報を極性間におい …

    IEICE technical report 107(480), 57-62, 2008-02-07

    References (14)

  • Producing Test Collections for Patent Information Processing : Toward the Fusion of Information Retrieval and Natural Language Processing  [in Japanese]

    Fujii Atsushi , Nanba Hidetsugu , Iwayama Makoto , Kando Noriko , Utiyama Masao , Yamamoto Mikio , Utsuro Takehito , Hashimoto Taiichi

    情報検索や自然言語処理に関する技術を体系的に評価するためには,ベンチマークとして研究者が共有できる大規模なテストコレクションが必要である.本稿は,NTCIRワークショップにおいて構築している特許情報処理テストコレクションについて,検索,分類,機械翻訳,マイニングの観点から解説する.検索では技術動向調査,無効資料調査,パッセージ検索を目的とし,分類ではFタームに基づくカテゴリ分類を目的としたテストコ …

    IPSJ SIG Notes 2008(4), 31-36, 2008-01-21

  • Producing Test Collections for Patent Information Processing : Toward the Fusion of Information Retrieval and Natural Language Processing  [in Japanese]

    FUJII Atsushi , NANBA Hidetsugu , IWAYAMA Makoto , KANDO Noriko , UTIYAMA Masao , YAMAMOTO Mikio , UTSURO Takehito , HASHIMOTO Taiichi

    情報検索や自然言語処理に関する技術を体系的に評価するためには,ベンチマークとして研究者が共有できる大規模なテストコレクションが必要である.本稿は,NTCIRワークショップにおいて構築している特許情報処理テストコレクションについて,検索,分類,機械翻訳,マイニングの観点から解説する.検索では技術動向調査,無効資料調査,パッセージ検索を目的とし,分類ではFタームに基づくカテゴリ分類を目的としたテストコ …

    IPSJ SIG Notes 89, 31-36, 2008-01-21

    References (13)

  • Machine Translation for Patent Information : Towards the establishment of shared evaluation tasks  [in Japanese]

    UTIYAMA Masao , YAMAMOTO Mikio , FUJII Atsushi , UTSURO Takehito

    本稿では,特許の機械翻訳が,以下の観点から,日英・英日の機械翻訳の対象として好適なことを述べた.すなわち, (1)特許の翻訳は社会的にも重要なこと, (2)大規模な日英対訳コーパスが存在すること, (3)オープンソースの機械翻訳システムが存在すること, (4)NTICR-7において特許翻訳タスクが企画されていること.そして,特許翻訳タスクが有望なことを, NTICR-7において提供される対訳データ …

    IPSJ SIG Notes 180, 133-138, 2007-07-24

    References (15) Cited by (3)

  • Machine Translation for Patent Information : Towards the establishment of shared evaluation tasks  [in Japanese]

    UTIYAMA Masao , YAMAMOTO Mikio , FUJII Atsushi , UTSURO Takehito

    本稿では,特許の機械翻訳が,以下の観点から,日英・英日の機械翻訳の対象として好適なことを述べた.すなわち,(1)特許の翻訳は社会的にも重要なこと,(2)大規模な日英対訳コーパスが存在すること,(3)オープンソースの機械翻訳システムが存在すること,(4)NTICR-7において特許翻訳タスクが企画されていること.そして,特許翻訳タスクが有望なことを,NTICR-7において提供される対訳データおよびオー …

    IEICE technical report 107(158), 133-138, 2007-07-17

    References (15) Cited by (1)

  • Reordering Priority Decoder for Statistical Machine Translation  [in Japanese]

    IWAKOSHI HAYATO , YAMAMOTO MIKIO

    統計的機械翻訳では翻訳候補の中から確率が最大である候補を出力する.これまでにも効率的に探索するデコーダはいくつか提案されているが,我々はgreedy デコーダに着目した.greedy デコーダの英日翻訳における欠点は単語の並べ替えに関して局所解に陥りやすいことにあると我々は考える.そこで訳語選択と単語の並べ替え部分を分離して,より語順を重視した語順優先探索デコーダを提案する.その結果,翻訳精度BL …

    IPSJ journal 47(11), 3032-3040, 2006-11-15

    IPSJ  References (14)

  • Topic-Based Language Models Using Dirichlet Mixtures  [in Japanese]

    SADAMITSU Kugatsu , MISHINA Takuya , YAMAMOTO Mikio

    混合ディリクレ分布を多項分布パラメータの事前分布とした(合成分布は混合Polya分布), 生成文書モデルを提案し, 統計的言語モデルへの応用という面で高い性能をもつことを示す. 本論文では, 混合ディリクレ分布のパラメータ推定法及び適応時に必要な事後分布の期待値推定法をいくつか述べた後に, 二つの代表的な従来の文書モデルと比較する. 一つ目の従来モデルは, 統計的言語モデルにトピックを取り込むとき …

    The IEICE transactions on information and systems Pt. 2 88(9), 1771-1779, 2005-09-01

    References (14) Cited by (6)

  • Read Documents Recognition using Generative Text Models  [in Japanese]

    NAKAZATO Rie , SADAMITSU Kugatsu , TOMIYAMA Ryosuke , YAMAMOTO Mikio , ITAHASHI Shuich

    生成文書モデルは文書全体に対して文書らしさの確率を付与できる。我々は生成文書モデルによる確率を用いて、文書全体を読み上げた音声を全体で最適化し、認識するシステムを検討する。局所的言語モデルとの融合方法としてはunigram rescaling法と文書尤度法の2種類を提案する。生成文書モデルとしてDM(Dirichlet Mixtures)モデルとLDA(Latent Dirichlet Alloc …

    IPSJ SIG Notes 57, 19-24, 2005-07-15

    References (13)

Page Top