Sensorizer : An Architecture for Regenerating Cyber Physical Data Streams from Entombed Web Contents (知的環境とセンサネットワーク) Sensorizer : An Architecture for Regenerating Cyber Physical Data Streams from Entombed Web Contents

この論文をさがす

著者

抄録

ウェブ空間には、大気汚染物質量や渋滞情報、駐車場の空き情報などを初めとして、現実空間に関連した膨大な量のデータが存在する。しかし多くのそれらはウェブ空間に埋没していて、容易にアクセスできない上に、定期的に更新されて古いデータが消えていく。このような、ウェブ空間に埋没した有益なデータ(ウェブ埋没データ)を発見、発掘、および再生するために、我々はSensorizerアーキテクチャに関する研究を進めている。同アーキテクチャでは、クラウドソーシングを活用してウェブ埋没データを発見し、ヘッドレスウェブブラウザを用いて周期的なスクレイピングを実現した上で、XMPPを用いて抽出されたデータを配信する。本稿では、Sensorizerアーキテクチャの概要を述べた上で、実現可能なアプリケーションと評価について述べる。

World Wide Web contains a huge amount of open data related to the physical world. They include, for example, density of air pollutant, road traffic condition, and car park occupancy. In many cases, however, those data are entombed in the cyber web space. The values are not easily accessible from a computer program due to the lack of APIs to fetch them. They are updated periodically, making the past data totally inaccessible. To cope with this problem, we propose an architecture for discovering, excavating, and streaming the entombed web contents (EWC). This architecture, called Sensorizer, leverages crowd sourcing for accurate EWC discovery, periodic web scraping with a headless browser for excavation from dynamic web pages, and a standardized communication protocol (XMPP) for data streaming to wide variety of applications. In this paper, we first demonstrate the architecutre and show unique applications based on sensorizing different web pages, and evaluate the architecture.

収録刊行物

  • 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報

    電子情報通信学会技術研究報告 = IEICE technical report : 信学技報 114(418), 249-254, 2015-01-26

    一般社団法人電子情報通信学会

各種コード

  • NII論文ID(NAID)
    110010001870
  • NII書誌ID(NCID)
    AA12618979
  • 本文言語コード
    ENG
  • ISSN
    0913-5685
  • NDL 記事登録ID
    026148602
  • NDL 請求記号
    Z16-940
  • データ提供元
    NDL  NII-ELS 
ページトップへ