「大量データストリームの類似探索手法」[論文誌Vol.48, No.SIG7(TOD33), pp. 1-14 (2007)]

平成19年度論文賞受賞者の紹介

「大量データストリームの類似探索手法」[論文誌Vol.48, No.SIG7(TOD33), pp. 1-14 (2007)]

[論文概要]
 現在データストリームを利用したアプリケーションに対する注目が様々な分野で集まっている.データストリームを処理するには今までにない新しいアプローチが必要であるが,本論文ではその中で流入する複数の任意長のシーケンスのうち類似した組み合わせを探索する問題について取り組んだ.本論文では (1) シーケンスの特徴量をメモリ内で保持し,(2) 圧縮されたシーケンスをディスク内に保持する手法 DAPSS を提案した.DAPSS を検証した結果ナイーブな手法と比較して高速かつ省メモリに処理が行えることを確認した.

[推薦理由]
 本論文は、大量データストリームの活用という近年重要性を増している話題に関し、並行流入する多数のストリーム群から、部分的に類似するシーケンスをアドホックに検索・列挙するという、有用性のある新たな問題を定式化し、その解法を提案している。提案方式は、1次記憶上に保持した、任意長の直近部分シーケンス間のユークリッド距離を精度よく見積り可能な特徴量と、基準点としてランダムに選択した複数のシーケンスからの距離の下限値により枝刈りを行う点に特徴がある。このように問題設定・解法に新規性があり、また、照合する部分シーケンスの長さと類似判定の許容範囲を任意に変更可能な自由度を確保した上で、メモリ効率のよい高速で厳密な類似検索を実現している点が示唆的で、今後の発展が期待されることから、本論文を論文賞に推薦する。

藤原 靖宏 君  2001年早稲田大学電気電子情報工学科卒.2003年早稲田大学大学院理工学研究科修士課程終了.同年日本電信電話株式会社入社.DEWS2006優秀論文賞,平成19年度電子情報通信学会論文賞各受賞.時系列データ処理の研究開発に従事.電子情報通信学会,日本データベース学会各会員.

櫻井 保志 君 1991年同志社大学工学部電気工学科卒業,同年NTT入社.1999年奈良先端科学技術大学院大学博士後期課程修了.工学博士.2004年から2005年までカーネギーメロン大学客員研究員.現在,NTTコミュニケーション科学基礎研究所主任研究員.平成16年度情報処理学会論文賞,平成18年度長尾真記念特別賞,平成18年度日本データベース学会上林奨励賞など受賞.索引技術,データストリームの研究に従事.

山室 雅司 君 昭和62年早稲田大学大学院理工学研究科数学専攻修士課程修了.同年日本電信電話株式会社入社.平成2年コロンビア大学大学院電気工学研究専攻修士課程修了.以来ネットワーク設計法,データベース設計・可視化,マルチメディア情報検索,デジタル情報流通基盤の研究開発に従事.博士(工学).平成6年電子情報通信学会学術奨励賞.電子情報通信学会,日本ソフトウェア科学会,日本データベース学会,IEEE-CS各会員.情報処理学会情報規格調査会理事.