2009年2月16日

情報処理学会 第71回全国大会

[ReTweet This!] カテゴリ:情報処理

 3月に行われる情報処理学会のプログラムがやっと発表されたですー。ああ、なのに事前登録締め切られてるしー、、、しどい。今年は母校での開催ですな、BKCは3年くらい前に研究室リニューアルのお知らせで行ったとき以来。というわけで、今年は地域SNS研究会が宇治で行われることもあって1週間弱京都におります。

 受講セッションはWeb系を中心に、学生セッションが中心になりそう。

3月10日(火)9:30~12:00
Webサービス提供
情報検索・評価分析

3月10日(火)14:30~17:00
Web応用
Webマイニング

3月11日(水)9:30~12:00
グループウェア
Web応用

3月11日(水)15:30~17:30
情報可視化

3月12日(木)9:30~12:00
自然言語処理
情報検索(1) 

3月12日(木)14:30~16:30
マイニング
情報検索(2)

投稿者 ymkx : 2009年2月16日 12:29 |

2008年9月 4日

ユビキタスWeb-これからのWebのために必要な技術は何か-

[ReTweet This!] カテゴリ:情報処理

○講演1「W3Cにおけるマルチモーダル対話処理の標準化」
 芦村 和幸(W3C/慶大)
・W3Cって?
・World Wide Web Consortium
・W3C Member、418組織、日本は30組織
・W3C Team、MIT、ERCIM、慶應の3ホスト機関、67名、慶應には10名
・慶應、東アジア地区

・標準化の重要性
・単三乾電池
・プラットフォームに左右されない
・open、global、de facto
・標準化には世界中の技術者が参加
・年会費激高い!
・特許に関する注意点
・Royalty Free License

・マルチモーダル対話ワーキンググループ
・ユビキタスWebの実現に向けて
・MMIアーキテクチャ(マルチモーダル対話)
・入力:音声・手書き・ボタン操作・ゲーム機器などのコントローラ
・SVGによる地図情報の利用
・linkML、手書き入力情報共有
・デジタル・ホワイトボード
・SSML、SpeechSynthesis、世界のあらゆる電話から音声とかキー操作でWebのサービスを利用
・ちょっとすごいな、標準化されていても実用化できるかわからんけど
・国際標準化活動にご参加下さい! 高い!

○講演2「Webにおけるビデオコンテンツの利用」
 Felix Sasaki(W3C/慶大)
・佐々木フェリックス、、、佐々木って
・スライドはw3cのサイトにアップされてる

・2007年12月にカリフォルニアとベルギーでVideoで同時にワークショップを実施
・YouTubeとかも参加してるわ
・国内でも3月14日に三田で公開セミナーをやってる
・W3C Video Activity

・Video/Audioのフォーマット
・映像フォーマット、音声フォーマット、字幕、メタデータ
・Flashの例、FlashのバージョンによってVideoデータのフォーマットが違ってた
・ビデオコーデック
・H.264/AVC、Apple/Quicktime/Safari
・VC-1、MS/Silverlight,HD DVD/ BlueRay
・Ogg/Theira、Mozilla、Opera、KDE
・Dirac
・H.263
・ビデオコーデックはまだ発展途上
・HTML5の要件に合うコーデックがない、オープンソースとの整合性、十分な品質、サブマリン特許リスクの排除

・ビデオ利用のBest Practices
・ハードの依存性がないとか
・商用コンテンツを売るために
・使用権の強制、コンテンツ利用の監視、DRM、電子透かし、フィンガープリント
・これらは仕様策定中

・Videoメタデータ
・既に多くの仕様が存在
・元のデータにさわらずにメタデータを加える能力、ほしー
・検索、発見、このあたりが中心か

・空間、時間のフラグメント
・空間・時間的なことをURIに加えてみたい
・空間についてはSVGやMPEG7は実装してる
・時間についてはMPEG-7、MPEG-21で実装

・W3C Video活動のワーキンググループ
・8月中旬にスタート
・Timed Text WG
・Media Fragments WG
・Media Annotations WG


○講演3「Webアプリケーションにおける地理位置情報の活用」
 Michael Smith(W3C/慶大)
・W3C Geolocation API
・GoogleはW3CのGeolocation WGに入ってて、GoogleはGoogle Gearsを出しちゃってるしねぇ
・Googleの人がエディターレベルで出してるみたい
・MUST latitude and logitude, 位置の精度情報も
・one-shot position update
・repeated position update
・重たい処理じゃイヤだ
・Agnostic about location method
・んー、途中から聞くのにせんねん


○講演4「わが国におけるマルチモーダル対話記述標準化-現状と将来への期待-」
 荒木 雅弘(京都工繊大)
・ITSCJ試行標準
・試行標準として仕様情報をWebで公開
・意見を募って拡張・改良を行い、標準規格へ
・実用システムにも研究開発にも利用できるアーキテクチャを確立
・実装事例を通じて妥当性を検討
・開発用フレームワークとしてリリース
・Galatea Toolkit、OpenSource
・検討の手順
・第一フェーズ、ユースケースの分析、要求仕様、MMIアーキテクチャの検討
・要求仕様はW3Cと共通の部分と拡張の部分
・第二フェーズ、ユースケースの詳細分析、各階層の要求仕様、試行標準案の公開
・ユーザモデル・デバイスモデル
・W3Cアーキテクチャとの違い
・明示的なユーザモデルの扱い
・タスクレベル制御の導入によるWebアプリケーションFWの親和性
・サーバ/クライアントの協会がどこでも切れる
・今後の予定
・試行標準案の公開
・参照実装・フレームワークの開発


○パネル討論「ユビキタスWeb実現にあたっての課題」
 討論司会:芦村 和幸(W3C/慶大)
 パネリスト:荒木 雅弘(京都工繊大)、桂田 浩一(豊橋技科大)、西本 卓也(東大)、Felix Sasaki(W3C/慶大)、Michael Smith(W3C/慶大)

・マルチモーダル対話記述の現状

・なぜ標準化技術は使われないか、西本先生
・実は今の技術が標準であり続けるとは限らない
・技術サバイバル論
・生き残ればいつか日の目を見る
・ヒューマンインタフェースの原則
・要素技術とアイデアを統合する理論
・原則に基づく音声認識の応用
・インクリメンタル音声I/F
・実装能力
・失敗の原因はあらゆる段階に存在
・実装に深く関わる理論の見極め
・開発者にとってのイタフェース原則
・効率性・合理性・ソフトウェア工学
・生産性
・国際化とアクセシビリティ
・マルチモーダルと密接に関連
・小さな市場を少しでも大きくするべき
・確かにねー
・国際化
・アクセシビリティ=アーリーアダプター??
・ライセンス、オープンソース戦略
・担当者や予算を失っても生き残るために
・プログラマ三大美徳
・ちょっとしたことに開発者は敏感
・定期的な情報発信
・フィードバック
・コミュニティ形成

・標準化でもうかるんか?の提示

・標準仕様が我が国で普及しにくい要因

・桂田先生
・流行ってないって程のことでもないと思うよ
・HTMLとかみんなつかってるじゃん
・それなりにビジネスになるものは流行ってるし
・携帯とか日本で先行しているものの標準化とか、そういう方向性は無いよね

・荒木先生
・W3Cの会員数が減ってる!!! 特に日本! 一時期増えて、減って、今安定かな?
・一般論、秩序→混沌→秩序、、、エンドレス
・HTML→NN&IE戦→HTML4→WHAT WG(Safari&Mozilla&Opera,,,,)→HTML5
・混沌期、大企業の意向、特許の問題、、、
・秩序形成期、新しい技術への期待
・マルチモーダルインタラクションでは、、、ちょっと絶望的、混沌期のまま
・開発者サイド、準拠するメリットが不明、人月神話、、、
・研究者サイド、最近技術との乖離
・一般に、技術普及への努力が少ない、解説書、魅力的なデモやろう
・ちょっとしたきっかけで混沌期から秩序期へ遷移するのでは

・WG同士の依存関係があったり
・英語ベース、、、やっぱ日本語ベースだと助かるよね
・膨大なドキュメント、、、まとめてくれー

・SASAKI氏
・普及活動が大事
・W3Cの構造変革が必要か
・普及活動をさせるような仕組みを盛り込む

・まぁ、人手が足りないんだよね、、、

・斉藤先生? アジア副統括?
・会員制度に基づいている
・オープン化が標準になりつつある
・そのあたりの兼ね合い、摺り合わせ
・会員のみってのはねぇ、会員じゃなくても参加できるような形を広めるべきなのでは
・会員制を辞めちゃうのも一つの手かも
・標準化を進める人間と、普及を進める人間は別でしょー

・というわけで、時間切れです
・W3Cってなんだろ? ってのはよくわかりました

投稿者 ymkx : 2008年9月 4日 18:02 |

6Tセッション [Webサービスとインターネット]

[ReTweet This!] カテゴリ:情報処理

○Web サービス標準を用いたAutomated Trust Negotiation基盤の開発
 ◎Indika Harindra Katugampala・八槇博史・山口由紀子(名大)
・途中からなのでよくわからんですが
・ATNってはじめて聞きました
・ATNは相互トラスト形成の仕組みで,トラスト形成プロセスの自動化または半自動化を目的としている
・WS-ATN
・TrustBuilder2
・ATNは実用に至っていない
・まぁ、俺も聞いたこと無いからね
・今後の未来展開
・DB業界で研究が進んでいる、DB周りの認証とかで研究されてるかも
・んー、確かに全く聞いたこと無いから、まだ実用レベルの実装とか理論とかが形成されてはいないんだろうね

○Nagatuki:サービスカスタマイズ向けマッシュアップ基盤
 ○小山和也・北野貴稔・井口圭一(NEC)
・Nagatsuki?
・マッシュアップ基盤?
・サービスのカスタマイズ?
・Webサービス側とユーザーの要求のギャップ
・開発コストの問題
・相矛盾する要求
・開発終了後のユーザー要求の変化
・全部を満たすことは無理
・アプリのカスタマイズで対応するのは困難
・SOAによるカスタマイズ性向上
・既存アプリが持つ一部の機能やデータを部品として利用し、それらを連係・統合して新たなアプリを生成
・可能なカスタマイズが部品の組み合わせ方に限定
・可能なカスタマイズが部品の作り方に依存
・カスタマイズの柔軟性に限界
・既存アプリの創りに依存せずに実現する必要性
・カスタマイズ向けサービスマッシュアップ基盤
・既存サービスとユーザの間に、カスタマイズ向けマッシュアップ基盤を差し込む?
・Nagatsuki
・やはり、そうプロクシとして動作する感じ
・プロクシ、画面変換(HTML変換、スクリプト挿入)
・ブラウザ制御スクリプト
・Wikiを使ってデータを管理
・カスタマイズ種類
・ビュー変更(レイアウト変更)、これは既存のものでもあるらしい
・データモデル変更、これは新しい、データベースのJOINで拡張しているように見せる
・振る舞いの変更、これも新しい、ユーザアプリケーションの操作への変更
・購入要求システムでのカスタマイズ例
・従来はHTML変換しかできなかった
・Nagatsukiは多様なカスタマイズサービスを提供可能
・実適用を通したカスタマイズ能力の見極め、強化
・性能・スケーラ-ビリティ向上予定

・Nagatsuki、サービス強化基盤SEP、Septenber、長月
・製品化はまだー
・実際には解決しなければいけない問題もたくさん
・画面からとAPIからたたける

・セキュリティ的な話しで質問をしてみた
・既存のアプリの穴を埋めるようなセキュリティ的な機能の実装は?
・現在は企業内での仕様を想定しているけど、アクセス制御的な考えもあり
・なんか、結構実用性がありそう
・NECの研究だからね

・性能向上におけるキャッシュ機能は考えてないけどあり得るかも
・クラスタ負荷分散、プロキシだけを切り離すとか

○Nagatukiにおけるマッシュアップ再利用の促進
 ◎井口圭一・小山和也・北野貴稔(NEC)
・Nagatsukiでのマッシュアップの再利用
・リポジトリに注目
・Nagatsukiマッシュアップの傾向
・リポジトリにサービスをカスタマイズするマッシュアップの定義が蓄積
・カスタマイズ要求は利用者毎に少しずつ異なる
・サービスカスタマイズのためのマッシュアップ
・元のサービスに強く依存
・元のサービスに変更があった場合は、関連する全てのマッシュアップに変更が必要
・マッシュアップの部品化
・マッシュアップの版間の差分を部品化
・Nagatsukiの想定ユーザーはエンジニア以外も
・版管理システム
・運用への依存性が高い
・一つのコミットに複数の変更が含まれていると再利用性の低い部品に
・必要な変更が一つのコミットにまとまっていない
・プログラムコード解析技術による部品化、再利用性を考慮していない記述は解析が困難
・再利用性を考慮した記述方法を定義
・マッシュアップの変更から、自動的に部品化
・マッシュアップ記述言語設計時にマッシュアップの構成部品、変更箇所を定義
・マッシュアップ構成要素の種類、要素種類に対する変更種類、システムが自動で識別できる変更内容である必要
・依存関係定義、関連する他の要素、その要素の依存する変更種類
・依存関係解析
・部品化、依存関係で繋がれた変更をグループ化し部品として登録する
・これらの部品を再利用カタログに登録する
・マッシュアップ編集の自動部品化手法を提案
・作成された部品群を効率よく利用するための適用可能な部品の検索技術
・部品を適用した際の動作の検証

・一般ユーザーが使うもの?
・ユーザーが要求を満たす為にマッシュアップする
・対象ユーザーは? ファーストターゲットはSIだけど、ゆくゆくは一般ユーザーにもやらせたい
・サーバの形でリリース

・またもや質問を投げてみた
・GUI的な話しはどう? 一般ユーザー対象も考えていると言うことなら?
・たぶんGUIで制約をつけてマッシュアップさせればかなり、いいと思うんだけど
・そこまではまだ到達していない
・けど、最終的にはそこまで行きたい


○Wikiにおけるグループ活動支援システムの開発
 ◎田崎潔志・藤田 毅・黒野 繁(九産大)
・Wikiの問題点
・誰でも自由に編集できる
・ユーザ認証を行うことで改善可能
・PukiWikiでのアクセス制限
・グループ管理機能
・複数のユーザをグループにまとめる
・メンバーに対する閲覧・編集制限をPukiWikiの制限配列に自動的に追加する
・グループの作成は自由に行う
・メンバーで自主的に管理できる
・作成時に特定の管理者が管理するか、メンバー全員で管理するかを選択できる
・ページの擬似階層構造を使用して、ページアクセス制限を行う
・個別のグル-プ管理権限の設定
・個別のページアクセス制限の設定
・メンバーの階層化
・グループ設定テーブル
・グループ管理権限、11種類
・単一のWikiを複数のグループ間で共有するためのグループ管理機能
・擬似階層機能を利用したため、自動リンク機能が利用できない、Wikinameに変わる自動リンク機能が必要
・グループ管理権限は柔軟に設定できるが、設定が複雑、自動設定できるような機能があればいいかもね
・階層番号/名前(省略可能):メンバー名1,メンバー名2,メンバー名3,,,

・んー、なんか必要性と機能性はわからなく無いんだけど、決定的にWikiの促進をすすめる感じにはならんだろうなぁ、、、


○現実世界における行動評価のSNSコミュニティへの反映方式について
 ○近藤拓也・高橋 修(はこだて未来大)
・ルームシェア、オフィスシェア、ライドシェア、等々、シェア行動の増加
・友人同士でのシェア
・ネット掲示板の利用、SNSのコミュニティの利用
・負担が大きい、怖い-
・ルームシェアジャパン、こんなサイトが、、、
・mixiの共同生活・ルームシェアコミュニティ、、、
・全然知らない世界だった、、、
・知らない人同士でのシェア、いきなりは怖いよねぇ
・問題が起きたり、想像に難くない
・信頼あるパートナー検索の効率化が必要
・ネットでの情報共有、SNSコミュニティをメインにする
・ネットと現実の世界が分かれているので、実際の信頼度・相性がわからない
・それをSNSのユーザ情報で判断できればすばらしい
・現実世界の行動評価をSNSへ
・行動評価パラメーター・趣向パラメーター
・2者でシェアした場合、お互いの行動評価パラメーターを評価する
・これらのデータの蓄積によって新たにシェア行動を取ろうとした人間に対して、過去のシェア行動履歴からマッチングを出したり出来る
・管理者の項目設定
・参加者の趣向設定
・相性度の確認
・シェア行動
・お互いの信頼度評価
・新たな参加者は過去の信頼値を確認して相性の確認が出来る
・評価式、信頼と相性
・信頼度の各評価項目の総和の平均値、1~5の段階評価で
・相性の項目に属する属性値の重なりで相性を評価
・課題
・シェア行動は評価の発生回数が少ない
・偽装評価に対する対応
・新規コミュニティ参加者に対する信頼度
・SNSに付随する属性を利用できないか

・質問してみた、攻撃的だ、全然攻撃じゃないけど
・シェア行動以外の適用
・なんでもあり、物品交換とか
・これは即利用してみたい機能でもあるよね

・クチコミの定量化?
・いわゆる入力値の信頼性
・何もないよりはまし
・確かに評価式に何か新しいものが入ってるわけじゃないよね
・いわゆる行動学・社会学的な領域だよね、結局は


○ネットワークによる人を介した情報推薦
 ◎山崎宏幸・太原育夫(東理大)
・情報フィルタとしての他者の利用
・Webにおける他者の問題
・Webにおける他者の発言は信用できるのか?
・各人の嗜好のちがいはどうするのか?
・Webにおける情報の信頼性
・一般にWebに置ける情報の信頼性は現実世界におけるクチコミのそれに劣る
・相手が見えない、身分や人柄が明示されない、発言に責任が伴わない
・WWWユーザに判断材料を与える
・Web Identification Tag = Web世界の身分証、現在までに体験した商品、コンテンツへの評価をもって身柄を担保
・Webにおける人間記述
・嗜好類似コミュニティの抽出
・経験または体験の共有
・協調フィルタリング
・条件付き協調フィルタリング
・ユーザが提示されるコミュニティに対し条件をつける
・協調フィルタリング→条件付き協調フィルタリング
・Amazonのカスタマーレビューを使用してみた
・書籍と映画でやってみる
・cold-start問題
・条件付き協調フィルタリングを使用することで、協調フィルタリングの問題点を埋められる

・今後はWITの採用がユーザに与えるインセンティブや,ユーザの満足度に対する優位性といったものを調査していきたい

・嗜好偏向の異なるコミュニティの抽出に成功、、、

・これって、既に実装されていないかなぁ?
・ああ、やっぱそうみたい、座長の井上さんが既に論文集が出てるからそれを参考にすべき的な

投稿者 ymkx : 2008年9月 4日 12:19 |

2008年9月 3日

脳に学ぶ遇有性の設計原理

[ReTweet This!] カテゴリ:情報処理

 正直、20分なんて少なすぎる、最低でも1時間は聞き続けたい話でした。
 茂木先生の話って初めて聞いたんですけど、すごいですね。聞き手の脳みそに直接語りかけてくるテンションが。研究者の集まりって事を理解して、そのレベルでの話を凄まじい勢いでされていたので、ついて行くのが精一杯。ただ、得るモノは大きかったです。っていうか、ユビキタス、勘違いしますよ、俺。かなーり、テンション上がりました、すげー茂木先生。本買おう本買おう。

-----

FIT2008 第7回情報科学技術フォーラム
これでいいのか、ユビキタス -今後のユビキタスコンピューティングの研究を考える-
講演4 「脳に学ぶ遇有性の設計原理」
茂木 健一郎 (ソニーコンピューターサイエンス研究所)

・Googleストリートビュー問題
・ユビキタスコンピューティングは、如何に脳がユビキタスな環境に適応できるか
・Contingency,偶有性、半ば規則的で半ば偶然的
・ドーパミン系
・強化学習
・行動→脳内報酬物質→強化→元に戻る
・知的行動のほとんどの部分は、強化学習のメカニズム
・ダニエル・カーネマン
・行動経済学→神経経済学
・デスクトップメタファーから離れることが出来るか
・自発性
・一つの脳のことだけを考えているのではダメ
・スモール・ワールド・ネットワーク
・規則的とランダムの間、偶有的、脳の構造は

・ユビキタスコンピューティングの可能性は、人間中心的なネットワーク
・ヒューマンセントラル
・コラボレーションの進化
・自己意識は社会的に文脈づけられる
・Mirror neurons
・アイコンタクトでドーパミンが出る動物は人間だけ、相手に関心を持つ
・Mirror self recongnition
・仲間に対するエンパシーをもっている動物は、ミラーテストに合格する
・コラボレーションという行動とミラーテストは関係している
・女性は鏡を見て化粧をする、その人が社会的に自分を提示したいのか
・他人と自分の顔を見るときの脳の動きは異なる
・女性が鏡で自分を見るときは、自分を見るのではなく他人を見る動きをする(脳が)
・女性は他者から見られていることを意識している

・embodyment
・顔の表情筋の制御
・顔は最も大きなembodyment

・ユビキタスコンピューティングとは、コミュニケーションのモードが変わる
・ユビキタスコミュニケーションは、他者とのコミュニケーションのモードが変わる
・利他性
・所属するコミュニティのネットワークが複雑、多様であるほど強められる
・色々なコミュニティに属している方がコラボレーションがしやすい
・ユビキタスは、独立した個でどうこうではなく、集としてどう動くか

・人間は社会を作る
・アポロ8号で撮った、地球の写真
・20世紀で最も意味のある写真

-----

投稿者 ymkx : 2008年9月 3日 12:57 |

2008年3月14日

情報処理学会第70回全国大会 【SNS,ブログ,ソーシャルWeb】

[ReTweet This!] カテゴリ:情報処理

SNS,ブログ,ソーシャルWeb

[4S-1]SNSにおける信頼値に基づいたアクセスコントロールの実装・評価
○山口修平,小柳 滋,川村義久(立命館大)
・SNS参加者急増による信頼性の低下
・SNS上でのアクセスコントロールによる信頼性の確保
・現在、アクセスコントロールの柔軟な設定が不可能
・信頼値に基づくアクセスコントロールの導入
・信頼値、主観的指標TV1と客観的指標TV2
・知り合い、多くの人に閲覧されてる、この2点
・TV1、ユーザ間の類似度
・TV2、ユーザの信頼度
・TV3=TV1+TV2
・TV2、CNMアルゴリズム、次数中心性
・んー、理論的には一理あるけど、リアルのSNSではほとんど使い物にならない
・マイミクの信頼性って幅があるんだよねぇ
・でも、この手の理論の研究はどんどんしてゆくべき、いろいろ

[4S-2]ソーシャルブックマークの仕組みに基づく映像シーンアノテーション
増田智樹,○山本大介,大平茂輝,長尾 確(名大)
・発表者欠席で共著の方がプレゼン
・Synvie、映像に対して突っ込みをして楽しむ、突っ込みのテキストを解析して映像との関連性を調べる
・映像アノテーション、オンラインアノテーション、不特区定多数のユーザによるコメントを利用、質の問題が出る
・SBM(ソーシャルブックマーク)を活用して、映像シーンに対してブックマークしてみる
・映像シーンへのブックマーク、シーンセレクト(開始点、終了点)、タイトル、タグ。ブックマークしたシーンのみを再生出来るように、もちろんブックマークは共有、コメント可
・複数のブックマーク(映像シーン)のプレイリストを作ることができる
・映像シーン検索、映像シーン検索システムdivieへ適用、タグやらコメントから映像シーンを検索できる
・多くのユーザーによってブックマークされている映像が人気がある映像ハイライト、、、
・んー、これは面白い。今すぐにでもニワンゴが実装しちゃいそうです
・確かにどの程度みんなが好意的に利用してくれるかどうかが重要だねぇ

[4S-3]社会ネットワークにおけるユーザの属性と振舞を利用したコミュニケーション支援システムの設計と評価
○古川 潤(電通大),村山隆彦(NTT),多田好克,佐藤 喬(電通大)
・SNSを含めて、Web上でのコミュニケーションには未だ解決されていない問題がある
・ブログによる情報発信者の増加による、ユーザ発見が困難に
・顔の見えないコミュニケーションにまつわる不安
・上記2点を解決するように、ユーザ推薦するシステムを実装
・課題1、興味情報の抽出、属性を求める
・課題2、コミュニケーションの敷居を下げる情報の抽出、コミュニケーションにおける積極さ(ユーザの振るまい)を出す、日記投稿、日記閲覧などアクティブさを測る
・属性の抽出、日記から特徴後を抽出
・属性一致度の算出、属性ベクトルからcos類似度で
・振舞情報の算出、自分の書いた日記へつけてもらったコメント等
・評価実験、既存の関係の評価、ユーザの推薦結果の評価
・んー、評価的にはびみょーかなぁ、当然だと思うけど
・っていうか、その辺のセンシティブな部分をシステムに任せる勇気って人には厳しいと思う

・どっかの先生からの指摘、ブログ後はベクトル類似度とかだけじゃ厳しいんじゃない
・さらにどっかの先生からの指摘、所属コミュニティも属性で使ってみたら? 他がやってるんだったら
・さらにさらにどっかの先生からの指摘、いわゆる個人間での閉じたコミュニケーション(友人同士でしか通じない言葉など)も勝手に解析しちゃったり、スパムも解析しちゃう問題、、、

[4S-4]blogにおける話題遷移点の抽出手法
○谷内幸憲,徳永幸生,杉山 精(芝浦工大)
・トラックバックに注目
・トラックバックのツリーをブログスレッドと定義
・ブログスレッドの中に話題が切り替わる話題遷移点がある、その話題を視覚化する
・7万エントリから52340スレッドを抽出、でもgooを使ってるのでトラックバック練習ブログのものが多いのでそいつを削除、一般的なブログスレッドを解析、話題遷移点の検出
・話題遷移点かどうかは、自分より前のエントリの単語と、自分より後のエントリの単語を抽出して比較、閾値を設定して判断

・ん、で、結局これって何に役に立つんだろう? 情報整理? 遷移点が何に生きるのかがいまいちわからない。たぶん、そこはそこで別の研究なんだろうなぁ
・可視化はされてるけど、見てもそれが何なのかよくわからない、ホントその通りだと思います
・クラスターの見せ方の問題
・やっぱ、学生のやる研究だからなぁ、なかなかそこまで広く見て研究するのは厳しいのかもしれないね

[4S-5]ブログスフィアからの最新の話題・流行の分析
○角田恵美,矢吹太朗,佐久田博司(青学大)
・ブログスフィア、全てのブログによって構成されている
・プログラムによってブログを取得して優良な情報を抽出
・大量のブログを一気に取得するシステムの開発
・624万件のエントリからタイトルの名詞を抜き出す、全2日の平均値の4倍、261語抽出
・トリビアルなものとか、メディアが扱ったものや、アフィリエイト、ドラマ、特番
・で、このシステムで抽出できたもの、隠れトピック型として目玉焼き、制服、ケンタッキー、湯たんぽ
・目玉焼きに何をかけるか? ぐっと来る制服はなに? ケンタッキーは不祥事の話題(ゴキ揚げ)、湯たんぽはブログから発生、後にメディアに掲載へ

・んー、大量なの? リアルタイムで処理がとか、、、まー、既に多くのブログポータルが実装してる仕組みだからなぁ、そうなると即時性とかをアピールしたいのかなぁ????
・隠れトピック型の定義は? 本当にメディアで取り上げられていないものなの?

[4S-6]標準クリック距離によるwebコミュニティの概視化
○谷口三郎,三浦孝夫(法大)
・WEBコミュニティ、内容が近く整合したページ集合
・WEBコミュニティを概視化
・通常クリック数と、標準クリック距離

・んーと、なんだかピンと来ませんでした

[4S-7]Web情報を活用する蔵書管理システム
~パーソナライズの適用~
○塚本哲也,西山裕之,溝口文雄(東理大)
・蔵書管理システムには、ソフトウェアタイプとWebシステムタイプがある
・実世界の蔵書をWebで一括管理する蔵書管理システムの実装が目的
・蔵書データ+データマイニング
・ユーザー間類似度を計測してみた、ベクトル空間法
・これは、研究というよりかは開発ですな
・前に作ろうとしたなぁ、こんなの

※なんだろ、論文のタイトルはそれっぽいけど学生セッションであることもあり考察も実験も知識も足らない感じがありありですなー。でも、参考になる部分も多い。あー、いっこだけ言えるのは、いわゆる理論をとりあえず当てはめた的な流れは、Webというか特にブログ界隈の文章や現象に対してはイマイチな結果が出ちゃうということがわかりました。

投稿者 ymkx : 2008年3月14日 16:41 |

情報処理学会第70回全国大会 【情報爆発時代におけるWeb技術及びWeb情報抽出】

[ReTweet This!] カテゴリ:情報処理

※遅刻、しかもすげー狭い教室でのセッションで座れずメモも取れずじまい※

 気になったのは【[3ZK-7]A Study On the Structure and Behavior of Web Spam by Link Hijacking○Young-joo Chung,Masashi Toyoda,Masaru Kitsuregawa(東大)】ですな。当然の如く、内容を理解するのだけで精一杯でしたが、もっともっと深く突っ込んでみるとG社が喜びそう。っていうか、ブラックリスト、ホワイトリストをつかった評価が今後の軸になっていきそうだなぁ。

 あと、【[3ZK-8] Webコンテンツ一貫性管理のための支援ツールの開発○高橋公海,澤菜津美,森嶋厚行,杉本重雄,北川博之(筑波大) 】これも結構面白い発表だったけど、実装を考えるとなんか違う問題に到達しちゃいそう。あ、発表者も十分理解していることだと思いますけどねー。

 一番気になってた【[3ZK-3] Webを用いた人物の別名抽出○本間大輝,Danushka Bollegala,松尾 豊,石塚 満(東大) 】は痛恨の遅刻で聴けなかった、と思いきやセッションが取り消しになってた、、、。論文を読む限り、なにかすごーく物珍しい訳じゃないけど、、、。

投稿者 ymkx : 2008年3月14日 14:02 |

情報処理学会第70回全国大会 【Web検索】

[ReTweet This!] カテゴリ:情報処理

[2R-2]ウェブ上の検索システムにおける検索結果の比較支援インタフェース
○島村祐介,三末和男,田中二郎(筑波大)
・既存の検索インタフェースの問題点、検索条件を変更するとページが遷移し、前のページの商品情報が消えてしまう。商品情報を忘れる、異なる商品比較が難しい
・商品情報の収集・比較を支援するシステム【Pick-up Cart】の開発
・Pick-up Cartの支援、商品情報の収集支援、及び比較支援
・ドラッグ&ドロップで商品情報を追加できる、カート内操作もドラッグ&ドロップで直感的に行える、ソーティングも出来る
・なんというか、研究と言うよりは実装できるアプリだなぁ、既に
・Pick-up Cartサーバを挟んで、クライアントとショッピングサイトを配置
・実験したら、Pick-up Cartを使った方が有用である。まぁ、当然だよなぁ
・なかなかおもしろいなぁ、でもAmazon以外はどうなんだろう?
・サイト毎にフィルター(ルール)を実装する必要がある

[2R-3]検索結果のインタラクティブな評価に基づくリランキングインタフェース
○軽部孝典,志築文太郎,田中二郎(筑波大)
・リランキング手法、様々な情報を利用してユーザにあったランキングを提示する
・既存のリランキングシステムの問題点、ユーザの閲覧行動の支援がなされていない
・アプローチ、閲覧行動の支援、検索要求
・ランキングを自分好みにする、Ensemble Search
・Ensemble Search
・検索結果をインタラクティブに評価して、検索結果を向上させる為のシステムですな
・Rerank.jp、スニペットの単語を強調、削除操作をすることでリランキングしている
・Rerank.jpとの比較、なんでそういった結果になったのかがよくわからないけどEnsemble Searchの方が結果がよくなる
・ベクトル空間法でワードを重み付け、最初にYahoo!の結果のスニペットを形態素解析、ベクトル空間法で重み付け。その後のリランキングで指定した文章を形態素解析したワードに対して+もしくは-で重み付け、リランキング結果表示

[2R-4]Web検索のための有用な関連キーワードを評価するシステムの構築
○寺島浩太,安藤大幸,藤本敬介,中山泰一(電通大)
・関連サービス、Googleサジェスト
・関連研究、野田らによる主題後から話題後を抽出し、提示するシステム
・bはaに似ていない、bにとってaが主要な情報
・類似度(sam)と定義、依存度(dep a)として定義、類似度が高すぎず、依存度が高いものを有用と評価

[2R-5]Web検索結果におけるランキング変動に着目したキーワード支援システム
○望月祐臣,東 基衞(早大)
・ユーザの適合・不適合判定を利用する
・適合ページを検索結果の上位へ、AND検索以外にも対応(?対応してると思うけど、、、)
・適合単語の上位NをAND、不適合単語の下位NをNOT
・んー、このあたりを自動で行う仕組みの実装がいいかも、Googleとかは暗に実装してるだろうけど

[2R-6]可視化Web検索支援
○劉 健全,陳 漢雄,古瀬一隆,大保信夫(筑波大)
・Yahoo! MINDSET、ショッピングかリサーチ
・Rerank.jpの関連語によるタグクラウド表示
・ズーミングとページ移動、関連語表示をズーミングできるように?
・件数別遷移をリンクではなくスライドバーに
・実装、関連語分析、ズーミング、リランキング
・ズーミングは関連語をどんどん追加するということだね、しかも+もしくは-で関連語つかってリランキングも出来る、でも、ズーミング直後はどうリランキングしてるんだろう? なんか、ズーミングのアルゴリズムがのぉ
・ズーミングは、関連語をいくつ使うかという操作
・チェックボックスを+にチェックしたときと、ズーミングの時のリランキングアルゴリズムというか計算式は異なっている

[2R-7]トピカモデルにおけるユーザアクセス経路を利用した関連文書の検索
○浅妻 理,田中 譲(北大)
・トレイルは経路(情報)のこと、狭義の意味でページを選択する際のキーワード?
・トピカモデル、ある文書に他の文書を格納する場所”トポス”を定義、文書上で格納した文書同士の関係を管理
・トピカドキュメントの作成が凄まじく大変?
・んーと、よくわかりません

[2R-8]検索の使用時間間隔の分布を用いて抽出される関連語の評価
○柳 阿礼,徳永幸生,杉山 精(芝浦工大),杉崎正之,池田成宏(NTTレゾナント)
・人間の検索行動のモデル、検索語の検討・入力→検索結果の評価→Web閲覧、でも評価がNGの場合最初に戻る、同じくWeb閲覧でNGの場合も最初もしくは検索結果に戻る
・時間間隔、検索語を入力してから次の検索語を入力するまでの時間
・検索語の入力と検索結果の評価を繰り返す行動が多い
・時間間隔関連度、検索語に対し追加候補
・特徴ベクトルによるcos関連度、検索語に対して置換候補

※さっきのWebデザインより研究っぽいけど、なんつーか内容がばらけてるよなぁ。個人的には可視化Web検索支援が面白かった気がする、ユーザビリティの一つとしてあのようなものの実装はいいかも。ズーミングについては、いろいろ思うところがあり。重みの計算式をもっと検討できるかも

投稿者 ymkx : 2008年3月14日 14:00 |

情報処理学会第70回全国大会 【Webデザイン】

[ReTweet This!] カテゴリ:情報処理

※メモ書きですので突っ込み厳禁※

[T1-1]閲覧者の情報に基づくWebコンテンツのプッシュ型配信について
○中村正人,児玉政幸,大囿忠親,新谷虎松(名工大)
・筑波大学迷宮に翻弄されて、最初の部分が聴けなかった、、、
・んー、基礎研究的というか、現場ではもっと激しいことやっちゃってるよ
・現場ではサーバサイドがクライアントサイドかってのはそれほど重要じゃなくなってきてるかも。クライアントサイド側にどのくらいのデータを持たせるかが重要だよなぁ

[1T-2]サーバ主導型プッシュ配信を利用した協調型Webブラウジングシステムの試作
○柿元宏晃,児玉政幸,浅見昌平,大囿忠親,新谷虎松(名工大)
・プロキシーを使う、、、そりゃ同期するわ
・long-poll?? これがポイントっぽいんだけど、どんな仕組みなんだろうなぁ
・おおー、これはプレゼンテーションとか使えるかも
・でも、プロキシだよね
・クライアントの許容量の制限とか、リアルではそこまで繋げないだろー。
・pollingとlong-pollの違いを明確に

[1T-3]携帯電話におけるWebコンテンツ閲覧のためのコンテンツ抽出アルゴリズムについて
○伊藤太樹,近藤圭佑,浅見昌平,大囿忠親,新谷虎松(名工大)
・携帯向けにコンテンツのメニューページを作成する
・コンテンツは、「DOM構造に基づく抽出」と「レイアウトに基づく抽出」
・テンプレートに基づくコンテンツ抽出、Webページはあるテンプレートに従っているという仮定の下に、、、
・テンプレートの種類、8種類のレイアウトにもってゆく
・Webページを分割、面積が指揮一以下になるまでDOMノードを展開、テンプレートとマッチング、テンプレートが有効かどうかを判断
・携帯云々は後付的で、最も重要になるのはコンテンツ抽出アルゴリズムの部分だよなぁ

[1T-4]携帯電話での microformats の利用: カレンダー情報を例として
○田辺豊博,伊藤一成,Martin J. Duerst(青学大)
・携帯電話でのWebカレンダー、登録件数の上限問題、操作性の違いが大きい問題
・携帯電話で情報の取得を簡単に、機種依存なしにカレンダー機能を活用、ボタン操作によりイベント情報を有効に操作
・microformats、オープンフォーマット、Webページ情報を機械的に処理、hCalendarはイベント情報を扱うフォーマット
・プロトタイプシステム、携帯電話でのイベント情報の取得、イベント情報の視覚化、Googleカレンダーへの登録
・サーバサイドでメタデータ処理を実装
・んー、確かに便利なんだけど具体化が微妙かもなぁ

[1T-5]WebScoreを利用したWebサイト評価及び改善に関する研究
○竹内康夫(東理大),平石広典(ウィズダムテック),溝口文雄(東理大)
・WebScore、HTMLの構文解析によるデータからWebサイトを計量し評価するシステム
・WebScoreの構造評価、これに対する研究
・異常な文書配置の検出、ベクトル空間法で文書館類似度の算出、Leader-Follower法で文書クラスタリング、クラスタ内での異常ノードを判定する
・眼球運動を使ってWebScoreの構造評価とユーザ行動の比較
・トヨタvsホンダ、いい例だ
・WebScoreと人的評価、平均総感知0.29だけど、27業種中14業種ではまあまあ
・WebScoreと業績は全然無関係
・人的評価のほうが業績との関連が高い→主観が交じる?

[1T-6]An Automated Presentation System from Web Contents employing Lifelike Agents
○Manuel Mercado,Shaikh Mostafa Al Masum,石塚 満(東大)
・聞くので精一杯でした、、、

[1T-7]Webインタラクションデザインにおけるプロトタイピングツールの提案
○矢部裕亮(芝浦工大),杉崎正之(NTTレゾナント),徳永幸生,杉山 精(芝浦工大)
・Web IxDに着目する、Web IxD=見た目のデザイン+動きデザイン(プログラミング)
・動きの部分のデザインはプログラマー、デザイナーの両者の作業が必要
・これをプロトタイピングで解決する
・確かに便利なツールで位置づけ的にも素晴らしいものだと思う
・が、インタラクションデザイン自体の必要性が、正直ピンとこないんだよねぇ

[1T-8]HTMLを用いたWebアプリケーション自動構築
○浅井暢仁,紫合 治(電機大)
・UML記法、モデリングツールの操作は難しい
・だからHTMLでWebアプリケーションを作れるツールを作成してみた、MVCモデルのアプリができますぜ
・FORMタグとINPUTタグのvalueにそれぞれの要素の特徴を記述する
・んー、なんちゅーかね、結局そのHTMLがめんどいんだよねぇ記法が、、、あと、構築できるアプリケーションの範囲が狭くないか?

※全体的に学生セッションだからピリッとこないものが多いけど、視点的には面白いものもあったと言えますな。ただ、セッションのタイトル「Webデザイン」ってのは違う気がするなぁ、、、

投稿者 ymkx : 2008年3月14日 13:57 |