« 言語処理学会 | メイン | 2008-3-19(ミハエル・クルム生誕日)の忘備な備忘 »

2008年3月18日

言語処理学会第14回年次大会【C2:評判】

カテゴリ:自然言語処理

[C2-1] 形容詞・形容動詞を用いたウェブ上の商品評価レビュー記事の意図・評価の推定 (pp.341-343) 岡田真, ○島本龍一 (大府大)
・Web上の商品や人物の評判を自動的に分析したい
・周辺情報を使用し従来からの問題点を解決
・共起名詞を使った評価の推定
・共起名詞を全て登録する代わりに名詞を属性で分類したカテゴリを登録
・日本語語彙大系
・評価用辞書の作成、形容詞の用法毎に使われやすい共起名詞と評価値を記述
・登録の例外として、慣用表現で使われるときの評価、過去形のときの評価
・形容詞の評価値を否定の-3~肯定の3までの7段階で表現
・話題の収拾、形容詞が評価している対象が何か? 話題の頻度から注目箇所を知る
・課題、括弧記号の扱い、複合語のルール、筆者の願望や仮定表現の文、「AのBがC」文

[C2-2] Web上の客観的記述からの評価情報抽出に関する技術的検討 (pp.344-347) ○中川哲治, 宮森恒, 赤峯亨, 乾健太郎 (NICT), 黒橋禎夫 (NICT/京大)
・文書中に含まれる情報、事実と意見(評価)
・情報分析エンジンWISDOM、与えられたトピックについて、どのような観点から、誰が、どのような評価をしているか
・客観的記述に含まれる評価情報、商品の広告・報告書、主観的な表現は含まれていない、、肯定的・否定的な評価を暗に含む
・従来は主観的表現が対象、これでは客観的表現も対象に含める
・今後の課題、客観的な記述に含まれる評価を考慮した、評価情報辞書の拡充、評価表現が文脈の情報を受ける場合への対処法の検討、評価保持者評価対象などの同定と改良

[C2-3] 複数注釈者による評判情報コーパスの作成と評判情報の自動抽出 (pp.348-351) ○宮崎林太郎, 前田直人, 森辰則 (横浜国大)
・評判情報コーパスの作成、評判情報構成要素の抽出
・Amazonから収拾したレビュー文書1726文書、10000文をコーパスに
・抽出の結果、全般的に大きく有効な素性を発見することは出来なかった
・コーパス規模の調査、ジャンルを横断したデータによる抽出実験、学習に用いる素性を検討

[C2-4] オンラインディスカッションにおける有益発言の抽出 (pp.352-355) ○村上明子 (東大), 那須川哲哉 (日本IBM), 中川裕志 (東大)
・アイデア創出のためのオンラインディスカッションが対象
・2-3日の限定した開催期間、ファシリテーターや専門家による補足
・話しの発散や関連のない発言が少ない、発言の関連性の局所性(大量の参加者や発言数であるため、術での議論を把握することは困難。途中参加者に事前知識を要求することが出来ない→説明を丁寧に)
・発言に返信することが出来るので、木構造となる
・分析、発言の集合を分析、マクロ的分析とミクロ的分析、今回はミクロ的分析について
・情報の有益度、他文書・参加者からの評価、新規情報の存在の有無、本研究では「再利用できる有益な発言を得ること」
・有益度を決める発言中の表現、他文書・参加者からの評価。それを意見表現とする
・意見表現の役割分類
・意見表現の影響の及ぼす範囲、意見表現は発言された議論の流れを評価している、同じ議論の流れにある発言に対してのみ影響(評価)を与える
・否定による意見の反転、否定している意見に同意しているもの、同意しているものに否定しているもの
・有益度の計算手法
・有益どの視覚化
・GoodIdeaフラグと意見表現との相関
・意見表現抽出の改善点、逆接の接続詞による文脈の変化、照応関係の失敗
・今後の課題、文脈・照応解析を加味した意見表現の抽出、意見表現の自動獲得、有益度指標の有効性の検証

[C2-5] 要望の対象の同定 (pp.356-359) ○金山博, 那須川哲哉 (日本IBM)
・「求められているもの」が何かを知る、要望分析のタスクの設定、再現率の向上のための工夫
・対象とする文章は、blog・webのフォーラムなど、一般のCGM
・意見の中には「好評・不評」の他に「要望」が含まれている
・求められている事物を列挙するだけで、要望分析の実用的なアプリとなる
・様々なタイプの要望表現のウチ、(用言ではなく)体現で表される「要望対象」に焦点を当てる
・扱うテキストは一般のCGM
・求められているものの本質は、一単語では表現できないので、修飾語を含めた名詞句を持って「要望対象」とする
・「要望表現パターン」と「補助パターン」を使って、木構造の頂点から要望対象を探索、補助パターンは要望表現パターンを適用できる場所を増やす
・「多くの人が求めているものがある」という課程を起き、要望表現のパターンを学習
・予備実験で得られた横暴対象から部分木を抽出し、「頻出要望インスタンス」とする、その信頼度すなわち「要望対象らしさ」をコーパス全体との頻度の比として計算
・頻出要望インスタンスと頻繁に共起する文末の表現を要望表現パターンの候補として、その信頼度を計算
・課題、他の文体・分野での振る舞いを調べる、再帰的にパターンの構築を行う、好評・不評の表現との関連についてより深く考察する

[C2-6] ブログを対象とした統計的意見情報検索 (pp.360-363) ○佐藤翔平, 関和広, 上原邦昭 (神戸大)
・主観的な表現の収集、意見情報を含む記事の検索が必要
・意見情報とは、個人の何らかの対象に対する主観的な表現
・意見情報の検索、単語に注目、主観的表現が文章無いに表れているか? ただ、単語だけを考慮するだけでは不十分で文脈を考慮する必要がある
・Nグラムモデル、非連結、非近傍では厳しい
・トリガーモデル、非近傍の語幹の依存関係を取り扱うモデル
・トリガー対、意見を述べる主体・批評される主体と主観的表現、また、トリガー対を考慮するパターンと考慮しないパターン
・トリガー対の同定、Amazonのユーザレビューをコーパスに、トリガーは14種類の代名詞
・同定したトリガー対を元にモデルを構築、3グラム言語モデルとトリガーモデルの線形補完
・TREC2006ブログトラックで用いられたコレクション(Blogコレクション)
・製品や映画のクエリは向上、政治や組織などは検索精度が向上しない
・課題、初期検索精度の向上、トリガー対、言語モデルの動的拡張、更新

[C2-7] Web世論からの意見抽出と賛否に基づく分類 (pp.364-367) ○井上結衣, 藤井敦 (筑波大)
・主観的な情報はWeb世論=一般大衆の声
・主観情報の集約に関する研究の例、OpinionReader
...エディタ不具合でメモ中止...
・課題、様々なトピックに対する評価実験、意志決定支援における有効性の評価、Webからのトピック自動抽出


[C2-8] 名詞の感情属性の抽出とそれに基づく名詞間類似度の計算 (pp.368-371) ○斉藤崇紘, 光部勇佑, 中谷和波, 韓東力 (日大)
...マシン不具合でメモ出来ず...
・でも、なかなか面白い発表だった、裏が、、、ですが



投稿者 ymkx : 2008年3月18日 18:49 |