スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

第11回 Mozilla 拡張機能勉強会

第11回 Mozilla 拡張機能勉強会で Ubiquity の日本語パーサについて発表してきました。

勉強会の前半に mitcho さん が発表してくださったので、プレゼン資料は、かなり手を抜いてます (^^;

プレゼン資料:
Ubiquity の日本語パーサを書いてみた (PDF)

Ubiquity 0.2pre25 (mar 版日本語パーサ stage 3):
ubiquity-0.2pre25_ja_mar-stage3.xpi [721,366 bytes]

「stage 3」は、stage 1, stage 2 を経てまだ開発途中の段階です。
予定では以下のように考えています。

stage 1
文を助詞部分で 2つに分割。
stage 2
目的語の絞り込み。
動詞の抽出。
stage 3
読点への対応と辞書の構造化。
nountypes の rankLast フラグを利用。
stage 4
Ubiquity に同梱のコマンドに対応?
stage 5
Ubiquity 0.2 の Semantic roles に対応?

日本語パーサの詳しい動作については、プレゼン資料(手抜き) とソースをご覧ください。

まだ、うまく目的語を拾えなかったり、コマンドに渡せなかったりするバグがあります。
「翻訳して」コマンドがきちんと動作できるようになったら、改めて公開します。

日本語の名詞と埋め込みコマンドについては、本家 trac サイトの Ticket #425 にパッチを投稿しています。
日本語パーサ関係のチケットは Ticket #583 から辿れます。

(追記: 2009-04-02)
バグを修正しました。
Ubiquity 0.2pre27 (mar 版日本語パーサ stage 3 修正版):
ubiquity-0.2pre27_ja_mar-stage3.xpi [723,020 bytes]

(追記: 2009-04-04)
Ubiquity 0.2pre28 (mar 版日本語パーサ stage 3 修正版2):
ubiquity-0.2pre28_ja_mar-stage3.xpi [682,274 bytes]

コマンド例:

  1. 「Ubiquityの使い方を彼に教えてを、英語に翻訳して」
  2. 「22/7-1を適当に計算して」

※1 同じ助詞が複数回使われる場合は、一番最後のものを採用します。
※2 コマンドが使用しない助詞は破棄されます。

関連記事

コメント

コメントする

管理者にだけ表示を許可する

この記事のトラックバックURL

http://chimantaea.blog8.fc2.com/tb.php/72-777612b6

※トラックバック元には、この記事へのリンクを含めてください。