Yahoo! Japanの日本語形態素解析Webサービス使ってみた


http://developer.yahoo.co.jp/jlp/
http://developer.yahoo.co.jp/jlp/MAService/V1/parse.html

なんかよさげなAPIがリリースされたようで。


Yahoo!の日本語形態素解析エンジンAPIを公開 - ITmedia NEWS
http://codezine.jp/a/article/aid/1461.aspx
http://japan.internet.com/webtech/20070618/3.html
ヤフー、形態素解析のWebサービスを公開 − @IT


おもしろそうなのでちょっと触ってみた。


んで、適当にモジュールをでっち上げてCPANにあげといた。
http://search.cpan.org/dist/WebService-YahooJapan-WebMA/


使ってみたところ、レスポンスも結構速いし、何よりYahoo! Japanで使ってるエンジンが使えるっていうことでかなり利用価値があるんじゃないかと。MeCabとか入れるよりお手軽。

制限は24時間以内で1つのIPアドレスにつき一日50000リクエストまでっていうのと、文章は100kb未満とのことだけど、個人or小規模Webサービスならほとんど問題ないんじゃないかと思う。


たつをさん曰く、ウェブに現れる語彙をじゃんじゃん追加しているとのことなので、辞書もどんどん新しくなるし、すばらしいサービスだと思う。

こういうツール的なWebサービスが大きいところからリリースされるのはあまりなかったので、Yahoo! Japanからとはちょっと驚き。


あとはJSONPのインターフェースが公式にリリースされればJavaScriptでそのまま形態素解析が出来るんだけど・・・

そこは今後リリースを検討していただけるとうれしいすね。
(appidが公開されちゃう、とかいろいろ問題はあると思うけど)


にしても、ChasenMeCabオープンソースだし、Yahoo! JapanWebサービスはあるしで、高度なテキスト解析をするのには非常に恵まれた環境だと思った。

なんか形態素解析が必要なサービス作ろうっていったときにRosetteとか買わなきゃいけないのとオープンソースのソフトウェアがあるのとじゃえらい違いだ。感謝感謝。