YahooAPI:キーフレーズ抽出
概要
Yahoo デベロッパーネットワークで、キーフレーズ抽出の API が公開されています。
詳細は下記をどうぞ。
http://developer.yahoo.co.jp/webapi/jlp/keyphrase/v1/extract.html
これを使用することにより、文中からキーフレーズ(特徴的な表現)を抽出することが簡単にできます。
なお、この API を使用するためにはアプリケーション ID が必要となります。
アプリケーション ID については、下記をどうぞ。
http://help.yahoo.co.jp/help/jp/developer/developer-06.html
使用例
以下、簡単な例です。
use strict;
use LWP::Simple;
use XML::Simple;
use Encode;
my $appid = '********'; # アプリケーション ID を入手する必要があります
my $y_url = 'http://jlp.yahooapis.jp/KeyphraseService/V1/extract?appid=%s&sentence=%s';
my $sentence = join(" ", <>);
my $result = keyphrase($sentence);
for my $i (@$result) {
printf "%s,%d\n", Encode::encode('utf8', $i->{Keyphrase}), $i->{Score};
}
sub keyphrase {
my ($sentence) = @_;
$sentence =~ s/([^ 0-9A-Za-z])/sprintf("%%%.2X", ord($1))/eg;
$sentence =~ tr/ /+/;
my $url = sprintf($y_url, $appid, $sentence);
my $response = get($url);
return undef unless $response;
my $xmlsimple = XML::Simple->new;
my $xml = $xmlsimple->XMLin($response);
return $xml->{Result};
}
キーフレーズ抽出ツール
簡単なものを作ってみました(/_\;)
キーフレーズ抽出ツール