広報・PR効果測定サービスのWebクリッピングの仕組み

仕組み:Webクリッピングをご理解いただくために

クリッピングはインターネットに溢れる情報の中でも、選別したWebメディアから記事を検索・抽出する仕組みです。

いつの記事を取得?

クリッピングの報告対象となる記事は、クリップ登録が完了した時点から新着記事として掲載された記事です。当社システムでは、対象メディアの新着記事を毎時でアーカイブしており、すでにアーカイブ化が完了した記事は「過去記事検索」よりご確認いただけます。

どこから記事を取得?

クリッピングの対象は世の中のすべてのメディアやサイトではありません。 主に国内ニュースサイトを中心に当社基準によって選別した1,100以上のWebサイトが対象です。

何をもとに取得?

クリッピング対象メディアの中から、ユーザー自身が設定したキーワードの含まれる記事を見つけてクリップします。 記事のタイトル・本文に設定したキーワードが含まれている場合、記事を自動取得しますが、関連性までは判別していません。例えば、「パリ」とだけキーワードを設定した場合、「パリジェンヌ」「パリパリ」「パリコレ」など、属性に関係なく”パリ”というワードが含まれる新着記事はすべて取得しますが、「エッフェル塔」「シャンゼリゼ」などパリに関係していても、キーワードに設定していないものは取得されません。

除外キーワードの活用

上記のように、設定したキーワードだけでは不要な記事が多数取得される見込みがある場合に、2語以上を掛け合わせるAND検索や「除外キーワード」を設定する方法があります。検索した記事の中に、除外キーワードが含まれているものは、レポートからは除外されます。上記を例にとると、「パリパリ」「パリジェンヌ」「パリコレ」などを除外キーワードとして設定することで、ノイズになる情報を取得せずに済みます。※パリは例として使用していますが、取得数が膨大になるため、実際は単独で使わない方がよい単語の一つです。

取得精度に関して

複数単語の組み合わせでキーワードを設定した方が、余分な記事を取得することがありません。たとえば、多くのプレスリリースを出している場合は、それぞれのプレスリリース特有の単語(具体的な数値など)を入れると精度が高くなります。基本的には、タイトルや記事本文内で使用しているキーワードを組み合わせることをお勧めします。

固有名詞 & 2単語以上

固有名詞(社名、サービス名、個人名)や具体的な数値等が含まれ、かつ2単語以上を組み合わせると、精度の高い検索結果が得られます。例えば、「マイケル」とだけ設定すると膨大な「マイケル」に関連する記事が取得されますが、「マイケル ジャクソン」や「マイケル ジョーダン」と言ったフルネーム(2語)にするだけである程度精度は高くなります。さらに「マイケル ジャクソン ツアー 東京 1987年」「マイケル ジョーダン ブルズ NBA」など、それぞれに関連する特徴的なキーワードを設定することで、想定に近い記事を取得できるようになります。