economist.com を Plagger で読む

英紙エコノミストのウェブサイトRSS を提供してるんだけど、description 内の本文が一行だったりして悲しいので Plagger でごにょごにょする config を書いてみた。

Filter::EntryFullText の config economist.yaml

author: Masanori Hara
handle: http://www\.economist\.com/agenda/
extract: <!-- top-title -->.*?<!-- top-title --><h1>(.*?)</h1>.*?From Economist.com</p>(.*?)<p class="back-to-top">
extract_capture: title body
extract_after_hook: $data->{body} =~ s![\r?\n]{1,4}.*?\'\);.*?//.*?// -->[\r?\n]{1,4}!!s;

あとこれは別に必須ではないけど、Filter::TruePermalink の config economist.yaml も書いた

author: Masanori Hara
match: http://www.economist.com/
rewrite: s!\&fsrc=RSS$!!

Plagger の config.yaml はこんな感じ

plugins:
  - module: Subscription::Config
    config:
      feed:
        - url: http://www.economist.com/rss/globalAgenda/economist_globalArticle.xml

  - module: Filter::TruePermalink
  - module: Filter::BreakEntriesToFeeds
  - module: Filter::EntryFullText

  - module: Publish::Gmail
    config:
      mailto: your-mail-address
      mailfrom: your-mail-address

これで economist の global agenda が全文あなたの好きなように読めます。渋いね。