economist.com を Plagger で読む
英紙エコノミストのウェブサイトは RSS を提供してるんだけど、description 内の本文が一行だったりして悲しいので Plagger でごにょごにょする config を書いてみた。
Filter::EntryFullText の config economist.yaml
author: Masanori Hara handle: http://www\.economist\.com/agenda/ extract: <!-- top-title -->.*?<!-- top-title --><h1>(.*?)</h1>.*?From Economist.com</p>(.*?)<p class="back-to-top"> extract_capture: title body extract_after_hook: $data->{body} =~ s![\r?\n]{1,4}.*?\'\);.*?//.*?// -->[\r?\n]{1,4}!!s;
あとこれは別に必須ではないけど、Filter::TruePermalink の config economist.yaml も書いた
author: Masanori Hara match: http://www.economist.com/ rewrite: s!\&fsrc=RSS$!!
plugins: - module: Subscription::Config config: feed: - url: http://www.economist.com/rss/globalAgenda/economist_globalArticle.xml - module: Filter::TruePermalink - module: Filter::BreakEntriesToFeeds - module: Filter::EntryFullText - module: Publish::Gmail config: mailto: your-mail-address mailfrom: your-mail-address
これで economist の global agenda が全文あなたの好きなように読めます。渋いね。