プログラミング・エンジニア転職について発信します

あきぞらてっく

Pythonでfeedparserを使用してRSSからデータを取得する

2021/03/02

こんにちは、あきぞらです。

コロナウイルス関連の情報を確認していたら厚生労働省のサイトにRSSで情報を提供していたので、

最新情報のURLリンクを取得するスクリプトを作成してみました。

RSSについてはこちらを参照ください。RSS

ウェブサイトの更新情報を配信するための文書フォーマットのことです。

目次

1 厚生労働省のRSSにアクセスしてデータを取得してみる
2 feedparserのインストール
3 feedparserを使ってURL一覧を取得

厚生労働省のRSSにアクセスしてデータを取得してみる

厚生労働省では、RSSでの情報を提供しているようです（2020/03/29時点）。

こちらから最新情報のURLを取得したいと思います。

feedparserのインストール

まず、feedparserをpip でインストールします。

$ pip install feedparser

feedparserを使ってURL一覧を取得

以下のようなコードで、簡単にURLの一覧を作成することができます。

RSSのデータを確認すると、

linkタグからURLが取れそうなのでそこから取得してみます。

またnewpageと記載されているURLが新着情報っぽいので、

この文字列が含まれるURLの一覧を取得してみます。

import feedparser

def getRssFeedData(): # アクセスするrdfのURLを記載
    RSS_URL = 'https://www.mhlw.go.jp/stf/news.rdf'
    xml = feedparser.parse(RSS_URL)
    for entry in xml.entries:
        # linkの中からnewpageの文字列を含むURLを取り出す
        if('newpage' in entry.link):
            print(entry.link)

getRssFeedData()

実行すると、確かにURLの一覧が取得できました。

$ python getRssFeed.py
https://www.mhlw.go.jp/stf/newpage_10555.html
https://www.mhlw.go.jp/stf/newpage_10552.html
https://www.mhlw.go.jp/stf/newpage_10551.html
https://www.mhlw.go.jp/stf/newpage_10549.html

関連記事

: Python

【Selenium】セレクト（プルダウンリスト）の選択中の値を取得する方法！

あきぞらです。今回は、Seleniumでセレクトの選択中の値を取得する方法を紹介します。選択中の値の取得の流れ選択中の値の取得の流れは以下です。「セレクトの要素を取得する」　⇒　「取得した要素 ...

: Python

【Python】Seleniumで複数クラス指定の要素をclass_nameで取得する方法！

あきぞらです。 PythonでSeleniumを使っていて、複数クラスが書いてある要素にアクセスしたいときがありました。そのとき「find_element_by_class_name」で取得しよう ...

: Python

【Python】必要なライブラリを一括インストール！requirements.txt を使おう！

あきぞらです。 Pythonを使っていると、頻繁にライブラリをインストールします。ただ、一個一個インストールしていると面倒ですよね。そんなとき、一括でインストールできる方法があります。今回はその ...

: Python

【Python】for文でrangeを使った要素の取り出し方法！

あきぞらです。個人開発でWebスクレイピングをしていて、Pythonを使っています。 Pythonでスクレイピングをするとき、for文を書くことがモチロン多いので、基本的な書き方を書いていこうと思 ...

: Python

【Python】LINE Notifyを使ってPythonでLINEの通知処理を実装する方法！

こんにちは、あきぞらです。前回、PHPでLINE Notifyを使ってLINE通知を行う記事を書きました。そこで今回は、Pythonで実装する方法を紹介したいと思います！目次1 LINE Not ...

PREV: 【Python】すぐできる！Pythonの環境を構築する手順！（Windows10）
NEXT: 【エンジニア転職】SIerからWebエンジニアになった僕が、SIerの仕事がなぜつまらないのか考えてみる

あきぞら

雑草エンジニア。自宅浪人で多浪。 SIerからWebエンジニアへ転向。プログラミング学習・転職活動・ライフハックについて発信します。

: Laravel

【Laravel10】Laravel Pennantで機能フラグを簡単に実装！

2024/10/3

: Laravel

【Laravel10】クエリスコープで複雑なデータ取得を簡単にする方法！

2024/10/2

: Laravel

【Laravel】PHP-CS-Fixer導入する方法！

2024/10/2

: Laravel

【Laravel】BladeファイルにHTMLのコードを反映させる方法！

2021/8/19

: aws

【aws】Amazon Linux 2にpipをインストールする方法！

2021/11/14

おすすめ記事

1: 【エンジニア転職】SIerからWebエンジニアに転職するまでに影響を受けたものを紹介します！

こんにちは、あきぞらです。僕は新卒でSIerに入社し3年ほど働いたあと、2020年の2月からWebエンジニアへ転職しました。 Webエンジニアとして、新しい職場で仕事をしています。「Webエンジニ ...

2: 【エンジニア転職】SIerとWeb企業との違いとは？両方で仕事をした経験から解説！

こんにちは、あきぞらです。今回は、私のSIerからWeb系企業へ転職した経験から、 SIer企業とWeb系企業との違いについて紹介します！目次1 SIer企業では何をしていたか2 S ...

3: 【仕事効率化】仕事が速くなるエンジニア・Webライターのおすすめキーボード！

こんにちは、あきぞらです。毎日タイピングをしていて、「腕や肩が疲れたな～」ということはありませんか？それは高品質なキーボードを使うことで改善されるかもしれません！エンジニアやWebライター、デザ ...

Copyright© あきぞらてっく , 2026 All Rights Reserved Powered by AFFINGER5.