データアーカイブ¶
都合により、下記コンテンツの更新を停止しました。
データアーカイブ¶
以下の3種類のデータを毎日18h に取得しています。 zip にまとめたものをダウンロードできます。 (データは 2023/05/10 以降)。
集計方法 |
ファイル名 |
医療機関数 |
医療機関あたり |
---|---|---|---|
男女別集計表 |
kw_sex_年月日_時分秒.csv |
|
|
年齢階級別集計 |
kw_age_年月日_時分秒.csv |
|
|
区別集計 |
kw_reg_年月日_時分秒.csv |
|
|
毎日のダウンロードデータの提供も停止しました。
同種のデータを別のサイトでも取得/公開しています(バックアップの意味で)、 本サイトの調子が悪いときは以下を試してみてください。
http://home.catv.ne.jp/dd/sken/
項目は同じだが、独立に動かしているので取得タイミングは少し異なる。 本サイトのデータと区別するためアーカイブ名に 2 を付加した。データへの直接リンク → kawasaki_data2.zip
源泉 :川崎市感染症情報発信システム/リアルタイムサーベイランス/ダウンロードサービス
注意 :文字コードは SHIFT_JIS で波ダッシュが使われている。SHIFT_JIS の波ダッシュ「~] は Unicode に変換するとき、使うツールによって波ダッシ ュ「〜」U+301C になったり、全角チルダ「~」U+FF5E になったりして混乱する。 詳しくは、"波ダッシュ 全角チルダ" で検索を。
データ取得プログラム¶
データ取得プログラムを公開します。利用・改変はご自由にどうぞ。 (この手の技術はあまり詳しくないので、色々無駄とか変なところも多いと 思いますが、それなりに稼働実績があるものを公開しています)。
男女別, 年齢階級別,区別の3種類のデータを取得する |
|
一日に一回、指定した時刻に上記を実行する |
使い方/動作環境¶
"""retr_n.py
川崎市リアルタイムサーベイランスからデータ(*.csv) を取得する。
疾患選択:
新型コロナウィルス感染症(COVID-19)
取得ファイル名 (集計方法):
data/kw_sex_YYMMDD_hhmmss.csv (男女別集計表)
data/kw_age_YYMMDD_hhmmss.csv (年齢階級別集計)
data/kw_reg_YYMMDD_hhmmss.csv (区別集計)
データの種類:
日別データ
期間:
2023年4月13日~実行日当日
注意
- 取得したデータのレコード数を確認している。上の取得期間を変更する場合には、
そちらも変更する必要がある。
- 取得データの文字コードは SHIFT_JIS。年齢階級に「~」波ダッシュが使われている。
SHIFT_JIS の波ダッシュは、問題を起こしやすい。
動作環境
Python 3.11
Windows11 (10 でも大丈夫と思う)
コマンドプロンプトから python retr_n.py で実行
依存関係 (実行に必要なもの)
1. Chrome (google の WEB browser)
2. selenium
> pip install selenium
3. webdriver-manager
> pip install webdriver-manager
selenium が要求する chrome-driver は chrome のバージョンに依存するが、
chrome は勝手にバージョンアップすることがあるため、あらかじめ用意した
chrome-driver で突然エラーが発生することになる。
webdriver-manager は、適切な chrome-driver を動的に割り当ててくれる。
"""
![Creative Commons License](https://i.creativecommons.org/l/by/4.0/88x31.png)
This work is licensed under a Creative Commons Attribution 4.0 International License .