データアーカイブ

都合により、下記コンテンツの更新を停止しました。

データアーカイブ

以下の3種類のデータを毎日18h に取得しています。 zip にまとめたものをダウンロードできます。 (データは 2023/05/10 以降)。

集計方法

ファイル名

医療機関数

医療機関あたり

男女別集計表

kw_sex_年月日_時分秒.csv

年齢階級別集計

kw_age_年月日_時分秒.csv

×

×

区別集計

kw_reg_年月日_時分秒.csv

×

毎日のダウンロードデータの提供も停止しました。

同種のデータを別のサイトでも取得/公開しています(バックアップの意味で)、 本サイトの調子が悪いときは以下を試してみてください。

http://home.catv.ne.jp/dd/sken/

項目は同じだが、独立に動かしているので取得タイミングは少し異なる。 本サイトのデータと区別するためアーカイブ名に 2 を付加した。データへの直接リンク → kawasaki_data2.zip

源泉 :川崎市感染症情報発信システム/リアルタイムサーベイランス/ダウンロードサービス

注意 :文字コードは SHIFT_JIS で波ダッシュが使われている。SHIFT_JIS の波ダッシュ「~] は Unicode に変換するとき、使うツールによって波ダッシ ュ「〜」U+301C になったり、全角チルダ「~」U+FF5E になったりして混乱する。 詳しくは、"波ダッシュ 全角チルダ" で検索を。

データ取得プログラム

データ取得プログラムを公開します。利用・改変はご自由にどうぞ。 (この手の技術はあまり詳しくないので、色々無駄とか変なところも多いと 思いますが、それなりに稼働実績があるものを公開しています)。

retr_n.py

男女別, 年齢階級別,区別の3種類のデータを取得する

loop.py

一日に一回、指定した時刻に上記を実行する

使い方/動作環境

"""retr_n.py

川崎市リアルタイムサーベイランスからデータ(*.csv) を取得する。
    
    疾患選択:
        新型コロナウィルス感染症(COVID-19)
    
    取得ファイル名 (集計方法):
        data/kw_sex_YYMMDD_hhmmss.csv (男女別集計表)
        data/kw_age_YYMMDD_hhmmss.csv (年齢階級別集計)
        data/kw_reg_YYMMDD_hhmmss.csv (区別集計)
    
    データの種類:
        日別データ
    
    期間:
        2023年4月13日~実行日当日

注意
   - 取得したデータのレコード数を確認している。上の取得期間を変更する場合には、
     そちらも変更する必要がある。
    
   - 取得データの文字コードは SHIFT_JIS。年齢階級に「~」波ダッシュが使われている。
     SHIFT_JIS の波ダッシュは、問題を起こしやすい。

動作環境
    Python 3.11
    Windows11 (10 でも大丈夫と思う)
    コマンドプロンプトから python retr_n.py で実行
    
依存関係 (実行に必要なもの)
    
    1. Chrome (google の WEB browser)
        
    2. selenium 
        > pip install selenium
        
    3. webdriver-manager
        > pip install webdriver-manager
        selenium が要求する chrome-driver は chrome のバージョンに依存するが、
        chrome は勝手にバージョンアップすることがあるため、あらかじめ用意した
        chrome-driver で突然エラーが発生することになる。
        webdriver-manager は、適切な chrome-driver を動的に割り当ててくれる。

"""

Creative Commons License
This work is licensed under a Creative Commons Attribution 4.0 International License .