この1~2年、私は大阪府が発表している新型コロナウィルスへの感染者数を可視化しています。
まあ、行政の発表ではありがちなのですが、大阪府でも発表はPDFとエクセル。
エクセルには各市町別の感染確認者数の発表者数データが表形式で記載されているので、そのデータを抜き出してグラフ等にして公開しています。
とは言え、エクセルの発表方法が、よく言われる方眼紙エクセルなのです。
見栄えを重視し、データ利用することを一切考えていません。
仕方なく、プログラムを作成して必要なデータのみを抜き出しています。ま、一度作成してしまえば、その後は比較的簡単にデータのみを抽出できます。
しかし、先日変なグラフが表示されてしまいました。
調べてみると、各市町の項目の一つ(府外)に「*」マークが記載されています。
「府外」と「*府外」と言う項目が作成されてしまい、今までの「府外」の感染者数に今日の「*府外」の感染者数が追加できなくなってしまいました。
仕方なく、プログラムを修正したのですが、翌日には、更なる暴挙が。
「*府外」の項目はなくなり「府外」に統一されたのですが、感染者数「981」と言う数字に「*1 981」と記載されています。
感染者数の数字が入力されるべきセルに「*1」と言う文字が追加されているのです。
おかげで「感染者数」と言うカラムの数字が全て数字でなく文字として認識され、プログラムからエラーが排出されてしまっています。
数字を入力すべきところ(セル)に文字を入力するなど考えられないですよね。完全にエクセルを方眼紙としか考えていないのでしょうね。
そもそも、私企業であるマイクロソフト社の販売製品エクセルでしかデータを公開しないと言う事自体が問題なのですが、そこまでは理解できないのでしょうね。
エクセルでしかデータを公開しないと言う事は、エクセルを購入しなければデータを見ることができないのです。
と言う事は、行政が私企業の製品購入を支援している事になってしまいます。市役所の駐車場をトヨタの車しか利用させないと言うのと同じです。
行政はオープンな形式(CSVなど)でもデータを公開すべきなのです。もちろんエクセルでも公開しても問題はないですよ。
しかし、大阪府に期待しても無理かな。。。