#14　産業連関表をデータフレーム形式で読み込む

2021年8月19日 2021年8月19日

宮崎稔也

今回は、和歌山県の産業連関表（187部門表）をデータフレーム形式で読み込むことに挑戦します。

和歌山県産業連関表はエクセル形式で、こちらからダウンロードできます。
こんな感じです。

このエクセルファイルを少しいじってから、CSV形式していこうと思います。

書式設定の3桁区切りを外す

まず、「セルの書式設定」で、「3桁区切り」にチェックが入っているので、そのチェックを外します。

空行・空列を削除

次に、行１〜4と列Aを削除します。

ファイル名を「wayakama_IO.csv」として保存します。

保存したwakayama_IO.csvをデータフレーム形式で読み込んでみます。

df_iotable = pd.read_csv('wakayama_IO.csv')
df_iotable.head()

う〜ん。
イメージしていたものと違う…

部門名の行と列をそれぞれ削除してみた

エクセルファイルに戻って、セルの書式設定と行1〜4、列Aを削除し、続いて部門名の行と列をそれぞれ削除してみました。

もう一度、CSVファイルに変換して、データフレーム形式で読み込むことにします。

うーん。
2列目の分類コードが、テキストではなく数値と解釈されたようですね。
なので、文字列に変換してみます。

df_iotable = df_iotable.rename(columns={'Unnamed: 0':'分類コード'})
df_iotable['分類コード'] = df_iotable['分類コード'].astype('str')
for i in range(len(df_iotable)):
   if len(df_iotable['分類コード'][i]) == 3:
       df_iotable['分類コード'][i] = '0' + str(df_iotable['分類コード'][i])
df_iotable.head()