#14 産業連関表をデータフレーム形式で読み込む
今回は、和歌山県の産業連関表(187部門表)をデータフレーム形式で読み込むことに挑戦します。
和歌山県産業連関表はエクセル形式で、こちらからダウンロードできます。
こんな感じです。

このエクセルファイルを少しいじってから、CSV形式していこうと思います。
書式設定の3桁区切りを外す
まず、「セルの書式設定」で、「3桁区切り」にチェックが入っているので、そのチェックを外します。

空行・空列を削除
次に、行1〜4と列Aを削除します。

ファイル名を「wayakama_IO.csv」として保存します。
保存したwakayama_IO.csvをデータフレーム形式で読み込んでみます。
df_iotable = pd.read_csv('wakayama_IO.csv')
df_iotable.head()

う〜ん。
イメージしていたものと違う…
部門名の行と列をそれぞれ削除してみた
エクセルファイルに戻って、セルの書式設定と行1〜4、列Aを削除し、続いて部門名の行と列をそれぞれ削除してみました。

もう一度、CSVファイルに変換して、データフレーム形式で読み込むことにします。

うーん。
2列目の分類コードが、テキストではなく数値と解釈されたようですね。
なので、文字列に変換してみます。
df_iotable = df_iotable.rename(columns={'Unnamed: 0':'分類コード'})
df_iotable['分類コード'] = df_iotable['分類コード'].astype('str')
for i in range(len(df_iotable)):
if len(df_iotable['分類コード'][i]) == 3:
df_iotable['分類コード'][i] = '0' + str(df_iotable['分類コード'][i])
df_iotable.head()

うーん。
前回の投稿での、重量単価表でもそうでしたが、本当は、分類コード(文字列)をインデックスにしたいんですよね。どうやればいいんだろう…
今日はもう時間が来たので、続きはまた明日にでも。

