#14 産業連関表をデータフレーム形式で読み込む

今回は、和歌山県の産業連関表(187部門表)をデータフレーム形式で読み込むことに挑戦します。

和歌山県産業連関表はエクセル形式で、こちらからダウンロードできます。
こんな感じです。

画像1

このエクセルファイルを少しいじってから、CSV形式していこうと思います。

書式設定の3桁区切りを外す

まず、「セルの書式設定」で、「3桁区切り」にチェックが入っているので、そのチェックを外します。

画像2

空行・空列を削除

次に、行1〜4と列Aを削除します。

画像3

ファイル名を「wayakama_IO.csv」として保存します。

保存したwakayama_IO.csvをデータフレーム形式で読み込んでみます。

df_iotable = pd.read_csv('wakayama_IO.csv')
df_iotable.head()

画像4

う〜ん。
イメージしていたものと違う…

部門名の行と列をそれぞれ削除してみた

エクセルファイルに戻って、セルの書式設定と行1〜4、列Aを削除し、続いて部門名の行と列をそれぞれ削除してみました。

画像5

もう一度、CSVファイルに変換して、データフレーム形式で読み込むことにします。

画像6

うーん。
2列目の分類コードが、テキストではなく数値と解釈されたようですね。
なので、文字列に変換してみます。

df_iotable = df_iotable.rename(columns={'Unnamed: 0':'分類コード'})
df_iotable['分類コード'] = df_iotable['分類コード'].astype('str')
for i in range(len(df_iotable)):
   if len(df_iotable['分類コード'][i]) == 3:
       df_iotable['分類コード'][i] = '0' + str(df_iotable['分類コード'][i])
df_iotable.head()

画像7

うーん。
前回の投稿での、重量単価表でもそうでしたが、本当は、分類コード(文字列)をインデックスにしたいんですよね。どうやればいいんだろう…

今日はもう時間が来たので、続きはまた明日にでも。

Follow me!

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です