數據處理

Data Processing

基礎介紹

Introduction

pandas

  • 資料操縱和分析
  • 操縱數值表格
  • 時間序列的資料結構

下載

> pip install pandas

創建數據

Creating

series

一維陣列

import pandas

my_data1 = pandas.Series([56, 32, 548], index=['2021', '2022', '2023'], name='count')

dataframe

二維數據 可以想像成 excel

import pandas

my_data2 = pandas.DataFrame({'number': [5, 7, 13], 'score': [131, 2, 8]})

創建完數據要怎麼輸出?

import pandas
print(my_data1)
print(my_data2)

輸出檔案

Writing

import pandas
my_data1.to_csv("data.csv")

讀取檔案

Reading

import pandas
input_data = pandas.read_csv("flie.csv")

索引

Index

利用索引尋找資料

import pandas

my_data3 = pandas.DataFrame({"score1": [78, 94, 68, 97, 68], "score2": [3, 4, 7, 6, 4])
print(my_data3.iloc[4])
print(my_data3.iloc[1:4])
print(my_data3.loc[1:4])
print(my_data3.iloc[1:4, 0])

資料分析

Insightes

資料概述

import pandas

melbourne_data = pandas.read_csv("melb_data.csv")

print(melbourne_data.describe())
count 有幾行值
mean 平均
std 標準差
min 最小值
25% PR25
50% PR50
75% PR75
max 最大值

資料概述

映射

import pandas

reviews.rooms.map(lambda p: p - 1)
Made with Slides.com