第 2 部分 基于 Python 的数据分析基础
主讲老师:王赫
2023/12/01
ICTP-AP, UCAS
数据分析实训之 Numpy
# Response
# Numpy
# Numpy
Numpy 要点:
# Numpy
...
# Numpy
# 引入 numpy 模块
import numpy as np
np1 = np.array([1, 2, 3])
np2 = np.array([3, 4, 5])
# array相加
print(np1 + np2) # [4 6 8]
# 显示相关信息
print(np1.ndim, np1.shape, np1.dtype) # 1 (3,) int64 => 一维array, 三个元素, 数值类型
np3 = np.array([1, 2, 3, 4, 5, 6])
# 改变 array 的维度
np3 = np3.reshape([2, 3])
print(np3.ndim, np3.shape, np3.dtype) # 2 (2, 3) int64
# Numpy
# Numpy
# Numpy
# Numpy
简单的说,对两个阵进行操作时,Numpy 逐元素地比较他们的形状。
只有两种情况下Numpy会认为两个矩阵(向右对齐后)内的两个对应维度是兼容的:
举个牛逼的例子:
A (4d array): 8 x 1 x 6 x 1
B (3d array): 7 x 1 x 5
Result (4d array): 8 x 7 x 6 x 5
当任何一个维度是1,那么另一个不为1的维度将被用作最终结果的维度。也就是说,尺寸为1的维度将延展或“逐个复制”到与另一个维度匹配。
# Numpy
argmax, argmin, argsort, corrcoef, dot, floor, inner, inv, lexsort, max, maximum, mean, median, min, minimum, nonzero, prod, re, round, sort, std, sum, trace, transpose, ...
# Pandas
# Homework
$ git clone git@github.com:<你的github账户名>/GWData-Bootcamp.git
homework
分支上完成。你需要在你的本地仓库中新建目录 /GWData-Bootcamp/2023/homework/<你的名字>/
;并最终把 homework 分支的作业 push 到你自己的关于本课程的远程仓库中,即: $ git push origin homework
;最后,在GitHub上你的远程仓库中,在 homework 分支下发起 Pull Request (PR) 至本课程远程仓库。
Repo of the course: https://github.com/iphysresearch/GWData-Bootcamp
<你的github账户名>
不要勾选,可以把homework分支也一并fork