python-绘图与可视化( 三 )


文章插图
(3)使用Seaborn“耍酷”然而seaborn 不仅能够用来更改背景颜色 , 或者改变画布大小,还有其他很多方面的用途 , 比如下面这个例子:
import seaborn as snssns.set()#通过加载sns自带数据库中的数据(具体数据可以不关心)flights_long = sns.load_dataset("flights")flights = flights_long.pivot("month","year","passengers")#使用每个单元格中的数据值绘制一个热图heatmapsns.heatmap(flights,annot=True,fmt="d",linewidths=.5)plt.show()

python-绘图与可视化

文章插图
4.描述性统计图形概览描述性统计是借助图表或者总结性的数值来描述数据的统计手段 。数据挖掘工作的数据分析阶段 , 我们可借助描述性统计来描述或总结数据的基本情况,一来可以梳理自己的思维,二来可以更好地向他人展示数据分析结果 。数值分析的过程中 , 我们往往要计算出数据的统计特征,用来做科学计算的Numpy和SciPy工具可以满足我们的需求 。Matplotlib工具可用来绘制图,满足图分析的需求 。
4.1制作数据数据是自己制作的,主要包括个人身高、体重及一年的借阅图书量(之所以自己制作数据是因为不是每份真实的数据都可以进行接下来的分析,比如有些数据就不能绘制饼图 , 另一个角度也说明,此处举例的数据其实没有实际意义,只是为了分析而举例,但是不代表在具体的应用中这些分析不能发挥作用) 。另外,以下的数据显示都是在Seaborn库的作用下体现的效果 。
#案例分析(结合图书情报学,比如借书量)from numpy import arrayfrom numpy.random import normaldef getData():    heights = []    weights = []    books = []    N =10000    for i in range(N):        while True:            #身高服从均值为172,标准差为6的正态分布            height = normal(172,6)            if 0<height:break        while True:            #体重由身高作为自变量的线性回归模型产生 , 误差服从标准正态分布            weight = (height-80)*0.7 + normal(0,1)            if 0 < weight:break        while True:            #借阅量服从均值为20,标准差为5的正态分布            number = normal(20,5)            if 0<= number and number<=50:                book = "E"if number <10 else("D"if number<15 else ("C"if number<20 else("B"if number<25 else "A")))            break        heights.append(height)        weights.append(weight)        books.append(book)        return array(heights),array(weights),array(books)    heights,weights,books =getData()4.2 频数分析(1)定性分析柱状图和饼形图是对定性数据进行频数分析的常用工具 , 使用前需将每一类的频数计算出来 。①柱状图 。柱状图是以柱的高度来指代某种类型的频数 , 使用Matplotlib对图书借阅量这一定性变量绘制柱状图的代码如下:
from matplotlib import pyplot#绘制柱状图def drawBar(books):    xticks=["A","B","C","D","E"]    bookGroup ={ }    #对每一类借阅量进行频数统计    for book in books:        bookGroup[book] = bookGroup.get(book,0) + 1    #创建柱状图    #第一个参数为柱的横坐标    #第二个参数为柱的高度    #参数align为柱的对齐方式,以第一个参数为参考标准    pyplot.bar(range(5),[bookGroup.get(xtick,0) for xtick in xticks],align="center")    #设置柱的文字说明    #第一个参数为文字说明的横坐标    #第二个参数为文字说明的内容    pyplot.xticks(range(5),xticks)    #设置横坐标的文字说明    pyplot.xlabel("Types of Students")    #设置纵坐标的文字说明    pyplot.ylabel("Frequency")    #设置标题    pyplot.title("Numbers of Books Students Read")    #绘图    pyplot.show()    drawBar(books)

推荐阅读