Python数据分析：实用向( 三 ) _生活百科

画图画图准备解决中文符号显示问题plt.rcParams['font.sans-serif'] = ['SimHei']# 黑体plt.rcParams['axes.unicode_minus'] = False# 解决无法显示符号的问题sns.set(font='SimHei', font_scale=0.8)# 解决Seaborn中文显示问题设置背景样式plt.style.use('classic')plt.rc("figure", facecolor="white")#去除灰色边框绘图这是一个画箱线图代码import matplotlib.pyplot as pltsns.set_style('darkgrid')fig, ax = plt.subplots(figsize=(16,12),ncols=2)ax1 = sns.boxplot(x="Embarked", y="Fare", hue="Pclass", data=https://www.huyubaike.com/biancheng/train, ax = ax[0]);ax2 = sns.boxplot(x="Embarked", y="Fare", hue="Pclass", data=https://www.huyubaike.com/biancheng/test, ax = ax[1]);ax1.set_title("Training Set", fontsize = 18)ax2.set_title('Test Set',fontsize = 18)fig.show()画缺口饼图churn_value=https://www.huyubaike.com/biancheng/data['cvr_group_high'].value_counts()labels=data['cvr_group_high'].value_counts().indexplt.figure(figsize=(7,7))plt.pie(churn_value,labels=['一般客户', '高价值客户'],colors=["#75bbfd","#00ffff"], explode=(0.05,0),autopct='%1.1f%%', shadow=False)plt.rcParams['font.sans-serif']=['SimHei']plt.rcParams['axes.unicode_minus'] = Falseplt.title("高价值客户占比23.4%")#plt.savefig('pie.png', dpi=300)画相关性系数图mask = np.zeros_like(data.corr(), dtype=np.bool)#mask[np.triu_indices_from(mask)] = Trueplt.subplots(figsize = (15,12))sns.heatmap(data.corr(),annot=True,#mask = mask,cmap = 'RdBu', ## in order to reverse the bar replace "RdBu" with "RdBu_r"linewidths=.9,linecolor='gray',fmt='.2g',center = 0,square=True)plt.title("Correlations Among Features", y = 1.03,fontsize = 20, pad = 40) #相关性矩阵plt.savefig('cor.png', dpi=300)plt.show()画核密度估计fig = plt.figure(figsize=(15,8),)## I have included to different ways to code a plot behigh, choose the one that suites you.ax=sns.kdeplot(data.client[data.cvr_group_high == 0] ,color='gray',shade=True,label='high')ax=sns.kdeplot(data.loc[(data['cvr_group_high'] == 1),'client'] ,color='g',shade=True,label='high',)plt.title('client - high vs high', fontsize = 25, pad = 40)plt.ylabel("Frequency of cvr", fontsize = 15, labelpad = 20)plt.xlabel("Client", fontsize = 15,labelpad =20)## Converting xticks into words for better understandinglabels = ['H5', 'android', 'ios','pc','wap']plt.xticks(sorted(data.client.unique()), labels)plt.legend()模型训练导入模块#加载模块from sklearn.preprocessing import StandardScalerimport warningswarnings.filterwarnings("ignore") #过滤掉警告的意思from pyforest import *import pandas as pdimport numpy as npfrom sklearn.ensemble import RandomForestClassifier#随机森林from sklearn.svm import SVC,LinearSVC#支持向量机from sklearn.linear_model import LogisticRegression#逻辑回归from sklearn.neighbors import KNeighborsClassifier#KNN算法from sklearn.cluster import KMeans#K-Means 聚类算法from sklearn.naive_bayes import GaussianNB#朴素贝叶斯from sklearn.tree import DecisionTreeClassifier#决策树import xgboost as xgbfrom xgboost import XGBClassifierfrom catboost import CatBoostClassifierfrom sklearn.ensemble import AdaBoostClassifierfrom sklearn.ensemble import GradientBoostingClassifier from sklearn.metrics import classification_report,precision_score,recall_score,f1_score,accuracy_score #分类报告from sklearn.metrics import confusion_matrix#混淆矩阵from sklearn.metrics import silhouette_score#轮廓系数（评价k-mean聚类效果）from sklearn.model_selection import GridSearchCV#交叉验证from sklearn.metrics import make_scorerfrom sklearn.ensemble import VotingClassifier#投票def plot_predictions(test,predicted):#整体平移x=np.arange(0,len(test))+1#x[0]=1#my_x_ticks = np.arange(1, 14, 1)#plt.xticks(my_x_ticks)plt.plot(x,test,label='Real')plt.plot(x,predicted,color='darkOrange',linestyle='--',label='Predicted')#plt.xlabel('month')plt.ylabel('count')plt.legend()import mathdef mse_loss(y_true, y_pred):return np.sum(np.power(y_true - y_pred, 2)) / y_true.shape[0] / 2def return_rmse(test,predicted):rmse = math.sqrt(mse_loss(test, predicted))return rmse#print("The mean squared error is {}.".format(rmse))Classifiers=[["Random Forest",RandomForestClassifier()],["Support Vector Machine",SVC()],["LogisticRegression",LogisticRegression()],["KNN",KNeighborsClassifier(n_neighbors=5)],["Naive Bayes",GaussianNB()],["Decision Tree",DecisionTreeClassifier()],["AdaBoostClassifier",AdaBoostClassifier()],["GradientBoostingClassifier", GradientBoostingClassifier()],["XGB", XGBClassifier()],]设置训练集X=train.drop(['目标客户编号','品牌类型','购买意愿'], axis = 1)# X=train.drop(['目标客户编号','品牌类型'], axis = 1)t=Xheaders = X.columnsX= X.astype(float)y = train["购买意愿"]训练模型import warningswarnings.filterwarnings('ignore')Classify_result=[]names=[]prediction=[]for name,classifier in Classifiers:classifier=classifierclassifier.fit(X_train,y_train)y_pred=classifier.predict(X_test)recall=recall_score(y_test,y_pred,average='macro')precision=precision_score(y_test,y_pred,average='macro')f1score = f1_score(y_test, y_pred,average='macro')mse = return_rmse(y_test,y_pred)class_eva=pd.DataFrame([recall,precision,f1score,mse])Classify_result.append(class_eva)name=pd.Series(name)names.append(name)y_pred=pd.Series(y_pred)prediction.append(y_pred)plot_predictions(y_test,y_pred)## plt.savefig('seven1.png', dpi=300)plt.show()


上一页
1
2
3
4
下一页
		  	

    
    




    
    
    


推荐阅读

           
                  
              
                  excel怎么核对两个表格的名字相同 两个excel表快速核对重复名字 
                
                   
                
              
            

                  
              
                  二刻是多少分钟「2刻是多少分钟」 
                
                   
                
              
            

                  
              
                  奥运冠军吴敏霞官宣二胎！ 疑 怀胎超4个月，挺孕肚看比赛激动尖叫 ... 
                
                   
                
              
            

                  
              
                  槑 槑头槑脑 
                
                   
                
              
            

                  
              
                  地址+工作时间+联系电话 厦门办税服务厅多少？ 
                
                   
                
              
            

                  
              
                  *** 入党誓词4篇 
                
                   
                
              
            

                  
              
                  vivox27重启键在哪 
                
                   
                
              
            

                  
              
                  为什么手机usb连不上电脑 为什么手机usb连不上液晶电视 
                
                   
                
              
            

                  
              
                  耳机的两根线应该插在电脑的哪 
                
                   
                
              
            

                  
              
                  高速公路快车道停车追尾后谁的责任 死亡 高速公路快车道停车追尾后谁的责任 
                
                   
                
              
            

                  
              
                  西安有动漫游戏公司吗 
                
                   
                
              
            

                  
              
                  闰年的计算方法 闰年的判断方法 
                
                   
                
              
            

                  
              
                  彼岸花的花语是什么可以养家里吗 彼岸花的花语是什么,象征了什么?? 
                
                   
                
              
            

                  
              
                  2021年瘦西湖夜游 2023瘦西湖夜游有哪些好玩的 
                
                   
                
              
            

                  
              
                  斯柯达明锐用什么机油好 斯柯达明锐用啥机油好 
                
                   
                
              
            

                  
              
                  甜蜜蜜大结局 甜蜜蜜大结局雷雷会醒过来吗? 
                
                   
                
              
            

                  
              
                  笔记本电脑怎么投屏到投影仪，笔记本电脑怎么投屏到电视 
                
                   
                
              
            

                  
              
                  仙桃高铁站在什么地方 仙桃高铁站具体位置 
                
                   
                
              
            

                  
              
                  北京倡导13日居家办公14日15日居家休息：居家办公细则怎么制定？ 
                
                   
                
              
            

                  
              
                  狮子座婚姻配对指数 
                
                   
                
              
            

          

python ROS2时间同步 

图文 Python 嵌入式打包 

其三 Gitea 1.18 功能前瞻：增强文本预览效果、继续扩展软件包注册中心、增强工单实用功能、完善了用户邀请机制和SEO 

3 Python全栈工程师之从网页搭建入门到Flask全栈项目实战 - 入门Flask微框架 

跟我学Python图像处理丨图像特效处理：毛玻璃、浮雕和油漆特效 

四 Selenium4.0+Python3系列 - 常见元素操作（含鼠标键盘事件） 

二、python基本数据类型 

python3使用mutagen进行音频元数据处理 

Python 根据两个字段排序 中文排序 汉字排序 升序 降序 

锤子手机怎么样，功能都实用吗（锤子手机怎么进入工程模式)

Python数据分析：实用向( 三 )

推荐阅读

excel怎么核对两个表格的名字相同两个excel表快速核对重复名字

二刻是多少分钟「2刻是多少分钟」

奥运冠军吴敏霞官宣二胎！疑怀胎超4个月，挺孕肚看比赛激动尖叫 ...

槑槑头槑脑

地址+工作时间+联系电话厦门办税服务厅多少？

*** 入党誓词4篇

vivox27重启键在哪

为什么手机usb连不上电脑为什么手机usb连不上液晶电视

耳机的两根线应该插在电脑的哪

高速公路快车道停车追尾后谁的责任死亡高速公路快车道停车追尾后谁的责任

西安有动漫游戏公司吗

闰年的计算方法闰年的判断方法

彼岸花的花语是什么可以养家里吗彼岸花的花语是什么,象征了什么??

2021年瘦西湖夜游 2023瘦西湖夜游有哪些好玩的

斯柯达明锐用什么机油好斯柯达明锐用啥机油好

甜蜜蜜大结局甜蜜蜜大结局雷雷会醒过来吗?

笔记本电脑怎么投屏到投影仪，笔记本电脑怎么投屏到电视

仙桃高铁站在什么地方仙桃高铁站具体位置

北京倡导13日居家办公14日15日居家休息：居家办公细则怎么制定？

狮子座婚姻配对指数