Python技术栈

 找回密码
 立即注册

QQ登录

只需一步,快速开始

扫一扫,访问微社区

查看: 13825|回复: 101

[数据可视化] 爬取房天下某城市新房数据并尝试可视化(二)

  [复制链接]

10

主题

20

帖子

161

积分

超级版主

Rank: 8Rank: 8

积分
161
发表于 2019-3-26 10:34:03 | 显示全部楼层 |阅读模式
[Python] 纯文本查看 复制代码
import pandas as pd
import numpy as np
import seaborn as sns
import matplotlib as mpl

import matplotlib.pyplot as plt
from IPython.display import display 
plt.style.use("fivethirtyeight")
sns.set_style({'font.sans-serif':['simhei','Arial']})
%matplotlib inline

data = pd.read_csv('houseInfo.csv')
data['loc'] = data['区域'].str.split(']').str[0].str.split('[').str[1] # 区域列数据清洗
data['coment_num'] = data['评论数'].str.split('条').str[0].str.split('(').str[1] # 评论列数据清洗
data['name'] = data['名称']
data['price'] = data['价格']
# 清除脏数据
del data['名称']
del data['区域']
del data['价格']
del data['评论数']

columns = ['name','loc','price','coment_num'] # 调整一下column顺序
data = data[columns]
data = data[(data['price']!='售价待定') & (data['price']!='价格待定')] # 删除价格待定的数据
data.loc[(data['loc'] == '高新'),'loc'] = '高新技术开发区'
data.to_csv('data_clean.csv',index=False)

df = pd.read_csv('data_clean.csv') # 导入新数据

"""各区新房数量对比图"""
df_house_count = df.groupby('loc')['price'].count().sort_values(ascending=False).to_frame().reset_index()
f,ax = plt.subplots(figsize=(20,15))
sns.barplot(x='loc',y='price',palette='Greens_d',data=df_house_count)
ax.set_title('潍坊各区新房数量对比',fontsize=15)
ax.set_xlabel('地区')
ax.set_ylabel('数量')

"""各区房屋价格对比图"""
f,ax = plt.subplots(figsize=(20,15))
sns.boxplot(x='loc',y='price',palette='Blues_d',data=df)
ax.set_title('潍坊各区房屋价格对比图')
ax.set_xlabel('地区')
ax.set_ylabel('新房价格')

"""价格与评论量关系图"""
f,ax = plt.subplots(figsize=(20,15))
sns.regplot(x='price',y='coment_num',data=df)
ax.set_title('价格与评论量关系图')
ax.set_xlabel('价格')
ax.set_ylabel('评论数')

Python 总 群
回复

使用道具 举报

0

主题

6

帖子

22

积分

新手上路

Rank: 1

积分
22
发表于 2019-3-26 10:34:03 | 显示全部楼层
众里寻他千百度,蓦然回首在这里!
Python 总 群
回复

使用道具 举报

0

主题

8

帖子

26

积分

新手上路

Rank: 1

积分
26
发表于 2019-3-26 10:35:21 | 显示全部楼层
求沙发
Python 总 群
回复

使用道具 举报

0

主题

9

帖子

28

积分

新手上路

Rank: 1

积分
28
发表于 2019-3-26 10:48:54 | 显示全部楼层
沙发???
Python 总 群
回复

使用道具 举报

0

主题

16

帖子

44

积分

新手上路

Rank: 1

积分
44
发表于 2019-3-26 11:30:45 | 显示全部楼层
鼎力支持!!
Python 总 群
回复

使用道具 举报

0

主题

4

帖子

18

积分

新手上路

Rank: 1

积分
18
发表于 2019-3-26 11:44:42 | 显示全部楼层
看起来不错
Python 总 群
回复

使用道具 举报

0

主题

5

帖子

20

积分

新手上路

Rank: 1

积分
20
发表于 2019-3-26 14:00:31 | 显示全部楼层
确实不错,顶先
Python 总 群
回复

使用道具 举报

0

主题

4

帖子

18

积分

新手上路

Rank: 1

积分
18
发表于 2019-3-26 15:03:20 | 显示全部楼层
我了个去,顶了
Python 总 群
回复

使用道具 举报

0

主题

5

帖子

20

积分

新手上路

Rank: 1

积分
20
发表于 2019-3-26 15:24:34 | 显示全部楼层
围观 围观 沙发在哪里!!!
Python 总 群
回复

使用道具 举报

0

主题

6

帖子

22

积分

新手上路

Rank: 1

积分
22
发表于 2019-3-26 15:55:40 | 显示全部楼层
楼下的接上
Python 总 群
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则


QQ|Archiver|手机版|小黑屋|Python.BBS ( 鲁ICP备18046958号 )

GMT+8, 2020-8-4 10:18 , Processed in 0.136412 second(s), 20 queries .

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表