Hello I am Aljun!

wanna know more ,please click

爬取豆瓣top250电影榜的电影分类进行数据分析

2015-10-09 21:04:20

本博客采用创作共用版权协议, 要求署名、非商业用途和保持一致. 转载本博客文章必须也遵循署名-非商业用途-保持一致的创作共用协议

本文是我第一次的数据分析尝试,使用了爬虫爬取了 豆瓣top250网站的电影的分类,然后对他进行统计,看看那个类型的片子,观众对他的评价可能最高

内容包括:

  • scrapy写一个爬虫爬取数据,并且使用 jieba分词,将数据处理

  • mongodb 保存数据并小部分处理

  • 使用python的 matplotlib进行数据可视化操作

  • 拿到数据图像进行分析

对这份数据感兴趣的同学可以在评论区发表自己的观点

数据分析

知乎用户图谱(用户数据分析)

2016-04-10 18:38:17

本博客采用创作共用版权协议, 要求署名、非商业用途和保持一致. 转载本博客文章必须也遵循署名-非商业用途-保持一致的创作共用协议

这个是我拿我爬去下来的知乎十万用户数据做的知乎用户图谱分析

分析内容还是比较有趣的

这个能让我更加了解这个社区,比如:

  • 知乎男女比?

  • 那些大学的大学生多?

  • 产品经理真的很多么?

这些问题我都以数据图的形式呈现

数据分析

Designed and built with all the love in the world by the Mr.ALJUN.

@SERVER BY NGINX AND POWER BY DIGITALOCEAN.

© COPYRIGHT BY GAGASALAMER 2015