python编程大作业

提供的csv文件是某商店的销售纪录，其前5行记录如下：

user_id,item_id,behavior_type,user_geohash,item_category,time

10001082,285259775,1,97lk14c,4076,2014-12-08 18

10001082,4368907,1,,5503,2014-12-12 12

10001082,53616768,1,,9762,2014-12-02 15

可以看出，每行记录都包含5个字段，数据集中的字段及其含义如下：

user_id（用户id）

item_id(商品id)

behaviour_type（包括浏览、收藏、加购物车、购买，对应取值分别是1、2、3、4）

user_geohash(用户地理位置哈希值，数据处理时暂不考虑)

item_category（商品分类）

time（该记录产生时间）

要求进行Python编程实现以下功能（可以导入任意的库来辅助你完成）：

1、找出“购买效率达人”：根据behaviour_type的数据，找出购买行为占比最高的前10个用户id

2、找出用户10001082的“同道中人”：即找出与该用户浏览、收藏、加购物车、购买的商品分类近似的前10个用户id

3、给出三种数据画像：这里不给出具体的要求，你可以从自己的分析角度对数据给出各种效果显示，如用户关注的商品分类饼图；某用户的购物活动时间折线图；商品分类关注度词云图；用户活跃度（前10）柱状图等。

Name		Name	Last commit message	Last commit date
Latest commit History 3 Commits
.gitignore		.gitignore
LICENSE		LICENSE
main.py		main.py
readme.md		readme.md
small_user.csv		small_user.csv
用户10001082的购物活动时间图.svg		用户10001082的购物活动时间图.svg
用户关注的商品分类前5.svg		用户关注的商品分类前5.svg
用户活跃度前10.svg		用户活跃度前10.svg

Provide feedback