博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
微博官微爬虫
阅读量:4100 次
发布时间:2019-05-25

本文共 267 字,大约阅读时间需要 1 分钟。

最近需要爬取某地区的官方微博,针对它的评论做情感分析。但是发现一个问题,该微博账号(以下简称A)有80多万粉丝,但是日常评论只有10-30条,而且不管A发布什么,下面大部分都是溢美之言,还有重复的一字不差的夸赞。另外,A的粉丝不可见。很明显大部分都是水军的留言。所以并不打算从里面获得什么东西,暂且当练手爬虫和神经网络吧。

又找了其他几个官微,发现同样有许多粉丝对外不可见,并且日常评论数和粉丝数严重不匹配。这倒激发了我的求知欲:微博上有多少官微存在买粉的行为,又有多少官微存在操纵评论的行为呢?先立个flag,有空了写个爬虫看一下~

转载地址:http://zwksi.baihongyu.com/

你可能感兴趣的文章
【设计模式】—-(2)工厂方法模式(创建型)
查看>>
有return的情况下try catch finally的执行顺序(最有说服力的总结)
查看>>
String s1 = new String("abc"); String s2 = ("abc");
查看>>
JAVA数据类型
查看>>
Xshell 4 入门
查看>>
SoapUI-入门
查看>>
Oracle -常用命令
查看>>
JAVA技术简称
查看>>
ORACLE模糊查询优化浅谈
查看>>
2016——个人年度总结
查看>>
2017——新的开始,加油!
查看>>
【Python】学习笔记——-6.2、使用第三方模块
查看>>
【Python】学习笔记——-7.0、面向对象编程
查看>>
【Python】学习笔记——-7.1、类和实例
查看>>
【Python】学习笔记——-7.2、访问限制
查看>>
【Python】学习笔记——-7.3、继承和多态
查看>>
【Python】学习笔记——-7.4、获取对象信息
查看>>
【Python】学习笔记——-7.5、实例属性和类属性
查看>>
破4!《我想进大厂》之Java基础夺命连环16问
查看>>
音视频干货|深入Storyteller:实时协同Tutorial编辑器
查看>>