第675章(2 / 5)
那么他们的发言里一定会提到同样的东西。
这个时候就要再拿出来一个新的id,比如李四。
利用李四这个id,在微博上进行搜索,又出来一万个李四。
照例,全给爬取下来。
接下来是王五、赵六……
然后再进行横向比对,一个个的去试!
总能试出来蛛丝马迹。
这个工作量是无比巨大的,对计算机的要求也很高。
这种情况下,豆半只能增加人手,外聘公司。
只是过去的这一夜,花了至少上千万。
但是这是目前为止豆半唯一的方法了。
其实还有一个方法,那就是豆半后台有这些新注册的人绑定的电话号码,如果他们拿着这些电话号码去找微博,在微博数据库里直接用电话号码查找的话,基本上一两个小时就能解决。
但是,这违法。
不同平台不可以把彼此的数据互通有无。
然而,豆半还真是高估了这些小粉丝们的水平了。
↑返回顶部↑
这个时候就要再拿出来一个新的id,比如李四。
利用李四这个id,在微博上进行搜索,又出来一万个李四。
照例,全给爬取下来。
接下来是王五、赵六……
然后再进行横向比对,一个个的去试!
总能试出来蛛丝马迹。
这个工作量是无比巨大的,对计算机的要求也很高。
这种情况下,豆半只能增加人手,外聘公司。
只是过去的这一夜,花了至少上千万。
但是这是目前为止豆半唯一的方法了。
其实还有一个方法,那就是豆半后台有这些新注册的人绑定的电话号码,如果他们拿着这些电话号码去找微博,在微博数据库里直接用电话号码查找的话,基本上一两个小时就能解决。
但是,这违法。
不同平台不可以把彼此的数据互通有无。
然而,豆半还真是高估了这些小粉丝们的水平了。
↑返回顶部↑