银河飞将
主要是python+javascript
共投入大约300小时开发时间 3月底开始, 持续一个半月吧
爬虫共抓取帖子25891836条, 共分析文本2265045897字
很明显, ps 遥遥领先, xbox和wii差不多
貌似锤片先火, 蝶片后来居上
看图, 大屁股貌似2015年开始传奇之路
2009年一月, 中山公园事件轰动一时
2016年前不相上下, 2016年华为暴跌, 小米后来逆市增长, 也符合实际情况
江西恐龙好像2010后就开始隐退了
tg2007到2017访问量其实很稳定的
可以看到, 游戏区2007年达到顶峰, 之后变快速花落了, 当年的, 水区2007年后边暴涨, 很快取代成为tg第一板块
tg之最告诉你
看图, 确实2007, 2015是个高峰, 对应了这么多年的两个牛市
tg会员星空图, 我把会员各项活动算了一个总积分, 并划分为各个行星, 就好像tg是宇宙,我们每个人是个小星.
最后, 海王星大神只有2人, 分别为west2046, 和 zhaolinjia, 这两人都是名副其实的tg铁杆, 向他们致敬. 你们也来找找看自己在那里呗.
计算公式为: 在tg天数 * 1 + 主贴数 * 3 + 回帖数 * 1 + 总文字数 / 100 + 鸡骚 * 2 + 精华 * 500
本项目完全是个人兴趣, 所有数据仅供参考, 且都以实际统计为准, 部分与tg现实数据不符, 因为抓取过程中也发现很多错误的帖子.
目前是在google cloud
初步计划是开一年
数据需要手动更新, 且比较麻烦, 所以打算每3个月更新一次
暂不打算申请专门域名
最后看数据, 有点惊讶, tg居然只有4万多有效会员(指发过贴, 且没被封或删id的) 大部分会员都可算是核心, 8年以上占大部分
从关键词趋势确实可以看出很多有意思的东西
感谢TG, 感谢站长和比卡丘等人, 我觉得无论人或物, 如果能相处十年, 那一定是有爱的. 此项目献给所有爱tg的人!
感谢python, 没有python很难独立高效开发, python是神, 不解释
感谢很多开源大神的分享, 没有开源开发寸步难行啊
感谢我的测试服务器, 去年组装ryzen 1700+32G , 这次16线程终于派上用场, 文本处理相当耗时
感谢imac , 我的主力开发机, 确实稳定高效, 光荣完成任务, 打算换台新的了
2018.5.7 somesun
查看详细资料
TOP
魔王撒旦
混世魔头
猫族
我不知道
侠客
魔神至尊
小白屋
天外飞仙