我要放大招用Python来预测双色球
双色球大家应该都不陌生吧,作为福利彩票的一种,有很多种购买的途径,某付宝上就可以购买,他的购买规则是这样的,双色球分为红色球和蓝色球两种,大家需要从1到33中随机选取6个来构成红色球,然后从1到16中随机选取1个数字来构成蓝色球,一共是7个数字。
小编粗略的为大家计算了一下中一等奖的概率,大概是0.0000000564,也就是亿分之5.64。我估计这辈子是没这运气了。介绍完双色球之后,下面就开始我们的Python预测双色球之旅。
01
爬取双色球几年的数据
首先是数据的获取,小编利用爬虫来爬取近16年来的每一期的双色球中奖号码,如下图所示。
爬虫的部分程序如下图所示:
爬虫的思路很简单,主要是遍历爬取120几页的数据,GetPage函数取逐页解析,然后用bs取解析一些,并把数据保存在lottery文件里面。
用requests取伪装一个header取请求数据,这些都是非常基本的爬虫知识,这里就不过多描述。
小编一共爬取到了2441条数据,包含了从2003年2月23号到2019年7月16号的所有中奖彩票数据。有了数据之后,小编先进行了一下数据的分析,看看红色球和蓝色球当中,究竟哪些数字出现的频率较高。红色球的各个数字出现频率如下图所示。
从图上可以看出来,数字1出现的次数最高,而数字33出现的频率最低。蓝色球数字出现的频率如下图所示。
蓝色球当中数字12出现的频率最高,而数字8出现的频率最低。所以按照各个数字的出现频率,小编统计了一下。按照出现的频率来买,总比随机买让我感到安心。概率统计的部分代码如下图所示。
其实就是用collection模块里面的Counter库里面的most_common()函数来对数据进行统计一些最常见的红色球和蓝色球的频次比较高的。
02
机器学习来训练模型
下面小编决定参照网上给出的一些方法,利用线性回归来进行预测。小编对每个位置上的数字都分别训练一个模型。如下图所示:
绿色数字代表的是中奖号码的每一个位置,黄色数字就代表着每一个位置下的编号,小编就是将每个位置上的号码分别存储,以每个中奖号码作为Y值,而其每个编号作为X值,以此构成X、Y训练数据,而我们只需要预测每一个位置上的下一期中奖号码,然后将其拼接起来,就可以构成我们的下一期预测号码。部分程序如下图所示:
小编首先是将各个位置上的中奖号码分别存储到csv文件当中,然后从各个csv文件中读取数据,作为X、Y训练数据进行返回。
最后再针对每个位置上的中奖号码训练各自的模型即可得到我们的下一期预测号码。
以上就是小编分享的预测中奖号码的全部内容了........ 很多初学者,对python的概念都是模糊不清的,python是什么,能做什么,学python有什么优势,该按照什么线路去学习,学完往哪方面发展,想深入了解,想学习的同学欢迎加入我创建的千人python学习裙 ,裙聊号码:315346913,内有有大量实战学习资料(零基础以及进阶的经典实战)分享给大家,并且有资深讲师给大家免费授课,给大家分享目前国内最完整的python高端实战实用学习流程体系,让你少走弯路。
麻将文化作为中国传统文化最草根最民族的文化博彩问答,如今在重庆的老外圈里也流行着。重庆龙湖星悦荟有关方面负责人表示,举办外籍友人麻将比赛,意在促进重庆市民与外籍友人的沟通和交流,从而进一步促进中外文化的交流。
如果直杠由引杠者给10元博彩问答,绕杠3方各给5元,那如我已经碰了一个牌,自己再摸到一张来杠起,这种也算直杠吗?这种还是3方各收5元吗?展开我来答答题抽奖
上一篇:龙虎斗技巧 【头号玩家】第23期Sea(NYSESE)崛起中的东南亚互联网巨头游戏+电商+移动支付全覆盖 下一篇:赌博技巧 FloatingGateVSChargeTrap