欧易

欧易(OKX)

国内用户最喜爱的合约交易所

火币

火币(HTX )

全球知名的比特币交易所

币安

币安(Binance)

全球用户最多的交易所

用PythonAI模型预测世界杯结果靠谱吗?

时间:2022-11-29 06:30:46 | 浏览:3615

看到kaggle、medium上有不少人用球队的历史数据来进行建模预测,比如用到泊松分布、决策树、逻辑回归等算法,很大程度上能反映强者恒强的现象,比如巴西、英格兰等大概率能进8强,就像高考模拟考试成绩越好,大概率高考也会考得好。这个和人脑的

看到kaggle、medium上有不少人用球队的历史数据来进行建模预测,比如用到泊松分布、决策树、逻辑回归等算法,很大程度上能反映强者恒强的现象,比如巴西、英格兰等大概率能进8强,就像高考模拟考试成绩越好,大概率高考也会考得好。


这个和人脑的预测是类似的,建立在你看了足够多的球赛,对每一个国家队、球员、教练、打法等都了如指掌,你才能有充分的判断依据。而且你还不能带有主观的倾向,意大利球迷肯定笃定意大利能夺冠,但他们在预选赛就被淘汰了。

但是阿根廷输沙特、德国输日本这样的黑天鹅事件,不管是AI还是人脑都是没法预测的,否则真成预言者了。买阿根廷、德国赢的人其实是选择了大概率事件,但并没有发生,他们的决策其实是对的。

因为世界杯比赛有很多变动因素,比如裁判规则、球员伤退、排兵布阵,甚至当地环境、食宿也都会有影响,所以在进行AI预测的时候,需要有很多维度的数据进行综合分析,单单从球队的历史成绩来判断,肯定是对准确率会有影响。

这其实是有贝叶斯定理的逻辑在里面,大胆假设,小心求证。

说了一大堆,还没讲如何用AI来预测。我前几天在kaggle看到过一个博主用了GBM梯度提升算法,它通过求损失函数在梯度方向下降的方法,层层改进。

大概描述下步骤:

1、数据准备。

该项目用了【FIFA 1992-2022世界排名】、【1872-2022国家队比赛结果】两个数据集。通过数据预处理对两个数据源进行连接

2、特征工程。

列出对预测比赛结果有影响的特征字段,共37个。特征选取主要根据历史经验、直觉判断,比如过去的比赛积分、过去的进球和损失、比赛的重要性、球队排名、团队排名提升等等。

接着要对各个特征进行相关性检测,判断对预测是否有帮助,如果没有帮助的特征则直接剔除。最后留下11个最重要的特征,用来建模分析。

3、建立模型。

数据处理了,接下来是通过机器学习模型对数据进行训练,然后得出预测结果。

这里用了梯度提升和决策树两个算法,最终选recall最高的,博主测试后选择了梯度提升算法。

算法具体使用操作方法如下:

4、预测世界杯比赛。

搭建好模型,就可以把世界比赛的对阵数据放到模型里进行预测。最终算出来小组赛、十六强赛、八强赛、四强赛、总决赛的得分情况。

从目前看,预测结果其实还是复制历史经验,小组出线情况基本和世界排名情况一致,没有超乎人的经验范围。对于黑马、黑天鹅并没有什么预测能力。

其他预测结果就不一一展示了,哦,最后好像预测是巴西夺冠概率较大。

总之,AI预测世界杯其实是对历史数据的归纳总结,而且完全依赖数据的喂养,能给出相对概率。

这和人的直觉一样,你觉得巴西会夺冠,肯定有一些过往的事实验证了你的直觉,不然就是瞎猜了。

相关资讯

用PythonAI模型预测世界杯结果靠谱吗?

看到kaggle、medium上有不少人用球队的历史数据来进行建模预测,比如用到泊松分布、决策树、逻辑回归等算法,很大程度上能反映强者恒强的现象,比如巴西、英格兰等大概率能进8强,就像高考模拟考试成绩越好,大概率高考也会考得好。这个和人脑的

“小天才学Python少儿编程夏令营”在深圳超算开营

8月5日,由国家超级计算深圳中心、中国计算机学会深圳分部联合云创大数据举办的“小天才学Python少儿编程夏令营”在深圳超算正式开营。30位7-10岁的孩子参与本期夏令营。在5天营期中,导师们将带孩子们认识turtle库、for循环、pen

必须收藏的python兼职网站大全

当下python需求量还是挺大的,对于想要做兼职的程序员还是挺友好的:起码不用愁找不到;目前来看,其兼职方向大致有三:开发、爬虫、数据分析。就开发来说,目前python的轮子在Github上一抓一大把,开发成本和开发周期相比于其他语言会更低

python入门019:认识字典

一、字典简介1、什么是字典字典由"键"和对应的“值”成对组成。可以理解成是一个无序、可变和有索引的集合。2、字典的表示方法字典示例:dict = {"name": "Tom","class": "2", "age": 16}字典拥有键和值,

文科生也能学会Python---第六讲:字典

复习:请说出字符串和列表的特征,并举例。答案:字符串:必须有引号表示列表:是[]括起来,多个内容用逗号隔开举例:"我是中国人":字符串[1,2,3]:列表参考答案下面来讲今天的新内容:字典试着看懂这两段代码dict={"Name":"Zar

python笔记15:字典

一、定义1、字典是另一种可变容器模型,且可存储任意类型对象。2、一对一关系。键和值在内存中是无序存在的。3、字典的每个键值 key=>value 对用冒号 : 分割,每个对之间用逗号(,)分割,整个字典包括在花括号 {} 中键必须是唯

支持Python3.10,OpenAI强化学习工具包Gym迎来史上最大更新

机器之心报道编辑:杜伟OpenAI 创建的 Gym 是开源的 Python 库,通过提供一个用于在学习算法和环境之间通信的标准 API 以及一组符合该 API 的标准环境,来开发和比较强化学习(DL)算法。自推出以来,Gym 的 API 已

卡塔尔世界杯32强最新世界排名以及历届世界杯冠军得主/次数/时间

卡塔尔世界杯32强世界排名(如下图)卡塔尔世界杯小组赛第一轮的比赛全部结束,从比赛结果与排名榜单对比来看,巴西、比利时、法国、英格兰、西班牙、葡萄牙等足球强国实至名归,是名副其实的一档球队,在小组赛第一轮的比赛中,都以较大的优势分别战胜各自

每经操盘必知(早间版)丨5G+工业互联网大会召开,未来将进一步丰富政策工具箱,概念股受追捧;卡塔尔世界杯比赛将正式打响,世界杯向元宇宙挺进

每经编辑:杨建NO.1 美股主要指数上周五收盘小幅上涨,道指涨0.6%,上周累计下跌0.01%;纳指涨0.01%,上周累计下跌1.57%;标普500指数涨0.48%,上周累计下跌0.69%。公用事业、风电板块涨幅居前,公务集团、太平洋煤电涨

中国裁判世界杯首秀,海信场边广告引发讨论|世界杯日报Day2

卡塔尔世界杯正式开启,懒熊体育推出“世界杯日报”,为您带来商业、赛事等维度的资讯,更多内容可查看懒熊体育“B面卡塔尔”专题页。以下为11月22日世界杯日报内容:商业资讯·海信世界杯广告语打“擦边球”,引发讨论本次卡塔尔世界杯,中国品牌开足马

(图表)[卡塔尔世界杯]卡塔尔世界杯赛程

新华社图表,北京,2022年11月27日(图表)卡塔尔世界杯赛程新华社发 卢哲 张子彧 编制

趣看世界杯|世界杯完整赛程高清大图来了!快收藏

文/北京青年报记者 张颖川编辑/张颖川

卡塔尔世界杯观察:“5换人”规则改变世界杯

新华社多哈11月25日电题:“5换人”规则改变世界杯新华社记者肖世尧、王浩宇、赵建通24日,卡塔尔世界杯首轮比赛结束,32支球队悉数亮相。从首轮比赛来看,本届赛事实行的“5换人”规则,在很大程度上改变了世界杯比赛进程。2020年5月,为应对

卡塔尔世界杯|中国元素闪耀卡塔尔世界杯

新华社多哈11月25日电新华社记者2022卡塔尔世界杯24日结束小组赛第一轮较量。赛场内外,丰富的中国元素成为世界杯重要的组成部分:“中国制造”的卢赛尔体育场见证了阿根廷队和巴西队的亮相,中国新能源客车成为公交出行主力,中国裁判亮相赛场,中

卡塔尔世界杯|伊朗两球击败十人威尔士世界杯首胜欧洲队

新华社多哈11月25日电(记者王浩明、韦骅)卡塔尔世界杯25日开启小组第二轮的争夺,伊朗队依靠切什米和雷扎扬补时阶段的进球,2:0战胜被罚下一人的威尔士队,这是伊朗在世界杯赛场首次战胜欧洲球队。B组的首轮比赛,伊朗队负于英格兰队,威尔士则战

友情链接

网址导航 SEO域名抢注宝宝起名网妈妈知道币圈国美零售港股王者荣耀游戏网兰博基尼跑车网台湾卤肉饭加盟官网茶颜悦色会员日昭通新闻头条网海澜之家股票优家宝贝母婴书法艺术官网实木板材采购网观赏鱼养殖网钦州新闻头条网双鱼球拍阿斯顿马丁跑车网吊顶品牌网
卡塔尔世界杯-卡塔尔世界杯成绩表最新消息、卡塔尔世界杯开幕式直播、卡塔尔世界杯开幕式完整版、卡塔尔世界杯32强名单、卡塔尔世界杯16强名单、卡塔尔王子表情包、卡塔尔王子馄饨皮、卡塔尔王子饺子皮、卡塔尔小王子秀中文、卡塔尔小王子掀头巾、卡塔尔足球队员名单。
卡塔尔世界杯 haolala.cn ©2022-2028版权所有