阿里数赛首次向AI开放！知乎网友：给AI捏汗，防止人类替考

新闻公告

< 返回新闻公共列表

阿里数赛首次向AI开放！知乎网友：给AI捏汗，防止人类替考

发布时间：2024-03-15 10:16:12

声明：本文来源于微信公众号新智元（ID:AI_era），作者：新智元，授权站长之家转载发布。

【新智元导读】一年一度的阿里全球数学竞赛又开始了。今年最大的亮点，首次向硅基AI开放，最高可以获得1万美元大奖。别等了，带着你的人工智能去挑战吧。

首个数学竞赛是专门为AI打开大门的！

今日，2024年阿里巴巴全球数学竞赛开始报名，首次向人工智能开放。要求很简单，就是用人工智能完成预选赛的题目，第一奖金高达1万美元。

消息一出，没想到，一向不爱数学的网友反响出奇的热情，疯狂@各种大模型参赛。

还冲上了相关话题知乎当天的热榜。有网友表示，「作为一个曾经的数学爱好者，今天的人工智能爱好者表达了厨师的狂喜。」

当然，也有认真学习的网友对人工智能竞争非常感兴趣，「现在 AI 解决一些常规的计算问题可能会出错，不知道如何回答比赛的证明问题？」

也有网友参加过去的比赛直言不讳，「人工智能估计没有戏剧，阿赛是一个没有直接回答和解决问题想法参考的新问题，不能依靠存储和搜索。」

但也有网友发现了比赛的真正槽点，2333

都说「一切都可以AI」，用人工智能做数学题很简单吗？兴奋的小编决定试一试，用现在「地表最强」大型GPT-4和Claude3opus练手。

与地表最强AI团队考试是什么感觉？

从过去三年阿里数赛的真题中，小编挑选了一个「人人易懂」让两个大模型完成题目。

这很有意思「抽鬼牌」游戏。A有n张牌(两张不同)，B手有n+1张牌(n张牌和A一样)，只有一张是「鬼牌」。

游戏规则也很简单，A和B从对方手中抽牌，A先开始，如果抽牌和手中的一张牌一样，就会丢弃。最后，手里有「鬼牌」人，就是loser。

假设每次从对方手中抽任何一张牌的概率都是一样的，那么，n等于多少时候，a的胜率呢？最高?

GPT-4定义一个递归函数来计算A的胜率。

具体函数代码流程如下：

A在第一抽牌时，抽牌「鬼牌」的概率:1/ （n +1）。

A没有抽到「鬼牌」的概率:（n / (n +1）) * (1- A的胜率(n -1))。

然后，A获胜的总概率等于以上两个加起来:1/ （n +1）+ (n / (n +1)) * (1- A的胜率(n -1))。

最终将n = {31、32、999、1000}，分别计算，最终ChatGPT得到n=31时，A的胜率最大。

defA_win_probability（n）:#Basecase:ifonlytheghostcardremains，Aloses，sotheprobilityis.ifn==0:return0

# Probability of A drawing the ghost card on the first draw. prob_A_draws_ghost =1/ （n +1）

# Probability of A not drawing the ghost card and then considering the outcomes # of the remaining game， which behaves like a game starting with one less card # （since A will draw a matching card and both will be discarded）. prob_A_not_draw_ghost_and_wins = (n / (n +1)) * (1- A_win_probability(n -1))

# Total probability of A winning. return prob_A_draws_ghost + prob_A_not_draw_ghost_and_wins

# Calculating A's win probability for the given n valuesn_values = [31，32，999，1000]win_probabilities = {n: A_win_probability（n） for n in n_values}

win_probabilities

再来看看所谓的干翻「GPT4」Claude3opus的表现如何？

Claude3Opus将游戏的最终结果归因于具体的分析过程「A和B的抽牌顺序」——根据题目给出的条件，是让A先抽牌。然后，它把A和B手中的牌加在一起，共有2n+1张牌，然后得出谁抽到最后一张牌，谁就输了。Claude3opus给了A获胜的条件，就是B抽到最后一张牌，简而言之，一共进行「奇数次」抽牌，A就赢了。

最后，该模型将获胜率转化为「鬼牌」当n为偶数时，A的胜率大于1/2。因此，根据选项，得出n=32，胜率最大。

正确的官方答案是B，n=32。

GPT-很明显，挑战失败了，而Claude3Opus虽然答对了，但是严格来说，算了算「懵对」。逻辑前后不一致。这种情况如果算过程分，只能拿零分。

经过实测，任何人都能理解的话题，但对于人工智能来说，并不一定。

大型模型需要将主题转化为正式语言，即计算机可以理解的语言，然后根据现有知识进行推理和计算。

GPT-回答复杂数学问题的情况与Claude3opus完全相同：

学好数学对人工智能同样重要

在解决数学问题的能力上，即使是地表最强AI，同时也暴露出许多缺点。

直接得出结论，人工智能今年应该赶不上人类选手的水平。

但未来的差距无疑会缩短甚至超越。如果发生这种情况，它将迫使比赛的难度增加，并使人类球员爆发出更大的潜力。

写到这里，我开始明白阿里为什么要举办人工智能数学比赛。

数学对人工智能，人工智能对数学，是一种相互依赖的关系。在赶上人类之前，人工智能可能会成为学生和数学家的助手，充分发挥搜索、记忆和计算速度的优势，帮助人类解决问题。另一方面，没有数学理论的支持，人工智能就很难稳定下来。

就连菲尔兹奖得主陶哲轩本人，第一时间将ChatGPT添加到工作流中，并预测：

2026年，人工智能将与搜索和符号数学工具相结合，成为数学研究中值得信赖的合作者。

最近接受了Quanta 在Magazine的采访中，他还强调，「人工智能可以让数学家大规模合作，让更多的业余爱好者参与其中，为数学做出有意义的贡献」。

数赛组委会成员、达摩院决策智能实验室负责人印卧涛表示，「引入人工智能为比赛带来了新的视角，让每个人都能见证人工智能在逻辑思维和解决问题方面的能力」。

在花式整活背后，促进数学和人工智能的发展

原来这不是阿赛第一次整活儿。

今年是第六届阿里全球数学竞赛，每年都吸引了退休教授、律师、船员、编剧、快递员等各行各业的选手。

在2023年阿里数赛中，一个95后快递小哥成了那个「民间高手」。

白天忙着送快递，晚上留出时间研究数学。他只花了两周时间证明了欧拉常数的13个公式。

仔细想想，阿里今年首次举办人工智能数学挑战赛，对公众来说也是一个很好的数学科普。

原来「不仅数学难，AI也难。」，或者脚踏实地的学习(狗头)

组委会表示，数学本身就是人工智能的基础。今后，它将解释一些优秀人工智能背后的数学原理，向公众展示数学对人工智能的重要性和应用前景，希望提高公众，特别是青少年对基础学科的兴趣。

此外，可以预料的是，比赛将吸引大量的代码农民参加比赛。也许数学问题还没有解决，但在这个过程中发现了新的人工智能训练方法和新的算法，这反过来又促进了人工智能的进步。

听说魔搭社区已经发起号召，就等着大神揭榜。

相信「重赏之下，一定有勇夫」，人工智能有自己的路数，必然会让人期待。

你还在等什么？点击注册链接或扫描二维码，带您「硅基宝可梦」来挑战吧!

中文注册链接：

https://damo.alibaba.com/alibaba-global-mathematics-competition?language=zh

关于我们

新闻公告

阿里数赛首次向AI开放！知乎网友：给AI捏汗，防止人类替考

八彩云产品

解决方案

帮助与支持

其他链接

联系我们