Tag: AGI

为什么AI下棋比走路简单? 莫拉维克悖论全解析(Moravec’s Paradox)

莫拉维克悖论是什么? 莫拉维克悖论(Moravec’s Paradox)是人工智能与机器人学中的一个重要观察结果。 一句话总结 “对于人类来说简单的事情,对机器却很难;而人类觉得复杂的事情,机器却往往很容易。” 悖论的由来 由 Hans Moravec、Rodney Brooks、Marvin Minsky 等人在 1980 年代提出 他们注意到:计算机能轻松完成逻辑推理,却难以感知与运动:让计算机进行高等数学、下棋、逻辑推理等任务相对容易;但让计算机像人类一样“感知世界”和“移动身体”——比如走路、抓取物体、识别人脸——却非常困难。 为什么会出现这种现象? 进化时间差 人类的感知与运动系统经过数亿年进化,极度复杂;抽象思维是最近几千年才发展出的新能力。感知与运动能力(比如视觉处理、走路、抓握)是人类在数亿年的进化中逐步发展出来的,极其高效而复杂。抽象逻辑和符号推理(比如数学、象棋)则是人类近几千年才发展出的“新技能”,反而对人类来说相对“费力”。 神经资源分配不同 大脑的大部分区域用于处理感知与运动,只有小部分用于逻辑与推理:大脑皮层中,有大量区域用于视觉、听觉、运动控制等感知与行动;相比之下,用于抽象思维的区域相对较小。 我们低估了“本能”的复杂性 比如走路、看东西、抓杯子——这些能力虽然自动完成,但对机器来说极其复杂:因为感知与行动是无意识自动完成的(比如:走路时你不需要思考每一步如何移动),人类通常低估了这些任务的复杂性。 经典对比案例 任务 人类 机器 玩象棋 难 容易(如 …

苹果最新研究揭示: AI推理模型在复杂逻辑题面前“崩溃”与“放弃”

近日,苹果机器学习研究团队发布了一项引人关注的研究,指出当前所谓的大型推理模型(LRM,如 OpenAI、Anthropic、Google 等推出的模型)在面对难度不断提升的逻辑类问题时,会出现准确率骤降至 0、推理努力减少的现象,表明这些模型并没有真正具备稳定的“思考”能力。 研究背景与核心发现 实验设计:复杂性可控的逻辑谜题 研究团队采用了像 河流过渡 和 汉诺塔(Tower of Hanoi) 等经典谜题,通过可控手段系统增加问题复杂度,同时观察模型的“思考过程”和最终结果,避免传统数学或编程基准可能的数据泄露问题。 苹果机器学习团队最新发布研究,指出当前大型推理模型(LRM)在面对高复杂度逻辑题时,准确率骤降至零,且推理过程中的计算量急剧下降,表现出“放弃思考”的现象。 研究用经典谜题如河流过渡和汉诺塔,通过逐步增加难度控制变量,观察模型的表现和推理行为,规避了训练数据泄露的影响。 结果显示,低复杂度时普通大语言模型LLM表现更好,中等难度下推理模型依赖“链式思考”提升表现,但高复杂度下所有模型准确率急剧崩溃。 模型推理能力的“崩溃”与“偷懒” 在复杂度临界点,模型的有效 token 使用量明显下降,表明模型在完成部分步骤后“停止推理”。在问题复杂度接近崩溃阈值时,这些模型伴随着有效 tokens 使用量骤降(即前几步还在思考,後面却“偷懒”了),表现出类似“放弃继续解题”的行为 。 即使研究者直接给出解题算法,模型仍无法有效利用,说明其并非真正理解算法逻辑。为了验证模型是否真无法理解算法,研究者在汉诺塔问题中提供了解题算法,但这些模型依然无法提升准确率,表明它们并不能用“听懂并执行算法”的思维方式,而是纯粹靠训练数据中的“模式匹配” 。 研究实验示意表 复杂度等级 模型类型 表现趋势 …

可以用ChatGPT来轻松转换编程语言

ChatGPT是今年最火的技术,人工智能AI,但是确实来说,是AGI,也就是通用人工智能 Artificial General Intelligence。ChatGPT可以用来做很多事情,我最近发现它可以拿来转换编程语言。比如我想学习一门新语言了,就可以把现有的程序让ChatGPT转换成新的编程语言。或者在力扣上换个新的编程语言学习一下。 下面这个例子ChatGPT转换后的代码我就可以直接在力扣上跑,就通过了所有的测试用例。 网上还有很多不同语言之间的转换工具,相信实现起来都不简单,但是如今有了ChatGPT这个通用人工智能,完全可以套个UI前端就可以实现不同语言之间的转换工具,而且转换逻辑完全不用自己实现,调用ChatGPT的API即可。 英文:Programming Language Conversion Tool based on ChatGPT AI 本文一共 283 个汉字, 你数一下对不对. 可以用ChatGPT来轻松转换编程语言. (AMP 移动加速版本) 赞赏我的几个理由. ¥ 打赏支持 扫描二维码,分享本文到微信朋友圈

ChatGPT最擅长的任务之: 写邮件

“ChatGPT”(人工智能)可以做什么? 撰写电子邮件是ChatGPT擅长的任务之一. 如何要求ChatGPT写一封好邮件? 提示(Prompt)非常重要. 您需要告诉ChatGPT(即人工智能), 如何称呼收件人, 邮件主题以及其他相关细节. 前不久, 我在网上找到一个剑桥比较有名的钢琴老师, 想联系他, 于是试着让ChatGPT来帮我写, 我感觉这AI写得很不错, 很专业, 一点都不像我写出来的, 相反感觉还有点正式, 我最后面改了改, 不到3分钟就把邮件发出去了. ChatGPT作个个人助手很好用, 大大提高了工作效率, 而且还从来不会抱怨, 细节可以反复让其修改. 甚至可以反复让它重新生成答案(Re-generate Response) 如果是让我自己写, 我可能得花10几分钟, 写出来的还没有这个专业. 可以看到, ChatGPT自己还加了料, 加了一些细节, …

ChatGPT 使用 Promise.All 重构/重写代码(并行发送请求)

在我的一个项目中, 我有以下代码(Node/Javascript), 它(顺序)调用了一些 API. 这些 HTTPS 请求其实是可以并行完成的, 因为它们相互独立. 然后结果会被聚合到一个数组中. 我知道可以用Promise.all来把这些请求并行化, 我就问了ChatGPT怎么弄, 看看它是否能理解并给出正确的代码: 我先用英文问 ChatGPT-3.5: Rewrite the following Python code using the Promise.all to parallelize the requests: let result = …

ChatGPT-4 使用 Math Wolfram 插件解决数学脑筋急转弯问题

这篇文章, 我们看一个简单的数学问题(脑筋急转弯), 并用 Python 解决它. 我们看一下LLM(大型语言模型): ChatGPT3.5和ChatGPT4. 通过 ChatGPT-Plus 订阅(目前每月 20 美元 + VAT增值税), 我们可以启用 ChatGPT-4 的插件, 因此, 我们还使用 Wolfram 插件来了解 ChatGPT-4. 数学问题: 大于95555并且有4个相同数字的最小整数 大于 95555 并且有 4 个相同的数字的最小整数是多少? …

ChatGPT (3.5和4) 解2023年高考数学题

我们来看看今年的高考数学题 并尝试让ChatGPT来解答一下. 问: 下列物体中, 能够被整体放入棱长为1(单位:m)的正方体容器(容器壁厚度忽略不计)内的有 A直径为0.99m的球体 B所有棱长均为1.4m的四面体 C底面直径为0.01m, 高为18m的圆柱体 D底面直径为1.2m, 高为0.01m的圆柱体 ChatGPT-3.5解这道高考数学题 要确定哪些物体能够整体放入棱长为1米的正方体容器内, 我们需要计算每个物体的最大尺寸, 并将其与容器的尺寸进行比较. A. 直径为0.99米的球体: 球体的直径小于容器的棱长, 因此可以整体放入容器内. B. 所有棱长均为1.4米的四面体: 四面体的最大尺寸是其最长的对角线长度, 而四面体的对角线长度可以通过应用勾股定理来计算. 每个面都是边长为1.4米的等边三角形, 因此可以将四面体的高度表示为√(1.4^2 – (1.4/2)^2) ≈ 1.214米. …