Category: 机器学习

微软研究院十年前的 ResNet图片识别模型把Chessly识别成波斯猫。

微软研究院十年前的 ResNet图片识别模型把Chessly识别成波斯猫。 Chessly是英短,虽然毛并短,估计不是纯的英短/British Short Hairs(杂交来的)。 在Chessly的每年疫苗本上写的是英短,但是她的毛很长,更像是英长/British Long Hairs。 ResNet-50 简介 ResNet(残差网络)由微软研究院在 2015 年提出。它通过残差结构解决了深层神经网络中的退化问题。 ResNet-50 是其中一个常用版本,总共有 50 层。 核心思想 残差模块的计算方式是: 这种跳跃连接(shortcut connection)可以避免梯度消失,让更深的网络更容易训练。 网络结构 输入图像大小通常为 224×224。 主要阶段: 7×7 卷积 + 最大池化 …

机器学习(最优化)根本数学公式: arg_max_{x∈X} F(x)

argmax:从未来推理现在 整个机器学习(最优化),背后的根本数学原理是下面这个公式: arg_max_{x∈X} F(x) 它的含义是:在所有可能的输入 x ∈ X 中,找出让目标函数 F(x) 最大的那个 x。这个公式返回的是最优解 x,而不是最大值本身。 这个公式代表【从未来推理出现在的最佳选择】,因为所有的x有哪些,实际上是没办法穷尽的,以及F有哪些,是未来才知道的。代表一种完全信息视角。 这个和“传统”的数学递推公式是反过来的,传统的递推公式是,利用过去的推理未来的,例如斐波那契额数列 ,假设的是F(n-1)和F(n-2)我们已经知道,我们就可以推理F(n)(这也是动态规划算法的核心)。这个是【利用过去的信息推理未来的】。 因此,机器学习/最优化,本质是预测未来。实际上,arg_max 公式,如果用编程语言来表达,非常好理解: 这个思维方式代表的是“从未来反推现在”:F(x) 是未来某种评估函数,我们假设它存在,并试图找到现在该做什么(x)才能让它最大。 def arg_max(X, F): best_x = None best_score = float('-inf') …