Category: 学习笔记

用Python和现有CLI工具测试开发Web Sockets应用

2025年8月8日 Python, Python, 学习笔记, 程序设计, 编程, 计算机 No Comments

Web Sockets简介 WebSocket 实现了客户端和服务器之间基于单个 TCP 连接的实时全双工通信。在这篇文章中，我们将向你展示如何用 Python 搭建一个简单的 WebSocket 服务器，以及如何使用 Python 客户端和流行的命令行工具，比如 websocat 和 wscat 来测试它。用 Python 搭建 WebSocket 服务器我们使用 websockets 库，它提供了基于 asyncio 的易用 WebSocket 服务器实现。下面是一个简单的服务器（Python 代码），监听端口 …

[继续阅读……]

时隔两年, 重新教媳妇编程, 不过她好像全忘光了

2025年8月5日女人, 媳妇, 学习笔记, 生活, 看图说话, 程序设计, 编程, 资讯 2 Comments

我上一次教我媳妇编程，大概是两年多前了。后来因为工作太忙，再加上一些其它原因，就停下来了。其实她对编程也不是很感兴趣，反倒更喜欢用 Excel，因为她工作中经常会用到。上周刚好有点空闲时间，我又教她写了一个反转链表的题目。这个题我前阵子刚教过我儿子，觉得既适合用来面试，也很适合用作编程启蒙。不过整个过程下来，她一直显得很迷茫。我也不确定是不是我讲得不好。还记得以前有网友留言调侃：“课讲得很一般，不过媳妇还挺好看的。” 说到底，编程不能只停留在理论层面。如果只是单方面学习、平时又缺乏实践的话，不仅学得不深入，而且很容易就忘了。学编程最好的方法就是敲代码。我挺喜欢“输出型”的事情，像教娃、教媳妇这种，既能复盘知识，又特别解压。之前有网友留言：“你能教媳妇编程还不被她一顿骂，已经很成功了，这可是站在作死边缘反复横跳啊。” 网友说：“难度太大了赖总可以换换思路教教好玩的比如说图形化编程或者ai做游戏或者ai做视频音乐啥的女生喜欢这些生动形象好玩有趣的算法感觉也只能教教喜欢动脑子和喜欢挑战的小孩子或者要打比赛，找工作种种需求的，不然这个玩意没人想碰，太无聊了。” 网友还说：“对夫妻感情那么有信心吗？就不能教点别的吗？” 网友又说：“人家是靠颜值吃饭的，你非得逼着学编程，哈哈哈” 本文一共 534 个汉字, 你数一下对不对. 时隔两年, 重新教媳妇编程, 不过她好像全忘光了. (AMP 移动加速版本) …

[继续阅读……]

精子的数据传输: 一次”发射”相当于1587.5TB? 我们来到世上本身就赢麻了

2025年8月3日学习笔记, 小确幸, 资讯 No Comments

最近在网络上看到一张图让我忍俊不禁，但越想越觉得耐人寻味。图上写着： “一个精子含有37.5MB的DNA信息。这意味着一次正常的射精相当于1587.5TB的数据传输。” 配图是一张巨大的精子图像，像极了IT大会上的PPT封面，一副“我是数据载体”的自豪模样。我们身体里隐藏的“数据工厂” 乍看这句话好像是个玩笑，但它其实反映出一个有趣的生物学事实：DNA的确可以被视作一种极其高效的数据储存方式。人类基因组大约包含30亿个碱基对，如果以纯文本存储方式计算，每个碱基占2位二进制，总共就是大约750MB，但经过压缩后能被压到几十MB。因此，“一个精子大概有37.5MB的信息”并不是完全虚构，甚至可以说是相当保守的估计。要知道，一个男性在一次射精中释放出的精子数量大约是4亿到5亿个。按照图中“37.5MB * 42,333,333个精子 ≈ 1587.5TB”的算法，这个数据总量确实惊人。如果你是个程序员或者存储工程师，大概会想：“这得用多少硬盘来装？” 生物=硬件，DNA=代码？我们可以打个比方：每个精子都像是携带完整代码的U盘，而人类就是那些由代码运行出来的“程序”。精子在其中扮演的，是半个“源码仓库”的角色（另一半来自卵子）。两者合并后，构建出一个完整的“应用程序”——也就是一个新生命。这么看，每一次“数据传输”，其实是一个复杂的信息复制、筛选、执行和实现的过程。关键是，这个系统自动且高效，没有服务器宕机，也不需要网络加速，进程控制由激素和生理机制负责调度。信息的浪费与自然的策略可能你也注意到了，一个射精释放数亿个精子，真正能成功受精的只有一个。这似乎是一种“巨量冗余”的传输方式，远不如我们IT行业中的高效多了。但这其实就是自然的奇妙之处。冗余是进化出的策略，确保在极不确定的环境中，至少有一个能成功完成“上传”。比起精准高效的现代网络协议，自然更偏向“大量广播+高淘汰”的策略，类似P2P中的“flooding”。科技与生命的交汇从某种角度看，这种“数据转移”的说法为我们提供了一种重新审视生命的方式。DNA本身就是信息，它携带了构建生命的全部“指令集”。现代合成生物学和基因编辑技术的发展，正是基于对这种信息系统的理解和操作。未来，我们可能真的可以“下载”一个人的基因序列到硬盘中，也可以“编辑”某些基因特征，甚至远程“部署”新生命。这当然牵涉到巨大的伦理问题，但科技的脚步从不会停止。下次你看到某个高性能服务器，或者听到“超大数据集”时，不妨想一想：每个活着的人，本身就已经是一个自然界精心构建的“云计算终端”，而我们每天产生的信息——说不定早已远远超过了一次射精的“1587.5TB”。在网络世界里，TB级的数据已经不罕见了，动辄就是AI模型、高清电影、星球级数据库。但当我们意识到，自己身体里每天、甚至每一刻都在进行着TB级别的信息处理时，会不会突然感觉人类其实是最强大的“超级计算机”？每个人，都是亿万分之一的胜者如果说一次射精是一次1587.5TB的数据洪流，那么我们每个人的诞生，都是在亿万个“候选者”中的唯一“成功上传”。精子与卵子的结合，不只是生物学上的奇迹，更是一种概率上的奇迹。每一个人，都是在数亿分之一的竞争中脱颖而出，才有了今天站在这个世界上的机会。所以，不论你是谁，来自哪里，有怎样的过去，都请记住——你一出生，就已经赢了一次宇宙级的“选拔赛”。你就是那个成功传输并执行的“超级程序”，是生命给这个世界投出的最坚定的数据包。 PS：下次为爱鼓掌的时候，得和媳妇分享这个知识点，要是信息知识可以通过这种方式传授的话，那岂不是我媳妇每天都能进步？本文一共 1248 个汉字, 你数一下对不对. …

[继续阅读……]

很久没有读完一本书了: 书买来后看了才算是消费了

2025年8月1日学习笔记, 生活 No Comments

两周前我立下了一个小目标：每天读10页书。没想到这个习惯坚持得还挺顺利，居然真的读完了一整本书。这是我很久以来第一次完整读完一本书。过去几年也陆陆续续买了几本，但基本都是翻了几页就被丢到书架上积灰了。听过一个说法：书只有读了才算真正“消费”了。我记得高中课文里提到过一句话：“书非借不能读也”，意思也正是强调书要读才有意义。这次我选的第一本书很简单，没有太多技术含量，就是轻松地读着玩儿的。但刚开始的几天进展特别慢，每次都是一目好几行，却又好像什么都没看进去，还得不断回头重读，效率非常低。后来我意识到，这可能和我做事缺乏耐心有关。于是我尝试静下心来，一句一句地慢慢读，甚至在心里默念，果然这样效果好多了。怪不得总说读书有很多好处，比如能提高专注力，让孩子多读书，也有助于他们培养耐心和注意力。这本《极简主义》介绍了几种方法和思路，核心内容我整理在下图里。可能过段时间我不太记得细节了，但这本书给我留下最深的印象就是一句话：“如果一件事不去做，它就永远不会完成。” 现在我又把Alex Xu的《系统设计》翻出来，每天照样读10页。以后准备把书架上的书一本一本都拿出来读，读完再放回去。这样真的很有成就感。本文一共 472 个汉字, 你数一下对不对. 很久没有读完一本书了: 书买来后看了才算是消费了. (AMP 移动加速版本) 赞赏我的几个理由. ¥ 打赏支持扫描二维码，分享本文到微信朋友圈

[继续阅读……]

竞技编程的边际效应(Marginal Effect)递减

2025年7月30日学习笔记, 程序员, 程序设计, 算法, 编程, 育儿, 计算机 No Comments

什么是竞技编程（Competitive Programming）？竞技编程的英文是 Competitive Programming，是指在限定时间内通过编写程序解决一系列算法问题的比赛形式。比较知名的赛事有 ACM-ICPC、Codeforces、Google Kick Start 等。这类比赛不仅考验选手的算法功底和编程技巧，还需要良好的思维敏捷性和代码调试能力。比如我二十多年前在高中参加的 ICPC，就是一种典型的竞技编程。当时我们使用的编程语言还是 Turbo Pascal，比赛时间是三个小时，要解决四道题。那时候只要程序能输出正确的结果就行了，根本不太在意代码的实现方式和写得是否优雅。我家娃在做 LeetCode 的一道算法题时，由于算法不够高效，有两三个测试用例出现了超时。他索性“投机取巧”地加了一个 if 判断，针对那些特定的输入直接返回正确结果。这样做在 LeetCode 上是可行的——前提是你知道测试数据，并能手动处理特殊情况。但在实际的比赛中，这种做法往往行不通。一方面你无法提前知道测试输入；另一方面题目设计者也会故意防止这种“硬编码逃课”手法，所以比赛更要求通用、稳健的算法方案。这也是竞技编程和普通刷题平台之间的一个重要区别。 🏆 ACM-ICPC（国际大学生程序设计竞赛）由 ACM 发起，目前由 ICPC Foundation 主办。 …

[继续阅读……]

活到老, 学到老, 每天进步一点点: 油管视频学习

2025年7月29日学习笔记, 小技巧 No Comments

从今年开始，我给自己设定了各种打卡目标，每天会把要做的事情记录在 Excel 表格里。这样不仅不容易忘记，也更方便坚持下去。大约两三个月前，我启动了一个全新的学习计划：每天在 YouTube 上找一个视频来学习。最初是集中在系统设计（System Design）方面，但后来不再局限于某个主题，有时是 C++，有时是 ROS2 或机器人相关内容，还有时候是数学。这样做有几个好处。一方面，每月花 20 英镑订阅的 YouTube Premium 总算真正用上了；另一方面，也实现了“每天进步一点点”的目标。听说，如果你能每天坚持做一件事情，持续一年，就能超过 95% 的人。一两天看不出什么差别，但日积月累，复利效应就非常惊人。比如每天进步 1%，那么一年后就是 1.01 的 365 次方，结果大约是 37.78。其实我最早在去年下半年就开始尝试了，但那时还没做到每天都坚持。后来用了 Excel 表格来记录，从两个月前起，才真正稳定下来。我还把我看过的学习视频分享到这个播放列表上，共同进步。本文一共 …

[继续阅读……]

机器学习(最优化)根本数学公式: arg_max_{x∈X} F(x)

2025年7月29日 Python, Python, 人工智能 (AI), 动态规划算法 DP, 学习笔记, 数据结构与算法, 机器学习, 程序设计, 计算机 No Comments

$机器学习(最优化)根本数学公式: arg_max_{x∈X} F(x)$

argmax：从未来推理现在整个机器学习(最优化)，背后的根本数学原理是下面这个公式: arg_max_{x∈X} F(x) 它的含义是：在所有可能的输入 x ∈ X 中，找出让目标函数 F(x) 最大的那个 x。这个公式返回的是最优解 x，而不是最大值本身。这个公式代表【从未来推理出现在的最佳选择】，因为所有的x有哪些，实际上是没办法穷尽的，以及F有哪些，是未来才知道的。代表一种完全信息视角。这个和“传统”的数学递推公式是反过来的，传统的递推公式是，利用过去的推理未来的，例如斐波那契额数列，假设的是F(n-1)和F(n-2)我们已经知道，我们就可以推理F(n)（这也是动态规划算法的核心）。这个是【利用过去的信息推理未来的】。因此，机器学习/最优化，本质是预测未来。实际上，arg_max 公式，如果用编程语言来表达，非常好理解：这个思维方式代表的是“从未来反推现在”：F(x) 是未来某种评估函数，我们假设它存在，并试图找到现在该做什么（x）才能让它最大。 def arg_max(X, F): best_x = None best_score = float('-inf') …

[继续阅读……]