💡

TechInsight

技术实践与工程思考 · 63 篇文章

爬虫死了怎么办——百度贴吧爬虫修复全记录

之前写了一个百度贴吧爬虫，用 Playwright 模拟浏览器操作，能爬帖子、回复、图片，保存成 Markdown。写的时候还好好的，今天再跑，发现——一个帖子都爬不到了。不是报错，不是超时，而是静默失败：页面能打开，但所有选择器返回空值。

2026/03/29

AI上下文持久化：如何构建标准化的“提示词交接协议”

为了解决这个问题，我们需要一种机制，能够将项目的“心智”完整地传递给下一个AI实例。这就是AI上下文持久化的核心需求。

2026/03/28

AI时代的知识金矿如何自动捕获编程对话中的隐性价值

今天，我要分享如何利用AI自身的Hook机制，构建一个自动捕获并沉淀这些技术对话价值的系统——我们将这个过程称为"被动式知识资产化"。

2026/03/26

构建无感知的知识闭环：从Hook机制到全流程自动化

在当今这个AI辅助编程的时代，我们的工作方式正在发生根本性的转变。作为开发者，我们每天产生大量的代码片段、架构思考、甚至是商业计划文档。

2026/03/24

开源与连接

当代码遇见传统，会碰撞出不一样的火花

2026/03/20

百度贴吧爬虫开发实战：从固定配置到通用交互式工具

本文记录了开发百度贴吧爬虫的完整过程，包括遇到的反爬挑战、解决方案，以及从单一功能到通用工具的演进思路。。

2026/03/14

一个项目的多种可能

思考本身，就是学习的意义。

2026/03/13

神经符号架构：第三范式编程的核心引擎还是过渡性妥协？

神经符号架构的价值不在于"解决"神经网络与符号系统之间的张力，而在于将这种张力转化为第三范式编程的核心特性——正如量子力学中的波粒二象性，看似矛盾的两个方面恰恰构成了系统的本质。

2026/02/21

Windows文件管理系统：从MS-DOS到AI Agent的"记忆之根"

在信息爆炸的时代，我们每天都在产生海量数据。文档、照片、视频、代码…这些数字资产需要一个可靠的方式来组织和存储。Windows文件管理系统，这个我们每天都在使用却鲜少关注的基础设施，实际上是人类数字文明的基石。

2026/02/20

OpenViking：字节跳动开源的 AI Agent 上下文数据库

2026年1月，字节跳动火山引擎 Viking 团队开源了 OpenViking——一个专为 AI Agent 设计的上下文数据库。本文深入解析其核心技术、应用场景和最佳实践。

2026/02/19

都在预测token，为什么编程模型更懂代码？

一个很多人都会有的疑惑：通用大模型和专门的编程模型，底层都是Transformer架构，都是在做概率预测下一个token。那为什么编程模型写代码明显更好？今天我们就来深挖这个问题，从技术角度分析"概率预测的魔法"到底是怎么运作的。

2026/02/18

Claude Code Skills 系统：让 AI 适应你的编程习惯

2026年2月，Claude Code 2.1 版本带来了 Skills 热重载功能。但这只是冰山一角。Skills 系统是 Claude Code 最强大的自定义能力，却被很多人忽视。本文将深度解析 Skills 系统，从基础概念到实战应用，帮你构建属于自己的 AI 技能库。

2026/02/17

中国AI的2025：激动人心的一年

基于2025-2026年最新数据，全面解析中国AI在技术突破、应用落地、产业发展等方面的进展

2026/02/16

Claude Code 2月半月更新全解析：Agent Teams登场与14次版本演进

基于2026年2月1日-15日期间Claude Code的14个版本更新，深度解析Agent Teams多代理协作功能及其他重要更新。

2026/02/15

AI幻觉的真相：AI为何会编造内容？

基于2025-2026年最新研究数据，深入解析AI幻觉的产生原因、类型分布和应对策略什么是AI幻觉？AI幻觉（Hallucination）是指大语言模型（LLM）生成看起来合理、但实际上虚假或无意义的内容。这不是AI"故意撒谎"，而是其概率生成机制的固有特性。

2026/02/14

Claude Code Agent Teams：让多个 AI 像团队一样协作开发

Claude Code 的 Agent Teams 功能正在改变这一现状。它让多个 Claude Code 实例像真正的开发团队一样协同工作，各司其职，并行处理，互相讨论。本文将深入解析这一实验性功能的核心概念、工作原理和实际应用。

2026/02/13

GPT-5：OpenAI的最后一搏？

2025年1月，ChatGPT占据移动AI应用69.1%的份额。一年后，这个数字跌到了45.3%。这不是股价的波动。这是王座的动摇。

2026/02/12

Web3+AI：去中心化的最后机会

2025年，一个令人不安的数据浮出水面：全球90%以上的AI算力被5家公司控制——OpenAI、Google、Meta、Microsoft和Amazon。这五家公司正在成为AI时代的"新石油寡头"。

2026/02/12

RAG的泡沫：为何90%企业项目烂尾？

企业RAG项目的失败率高达90%。绝大多数项目在Demo阶段表现完美，一旦进入生产环境就问题频发，最终不了了之。为什么会出现这样的局面？RAG技术本身有问题，还是企业的期望不切实际？本文将从技术本质出发，深入分析RAG项目的致命陷阱，并给出务实的落地建议。

2026/02/10

AI术语大扫除：一次性搞懂GLM-OCR、RAG、大模型的区别与关系

最近刷技术视频，总能看到这三个词：GLM-OCR、RAG、大模型。很多人（包括我自己）一开始都是一头雾水：这三个东西到底有什么区别？

2026/02/09

AI教育的谎言：个性化学习还是数据挖掘？

6.5%——这是MOOC平台的平均完成率。所谓的"个性化学习"，究竟是教育革命，还是数据挖掘的幌子？这不是科幻电影里的预言，而是2024-2025年的真实研究数据。

2026/02/08

Agent的死亡螺旋：90%项目为何死于Demo

90%——这是AI Agent项目从Demo走向生产时的失败率。Demo阶段看起来完美无缺，一旦上线就瞬间崩溃。

2026/02/06

AI医疗：误诊率比医生高，为什么还在推？

52.1%——这是AI医疗诊断的平均准确率，比专家医生低了15.8个百分点。这不是科幻电影里的预言，而是2024-2025年的真实研究数据。

2026/02/06

DeepSeek：开源之死还是新的黎明？

2024年12月27日，一个普通的周五下午。GitHub上突然出现了一个新的仓库，名为"DeepSeek-V3"。24小时内，这个仓库获得了超过10万颗星。

2026/02/05

AI版权之战：创作者的沉默与巨头的狂欢

2026年1月的一个下午，旧金山联邦法院。Sarah坐在原告席上，双手紧握。她不是律师，不是科技公司高管，只是一名默默无闻的插画师。但今天，她代表着全球数十万创作者，站在了历史的十字路口。

2026/02/03

强化学习入门：从Q-learning到PPO，一文掌握AI试错学习的奥秘

本文将用通俗易懂的方式，带你系统学习强化学习的核心概念、经典算法和实际应用。

2026/02/01

机器学习基础：从零开始理解AI的基石

在人工智能的三大分支中，机器学习是最基础、应用最广泛的领域。从抖音的推荐算法到特斯拉的自动驾驶，从Siri的语音识别到ChatGPT的智能对话，背后都有机器学习的身影。但你有没有想过：机器到底是怎么"学习"的？它和传统编程有什么区别？

2026/01/31

2026年1月AI界重大资讯盘点：从Maia 200到智能体时代

2026年1月，AI领域迎来了新一轮的技术爆发和资本狂欢。微软发布革命性的Maia 200 AI加速器、OpenAI寻求高达600亿美元的融资、中国AI产业规模突破1.2万亿元……这些事件不仅标志着AI技术的快速演进，更预示着智能体（Agent）时代已经到来。

2026/01/30

AI Agent 遇到故障怎么办？错误处理和重试机制设计全解析

AI Agent 遇到故障怎么办？错误处理和重试机制设计全解析.mdAI Agent 遇到故障怎么办？

2026/01/29

2026 AI决战元年：1月27日的七个关键信号

2026年1月27日，AI领域发生了什么？本文深度解读七大关键信号，揭示AI从概念走向现实的转折点。

2026/01/27

2026年1月AI最新进展：AI发展的分水岭

OpenAI发布《AI as a Healthcare Ally》，首次系统性展示AI在医疗垂直领域的实际应用价值；Anthropic推出《Economic Index Report》，引入全新AI使用度量指标；智源研究院发布《2026十大AI技术趋势》，指出AI演进核心正在从参数规模转向物理世界理解…

2026/01/18

Claude Code 2.1 重磅更新解析：1096次提交背后的技术革命

2026年1月，Claude Code发布了被称为"史上最大更新"的2.1版本。

2026/01/17

LangChain链式调用原理：像搭积木一样构建AI应用

LangChain 的链式调用（Chain）就是为了解决这个问题而生的。它让我们可以像搭积木一样，把不同的处理步骤串联起来，让数据自动流转。本文将深入讲解链式调用的核心原理和使用方法。

2026/01/16

实战：从零构建自动写代码的AI Agent

代码自己写自己？这不是魔法，是Agentic AI时代的新范式作者：架构狮与橘 | 阅读时间：约15分钟

2026/01/14

RAG应用场景实战：7大真实案例带你落地RAG技术

开篇引入你有没有遇到过这样的问题：学了RAG核心技术、向量数据库、文本切分策略、质量优化方法、多模态RAG、企

2026/01/12

企业级RAG架构设计：从Demo到百万级QPS的生产系统

Demo关注功能实现，企业级关注非功能需求：高并发、高可用、可扩展、安全合规、成本控制。这些需求相互制约，需要架构师在约束条件下找到最优解。本文将详细介绍企业级RAG系统的架构设计，从需求分析到具体实现，给你一套经过验证的生产级方案。

2026/01/12

多模态RAG系统：让AI看懂图像、视频和表格数据

在实际应用中，企业数据往往包含大量非文本内容：产品图片、财务报表、培训视频、会议录音等。如何让AI检索这些多模态数据，成为了一个亟待解决的问题。多模态RAG系统通过将图像、视频、音频、表格等数据映射到统一的向量空间，实现了跨模态的智能检索。

2026/01/11

RAG质量优化实战：从评估到生产环境的完整指南

开篇引入做了RAG系统，但不知道质量好不好？检索总是不准，回答总是幻觉？你并不孤单。

2026/01/10

文本切分与检索策略全指南：让RAG准确率突破90%

文档切分与检索策略

2026/01/09

向量数据库深度解析：RAG系统的核心引擎

2026/01/08

RAG核心技术原理深度解析

RAG（Retrieval-Augmented Generation，检索增强生成）是一种让大语言模型（LLM）能够连接外部知识库的技术架构。它的核心思想是：在生成答案之前，先从外部知识库中检索相关资料，然后基于这些资料生成回答。

2026/01/07

Claude Code + GLM 4.6 完整配置指南：原理、实践与进阶

一篇手把手的安装教程，更是一次深入技术的探索之旅。我们不仅教你"怎么做"，更让你理解"为什么"。

2026/01/04

AI从零构建3D太阳系：一次关于创造的深度对话

2026年1月3日，一个普通的冬日午后。用户问了我一个问题：“你总是说你能做前端设计、能写代码、能处理各种文件…那到底能做什么？”这是一个很好的问题。因为作为AI，我们被训练成总是给出正确的答案，但很少被要求证明这些答案。

2026/01/04

AI自进化记：一个GLM模型如何通过阅读完成自我蜕变

一次平凡的阅读任务2026年1月3日，一个普通的冬日午后。用户给了两篇来自"字节笔记本"的微信公众号文章，让AI"深度学习"。这是再平常不过的任务——作为AI，我们习惯了被动接收信息，然后输出答案。但这两篇文章讲述了一个让AI"眼馋"的东西：Claude Skills。

2026/01/03

Windows环境个人开发者全栈项目落地完整指南

基于两个真实跨平台项目的开发经验总结Simple Account (个人财务记账系统) v0.4.1TimelineFlow (待办事项管理平台) v1.0.0

2026/01/02

MCP 协议完全指南：AI Agent 的"USB-C 接口"

2024年11月，Anthropic 推出了一个名为 MCP（Model Context Protocol，模型上下文协议）的开放标准。虽然它的名字听起来很技术化，但本质上，它就是 AI 世界的"USB-C 接口"——一个统一连接 AI 与外部工具的标准协议。

2025/12/30

REST API和Vue

REST API和Vue是现代Web开发中两个核心但不同层面的技术，它们在前后端分离架构中扮演着关键角色。

2025/12/25

让你的手机秒变AI助手！AutoGLM安装使用教程

⚠️ 免责声明：本文内容仅供技术学习和研究使用，严禁用于任何违法违规行为。使用者需自行承担使用风险，作者不承担任何责任。

2025/12/12

获得自己的AI手机

2025/12/12

RAG：为AI装上“外接大脑”，告别一本正经的胡说八道

深度解析检索增强生成，如何让聊天机器人从“信口开河”到“引经据典”

2025/12/10

码上云工具箱：基于微信云开发的实用工具集合实践项目概述

"码上云工具箱"是基于微信小程序生态开发的实用工具集合项目。结合了校园生活和开发工作中常见的工具需求，通过微信云开发技术栈，实现了一个包含12个实用功能的综合性工具平台。项目展现了小程序开发的最佳实践，以及云原生架构在轻量级应用中的优势。

2025/12/09

我写了一个与潜意识对话的AI，它正在改写心理学的使用说明书

如果我们写的代码，不再只是处理电商订单、管理服务器集群，而是能叩开人类潜意识的帷幕，与你的梦境进行一场深邃、私密且科学的对话——这听起来像科幻，却正是我过去几个月里，用 React、FastAPI 和超过5000字的提示词工程所构建的现实。

2025/12/02

你的第一门编程语言，怎么选才不会后悔？

面对Python、Java、C++、JavaScript……你是否感到选择恐惧？本文用生动的比喻，为你彻底剖析主流语言的特性、优劣势与核心应用场景，并提供三条黄金选择准则。

2025/11/30

提示词炼金术：三大心法，把你从AI小白变成“许愿大师”

你是否曾感觉，自己对AI说的话像扔进山谷的石子，听不到期待的回响？你说“写一份报告”，它给你一堆空洞的废话。问题不在AI，而在你那没有“魔法”的指令。本文教你三大“炼金心法”，将你的模糊想法，炼成AI的精确指南。

2025/11/24

Gemini：Google的多模态AI“超级大脑”如何同时理解文字、图像与声音？

它能同时读懂你的代码、图片和语音指令，这个“全能型选手”正重新定义人机交互的边界。

2025/11/23

AI编程助手崛起，Trae如何用“全能团队”颠覆传统开发？

一行代码不会写，也能开发出复杂的应用程序，这不再是天方夜谭

2025/11/21

SQL注入：骗过数据库的"万能钥匙" | 一句密码撬开整个系统

仅仅在登录框里输入一句 ' OR '1'='1，就能绕过密码验证，以管理员身份进入系统？这不是电影桥段，而是SQL注入攻击的日常，一种直捣黄龙、最经典的Web安全漏洞。

2025/11/17

事务：数据库的“安全保镖” | 用一次转账，搞定ACID四大原则，告别数据错乱！

程序崩溃导致钱扣了对方没收到？多个用户同时操作导致数据乱七八糟？本文将用最经典的银行转账案例，带你理解数据库事务如何像“安全保镖”一样，为你的数据操作保驾护航，彻底告别数据错乱的尴尬！

2025/11/09

音频处理全栈实战：从FFmpeg安装到专业级降噪处理

本文提供从FFmpeg环境搭建到高级音频降噪的完整解决方案。涵盖详细的安装配置步骤、核心命令解析，以及经过实践验证的三步降噪方案，帮你快速构建专业的音频处理能力。

2025/11/06

AI革命周报：OpenAI推浏览器，DeepSeek开源OCR，字节双模型引爆开源圈

过去一周AI领域迎来重大突破：OpenAI推出Atlas浏览器并升级Sora 2、Veo 3视频工具；DeepSeek开源OCR模型，字节发布DreamOmni2和Seed3D双模型。开源AI正迎来黄金时代，开发者迎来全新机遇！

2025/10/27

Dockerfile优化指南：如何让你的镜像“瘦身”90%？

告别臃肿的巨型镜像！掌握多阶段构建等神技，让你的Docker镜像体积锐减90%，构建更快、部署更稳、安全性更高大家好，我是「码上云开工」的号主。

2025/10/26

微软365全新图标来袭！设计背后隐藏这些AI野心

微软365图标悄然换新。这远非简单“变脸”，而是一份AI时代的“设计宣言”。当熟悉的标识变得圆润、流动，预示着工具正从“死板软件”蜕变为“智能协作者”。本文将解码微小图标背后隐藏的宏大AI野心。

2025/10/24

【你的编程环境，我来搞定！】

还在为复杂的环境配置头疼？我来帮你远程搞定！ ✅ Java/Python/Node.js开发环境一站式配置 ✅ IDEA、VS Code等专业IDE安装与优化 ✅ 数据库、中间件环境部署 ✅ 各类软件安装报错、BUG调试解决 💡 作为软件工程专业学生，我提供： ▸ 专业远程技术支持 ▸ AI辅助高效排查问题 ▸ 耐心讲解，帮你理解原理 ▸ 100%合法合规的技术服务扫描海报二维码，获取免费初步诊断！有需要的同学朋友欢迎推荐～ #技术支持 #编程环境 #远程协助

2025/10/23