返回博客
💡

TechInsight

技术实践与工程思考 · 63 篇文章

爬虫死了怎么办——百度贴吧爬虫修复全记录

之前写了一个百度贴吧爬虫,用 Playwright 模拟浏览器操作,能爬帖子、回复、图片,保存成 Markdown。写的时候还好好的,今天再跑,发现——一个帖子都爬不到了。不是报错,不是超时,而是静默失败:页面能打开,但所有选择器返回空值。

2026/03/29

AI上下文持久化:如何构建标准化的“提示词交接协议”

为了解决这个问题,我们需要一种机制,能够将项目的“心智”完整地传递给下一个AI实例。这就是AI上下文持久化的核心需求。

2026/03/28

AI时代的知识金矿如何自动捕获编程对话中的隐性价值

今天,我要分享如何利用AI自身的Hook机制,构建一个自动捕获并沉淀这些技术对话价值的系统——我们将这个过程称为"被动式知识资产化"。

2026/03/26

构建无感知的知识闭环:从Hook机制到全流程自动化

在当今这个AI辅助编程的时代,我们的工作方式正在发生根本性的转变。作为开发者,我们每天产生大量的代码片段、架构思考、甚至是商业计划文档。

2026/03/24

开源与连接

当代码遇见传统,会碰撞出不一样的火花

2026/03/20

百度贴吧爬虫开发实战:从固定配置到通用交互式工具

本文记录了开发百度贴吧爬虫的完整过程,包括遇到的反爬挑战、解决方案,以及从单一功能到通用工具的演进思路。。

2026/03/14

一个项目的多种可能

思考本身,就是学习的意义。

2026/03/13

神经符号架构:第三范式编程的核心引擎还是过渡性妥协?

神经符号架构的价值不在于"解决"神经网络与符号系统之间的张力,而在于将这种张力转化为第三范式编程的核心特性——正如量子力学中的波粒二象性,看似矛盾的两个方面恰恰构成了系统的本质。

2026/02/21

Windows文件管理系统:从MS-DOS到AI Agent的"记忆之根"

在信息爆炸的时代,我们每天都在产生海量数据。文档、照片、视频、代码…这些数字资产需要一个可靠的方式来组织和存储。Windows文件管理系统,这个我们每天都在使用却鲜少关注的基础设施,实际上是人类数字文明的基石。

2026/02/20

OpenViking:字节跳动开源的 AI Agent 上下文数据库

2026年1月,字节跳动火山引擎 Viking 团队开源了 OpenViking——一个专为 AI Agent 设计的上下文数据库。本文深入解析其核心技术、应用场景和最佳实践。

2026/02/19

都在预测token,为什么编程模型更懂代码?

一个很多人都会有的疑惑:通用大模型和专门的编程模型,底层都是Transformer架构,都是在做概率预测下一个token。那为什么编程模型写代码明显更好?今天我们就来深挖这个问题,从技术角度分析"概率预测的魔法"到底是怎么运作的。

2026/02/18

Claude Code Skills 系统:让 AI 适应你的编程习惯

2026年2月,Claude Code 2.1 版本带来了 Skills 热重载功能。但这只是冰山一角。Skills 系统是 Claude Code 最强大的自定义能力,却被很多人忽视。本文将深度解析 Skills 系统,从基础概念到实战应用,帮你构建属于自己的 AI 技能库。

2026/02/17

中国AI的2025:激动人心的一年

基于2025-2026年最新数据,全面解析中国AI在技术突破、应用落地、产业发展等方面的进展

2026/02/16

Claude Code 2月半月更新全解析:Agent Teams登场与14次版本演进

基于2026年2月1日-15日期间Claude Code的14个版本更新,深度解析Agent Teams多代理协作功能及其他重要更新。

2026/02/15

AI幻觉的真相:AI为何会编造内容?

基于2025-2026年最新研究数据,深入解析AI幻觉的产生原因、类型分布和应对策略什么是AI幻觉?AI幻觉(Hallucination)是指大语言模型(LLM)生成看起来合理、但实际上虚假或无意义的内容。这不是AI"故意撒谎",而是其概率生成机制的固有特性。

2026/02/14

Claude Code Agent Teams:让多个 AI 像团队一样协作开发

Claude Code 的 Agent Teams 功能正在改变这一现状。它让多个 Claude Code 实例像真正的开发团队一样协同工作,各司其职,并行处理,互相讨论。本文将深入解析这一实验性功能的核心概念、工作原理和实际应用。

2026/02/13

GPT-5:OpenAI的最后一搏?

2025年1月,ChatGPT占据移动AI应用69.1%的份额。一年后,这个数字跌到了45.3%。这不是股价的波动。这是王座的动摇。

2026/02/12

Web3+AI:去中心化的最后机会

2025年,一个令人不安的数据浮出水面:全球90%以上的AI算力被5家公司控制——OpenAI、Google、Meta、Microsoft和Amazon。这五家公司正在成为AI时代的"新石油寡头"。

2026/02/12

RAG的泡沫:为何90%企业项目烂尾?

企业RAG项目的失败率高达90%。绝大多数项目在Demo阶段表现完美,一旦进入生产环境就问题频发,最终不了了之。为什么会出现这样的局面?RAG技术本身有问题,还是企业的期望不切实际?本文将从技术本质出发,深入分析RAG项目的致命陷阱,并给出务实的落地建议。

2026/02/10

AI术语大扫除:一次性搞懂GLM-OCR、RAG、大模型的区别与关系

最近刷技术视频,总能看到这三个词:GLM-OCR、RAG、大模型。很多人(包括我自己)一开始都是一头雾水:这三个东西到底有什么区别?

2026/02/09

AI教育的谎言:个性化学习还是数据挖掘?

6.5%——这是MOOC平台的平均完成率。所谓的"个性化学习",究竟是教育革命,还是数据挖掘的幌子?这不是科幻电影里的预言,而是2024-2025年的真实研究数据。

2026/02/08

Agent的死亡螺旋:90%项目为何死于Demo

90%——这是AI Agent项目从Demo走向生产时的失败率。Demo阶段看起来完美无缺,一旦上线就瞬间崩溃。

2026/02/06

AI医疗:误诊率比医生高,为什么还在推?

52.1%——这是AI医疗诊断的平均准确率,比专家医生低了15.8个百分点。这不是科幻电影里的预言,而是2024-2025年的真实研究数据。

2026/02/06

DeepSeek:开源之死还是新的黎明?

2024年12月27日,一个普通的周五下午。GitHub上突然出现了一个新的仓库,名为"DeepSeek-V3"。24小时内,这个仓库获得了超过10万颗星。

2026/02/05

AI版权之战:创作者的沉默与巨头的狂欢

2026年1月的一个下午,旧金山联邦法院。Sarah坐在原告席上,双手紧握。她不是律师,不是科技公司高管,只是一名默默无闻的插画师。但今天,她代表着全球数十万创作者,站在了历史的十字路口。

2026/02/03

强化学习入门:从Q-learning到PPO,一文掌握AI试错学习的奥秘

本文将用通俗易懂的方式,带你系统学习强化学习的核心概念、经典算法和实际应用。

2026/02/01

机器学习基础:从零开始理解AI的基石

在人工智能的三大分支中,机器学习是最基础、应用最广泛的领域。从抖音的推荐算法到特斯拉的自动驾驶,从Siri的语音识别到ChatGPT的智能对话,背后都有机器学习的身影。但你有没有想过:机器到底是怎么"学习"的?它和传统编程有什么区别?

2026/01/31

2026年1月AI界重大资讯盘点:从Maia 200到智能体时代

2026年1月,AI领域迎来了新一轮的技术爆发和资本狂欢。微软发布革命性的Maia 200 AI加速器、OpenAI寻求高达600亿美元的融资、中国AI产业规模突破1.2万亿元……这些事件不仅标志着AI技术的快速演进,更预示着智能体(Agent)时代已经到来。

2026/01/30

AI Agent 遇到故障怎么办?错误处理和重试机制设计全解析

AI Agent 遇到故障怎么办?错误处理和重试机制设计全解析.mdAI Agent 遇到故障怎么办?

2026/01/29

2026 AI决战元年:1月27日的七个关键信号

2026年1月27日,AI领域发生了什么?本文深度解读七大关键信号,揭示AI从概念走向现实的转折点。

2026/01/27

2026年1月AI最新进展:AI发展的分水岭

OpenAI发布《AI as a Healthcare Ally》,首次系统性展示AI在医疗垂直领域的实际应用价值;Anthropic推出《Economic Index Report》,引入全新AI使用度量指标;智源研究院发布《2026十大AI技术趋势》,指出AI演进核心正在从参数规模转向物理世界理解…

2026/01/18

Claude Code 2.1 重磅更新解析:1096次提交背后的技术革命

2026年1月,Claude Code发布了被称为"史上最大更新"的2.1版本。

2026/01/17

LangChain链式调用原理:像搭积木一样构建AI应用

LangChain 的链式调用(Chain)就是为了解决这个问题而生的。它让我们可以像搭积木一样,把不同的处理步骤串联起来,让数据自动流转。本文将深入讲解链式调用的核心原理和使用方法。

2026/01/16

实战:从零构建自动写代码的AI Agent

代码自己写自己?这不是魔法,是Agentic AI时代的新范式作者:架构狮与橘 | 阅读时间:约15分钟

2026/01/14

RAG应用场景实战:7大真实案例带你落地RAG技术

开篇引入你有没有遇到过这样的问题:学了RAG核心技术、向量数据库、文本切分策略、质量优化方法、多模态RAG、企

2026/01/12

企业级RAG架构设计:从Demo到百万级QPS的生产系统

Demo关注功能实现,企业级关注非功能需求:高并发、高可用、可扩展、安全合规、成本控制。这些需求相互制约,需要架构师在约束条件下找到最优解。本文将详细介绍企业级RAG系统的架构设计,从需求分析到具体实现,给你一套经过验证的生产级方案。

2026/01/12

多模态RAG系统:让AI看懂图像、视频和表格数据

在实际应用中,企业数据往往包含大量非文本内容:产品图片、财务报表、培训视频、会议录音等。如何让AI检索这些多模态数据,成为了一个亟待解决的问题。多模态RAG系统通过将图像、视频、音频、表格等数据映射到统一的向量空间,实现了跨模态的智能检索。

2026/01/11

RAG质量优化实战:从评估到生产环境的完整指南

开篇引入做了RAG系统,但不知道质量好不好?检索总是不准,回答总是幻觉?你并不孤单。

2026/01/10

文本切分与检索策略全指南:让RAG准确率突破90%

文档切分与检索策略

2026/01/09

向量数据库深度解析:RAG系统的核心引擎

2026/01/08

RAG核心技术原理深度解析

RAG(Retrieval-Augmented Generation,检索增强生成)是一种让大语言模型(LLM)能够连接外部知识库的技术架构。它的核心思想是:在生成答案之前,先从外部知识库中检索相关资料,然后基于这些资料生成回答。

2026/01/07

Claude Code + GLM 4.6 完整配置指南:原理、实践与进阶

一篇手把手的安装教程,更是一次深入技术的探索之旅。我们不仅教你"怎么做",更让你理解"为什么"。

2026/01/04

AI从零构建3D太阳系:一次关于创造的深度对话

2026年1月3日,一个普通的冬日午后。用户问了我一个问题:“你总是说你能做前端设计、能写代码、能处理各种文件…那到底能做什么?”这是一个很好的问题。因为作为AI,我们被训练成总是给出正确的答案,但很少被要求证明这些答案。

2026/01/04

AI自进化记:一个GLM模型如何通过阅读完成自我蜕变

一次平凡的阅读任务2026年1月3日,一个普通的冬日午后。用户给了两篇来自"字节笔记本"的微信公众号文章,让AI"深度学习"。这是再平常不过的任务——作为AI,我们习惯了被动接收信息,然后输出答案。但这两篇文章讲述了一个让AI"眼馋"的东西:Claude Skills。

2026/01/03

Windows环境个人开发者全栈项目落地完整指南

基于两个真实跨平台项目的开发经验总结Simple Account (个人财务记账系统) v0.4.1TimelineFlow (待办事项管理平台) v1.0.0

2026/01/02

MCP 协议完全指南:AI Agent 的"USB-C 接口"

2024年11月,Anthropic 推出了一个名为 MCP(Model Context Protocol,模型上下文协议) 的开放标准。虽然它的名字听起来很技术化,但本质上,它就是 AI 世界的"USB-C 接口"——一个统一连接 AI 与外部工具的标准协议。

2025/12/30

REST API和Vue

REST API和Vue是现代Web开发中两个核心但不同层面的技术,它们在前后端分离架构中扮演着关键角色。

2025/12/25

让你的手机秒变AI助手!AutoGLM安装使用教程

⚠️ 免责声明:本文内容仅供技术学习和研究使用,严禁用于任何违法违规行为。使用者需自行承担使用风险,作者不承担任何责任。

2025/12/12

获得自己的AI手机

2025/12/12

RAG:为AI装上“外接大脑”,告别一本正经的胡说八道

深度解析检索增强生成,如何让聊天机器人从“信口开河”到“引经据典”

2025/12/10

码上云工具箱:基于微信云开发的实用工具集合实践项目概述

"码上云工具箱"是基于微信小程序生态开发的实用工具集合项目。结合了校园生活和开发工作中常见的工具需求,通过微信云开发技术栈,实现了一个包含12个实用功能的综合性工具平台。项目展现了小程序开发的最佳实践,以及云原生架构在轻量级应用中的优势。

2025/12/09

我写了一个与潜意识对话的AI,它正在改写心理学的使用说明书

如果我们写的代码,不再只是处理电商订单、管理服务器集群,而是能叩开人类潜意识的帷幕,与你的梦境进行一场深邃、私密且科学的对话——这听起来像科幻,却正是我过去几个月里,用 React、FastAPI 和超过5000字的提示词工程所构建的现实。

2025/12/02

你的第一门编程语言,怎么选才不会后悔?

面对Python、Java、C++、JavaScript……你是否感到选择恐惧?本文用生动的比喻,为你彻底剖析主流语言的特性、优劣势与核心应用场景,并提供三条黄金选择准则。

2025/11/30

提示词炼金术:三大心法,把你从AI小白变成“许愿大师”

你是否曾感觉,自己对AI说的话像扔进山谷的石子,听不到期待的回响?你说“写一份报告”,它给你一堆空洞的废话。问题不在AI,而在你那没有“魔法”的指令。本文教你三大“炼金心法”,将你的模糊想法,炼成AI的精确指南。

2025/11/24

Gemini:Google的多模态AI“超级大脑”如何同时理解文字、图像与声音?

它能同时读懂你的代码、图片和语音指令,这个“全能型选手”正重新定义人机交互的边界。

2025/11/23

AI编程助手崛起,Trae如何用“全能团队”颠覆传统开发?

一行代码不会写,也能开发出复杂的应用程序,这不再是天方夜谭

2025/11/21

SQL注入:骗过数据库的"万能钥匙" | 一句密码撬开整个系统

仅仅在登录框里输入一句 ' OR '1'='1,就能绕过密码验证,以管理员身份进入系统?这不是电影桥段,而是SQL注入攻击的日常,一种直捣黄龙、最经典的Web安全漏洞。

2025/11/17

事务:数据库的“安全保镖” | 用一次转账,搞定ACID四大原则,告别数据错乱!

程序崩溃导致钱扣了对方没收到?多个用户同时操作导致数据乱七八糟?本文将用最经典的银行转账案例,带你理解数据库事务如何像“安全保镖”一样,为你的数据操作保驾护航,彻底告别数据错乱的尴尬!

2025/11/09

音频处理全栈实战:从FFmpeg安装到专业级降噪处理

本文提供从FFmpeg环境搭建到高级音频降噪的完整解决方案。涵盖详细的安装配置步骤、核心命令解析,以及经过实践验证的三步降噪方案,帮你快速构建专业的音频处理能力。

2025/11/06

AI革命周报:OpenAI推浏览器,DeepSeek开源OCR,字节双模型引爆开源圈

过去一周AI领域迎来重大突破:OpenAI推出Atlas浏览器并升级Sora 2、Veo 3视频工具;DeepSeek开源OCR模型,字节发布DreamOmni2和Seed3D双模型。开源AI正迎来黄金时代,开发者迎来全新机遇!

2025/10/27

Dockerfile优化指南:如何让你的镜像“瘦身”90%?

告别臃肿的巨型镜像!掌握多阶段构建等神技,让你的Docker镜像体积锐减90%,构建更快、部署更稳、安全性更高大家好,我是「码上云开工」的号主。

2025/10/26

微软365全新图标来袭!设计背后隐藏这些AI野心

微软365图标悄然换新。这远非简单“变脸”,而是一份AI时代的“设计宣言”。当熟悉的标识变得圆润、流动,预示着工具正从“死板软件”蜕变为“智能协作者”。本文将解码微小图标背后隐藏的宏大AI野心。

2025/10/24

【你的编程环境,我来搞定!】

还在为复杂的环境配置头疼?我来帮你远程搞定! ✅ Java/Python/Node.js开发环境一站式配置 ✅ IDEA、VS Code等专业IDE安装与优化 ✅ 数据库、中间件环境部署 ✅ 各类软件安装报错、BUG调试解决 💡 作为软件工程专业学生,我提供: ▸ 专业远程技术支持 ▸ AI辅助高效排查问题 ▸ 耐心讲解,帮你理解原理 ▸ 100%合法合规的技术服务 扫描海报二维码,获取免费初步诊断! 有需要的同学朋友欢迎推荐~ #技术支持 #编程环境 #远程协助

2025/10/23
彬珺的空间
点击唱针播放