ElasticSearch中的分词器详解

博主头像 概述 分词器(Analyzer)是Elasticsearch全文检索的核心组件,负责将文本内容拆分为一系列独立的词项(Term),同时完成大小写转换、特殊字符过滤、同义词替换、停词移除等预处理工作,直接决定检索的准确性和性能。 一个完整的分词器由三部分组成: Character Filter(字符过 ...

为什么越来越多的大厂抛弃MCP,转向CLI?

博主头像 前言 最近在AI圈,有一个话题引发了巨大的争论——“MCP已死,CLI称王”。 从Perplexity CTO公开宣布放弃MCP,到Y Combinator CEO直言“MCP sucks”,再到飞书、钉钉、企业微信等大厂纷纷选择开源自家的CLI而非MCP,一场关于AI Agent如何与外部世界交互 ...

Linux进阶--日志管理

博主头像 日志管理 Linux日志介绍 日志文件是重要的系统信息文件,其中记录了许多重要的系统事件,包括用户的登录信息,系统的启动信息,系统的安全信息、邮件相关信息、各种服务相关信息等。 日志记录了系统每天发生的各种事情,通过日志来检查错误发生的原因,或者收到攻击时攻击者留下的痕迹。 总之,日志是用来记录重大 ...

用300行代码手写一个mini版的Tomcat

博主头像 Tomcat 是 Java Web 开发的基石。我们天天使用它,但你是否思考过它内部是如何工作的?为了打破这个“黑盒”,最好的方式就是动手实现一个极度精简的核心。本项目 “TinyTomcat” 的目标,就是用大约 300 行纯 Java 代码,实现一个能够解析 HTTP 请求、路由到对应处理逻辑并 ...

电子小白的枕边书:电子学(The Art of Electronics)

博主头像 平时咱们聊了很多具体的元器件,比如电阻的使用场景、电容怎么滤波、三极管怎么当开关。每次写文章,我都要翻箱倒柜找资料,要么网上AI给一堆,然后还需要辨别是否正确,查得头大,要么翻出的教材全是微积分。 直到前段时间,一位硬件大佬实在看不下去了,甩给我一本书,说:“别上网乱搜了,查元器件,这本就够了。” ...

一个简单案例理解OpenClaw的做梦过程

博主头像 OpenClaw 的梦境(Dreaming) 是一套“模仿”人类睡眠的后台记忆自动巩固系统,核心是把短期对话、任务记录,筛选、反思、评分后,把高价值内容固化为长期记忆,让 AI 智能体越用越懂你、上下文不丢失。 此篇通过一个可对照的实例,模拟 OpenClaw 梦境流程,观察memory和dream... ...

如何在EDKII中编译UNIX风格C语言

博主头像 一、前言 通过阅读前面的 EDKII 相关代码实现,我们可以很容易发现其虽使用的是 C 语言语法,但编写规则与我们在 IDE 或者操作系统上运行的 C 语言代码不太一样。以简单的 HelloWorld 程序为例。EDKII 中的代码为: #include <Uefi.h> #include <Lib ...

静态网站渗透实战:从信息泄露到 Flag 获取

博主头像 目录前言靶场描述静态网站核心测试思路渗透流程 前言 所有操作均在授权靶场环境内进行,本文仅用于网络安全学习交流,严禁用于非法攻击,任何违法行为均与作者无关。 本文首发于公众号“希泽Sec” 靶场描述 静态网站渗透测试,目标是攻破站点获取 Flag,Flag 存储路径:/tmp/flag.txt。 静 ...

复制一个表结构和数据,我的索引和约束不见了?

博主头像 最近测试环境要做一轮压测,测试同学提出一个需求:想复制一份真实数据出来,单独做回放测试,避免污染原始日志表。 这个需求听起来非常简单。组里新来的初级开发毫无悬念地接下了这个任务。 第二天,测试同学一大早就在群里发消息: “这个日志查询接口怎么这么慢?昨天还好好的。” 过了一会儿,又来一条更离谱的消息 ...

AI周报 | 算力涨价近半、融资965亿、AI开始像真人员工

博主头像 4月13日至19日,全球AI领域迎来密集更新。Anthropic、阿里、智谱等公司纷纷推出更强的新模型,AI开始像真人员工一样能自己干活、记经验。GitHub上开源工具OpenClaw和Hermes Agent热度爆棚,一个擅长执行任务,一个会自我学习。融资方面,本周AI相关公司共融资约965亿元,... ...

前端重生之 - 前端视角下的 Python

博主头像 以前我认为 JavaScript 就是编程世界的全部。从 jQuery 时代的 DOM 操作,到 React/Vue 的组件化革命,再到 TypeScript 的类型安全,见证了前端技术的每一次跃迁。然而,AI 时代来临,人人都在喊转 “全栈“,所以我也开始真正深入 Python 的生态系统,才发现 ...

使用 C# 提取 Word 文档中的表格数据

博主头像 在日常办公或系统开发中,Word 文档里的表格数据常常需要被提取出来,用于数据导入、统计分析或报表生成。然而,手动复制粘贴效率低下,而借助 Office COM 组件又容易遇到版本兼容、部署繁琐等问题。本文将展示如何使用 C# 搭配 Free Spire.Doc 库,无需安装 Microsoft W ...

万字详解 RAG 向量索引算法和向量数据库

博主头像 ⭐️AI 应用开发面试和 AI Coding 实战相关的内容目前正在持续更新中:https://javaguide.cn/ai/ 。 前段时间面某大厂的时候,面试官问我:“你们 RAG 系统的向量检索怎么做的?”,我说:“用 MySQL 存 Embedding,查询时遍历计算相似度。” 空气突然安静 ...

CogVideo与CogVideoX笔记

博主头像 CogVideo与CogVideoX模型结构 VQ-VAE(CogVideo使用的编码器) VQ-VAE其实就是一个AE(自编码器)而不是VAE(变分自编码器) PixelCNN 要追溯VQ-VAE的思想,就不得不谈到自回归模型。可以说,VQ-VAE做生成模型的思路,源于PixelRNN、Pixel ...

Java BIO,NIO最真实简单的理解

博主头像 BIO就是阻塞的,NIO就是非阻塞?BIO就是堆内存,NIO就是直接内存?用了NIO就高并发,难道是银弹? NONONO 当然不是! 我们不讲具体技术及名词,存讲概念,把什么是B/NIO理解清楚了,网上的文章太多概念模糊,太千篇一律(也许是我个人一直没怎么深入IO相关开发,最近搞netty,才逐渐将 ...

AI开发-python-LangGraph框架(3-28-LangGraph 判断节点实战)

博主头像 LangGraph 判断节点实战:用条件路由打造智能天气查询 Agent 在 AI Agent 开发中,动态决策与流程分支是核心能力。传统线性调用难以应对 “是否需要调用工具”“是否结束对话” 等灵活场景,而 LangGraph 的判断节点与条件边机制,能以极简方式实现工作流的智能路由。本文结合天气 ...

123···100>