Gemini 1.5 Pro – 伯乐青狼

为什么我把公司知识库的RAG Pipeline从LangChain迁到了裸Gemini API：一场关于长上下文与分块策略的架构决策复盘

2026年6月10日 12 次浏览

去年Q4，我接手了一个企业知识库问答系统的重构项目。原有的架构跑在LangChain + Pinecone上，用的是经典的RAG分块策略——把所有文档切成512 token的片段，embedding后扔进向量库，查询时召回top-k，拼进prompt里喂给模型。这套方案在前6个月表现尚可，但随着客户…

我往 Gemini 1.5 Pro 里塞了 5 万行代码，它给我画了张循环依赖图，还顺手把重构 diff 写好了——但我差点被账单送走

2026年6月9日 12 次浏览

大家好，我是苏晚。前两天我干了一件很多开发者在脑子里想过、但没真下手的事——把整个微服务仓库，没错，整整 5 万多个文件，一次性扔进 Gemini 1.5 Pro 的上下文窗口里，然后让它给我做架构洞察、找出反模式，再自动输出重构成 diff。结果怎么着？它还真画出了一张挺像样的全局依赖图，甚至标…

标签： Gemini 1.5 Pro Vertex AI 配额微服务架构重构自动重构 diff 长上下文代码分析

我不再给长文档切块了——Gemini 2.5 Pro百万token上下文让我重写了整个问答系统

2026年5月11日 25 次浏览

我们用Gemini 1.5 Pro的百万token上下文窗口替代传统RAG分块，把500页合规手册直接喂给模型，跨章节逻辑准确率从72%飙到93%，开发周期从两个月压缩到一周。这篇文章记录了从RAG地狱爬出来的全过程，包括缓存调优、权限控制和生产级护栏的实现细节。

标签： Gemini 1.5 Pro