📁 技术洞察

AI 产业深度观察:从投资视角拆解 AI 芯片、大模型、具身智能等赛道的技术真相与商业逻辑。基于 37+ 份融资 BP 和 300+ 项目审查经验,拒绝 PPT 泡沫,只讲技术本质。

LLM.int8()论文说8bit无害,但我把Qwen-7B搬到Arm上才发现功耗确实减半,延迟却暗藏杀机——基于Neoverse V3的K8s部署深度复盘

上个月,我在公司内部的周五技术分享会上,当着CTO的面把一块功耗计插在了x86推理服务器和一台刚到的Arm云实例之间。当时我说:“同样的Qwen-7B,同样的INT4量化,咱们跑一个小时的locust压测,电表会告诉我们真相。”会议室里一半人觉得我在作秀,另一半人已经打开了手机计时器。结果出来后,我…

机器人在马拉松摔了7跤,每一跤都在打脸VLA的“物理理解”——因果推理缺位的60亿美金教训

我是方瑾。过去5年我在一家投技术赛道的风投做技术顾问,看过的AI项目BP没有一千也有八百。我有个职业病:只要PPT里出现“世界模型”四个字,我直接翻到财务预测那页,看看营收和研发投入之间的缺口有多大。因为大部分团队压根没想清楚,让机器人理解物理世界到底需要什么——他们以为堆足够多的视频数据、把VLA…

我们试过给汽车厂上协作机械臂,结果六轴的钱只赚回三轴,才搞明白人形机器人的真实切口在哪

我是沈青锋,现在是我第三个创业项目——给制造业做人形机器人的部署集成。前两个项目,一个做AGV调度系统,一个做工业视觉检测,都没能撑过B轮。这次我们把Walker S送进一家二线汽车零部件厂的产线做搬运和质检,干了快四个月,上个月刚刚跑通了连续20天无故障运行。今天这篇文章是这四个月的真实记录,包括…

我拿47个模型跑了一遍AWS Inf2,发现大模型部署成本砍半的核心条件90%的团队都不具备

我见过不下30份BP,它们在“核心技术壁垒”那一页写着“自研推理优化引擎,成本可降至GPU的50%”。翻到ROI测算那张表,80%的团队直接用GPU按时长单价乘以调用量,算出一个“如果迁移到自研方案能省多少钱”的数字。然后我让他们把模型文件发过来,用Neuron SDK在一台inf2.8xlarge…

当单卡算力撞上800 TFLOPS,我翻了37份AI融资BP,发现90%的“大算力需求”都是PPT泡沫

那个被吹爆的“800 TFLOPS”是怎么骗过投委会的 上周又有两家公司更新了融资材料,把“需要2000张H100”改成了“首批部署300张B200即可启动”。数字砍掉85%,估值反而往上抬了40%,这种魔术我五年里看过太多遍。投资经理们把英伟达官网的FP8算力数字拿来当圣旨,却从不去看数据中心机房…

给工厂的缺陷检测模型搬到了Trainium2上,A100的账单终于不用咬牙还了

去年秋天,我蹲在浙江一家汽车底盘件工厂的质检车间里,看着我们的AI模型把一片制动盘上的气孔误判成划痕,产线停了三分钟。车间主任老陈抱着胳膊,盯着屏幕上的误检图,只丢给我一句话:“你们这模型能一周更新一次不?现在的活,废品率又涨了。” 我是沈青锋,干了三个创业项目,现在这个公司搞制造业的AI视觉检测。…

📝

我拆解了英伟达AI工厂的TCO模型,发现万卡集群的盈亏平衡点在18个月

过去五年,我在投资机构审阅了三百多份AI基础设施相关的BP。我可以负责任地说,90%的创业者都在用同一套PPT模板:先贴一张NVIDIA官方的DGX超算渲染图,然后写“我们要建亚洲最大的AI算力平台”。我问他们单机柜功耗多少,回我“大概20kW”。我说现在一个GB200 NVL72的机架设计功耗是1…

我在机械臂产线上熬了两年,发现最难的不是算法,是让操作工信这个铁疙瘩不会撞到人

在制造业机器人落地的两年实战中,我发现技术集成、ROI计算和人员培训构成了三重困境:机器人控制器是个沉默的黑盒,日志缺位让排故全靠猜;财务总监一句“订单减半怎么办”戳穿了理想化的ROI模型;操作员换型时选错坐标系撞坏夹具,暴露了培训深层的认知盲区。这篇文章用真实的产线案例和可运行的代码,拆解了这些被技术人严重低估的落地难题。

我把三个AI Agent关进采购审批的黑盒,它们差点打起来——AWS Bedrock多智能体协作实录

我把企业采购审批链交给了三个AI Agent,用AWS Bedrock原生多智能体协作模式,将法务、财务、采购的串行流程自动化。文章分享从死锁噩梦到稳定上线的全过程:如何配置Supervisor路由、设计冲突解决矩阵、为每个Agent挑选模型和工具,以及通过前置过滤、Guardrails和吞吐量优化把每日推理成本压到80美元。