12GB显存里的ROI死磕:我把Gemma 2、Phi-3、Qwen-1.8B在法律/医疗微调上烧透了的成本账
我叫周明远,干了六年嵌入式开发,两年前因为项目需要开始往AI部署方向转。手头最常见的就是各种边缘盒子、工控机,显存从4GB到12GB不等,没有A100,更别提H100。去年年底,公司打算把法律咨询和医疗问诊的两个内部原型推到准生产环境,要求模型必须本地化部署,不能触网——这是合规底线。留给我的硬件是…
我叫周明远,干了六年嵌入式开发,两年前因为项目需要开始往AI部署方向转。手头最常见的就是各种边缘盒子、工控机,显存从4GB到12GB不等,没有A100,更别提H100。去年年底,公司打算把法律咨询和医疗问诊的两个内部原型推到准生产环境,要求模型必须本地化部署,不能触网——这是合规底线。留给我的硬件是…