90MB内存、40ms延迟:我把AutoTrain微调的情感分析模型塞进了树莓派4

我过去坚信微调大模型必须跟命令行死磕,直到我在树莓派4上看到一个连GPU都没有的边缘设备、靠浏览器点几下鼠标就生成了一个准确率89%的情感分析模型,推理延迟从310ms直接降到40ms,内存占用只多了90MB。这件事让我这个从嵌入式转过来的AI部署工程师重新审视了“零门槛”这三个字的价值。 从300…