Gemma 2那篇技术报告我读了三遍,直到我把2B模型量化塞进安卓机,才发现离线翻译的真正代价
把大语言模型塞进手机做离线翻译,这件事听起来很性感,但在真正动手把Gemma 2部署到一台老款安卓机上时,我才意识到从论文里的BLEU分数到用户按下翻译按钮之间,隔着一整套工程血泪。Google DeepMind在Gemma 2的技术报告里展示了2B模型在FLORES-200基准上零样本翻译的亮眼数…
把大语言模型塞进手机做离线翻译,这件事听起来很性感,但在真正动手把Gemma 2部署到一台老款安卓机上时,我才意识到从论文里的BLEU分数到用户按下翻译按钮之间,隔着一整套工程血泪。Google DeepMind在Gemma 2的技术报告里展示了2B模型在FLORES-200基准上零样本翻译的亮眼数…