法律AI – 伯乐青狼

我把Qwen2.5-72B扔进法律咨询聊天框，LoRA微调出的那些沉默和爆发

2026年5月21日 24 次浏览

去年秋天的一个深夜，我看着屏幕上那行“根据相关法律法规，你的问题需要进一步分析”的回复，差点把键盘砸了。这是我们内部用原生Qwen2.5-72B搭建的律师助手原型——客户问“离婚时婚前房产婚后共同还贷怎么分”，模型却像在背法条目录。我关掉终端，打开Jupyter，决定从零开始做一次垂直领域对话系统的…

72B参数挤进消费级显卡：我用QLoRA在RTX 4090上驯服法律版Qwen2.5的显存博弈

2026年5月19日 52 次浏览

我桌上这台机器只有一张RTX 4090，24GB显存。三个月前，领导丢过来一句话：“咱们能不能自己做一个法律咨询助手？别老调OpenAI的API，数据安全过不了审。”我盯着显卡的显存容量，又看了看Qwen2.5-72B的权重文件——138GB，FP16。那一刻脑子里蹦出的第一个念头是：这玩意儿连加载…