第30届自然语言处理经验方法会议(The 2025 Conference on Empirical Methods in Natural Language Processing, EMNLP 2025)将于2025年11月4日-11月9日在中国苏州召开。我院二年级硕士生陈鹏的论文“On Collaborating Small and Large Models for Few-shot Intent Detection”被EMNLP 2025录用。EMNLP是人工智能学会推荐的A类国际学术会议,是自然语言处理领域的顶级盛会之一,在国际上享有极高的学术声誉。
小样本意图检测(FSID)是对话系统中的一项核心且富有挑战性的任务,它旨在仅用少量标注样本对用户查询进行意图分类或识别为范围外(OOS)。现有的小模型(如PLMs)方法在数据稀疏时性能不佳,而新兴的大语言模型(LLM)方法虽能力强大,却面临着推理成本高昂和多类别干扰等实际应用瓶颈。为融合两者的互补优势,该工作提出了一种创新的大小模型协同框架(FCSLM)。该框架在训练阶段利用大模型进行数据增强,以有效训练一个任务专属的小型预测模型。在推理阶段,设计了一个多轮协同推理流程:首先由小模型高效处理绝大多数预测任务并给出候选意图;仅当预测置信度不足时,才调用大模型,利用其强大的语义理解能力进行二次精准判别和范围外检测。大量实验结果表明,所提方法在三个权威基准数据集上的意图分类和OOS检测任务中均显著超越了现有最强基线,取得了全新的SOTA(state-of-the-art)性能,为解决低资源场景下的意图识别问题提供了高效、精准的新范式。

图1 方案框架

表1 主实验结果