发现商业评论 旗下
洞察商业 启迪未来

阿里发布ZeroSearch模型,无需搜索引擎即可自我提升搜索能力

   时间:2025-05-09 21:13 来源:ITBEAR作者:顾雨柔

阿里巴巴近期在人工智能领域迈出了重要一步,正式开源了一款名为ZeroSearch的大模型,这一创新技术被标榜为无需依赖真实搜索引擎便能激发强大搜索能力的解决方案。

据官方介绍,ZeroSearch是一个基于强化学习的框架,其核心在于提升大型语言模型(LLM)的搜索效能,而这一切的实现无需借助任何真实的搜索引擎。这一技术突破,为LLM在搜索领域的应用开辟了新的路径。

在开发过程中,阿里巴巴的研究团队首先通过监督式微调,将LLM转化为一个检索模块,该模块能够针对查询生成相关或含有噪声的文档。为了进一步激发模型的推理潜能,他们引入了课程化展开机制。这一机制通过逐步增加检索任务的复杂性,让模型在不断挑战中锻炼其思考能力。

经过在多个领域内外数据集的广泛实验,结果显示,ZeroSearch在没有产生任何API费用的情况下,其性能甚至超越了基于真实搜索引擎的模型。这一成果不仅彰显了ZeroSearch的高效性,也体现了其在成本控制上的显著优势。

ZeroSearch还展现出了良好的泛化能力。它能够在不同规模的基础型和指令微调型LLM上稳定运行,并支持多种强化学习算法。这一特性使得ZeroSearch在实际应用中具有更高的灵活性和适应性。

在7大问答数据集评测中,ZeroSearch的性能表现尤为亮眼。数据显示,其70亿参数模型的得分高达33.06,超越了谷歌搜索的32.47分。同时,与通过SerpAPI使用谷歌搜索训练所需的高昂费用相比,使用140亿参数的模拟LLM在四个A100 GPU上进行训练的成本降低了87.93%。具体而言,通过SerpAPI训练64,000个查询的费用约为586.70美元,而使用ZeroSearch的训练成本仅为70.80美元。

目前,ZeroSearch已在Qwen-2.5、LLaMA-3.2等多个主流模型家族中得到了验证。为了推动这一技术的广泛应用和发展,阿里巴巴研究团队已将全部代码、数据集及预训练模型开源至GitHub和Hugging Face平台。这一举措无疑将为更多开发者提供学习和应用ZeroSearch的机会,共同推动人工智能领域的创新与发展。

开源地址:(点击此处访问)

 
 
更多>同类内容
全站最新
热门内容