发现商业评论 旗下
洞察商业 启迪未来

小米Mi-BRAG框架革新AI问答,打造多场景智能知识中枢

   时间:2025-05-06 20:08 来源:ITBEAR作者:沈如风

小米公司近期揭晓了其创新的知识库问答框架——Mi-BRAG,这一框架通过四大核心技术的集成,实现了知识处理范式的革新。Mi-BRAG已经在小爱同学的个人信息问答、汽车问答助手及商品问答等多个小米内部场景中得到了广泛应用。

Mi-BRAG框架的一大亮点是全格式兼容能力,内置的智能解析引擎能够无损处理包括PDF、Word、Excel在内的十多种文档格式,为构建统一的企业知识库奠定了坚实基础。该框架还突破了传统文本的局限,能够精准解析复杂的图片、表格以及图文混排信息,实现了全模态解析。

在国际化方面,Mi-BRAG支持主流语言的文档解析与交互问答,消除了知识流通中的语言障碍。同时,其细粒度溯源功能采用动态溯源定位技术,对每个生成结果都标注了原始文档及引用位置,用户只需一键即可追溯信息源头,构建出一个可信的知识生态。

面对大模型(LLM)在知识更新成本高、企业私有知识理解不足以及数据安全隐患等方面的挑战,小米引入了RAG(检索增强生成)技术,为这些问题提供了有效的解决方案。RAG技术通过检索最新的文档或数据库,为大模型注入实时信息,确保其输出内容的准确性与时效性。同时,通过构建外部知识库,RAG技术能够增强大模型在特定领域的表现。

在数据隐私与安全性方面,RAG技术通过调用私有数据库,在生成答案时仅基于检索到的相关片段进行加工,避免了原始数据被模型存储或泄露的风险。这一特性使得Mi-BRAG在处理企业敏感数据时更加安全可靠。

小米在多个应用场景中亟须自研的RAG框架提供领域安全可靠的智能知识中枢,以提升产品的智能化水平和用户体验。无论是面向消费者的个人信息问答、智能文档问答,还是面向企业的新产品研发、员工助手、智能客服等场景,Mi-BRAG都展现出了强大的应用潜力。

小米大模型团队认为,一个完整的知识问答框架应包括知识库创建、知识检索、知识增强和回复生成四个部分。其中,知识库创建模块对问答效果至关重要,因此小米将框架命名为Mi-BRAG。Mi-BRAG支持多种格式文档解析和图文混合的多模态问答,为用户提供了丰富的应用选项。

在RAG的基础框架下,Mi-BRAG的技术创新主要集中在知识库创建、知识检索以及回复生成等方面。知识库创建方面,Mi-BRAG实现了跨模态的知识融合及“金字塔型”动态知识体系的构建;知识检索方面,增强了用户Query的理解能力和多维语义增强;回复生成方面,为知识注入了场景定制模型,并强化了无关信息的拒答和精细化的溯源能力。

在第三方评测机构SuperCLUE的综合评估中,小米Mi-BRAG在单文档问答、多文档问答及搜索问答三大典型场景中表现出色,荣登榜首。这主要得益于Mi-BRAG在抗噪声数据处理与信息整合方面的创新数据构建方法,以及其突破性的模型训练范式。

在ASQA测试集上,小米团队对Mi-BRAG和业界大模型进行了对比测试。结果显示,Mi-BRAG在多文档生成溯源准召率方面表现优异,进一步验证了其强大的知识问答能力。

 
 
更多>同类内容
全站最新
热门内容