AI-NEWS · 2024年 11月 27日

研究者福音！新工具大幅提升效率

开放学者（OpenScholar）：科研助手的革命性突破

概述

开放学者（OpenScholar）是AI2研究团队开发的一款强大的文献综述写作工具。它利用其庞大的知识库——OpenScholar-Datastore (OSDS)，包含4.5亿篇开放访问论文和2.37亿段嵌入文章，帮助科研人员快速、准确地完成文献综述。

核心技术

OpenScholar-Datastore

数据量：4.5亿篇开放访问论文，2.37亿段嵌入文章。
工作流程：
- 使用检索器和重新排序模型（re-ranker）快速筛选相关文献片段。
- 利用语言模型（LM）提供完整且附带引用的回答。
- 根据用户自然语言反馈持续改进答案。

模型训练与评估

训练数据生成

使用OpenScholar的自我反馈检索增强推理机制，生成高质量的训练数据。
首先选择数据库中被引最多的论文，并基于摘要生成信息查询问题。
通过OpenScholar的推理过程生成高质量答案及其中间反馈。

模型评估

创建SCHOLARQABENCH测试平台：
- 包含2967个专家编写的文献综述问题，覆盖计算机科学、物理学、生物医学和神经科学四个领域。
- 使用自动化指标和人类评估结合的方式进行全面评估。

实验结果

性能表现：OpenScholar在SCHOLARQABENCH测试中显著优于其他模型，并且在某些领域甚至超过了人类专家。
- 在计算机科学领域，OpenScholar-8B的准确性比GPT-4高出5%，比PaperQA2高出7%。
- 引用准确度与人类专家相当，而GPT-4的引用伪造率为78-90%。

结论

开放学者（OpenScholar）不仅能够帮助研究人员节省大量时间和精力，还能提高文献综述的质量和效率。预计在未来不久，它将成为科研人员不可或缺的重要助手。

Source:https://www.aibase.com/news/13520

您可能还喜欢...