AI-NEWS · 2024年 7月 22日

微软研究人员SpreadsheetLLM项目,教AI“读懂”电子表格内容

微软SpreadsheetLLM项目总结

项目背景

微软研究人员发布了一项名为SpreadsheetLLM的创新研究,旨在解决大语言模型(LLM)解析电子表格时遇到的难题。

研究亮点

  1. 技术框架:通过一种编码框架,使得LLM能够“读懂”电子表格内容。
  2. 提升效率:显著提升电子表格的数据管理和分析效率。
  3. 自然语言交互:用户可以用自然语言向AI提出问题,无需掌握复杂的公式和操作。

挑战

  1. 体积庞大:电子表格体积可能超出LLM一次性处理的字符限制。
  2. 二维布局:电子表格采用的是二维布局,而LLM擅长处理线性输入。
  3. 特定格式理解:LLM通常没有专门的训练来解读单元格地址及特定格式。

技术细节

SheetCompressor

  • 结构锚点
  • 减少令牌数量的方法
  • 聚类相似单元格

利用这些模块,将编码所需的令牌数量减少了96%,并取得了12.3%的改进效果。

Chain of Spreadsheet

教会LLM如何在压缩后的电子表格中找到相关信息并生成回答。

应用与未来计划

  • 增强Excel功能:有望显著提升微软Copilot在Excel中的功能,处理更复杂的数据分析任务。
  • 未来研究方向
    • 对单元格背景色的编码
    • 加深对单元格内容关联性的理解

面临的问题

  • 生成数据准确性
  • 高计算资源消耗

总结

SpreadsheetLLM项目展示了微软在提升AI解析电子表格能力方面的突破,通过SheetCompressor和Chain of Spreadsheet两大核心技术,大幅提升了LLM对电子表格的理解能力,并为未来的应用奠定了基础。然而,仍需克服生成数据准确性和计算资源消耗等挑战。

Source:https://www.aibase.com/news/10474