AI-NEWS · 2025年 9月 3日

谷歌推出Gemini API新功能

Google推出Gemini API URL Context功能:让AI真正理解网页内容

功能概述

2025年5月28日,Google在AI Studio平台正式推出了Gemini API URL Context功能。这项创新技术旨在让AI在浏览网页时具备类似人类的理解能力,标志着Google在人工智能领域的又一次重大突破。

技术特点

与传统方式的区别

  • 传统方式:AI通过浏览器工具或搜索引擎插件读取网页内容,通常只能获取摘要或部分信息
  • URL Context:专为开发者设计的API,能够精确解析和理解网页全部内容

处理能力

  • 支持处理高达34MB的网页内容
  • 支持多种文件格式:HTML、JSON、CSV、PDF和图像
  • 能够识别复杂结构,包括表格和脚注

技术优势

简化开发流程

Google产品经理Logan Kilpatrick表示,该功能极大简化了开发工作流程,开发者只需几行代码即可实现深度信息提取和处理。

与传统RAG流程对比

  • 传统RAG:需要内容提取、向量存储和检索机制等多个繁琐步骤
  • URL Context:直接减少这些繁琐步骤,提高效率

实际应用案例

该功能展示出强大的实用价值:

  • 从特斯拉财务报告中准确提取"总资产"和"总负债"等关键数据
  • 识别PDF文档中的复杂表格结构
  • 快速准确地获取所需信息,大幅提升工作效率

使用限制

功能限制

  • 无法突破付费墙限制
  • 对需要登录才能访问的内容无效
  • 不支持处理YouTube视频和Google文档等专业工具

成本考虑

内容处理成本按token数量计费,开发者需要合理设计信息来源以控制成本。

行业意义

URL Context功能不仅展示了AI技术的前沿发展趋势,更让我们对未来的信息检索方式有了全新的认识。这项技术的推出预示着AI在内容理解和信息处理方面将进入一个新的发展阶段。

火龙果频道