Uber印度推出新型司机数据分类任务,支持AI模型开发
核心内容
近日,Uber在印度推出一项创新服务,允许其网约车和外卖配送司机通过应用程序利用空闲时间参与数据分类和信息收集任务。这项服务由Uber AI解决方案全球负责人Megha Yethadka在LinkedIn上宣布。
任务详情
工作形式
- 照片审核
- 物体计数
- 文本分类
- 音频录制
- 收据数字化
参与规模
- 已在印度12个城市推出
- 数万名司机开始参与"数字任务"
- 初期成果显著,计划全球推广
战略意义
Uber首席执行官Dara Khosrowshahi在8月财报电话会议中表示,推出数字任务是因为Uber具备向全球收入者分配任务的核心能力。这将创造新型收入者,参与全球激动人心的AI发展项目。
技术基础设施升级
数据管理规模
- 运营350PB(拍字节)数据湖
- 开发数据保护工具"HiveSync"
技术优化
- 推出"单区域计算"(SRC)计划
- 将所有批处理计算任务在单一区域运行
- 使用HiveSync将数据复制到第二区域
HiveSync发展历程
- 2016年开始开发
- 管理约300PB数据,存储在80万个Hive表中
- 每日复制8PB数据
- 计划开源此复制服务
- 支持向Google Cloud迁移批处理数据分析和机器学习训练系统
商业价值
这些数据分类任务将支持Uber的全球企业客户,帮助他们开发生成式AI模型或消费者应用程序,同时为司机提供额外的收入来源。