AI-NEWS · 2024年 10月 30日

谷歌发布移动端可用的日语AI模型Gemmax

Google 发布全新日语Gemina AI模型

概述

在最近于东京举行的Gemma开发者大会上,Google正式发布了新的日语版Gemma AI模型。该模型的性能与GPT-3.5相当,但仅有20亿参数,使其非常紧凑且适合运行在移动设备上。

关键点:

  1. 卓越的语言处理能力:新发布的Gemma模型不仅在日语处理方面表现出色,而且保留了其英语处理的能力。这对于小型模型来说尤其重要,因为它们可能在针对新语言的微调过程中遇到“灾难性遗忘”问题,即新的知识会覆盖之前学习的信息。然而,Gemma成功克服了这一挑战,展示了强大的多语言处理能力。

  2. 快速上手支持:Google立即通过Kaggle和Hugging Face等平台发布了模型权重、训练材料及示例代码,帮助开发者更快地开始使用该模型。这意味着开发者可以更容易地在本地进行计算,尤其是在边缘计算应用中,进一步拓展了可能性。

  3. 全球通信竞赛:为了鼓励更多国际开发者,Google发起了名为“通过Gemma解锁全球通信”的比赛,总奖金额达到15万美元。这一举措旨在帮助开发者将Gemma模型适应当地语言。目前已有阿拉伯语、越南语和祖鲁语的项目正在进行中。在印度,开发者正在开展“Navarasa”项目,目标是优化该模型以支持12种印度语言,另一团队则专注于微调来支持韩语方言。

  4. 高参数效率:Gemma2系列模型旨在通过更少的参数实现更高的性能。相较于Meta等公司的类似模型,Gemma2表现相当出色,在某些情况下,仅拥有20亿参数的Gemma2甚至能超过具有700亿参数的LLaMA-2。

  5. 开发者和研究人员资源:开发者和研究者可以通过Hugging Face、Google AI Studio 和 Google Colab 的免费计划访问Gemma-2-2B 模型及其他Gemma模型,并在Vertex AI Model Garden中找到这些模型。官方网站链接如下:

    • Hugging Face
    • Google Colab

总结观点

  1. 性能与参数优化:Gemma新模型在保持高性能的同时大幅减少了参数,使其更加适合移动设备的运行。
  2. 多语言支持和竞赛激励:通过全球比赛鼓励开发者将该模型应用到不同语言中,进一步扩大其使用范围。
  3. 高效开发工具链:提供丰富的资源和支持,使得开发者能够快速上手并有效利用Gemma模型。

这些优势表明,Gemma新模型具有巨大的市场潜力,并且为移动设备和边缘计算提供了强大的AI能力。

Source:https://www.aibase.com/news/12831