AI-NEWS · 2024年 7月 26日

字节跳动发布豆包·图生图模型 豆包大模型日均tokens使用量超5000亿

归纳总结

主要事件

  • 豆包大模型日均tokens使用量超5000亿:自5月15日发布以来,豆包大模型的日均tokens使用量增长了22倍。

技术与产品更新

  1. 豆包·图生图模型

    • 能高度保留原图的人物轮廓、表情、空间结构等多维特征。
    • 支持50余种不同风格,支持图片扩展、局部重绘和涂抹玩法。
    • 应用于抖音、剪映、豆包、星绘等应用,服务于三星、努比亚等企业。
    • 涵盖手机相册、工具助手、电商营销、广告投放等领域。
  2. 豆包·文生图模型

    • 深度理解主体关系、人物构造、空间构造等信息。
    • 提升画面质感从光影明暗、氛围色彩和人物美感三个方向优化。
    • 优化中国特色内容,能够细分理解中国人物、物品、朝代、地理、美食、节日等。
  3. 豆包·语音合成模型

    • 深度理解故事情节和人物角色,正确表达情绪。
    • 保留吞音、口音等发音习惯,媲美真人音色。
    • 提供26个精品超自然音色,满足多种场景需要。
  4. 豆包·声音复刻模型

    • 仅需5秒即可复制高保真音色,高度还原说话人声音特征和口音。
    • 支持跨6大语种迁移,发音更接近于当地人表达。

企业支持与平台服务

  • 火山方舟:提供核心插件和智能体能力,全周期数据安全可信方案,支持企业便捷落地大模型。
  • 头条抖音插件升级:新增网页解析插件和计算器插件,支持企业多样的应用需求。
  • 扣子专业版:支持低代码构建契合企业业务场景的专家型“AI Bot”。
  • HiAgent平台:帮助企业快速落地与持续优化AI应用,从速度、密度、厚度三个维度赋能。
  • 火山引擎AI全栈云:支持多芯、多云架构,提供超大规模算力,支持万卡集群组网、万亿参数MoE大模型。

总结

字节跳动的火山引擎在成都发布了最新的豆包大模型,该模型日均tokens使用量已超过5000亿,并展示了其在视觉图像、语音合成、声音复刻等方面的最新能力。通过多项创新技术和平台服务,火山引擎致力于帮助企业实现业务创新和AI应用的快速落地。

Source:https://www.aibase.com/news/10590