谷歌 Gemini 家族添 Flash 新成员:平衡规模和能力、支持多模态,单次可分析 3 万行代码

IT之家 5 月 15 日消息,谷歌公司今天扩充 Gemini 家族成员,推出了全新的 Gemini 1.5 Flash 模型,重点优化了该模型的速度和效率。

谷歌 DeepMind 首席执行官德米斯・哈萨比斯(Demis Hassabis)在一篇博客文章中写道:Gemini 1.5 Flash 擅长摘要、聊天应用、图像和视频字幕、从长文档和表格中提取数据等。

哈萨比斯补充说,谷歌之所以创建 Gemini 1.5 Flash,是因为开发人员需要一个比谷歌今年 2 月发布的 Gemini 1.5 Pro 更轻便、更便宜的模型。

IT之家注:Gemini 1.5 Flash 介于 Gemini 1.5 Pro 和 Gemini 1.5 Nano 之间。谷歌表示,这是通过一个名为“蒸馏”(distillation)的过程实现的,即把 Gemini 1.5 Pro 中最基本的知识和技能转移到更小的模型上。

这意味着,Gemini 1.5 Flash 将获得与 Pro 相同的多模态功能,以及长语境窗口(人工智能模型可一次性摄取的数据量),即一百万个 tokens。

谷歌表示 Gemini 1.5 Flash 将能够一次性分析 1500 页的文档或超过 30000 行的代码库。

Gemini 1.5 Flash 并非真正面向消费者,相反,它是开发人员利用谷歌设计的技术构建自己的人工智能产品和服务的一种更快、更便宜的方式。


这是一个从 https://www.ithome.com/0/767/954.htm 下的原始话题分离的讨论话题