Gemini拆解谷歌 :与GPT-4“掰手腕”的能力 现在可以免费使用

Gemini gpt 免费 能力 谷歌 2024-01-04 57

摘要:12月7日上午,上述算法工程师体验了实际搭载GeminiPro的Bard,并就多模态能力方面,对Gemini与GPT-4进行了对比测试。这位算法工程师实际使用对比后的感受是,Gemini达到了上述目的,但这是否表明其已经对GPT-4形成了“全面超越”?...

12月6日深夜,Google(谷歌)推出了“迄今为止,功能最强大、最通用的人工智能大语言模型”Gemini(双子星)。Gemini经过了广泛使用的32个基准测试,在其中大部分基准测试中,表现出了“最先进的性能”,不仅击败了OpenAI的GPT-4,甚至在MMLU(大规模多任务语言理解)基准测试中,成为第一个超越人类专家的模型。

“这是人工智能模型的巨大飞跃,最终将影响几乎所有的Google产品。”谷歌CEO Sundar Pichai(桑达尔·皮查伊)与DeepMind CEO Demis Hassabis(德米斯·哈萨比斯)联名表示。

Gemini最早是在今年5月举行的开发者大会上公布的,当时宣布将有不同尺寸和功能应用场景的设计。Gemini是由Google DeepMind开发出的原生多模态模型,该项目启动于今年4月20日。谷歌与DeepMind合并后,成立了Google DeepMind,并宣布将公司的资源结合,创新研发大模型以对标OpenAI的GPT-4。今年6月以来,Gemini系统的强大性引起了广泛关注。

Gemini共有Ultra、Pro和Nano三个版本,分别适用于不同场景,其中Ultra版可用于大型数据中心等,属于处理高复杂度任务的模型;Pro版则用于各种扩展任务,已被搭载于谷歌的对话机器人Bard中;Nano版则是应用于智能手机等移动设备终端上的模型。

Gemini模型的训练数据集既多模态又多语言,来自网络文档、书籍和代码的数据,包括图像、音频和视频数据等。谷歌拿自家海量云存储的图片进行了预训练,将模型的多模态能力提升到了新的高度。

Gemini Pro的多模态能力可以抗衡GPT-4,而且可以免费使用,相比之下,GPT-4有时间限制。Gemini模型的强大性引起了人们对其与GPT-4的比较和竞争的关注。

Gemini的技术报告中提到的多达八百余人的作者名单展示了谷歌在Gemini模型开发与技术创新方面投入的AI人才之多。Gemini能够证明原生多模态训练的范式是可行的,且容易扩展到视频格式,这一技术路线备受期待。

Gemini的技术报告中也提到了数据质量对于高性能模型至关重要的观点,谷歌表示将继续寻找预训练的最佳数据集分布方案。Gemini将在更多的产品和服务中得到应用,为后续Gemini的迭代提供有力支持。

相关推荐