人心向背网人心向背网

总编辑圈点

科技日报记者 张梦然

谷歌公司6日宣布推出一种名为Gemini的总编新人工智能模型,声称该模型在一系列智力测试中的辑圈表现优于OpenAI的GPT-4模型和“专家级”人类。


Gemini可处理文本、总编音频和视频。辑圈
图片来源:谷歌公司

Gemini已针对不同的总编应用创建了3个版本,分别是辑圈Nano、Pro和Ultra。总编谷歌拒绝回答有关Pro和Ultra的辑圈规模、它们包含的总编参数数量、训练数据的辑圈规模或来源等问题。

其最小版本Nano旨在在智能手机上运行,总编实际上有两种模型:一种用于速度较慢的辑圈手机,拥有18亿个参数;另一种用于功能更强大的总编手机,拥有32.5亿个参数。辑圈据传GPT-4包含多达1.7万亿个参数,总编而Meta的LLAMA-2则包含700亿个参数 。

谷歌声称,Gemini的中档Pro版本击败了其他一些模型,例如OpenAI的GPT3.5,但更强大的Ultra超过了所有现有AI模型的能力。它在行业标准MMLU基准上的得分为90%,而“专家级”的人类预计能达到89.8%。

这是人工智能首次在测试中击败人类,也是现有模型中得分最高的。该测试涉及一系列棘手的问题,主题包括逻辑谬误、日常场景中的道德问题、医疗问题、经济和地理。

在同一测试中,GPT-4的得分为87%,LLAMA-2的得分为68%,Anthropic Claude 2的得分为78.5%。Gemini在其他9项常见基准测试中的8项中击败了所有这些模型。

去年,谷歌“深度思维”发布了一款名为AlphaCode的人工智能代码生成器,它可击败50%的人类开发人员,而新发布的Gemini声称可击败85%的人类编程师。

谷歌“深度思维”的艾力·柯林斯表示,Gemini“几乎在每个领域都是最先进的”。

总编辑圈点:

Gemini目前没有可供测试的版本,但谷歌却演示了它两种很“实际”的功能——解决家庭作业问题、处理实时视频能力。这不禁让“特定人群”惊呼:我现在就需要它!而对业内人士来说,这个AI更值得注意之处,是它不仅能力最强,还最通用,这意味着它可以适应各种任务。与当前许多专注于文本的模型不同,Gemini接受过文本、图像和声音方面的综合训练,能接受所有这些格式的输入然后再输出,甚至,它还比所有“前辈”模型们更擅长搞开发。

赞(72)
未经允许不得转载:>人心向背网 » 总编辑圈点