马斯克 xAI 首款聊天机器人「Grok」,带有幽默感、可回答尖锐问题
马斯克(Elon Musk)成立 AI 新创 xAI 後,希望建立 AI 工具帮助人类寻求理解和知识,5 日正式推出如同 xAI 版 ChatGPT,称为「Grok」,目前先为美国少数用户提供测试机会。
Grok 以《The Hitchhiker’s Guide to the Galaxy》为蓝本所设计的人工智慧,利用对话方式让用户一问一答,几乎可以回答任何问题,更难得的是,甚至建议你应该问什麽问题。Grok 拥有一个独特且重要的优势在於,能透过 X 平台即时了解世界,也就是说与 ChatGPT 一样具有网路浏览功能,能网路上搜寻有关特定主题的最新资讯,更会回答其他 AI 系统拒绝回答的尖锐问题。
「Grok 被设计成能用一点机智来回答问题,并带有一点叛逆精神,所以如果你讨厌幽默,请不要使用它!」xAI 团队强调。
▲ 马斯克谈道 Grok 的设计带有一点幽默感。
xAI 成立後,团队训练了一个具有 330 亿参数的大型语言模型(Large Language Model,LLM)「Grok-0」,在标准语言模型基准上接近 700 亿参数版本的 LLaMA 2,但只使用 LLaMA 2 一半的训练资源。目前 Grok 背後支援的 LLM 为「Grok-1」,相较於 Grok-0 在推理和编码能力取得显着进步。
为了凸显 Grok-1 的能力,xAI 以衡量数学和推理能力的标准机器学习基准,包括 GSM8k、MMLU、HumanEval、MATH,来与竞争对手 OpenAI、Google、Meta、Anthropic、Inflection AI 开发的 LLM 比较:
▲ Grok-1 与其他大型语言模型进行数学和推理能力的测试比较。(Source:xAI 截图)
基准测试显示,Grok-1 可超越 GPT-3.5、Inflection-1、LLaMa 2(70B),然而使用大量训练资料和运算资源如 GPT-4、Claude 2、Palm 2 仍领先 Grok-1。
现在除了 ChatGPT、Bard、Claude 等聊天机器人,又有 Grok 加入市场竞争。xAI 团队指出,Grok 仍属於一个非常早期的测试版产品,期望在用户帮助下每周快速改进。马斯克则预告,一旦结束早期测试,Grok 将向所有 X Premium+ 订阅者开放使用,也藉此拉抬 X 平台的付费订阅服务。
(首图来源:达志影像)