独角兽 | xAI加码 Grok1.5V真实世界理解力赋能特斯拉自动驾驶?

独角兽 | xAI加码 Grok1.5V真实世界理解力赋能特斯拉自动驾驶?
2024年04月25日 16:29 荷马国际

Grok1.5V对自动驾驶有用?英伟达高级科学家Jim Fan表示Grok-1.5V最让人兴奋的是解决自动驾驶边缘案例的潜力。

本期我们来讲讲马斯克事业版图其中之一的xAI,虽然成立时间短但知名度却较其他公司毫不逊色。人工智能浪潮被视为继工业革命和信息技术革命之后的又一次重大技术革命,正不断改变我们生活和工作的方式。而马斯克出于对AI未来安全健康发展的担忧而创办了xAI。

2023年7月12日马斯克在Twitter上宣布成立xAI,两天后召开发布会,同时宣称其公司目标是理解宇宙的真正本质。毕竟是一家人工智能公司,那研发团队的技术实力才是竞争对抗的硬道理。xAI 的初创团队中有包括马斯克在内的 12 位核心成员,这些成员来自DeepMind、OpenAI、谷歌、微软、特斯拉和多伦多大学,参与并领导了一些重大AI技术领域成果的开发,比如AlphaStar, AlphaCode, Inception, Minerva, GPT3.5和GPT4,技术创新能力毋庸置疑。此外,xAI还邀请了美国人工智能安全中心的主任 Dan Hendrycks来担任安全顾问。这些成员有哪些成就,时长有限,就不具体讲了,大家要是感兴趣可以留言,我们后面再找时间展开说明。除了这11名核心成员之外,后续xAI 也一直在招兵买马,至今X平台上还挂着招聘广告,毕竟想要对抗有600人的OpenAI,对初创团队这12人来说还是有点勉强了。

图片来源:xAI官网

俗话说麻雀虽小五脏俱全,虽说xAI公司人少,但并不影响其产品发布。公司成立三个月后,在2023年11月4日,xAI就发布了第一款产品Grok。马斯克表示Grok是一个能够实时访问X平台信息的对话机器人,并且相较于别的模型严肃的风格,会具有一定的幽默感和反叛性。这里就不得不提到马斯克的推文了,也引发了一大波用户的调侃。

图片来源:X

为Grok提供动力的引擎则是Grok1,在Grok1前还有一版Grok0(一个具有 330 亿个参数的原型 LLM ),Grok0在标准LM基准测试上接近 LLaMA 2 (70B) 功能,但仅使用其一半的训练资源。而Grok1更是不俗,在HumanEval编码任务上取得63.2%的成绩,在MMLU上取得73%的成绩,超过了GPT3.5。虽说与GPT4还有较大差距,但毕竟训练时间较短,还有成长的空间。

图片来源:xAI官网

2024年3月28日,xAI推出了Grok1.5,在推力和问题解决能力方面有了大幅度的提升。在数学基准测试中,Grok1.5获得50.6%,比Grok1提高了一倍,并慢慢接近GPT4的52.6%。而在GSM8K基准测试中Grok1.5获得90%,而Grok1才只有62.9%。值得关注的是Grok1.5的新功能是可以处理多达128K token的上下文,比上一代模型增加了16倍,就能更好地利用长文信息。Grok1.5是基于Kubernetes、Rust 和 JAX 的定制分布式训练框架构建的,xAI团队可以通过该框架高效准确地在大规模GPU集群上训练新模型。

图片来源:xAI官网

4月12日,xAI宣告Grok1.5V(Vision),这是xAI首款能同时处理文本和视频的多模态模型,还包括图表、屏幕截图和照片。并表示Grok1.5V将很快提供给早期测试者和现有的Grok 用户。

图片来源:xAI官网

Grok1.5V虽暂未开放,但根据官网公布的与其他前沿大模型对比数据,可以看到Grok1.5V能力与GPT4V基本相当,在衡量真实世界空间理解能力的RealWorldQA基准测试中更优于GPT4V。xAI官网表示提高多模态理解和生成能力是构建能够理解宇宙的有益AGI的重要步骤。后续的升级迭代还是值得期待!

图片来源:xAI官网

根据斯坦福大学发布的《2024年人工智能指数报告》数据,2023年人工智能私人投资整体下降,但对生成式人工智能的投资却激增,比2022年(约30亿美元)增长了近8倍,达到252亿美元。其中生成式人工智能领域的参与者包括OpenAI、Anthropic、Cohere、Hugging Face、Inflection、xAI等等。

图片来源:斯坦福《2024年人工智能指数报告》

就目前公开市场消息,荷小马也理了一下xAI的融资新闻:(融资数据仅供参考)

2023年12月5日,美国证券交易委员会(SEC)网站上的信息显示,xAI已经递交申请,拟通过股权融资筹集10亿美元。文件显示,xAI已从四位投资者手中筹集了近1.35亿美元的资金,首次交易发生在11月29日。同时,交易双方就购买剩余股份达成了具有约束力且可强制执行的协议。

图片来源:SEC

2024年4月7日,据华尔街日报援引知情人士消息,xAI 正与投资者洽谈融资事宜,此次融资规模达到30亿美元,这将使xAI的估值达到180亿美元。

说起大模型,除了算法之外,有大量算力和高质量的数据也很重要。Perplexity的创始人兼首席执行官Srinivas在《Invest Like The Best》播客的最近一期节目中表示:“我试图从Meta聘请一位非常资深的研究员,你知道对方怎么回应吗?——等你有了10000块H100GPU再来找我。”扎克伯格曾表示,计划今年年底前向英伟达购买35万张H100芯片,将形成相当于60万张H100的总算力,训练Llama 3大模型。

而这方面,xAI是有“存货”的。据英伟达高级 AI 科学家 Jim Fan 在他的社交媒体账号透露,xAI 是目前唯一一个可以在X(Twitter)上抓取信息来训练的人工智能公司。2023年4月马斯克购买了大约10000个 GPU,称将用于推进一个推特的全新 AI 项目,估计就是为了xAI打算。2024年马斯克又表示特斯拉今年将从英伟达及其竞争对手AMD购买大量AI芯片。后续持续的算力投入对于xAI也是不小的压力。

挑战虽艰难,但机遇已然出现。若迭代升级的Grok 1.5V真能帮助特斯拉汽车分解并理解复杂场景,这1+1可谓打出了王炸!接下来的时间,xAI还会在图像、音频和视频等各种模式上重点发力,一起跟着看看吧!

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部