当前位置:首页 > 资讯中心 > 广东企划平台-广东企划行业交流平台 > 正文

Meta发布最强开源模型Llama 3.1 405B,扎克伯格:明年开源大模型全面领先闭源

2024-07-25 10:36 精品歌词网

【TechWeb】7月24日消息,Meta推出开源模型Llama 3.1,包括3个大小版本,分别是迄今为止最强大的开源模型Llama 3.1 405B,以及全新升级的Llama 3.1 70B和8B模型。

Meta CEO扎克伯格的公开信也在官网贴出,他指出,开源大模型正在迅速缩小差距。去年,Llama 2 还只能与上一代闭源模型性能相当;今年,Llama 3 与最先进的模型相媲美,并在某些领域处于领先地位;从明年开始,预计未来的Llama模型将成为业内最先进的。

同时,Meta AI宣布已接入Llama 3.1 405B,并推出AI图片编辑、AI编程等新功能。

Llama 3.1 405B性能超GPT-4o,采用超16000个H100 GPU训练

Meta在公开文档中介绍,Llama 3.1将上下文长度扩展到 128K,增加了对八种语言的支持。

其中,Llama 3.1 405B在基于15万亿个Tokens、超16000个H100 GPU上进行训练,这是Meta有史以来第一个以这种规模进行训练的Llama模型。

Llama 3.1 405B 在常识、可操纵性、数学、工具使用和多语言翻译方面的最先进能力方面可与GPT-4o、Claude 3.5 Sonnet和Gemini Ultra等顶级 AI 模型相媲美。

最新推出的Llama 3.1 8B 和 70B 模型的升级版本,支持相同的128K Tokens上下文窗口、多语言、改进的推理和最先进的工具使用,能够支持高级应用,例如长篇文本摘要、多语言对话代理和编码助手。

升级后的Llama 3.1 8B和70B模型,相比于同样参数大小的模型如Gemma2 9B、GPT3.5 Turbo等性能表现也更好。

另外,在现实场景中,Llama 3.1 405B进行了与人工评估的比较,总体表现优于GPT-4o和Claude 3.5 Sonnet。

Meta还对许可证进行了更改,允许开发人员使用 Llama 模型(包括 405B)的输出来改进其他模型。

从今天开始,Meta将在 llama.meta.com 和 Hugging Face 上提供这些模型供下载,用户可在合作伙伴平台生态系统上立即开发。

扎克伯格:通过封闭大模型来防止中国获得AI优势,行不通

在Llama 3.1发布之际,扎克伯格还发表了题为《开源AI是前进的道路》的署名文章。

扎克伯格认为,今天,几家科技公司正在开发领先的闭源模型,但开源正在迅速缩小差距。

去年,Llama 2 还只能与上一代闭源模型相当;今年,Llama 3 与最先进的模型相媲美,并在某些领域处于领先地位。从明年开始,预计未来的 Llama 模型将成为业内最先进的。

在文章中,扎克伯格从三个方面谈到了开源AI的好处,以下为重点摘要:

1、为什么开源AI对开发人员有好处

我们需要掌控自己的命运,而不是被锁定在封闭的供应商身上。许多组织不想依赖他们无法运行和控制的模型。他们不希望封闭模型提供商能够更改他们的模型、更改他们的使用条款,甚至完全停止为他们提供服务。他们也不想被锁定在拥有模型专有权的单一云中。开源使拥有兼容工具链的广泛公司生态系统成为可能,您可以轻松地在这些工具链之间移动。

我们需要保护我们的数据。许多组织处理需要保护的敏感数据,并且不能通过云 API 将其发送到封闭模型。其他组织根本不信任封闭模型提供商处理他们的数据。开源通过允许开发者在任何地方运行模型来解决这些问题。人们普遍认为,开源模型往往更安全,因为它的开发更加透明。

2、为什么开源AI对Meta有利

人们经常问我是否担心开源 Llama 会使得Meta失去技术优势,但我认为这忽略了大局,原因如下:

首先,为了确保我们能够使用最好的技术,并且不会长期被锁定在封闭的生态系统中,Llama 需要发展成为一个完整的生态系统。如果我们是唯一一家使用 Llama 的公司,这个生态系统就不会发展。

其次,我预计人工智能开发将继续非常具有竞争力,这意味着开源任何给定的模型并不会放弃当时相对于下一个最佳模型的巨大优势。Llama 成为行业标准的道路是一代又一代地保持竞争力、效率和开放。

第三,Meta 和封闭模型提供商之间的一个关键区别是,出售人工智能模型的访问权限不是我们的商业模式。这意味着公开发布 Llama 不会像闭源模型提供商那样削弱我们的收入、可持续性或投资研究的能力。(这也是一些闭源模型提供商不断游说政府反对开源的原因之一。)

最后,Meta 拥有悠久的开源项目和成功历史。我们通过开放计算项目发布我们的服务器、网络和数据中心设计,并让供应链在我们的设计上实现标准化,从而节省了数十亿美元。我们通过开源领先的工具(如 PyTorch、React 等)从生态系统的创新中受益。只要我们长期坚持,这种方法就一直对我们有效。

3、为什么开源AI对世界有益

与任何其他现代技术相比,AI 更具有潜力提高人类的生产力、创造力和生活质量,并加速经济增长,同时推动医学和科学研究的进步。开源将确保全世界更多的人能够享受 AI 带来的好处和机会,权力不会集中在少数公司手中,并且该技术可以更均匀、更安全地部署到整个社会。

有些人认为,我们必须封闭我们的模型,以防止中国获得这些模型,但我认为这行不通,只会让美国及其盟友处于不利地位。

将美国创新限制在封闭开发中,增加了我们完全无法领先的可能性。相反,我认为我们最好的策略是建立一个强大的开放生态系统,让我们的领先公司与我们的政府和盟友密切合作,以确保他们能够最好地利用最新进展,并在长期内实现可持续的先发优势。

我相信 Llama 3.1 版本将成为行业的一个转折点,大多数开发人员将开始主要使用开源。

接入Llama 3.1 405B的Meta AI

最后,再看看已经接入Llama 3.1 405B大模型的Meta AI还能怎么玩儿。此次推出的一批新的Meta AI创意工具主要聚焦视觉生成、数学和编码等领域。Meta AI也放出了一些演示视频。

以复杂推理为例,根据提示:“我有 3 件衬衫、5 条短裤和 1 件太阳裙。我要旅行 10 天,我的假期够穿吗?”,Meta AI能给出一些好的建议。

或者通过编码助手,Meta AI能创建一个使用递归回溯算法或深度优先搜索算法生成完美迷宫的程序,具有可自定义的大小和复杂性。(果青)

上一篇:广电总局:拟8月份起不播娱乐性强的古装剧偶像剧
下一篇:纯国产自研!龙芯3C6000服务器CPU流片成功:性能成倍提升
  • OpenAI董事会再添新人!美国前国安局局长重磅加入

    OpenAI董事会再添新人!美国前国安局局长重磅加入

    财联社6月14日讯(编辑周子意)美国人工智能公司OpenAI周四(6月13日)宣布其董事会再添一名新成员——保罗·中曾根(PaulM.Nakasone)。中曾根曾任美国国家安全局(NSA)局长,他也是在任时间最长的美国网络司令部司令和中央安全局(C…
    06-15
  • 微博电影之夜星光闪耀 影人齐聚共创行业未来

    微博电影之夜星光闪耀 影人齐聚共创行业未来

    6月10日,2023微博电影之夜在昆山如约举行。本届盛典由新浪微博和电影频道两大平台强强联合,云集众多行业嘉宾及大咖影人,群星齐聚在美丽昆山共同见证多项电影荣誉揭晓。最终,《保你平安》《长空之王》《人生路不熟》获年度观众喜爱影…
    06-12
  • 张歆艺曝儿子看熊猫不想回家 萌宝头发浓密肉嘟嘟

    张歆艺曝儿子看熊猫不想回家 萌宝头发浓密肉嘟嘟

    9月8日,侃膳斋棒棒鸡张歆艺发微博晒儿子近照,并配文称:“第一次看见大熊猫,兴奋得不想回家。”9月8日,张歆艺发微博晒儿子近照,照片中的宝宝和熊猫同框,从背影看宝宝后脑勺圆润头发浓密,胳膊肉嘟嘟的,盯着大熊猫看得很是专注。张…
    09-08
  • 刘诗诗产后复工状态好 搭档朱一龙演《亲爱的自己》

    刘诗诗产后复工状态好 搭档朱一龙演《亲爱的自己》

    8日,刘诗诗产后复工下班图曝光。照片中,贼牛网刘诗诗半扎马尾,贼牛网身穿浅色卫衣搭配牛仔裤,气质温柔沉静让人挪不开眼。据悉,目前刘诗诗、朱一龙正在搭档拍摄《亲爱的自己》,之前就有下班图流出,旁边围观群众都惊呼刘诗诗脸好小…
    10-10
  • 贝克汉姆为儿子庆17岁生日 罗密欧可爱童年照曝光

    贝克汉姆为儿子庆17岁生日 罗密欧可爱童年照曝光

    9月1日是贝克汉姆二儿子罗密欧的17岁生日,晚间,贝克汉姆通过微博晒罗密欧童年旧照,并为儿子送上祝福,“生日快乐我的大男孩罗密欧,我为你从一个漂亮的小男孩成长为一个帅气的大男生感到骄傲1照片中,童年罗密欧插着腰,十分的可爱。…
    09-02