灵魂交响曲：人工智能日记(新质生产力)_第2024章丨苹果AI“苹果智能”亮相！马斯克xAI将建造超级计算机_章节免费阅读无弹窗

。

该工厂占地785,000平方英尺，地址为3231 paul r. lowry road。该建筑于2022年关闭后，phoenix investors以3500万美元的价格购入，建筑所在的土地面积达216英亩。

参议员说，“很高兴欢迎xai来到田纳西，并祝贺elon musk这一激动人心的新计划。这项投资证明了我们州在技术进步和发现方面的领导地位，并将扩展我们的人工智能能力，以解决复杂的科学和安全问题。随着这一项目的推进，田纳西将在这一迅速发展的研究领域保持领先地位。”

8．openai芯片野心曝光：百万年薪挖角

根据半导体博客semianalyi 计划将只有几个人的芯片团队扩展到几十个人。新近招募的几乎所有研究人员，都是现任或前任的谷歌tpu团队成员。消息称openai每年将向这些高级工程师提供的价值数百万美元的股权。这里的股权是指openai内部自己制定的\"利润分红单位\"的股权结构。

9．qwen2-72b：开源语言模型的新巅峰

qwen2-72b，作为 qwen 系列的最新成员，是一款具备 720 亿参数的大型语言模型，涵盖了从 0.5 到 720 亿参数的多种规模。它在语言理解、生成、多语言处理、编程、数学和推理等多个领域的基准测试中表现出色，甚至在某些任务上超越了商业模型。

该模型采用了transformer架构，并引入了swiglu 激活、注意力偏置和分组查询注意力等创新技术，同时提供了适应多种语言和代码的改进分词器。性能评估显示，qwen2-72b 在包括 mmlu、humaneval 和 gsm8k 在内的多项任务中都取得了卓越成绩，尤其在中文任务c-eval和cmmlu上的表现突出，标志着开源语言模型的重大进步。

10．l3-aethora-15b基于llama3 架构的大型语言模型

l3-aethora-15b 是一个由 steelskull 开发的高级语言模型，它采用了 llama3 架构，并通过特殊的 “abilteration” 方法调整了模型的回应，以减少拒绝性，提供更加顺畅的对话交互。该模型使用了 depth up scale（dussthrough merge 方法合并了 15b 模型，并对‘o_proj’和‘down_proj’进行了特定的调整，以提高效率和减少困惑度。在使用 r 训练方法的 4 个周期中，该模型在约

个高质量样本的 aether-lite-v1.2 数据集上进行了训练，这些样本旨在平衡创造力、不精确性和智能。该模型支持 bf16 张量类型，且因大小过大，不能通过 inference api 加载，而需通过 inference endpoints（专用）来运行。

11．日立将培训5万名员工使用生成式ai

据新浪财经，日立计划到2027年培训5万名员工，他们将能够使用生成式人工智能（ai）开发新服务。该计划将覆盖日立27万名员工中的约20%。日本国内外信息技术（it）和铁路等部门的员工将接受培训。这家日本公司将为员工提供专门的生成式ai培训，包括如何将其引入服务和产品、如何收集数据以及如何构建大语言模型。

12．al-moammar与微软等签署数据中心合同

6月9日，al-moammar information systems（mis）在沙特交易所公告称，与微软、沙特数据中心基金（ center fund 1）签署了一份联合合同，目的是提供主机代管和数据中心服务，合同价值约占该公司上一年度（2023年）收入的50%以上。

13．pika团队：打败sora不难，算法能够以小胜大

即使sora已经强势“炸”过场，pika还是再次带着硅谷一众明星资方的投票回到了舆论中心。6月5日，pika宣布已完成8000万美元（约合人民币5.8亿元）的b轮融资，总融资额达到1.35亿美元，较2023年末，公司投后估值实现翻倍至4.7亿美元。“我们会更aggressive地做视频大模型”，这家刚刚度过一周年生日的视频生成创业公司，计划在这轮融资之后快速扩张研究和工程师团队。

14．百度文库ai功能蝉联国内总榜第一名

6月7日，

夜下客

第2024章 丨苹果AI“苹果智能”亮相！马斯克xAI将建造超级计算机

第2024章丨苹果AI“苹果智能”亮相！马斯克xAI将建造超级计算机