。
该工厂占地785,000平方英尺,地址为3231 paul r. lowry road。该建筑于2022年关闭后,phoenix investors以3500万美元的价格购入,建筑所在的土地面积达216英亩。
参议员说,“很高兴欢迎xai来到田纳西,并祝贺elon musk这一激动人心的新计划。这项投资证明了我们州在技术进步和发现方面的领导地位,并将扩展我们的人工智能能力,以解决复杂的科学和安全问题。随着这一项目的推进,田纳西将在这一迅速发展的研究领域保持领先地位。”
8.openai芯片野心曝光:百万年薪挖角
根据半导体博客semianalyi 计划将只有几个人的芯片团队扩展到几十个人。新近招募的几乎所有研究人员,都是现任或前任的谷歌tpu团队成员。消息称openai每年将向这些高级工程师提供的价值数百万美元的股权。这里的股权是指openai内部自己制定的\"利润分红单位\"的股权结构。
9.qwen2-72b:开源语言模型的新巅峰
qwen2-72b,作为 qwen 系列的最新成员,是一款具备 720 亿参数的大型语言模型,涵盖了从 0.5 到 720 亿参数的多种规模。它在语言理解、生成、多语言处理、编程、数学和推理等多个领域的基准测试中表现出色,甚至在某些任务上超越了商业模型。
该模型采用了transformer架构,并引入了swiglu 激活、注意力偏置和分组查询注意力等创新技术,同时提供了适应多种语言和代码的改进分词器。性能评估显示,qwen2-72b 在包括 mmlu、humaneval 和 gsm8k 在内的多项任务中都取得了卓越成绩,尤其在中文任务c-eval和cmmlu上的表现突出,标志着开源语言模型的重大进步。
10.l3-aethora-15b基于llama3 架构的大型语言模型
l3-aethora-15b 是一个由 steelskull 开发的高级语言模型,它采用了 llama3 架构,并通过特殊的 “abilteration” 方法调整了模型的回应,以减少拒绝性,提供更加顺畅的对话交互。该模型使用了 depth up scale(dussthrough merge 方法合并了 15b 模型,并对‘o_proj’和‘down_proj’进行了特定的调整,以提高效率和减少困惑度。在使用 r 训练方法的 4 个周期中,该模型在约
个高质量样本的 aether-lite-v1.2 数据集上进行了训练,这些样本旨在平衡创造力、不精确性和智能。该模型支持 bf16 张量类型,且因大小过大,不能通过 inference api 加载,而需通过 inference endpoints(专用)来运行。
11.日立将培训5万名员工使用生成式ai
据新浪财经,日立计划到2027年培训5万名员工,他们将能够使用生成式人工智能(ai)开发新服务。该计划将覆盖日立27万名员工中的约20%。日本国内外信息技术(it)和铁路等部门的员工将接受培训。这家日本公司将为员工提供专门的生成式ai培训,包括如何将其引入服务和产品、如何收集数据以及如何构建大语言模型。
12.al-moammar与微软等签署数据中心合同
6月9日,al-moammar information systems(mis)在沙特交易所公告称,与微软、沙特数据中心基金( center fund 1)签署了一份联合合同,目的是提供主机代管和数据中心服务,合同价值约占该公司上一年度(2023年)收入的50%以上。
13.pika团队:打败sora不难,算法能够以小胜大
即使sora已经强势“炸”过场,pika还是再次带着硅谷一众明星资方的投票回到了舆论中心。6月5日,pika宣布已完成8000万美元(约合人民币5.8亿元)的b轮融资,总融资额达到1.35亿美元,较2023年末,公司投后估值实现翻倍至4.7亿美元。“我们会更aggressive地做视频大模型”,这家刚刚度过一周年生日的视频生成创业公司,计划在这轮融资之后快速扩张研究和工程师团队。
14.百度文库ai功能蝉联国内总榜第一名
6月7日,