您现在的位置是：首页 > 人工智能人工智能

Groq 获 6.4 亿美元融资；传 ResNet 作者张祥雨加盟阶跃星辰；OpenAI 研发 ChatGPT 文本水印丨AI情报局

cc博主2024-08-07【人工智能】113人已围观

今日融资快报

人工智能芯片初创公司Groq获6.4亿美元融资，挑战英伟达

Groq是一家开发芯片以比传统处理器更快地运行生成式 AI 模型的初创公司，该公司周一表示，已在由 Blackrock 领投的新一轮融资中筹集了 6.4 亿美元。Neuberger Berman、Type One Ventures、思科、KDDI 和三星 Catalyst Fund 也参与其中。

这笔资金使 Groq 的总融资额超过 10 亿美元，公司估值达到 28 亿美元，这对 Groq 来说是一次重大胜利，据报道，该公司最初希望以略低的估值（25 亿美元）筹集3 亿美元。

Meta 首席人工智能科学家 Yann LeCun 将担任 Groq 的技术顾问，英特尔代工业务前负责人、惠普前首席信息官 Stuart Pann 将加入这家初创公司担任首席运营官。

优地机器人变更为股份公司并增资至3.5亿

优地机器人（无锡）有限公司发生工商变更，市场主体类型由有限责任公司（港澳台投资、非独资）变更为股份有限公司（港澳台投资、未上市），名称变更为优地机器人（无锡）股份有限公司，同时注册资本由约1707.9万人民币增至3.5亿人民币。官网显示，优地科技专注于配送机器人核心技术的应用性研发与商业化落地。

机器人初创公司 DELIVERS.AI 新一轮融资后估值达 3,600 万美元

DELIVERS.AI 的自主移动平台使用先进的、人工智能驱动的低排放路面交付机器人和汽车，旨在使最后一英里物流变得经济实惠且可持续。

DELIVERS.AI 估值达到 3600 万美元，并筹集了新一轮融资，具体金额尚未披露。这家总部位于英国沃里克的公司获得了来自日本邮政资本、土耳其发展基金、保加利亚的推动资本和伊斯坦布尔技术大学的资金。之前的投资者包括 Driventure、Arz Portföy、StartupFON、Plug and Play Ventures、Inveo Ventures、StartersHUB 和 Kalyon Ventures。

AI驱动的饰品公司Stepin获千万元天使轮融资

Stepin是一家饰品跨境出海品牌，专注AI饰品跨境电商，借助AI技术与中国供应链优势，实现“小单快返”的快速上新、高周转模式。Stepin完成千万元天使轮融资，由新岳资本与九九资本领投，其他产业机构与天使投资人参与跟投，浪潮资本担任独家财务顾问。目前，AI在Stepin内部的应用主要是创意泛化、生成相对初级的3D模型供设计师微调。（36氪）

（欢迎添加微信AIyanxishe2，了解更多AIGC、融资情况，与志同道合的朋友一同畅聊时新AI产品）

今日大厂风闻

传 ResNet 作者张祥雨加盟阶跃星辰

量子位消息，90 后 AI 大牛张祥雨加盟阶跃星辰，他是 ResNet 的四位作者之一，孙剑的首位深度学习博士生，并且是未来科学大奖的得主。张祥雨在西安交通大学获得了软件工程学士学位，并在微软亚洲研究院与孙剑、何恺明、任少卿合作完成了 ResNet，该论文在 2016 年获得了 CVPR 最佳论文奖，并在 2023 年获得了未来科学大奖的 “数学与计算机科学奖”。

除了张祥雨，阶跃星辰还招募了其他两位万引大牛，腾讯俞刚和 MSRA 段楠。俞刚是山东大学本科生，上海交通大学硕士，南洋理工大学博士，曾在微软研究院实习，并在旷视工作期间完成了多项研究成果。段楠是 MSRA 资深首席研究员，主要从事自然语言处理等研究，并在 MSRA 工作了 17 年零 9 个月，其研究成果被应用于多款微软 AI 产品中。

OpenAI 承认正研发 ChatGPT 文本水印，但面临挑战

OpenAI 已经开发出一款能够高精度识别 ChatGPT 生成文本的工具，但迟迟未发布。对此 OpenAI 进行了回应，承认正在研究文本水印技术，但表示这项技术仍存在诸多挑战。

OpenAI设想通过微妙调整ChatGPT生成文本中的词汇选择，来在字里行间编织一张不可见的“数字指纹”——即文本水印。这一设计精妙之处在于，未来能够借助特定工具轻松识别与验证文本的原始出处，为版权保护与内容溯源开辟新径。而文本水印仅是OpenAI多元化解决方案矩阵中的一环。他们还并行研究分类器技术和元数据策略，旨在构建一个全方位、多层次的文本身份认证体系，以确保信息的来源清晰可溯。

Figure预告人形机器人二代新品，人味儿更浓、硬件更强

Figure公布了Figure 02预告片，并表示将在北京时间8月7日正式发布该产品。相对于Figure 01搭载Open AI GPT4的视频演示，此次展示介绍的重心在于硬件，预计硬件能力有大幅提升。创始人CEOBrett Adcock自信发言：Figure 02是地球上最好的人形机器人。

Google Gemini API 大降价比 GPT-4o mini 价格便宜一半

Gemini 1.5 Flash 模型的输入成本直接减半，下降了约 85%，输出成本紧随其后，大幅削减了约 80%。这意味着，现在使用 Gemini API 的成本已经低于其主要竞争对手 GPT-4o mini 近 50%。Gemini Flash 的新定价每百万 token 的输入成本仅需 0.075 美元，输出成本也只有 0.3 美元。Gemini 1.5 Flash 和 Gemini 1.5 Pro 现在支持超过 100 种语言，Google 还引入了上下文缓存和批处理 API 等创新技术。

百川智能与中国人民大学成立"大模型联合实验室"

中国人民大学与百川智能共同成立了"大模型联合实验室"，旨在推动大模型技术的创新和发展。联合实验室的成立标志着双方将在大模型预训练、对齐、检索增强、智能体、多模态等前沿技术领域展开深入合作。中国人民大学将利用其在大模型研究上的人才和技术优势，与百川智能在工程和产品研发方面的力量相结合，共同推进相关技术的研究和应用。

阿里推出Tora，「轨迹可控版Sora」让视频生成更符合物理规律

Tora是第一个面向轨迹的 DiT 架构，它将文本、视觉和轨迹条件同时集成在一起以生成视频。Tora 的设计与 DiT 的可扩展性无缝契合，允许精确控制具有不同持续时间、宽高比和分辨率的视频内容。大量实验证明，Tora 在实现高运动保真度方面表现出色，同时还能细致模拟物理世界的运动。

Meta据称与好莱坞影星洽谈AI语音项目，将提供数百万美元以获取授权

据媒体援引消息人士报道，Meta和一些演员代表之间的谈判经历了多次中断和重启，因为双方无法就演员声音的使用条款达成一致。Meta正加速推进谈判，以有足够的时间开发AI工具，期望在9月的Connect大会上发布。目前尚不清楚Meta将如何使用这些声音，最有可能的是充当数字助理。例如，用户可以与拥有奥卡菲娜声音的聊天机器人聊天。

今日产品动态

Product Hunt 热榜，Avatar Architect

Avatar Architect 是一款融合了人工智能和 Notion 的系统，旨在通过深入了解目标客户群体，帮助企业家、营销人员和产品开发者提升营销策略和销售业绩，同时提供一系列工具和指南来构建和管理客户画像。

Avatar Architect 的优势在于其 AI 驱动的高效性、为目标市场提供的深入洞察以及指导产品开发的详细客户信息。该系统适合独立创业者、营销人员和产品开发者，特别适合那些希望深入了解客户并提升营销策略的用户。用户可以根据自己的业务需求自定义系统的功能，并且应定期更新客户数据以获得最佳效果。

? https://gcproductivity.gumroad.com/l/avatararchitect/ProductHunt?ref=producthunt

开发者推荐

1.简单提示轻松创建小程序代码LlamaCoder

LlamaCoder 是一个基于 Llama3.1405B 模型的平台，它通过强大的自动化能力，使得开发者只需提供简单的指令，就能快速生成完整的 React 应用程序和组件。该平台采用了现代化的技术栈，包括 Next.js 和 Tailwind 等流行技术，提供了一个既美观又易用的界面。LlamaCoder 的功能设计考虑了全面，包括代码沙箱、Helicone 集成和 Plausible 工具的使用，以提高开发效率和产品优化。入门门槛低，用户只需克隆代码库并设置 API 密钥，即可通过 npm 命令启动项目。目前已开源。

? https://llamacoder.together.ai/

2.Supermemory 个人知识库项目

该项目允许用户将网络信息如网页、推特和笔记等内容保存起来，并利用其内置的人工智能功能进行高效的搜索和提问。以二维画布的形式组织信息，帮助用户更好地理解和关联知识点。基于已保存数据提供 AI 辅助写作功能。支持与 Telegram、Twitter 等平台集成。

github?https://github.com/supermemoryai/supermemory网站?https://supermemory.ai/onboarding

特别关注

Jim Fan：机器人数据的放大是解决机器人技术发展中的关键问题

英伟达高级研究科学家、具身智能负责人兼 Embodied AI（GEAR 实验室）负责人Jim Fan 发布了 Project GR00T 的最新进展，提出了一种系统化的方法来放大机器人数据集，通过人类在真实机器人上的演示，结合模拟技术，将数据量扩大 1000 倍或更多，以解决机器人技术中的数据瓶颈问题。

利用 Apple Vision Pro 技术，实现人类操作员对人形机器人的第一人称控制。Vision Pro 能够实时解析人类手部姿势并映射到机器人手上，使得操作者感觉自己沉浸在另一个身体中，尽管远程操作较慢，但可以收集少量高质量的数据。

使用 RoboCasa 这一开源的生成模拟框架，通过改变环境的视觉外观和布局，将单一的真实演示数据扩展到多种多样的环境中，从而产生大量多样化的演示数据。这使得一个实体厨房的数据可以扩展到无限多的模拟厨房场景中。

应用 MimicGen 技术，根据原始的人类演示数据生成大量新的动作轨迹，并过滤掉失败的尝试，从而形成一个更大、更丰富的数据集。

通过这种方法，从一条人类轨迹开始，RoboCasa 可以产生 N 个不同视觉效果的数据，而 MimicGen 进一步增强到 NxM 个不同动作的数据。这种方法通过 GPU 加速的模拟，以计算能力为代价，解决了昂贵的人类数据收集问题，打破了传统的、以原子世界为限的数据收集障碍。

?https://x.com/DrJimFan/status/1818302152982343983

敬请期待明日的最新动态！

AI情报局征集情报合伙人，汇集独家价值线索！如果您可以提供有关AI最新融资&行业内幕&独特产品，请添加运营微信号：AIyanxishe2备注行业岗位。

雷峰网(公众号：雷峰网)

雷峰网版权文章，未经授权禁止转载。详情见转载须知。