您现在的位置是:首页 > 人工智能人工智能
独家丨一位 AI 科学家,拒绝了张一鸣开出的千万年薪
cc博主2023-03-31【人工智能】335人已围观
作者丨李梅
编辑丨陈彩娴
AI 科技评论独家获悉:字节跳动向知名 AI 青年科学家、深度学习框架 MXNet 作者李沐发出邀请,希望请他加入字节参与大模型研发,开出千万年薪。尽管条件丰厚,但综合考虑后,李沐选择了婉拒。
日前,AI科技评论报道了前亚马逊机器学习部门首席科学家 Alex Smola 和李沐师徒离职、宣布在大模型赛道创业的消息。李沐与博士导师 Alex Smola 创立了一家公司,叫 Boson.ai,受到行业热烈关注。
大模型的门槛高,据统计,全球能训练大模型的 AI 科学家不超过 500 人,华人科学家则更少,抢人成为近日国内大厂的重头戏。雷峰网(公众号:雷峰网)得到消息,字节跳动的创始人张一鸣曾亲自邀请李沐,不过李沐婉拒了这个年薪千万的工作机会,最终选择在硅谷创业。
李沐的选择出乎当前行业主流观点的意料之外。大家的共识是:国内能做成大模型的互联网科技大厂最终不会超过5家,BATH+字节;按照以往的规律,创业公司在大厂的挤兑下没有生存的空间。但李沐对张一鸣说不的这一举动,却给了大模型的小创业团队一个新的启示:
大厂并非唯一选择。
尽管大厂有几万人,但最终主导大模型研发的团队不过几十人。一方面,大厂有太多来自架构、业务、资源分配等方面的不确定性因素,最终能做成什么样还是未知数;另一方面,在一个新的、需要抢跑的赛道中,一个有能力、有决心 all in 的平台,或许更能把握节奏,抢占先机。
最终,大模型做成,技术平台积淀,再以数亿的金额卖给大厂,也不失为一个好的选择。进可攻,退可守,创业成为明星科学家眼中更「香」的选择。
(AI科技评论将持续关注大模型创业动态,欢迎添加本文作者微信ExperienceMachine交流爆料、互通有无)
—— 1 ——
李沐的「选择」
李沐
这不是李沐第一次创业。
在上一波深度学习落地潮中,AI人才大规模流向工业界,彼时快要博士毕业的李沐也抓住机遇,选择与他的两位导师Alex Smola和Dave Andersen一起创业,成立了一家公司Marianas Labs,李沐出任CTO。起初,公司的项目进展很顺利,还被一家上市公司看中,就将公司卖给了对方,但后来还是终止了合作。最后,由于团队核心人员离开,Alex和Dave分别去了亚马逊和谷歌,李沐的这次创业便就此终止。
紧接着,又一次重要的选择来到李沐面前。谷歌的AI掌门人Jeff Dean向李沐发来一封邮件邀请他去谷歌工作。当时Jeff Dean主导的深度学习框架Tensorflow问世,实力非常强,这对李沐而言当然是一个很好的机会。
但李沐还有自家的MXNet要发展,他认为“自己挖的坑,总是要自己填的”。当时李沐也考虑了一些技术性强的小创业公司,但从MXNet的发展来看,还是要找家巨头来依靠更好,所以去亚马逊是更优选择。
于是李沐就先以兼职的身份去了亚马逊,带着一些人做MXNet开发和AWS上深度学习的应用。之后李沐于2016年7月正式入职亚马逊AWS,直接向担任副总裁级别科学家的Alex汇报。
如今,六年多过去,在新一轮AI大模型热潮下,李沐面临着更大的机遇和更多的选择。如同许多下场创业的AI科学家一样,李沐也已经瞄准大模型,准备开启新事业。
Boson.ai 官网
—— 2 ——
顶级科学家选择创业 更能 All in 大模型
字节跳动已经入场语言生成大模型,挖人才进来正是头等大事。字节现已经揽入一名大将,原达摩院大模型M6带头人杨红霞。而据知情人士称,张一鸣亲自给在国外巨头工作的华人科学家打电话,邀请他们回国加入字节大模型事业。
像李沐这样的顶级科学家,选择自己创业,而对大厂的招揽有所保留,这并不是个别现象,亦有其合理性。大厂固然体量大、资源多,但真要论内部专门投入做大模型的人才密度,恐怕并不高,再加上资源分配等方面可能存在诸多束缚,大厂最终能否做好自己的ChatGPT是一个问号。因此,在顶级科学家眼里,大厂并非是唯一的、最好的去处。
语言生成大模型本身也有很高的技术壁垒,所以,相比去一家声量大但大模型并非主要方向的公司,建立一支更重视AI、能够all in大模型的团队,或许是更聪明的选择。
这是经过许多历史验证的,比如当年的百度少帅之一、曾任字节跳动AI Lab总监的李磊,曾考虑去百度新闻做推荐系统,当时刚离开百度、创立地平线的余凯劝说他,最好去一个推荐系统是核心业务、受重视的地方,哪怕是家小公司。最后李磊便加入了当时规模还不大的今日头条。
而且,创业如果成功,卖给大厂如亚马逊后带来的收益,也并非现在加入大厂拿千万美元年薪所能相比的。
(预告:2012年后,以余凯为代表的一群华人科学家从硅谷NEC Lab离开回国,直接推动了中国AI产业变革,也影响了包括李沐、李磊在内的一大批AI大牛。雷峰网后续将推出相关文章《硅谷NEC Lab往事》,欢迎添加作者微信ExperienceMachine交流)
另外,从亚马逊在这一波AI大模型竞争中的位置来看,尽管亚马逊也已经布局,且内部已经开始测试类GPT工具,但目前在美国战场占据制高点的,无疑还是微软与谷歌两大巨头。像李沐和其导师Alex Smola这样的科学家们,有技术、有影响力,也不会缺投资,所以他们要参与这一波竞争,创业的确是一个不错的选择。
而在技术优势方面,ChatGPT目前主要是堆数据、堆参数的方式,其模型效果具有一定的偶然性,在工程优化、降低成本方面还有很大的空间。而李沐正是做系统出身,非常擅长工程优化这一块,所以他的机会很大。
(公众号:雷峰网)
雷峰网原创文章,未经授权禁止转载。详情见转载须知。
Tags:
相关文章
- 独家丨王慧文仍在招兵买马,意向收购两家清华 NLP 校友公司
- GAIR 2023 预热沙龙:SaaS 创业者如何迎接 ChatGPT 时代?
- 数据动起来、算力动起来、算法动起来,浪潮数据云“解放”数据价值
- 腾讯提出蛋白质研究AI模型,预测准确率刷新纪录,入选Nature子刊
- 国产操作系统新进展:OpenCloudOS社区推出首个全自研发行版
- 区块链成数据要素关键技术 信通院TBI成立首个专项研究组
- Copilot引发的生产力革新战争,才刚刚开始
- 年度黑马第二代骁龙7+:左手普及旗舰体验,右手给手机市场破题
- 博鳌亚洲论坛|腾讯汤道生:AI驱动、全真互联、深入产业是下一代互联网的三个趋势
- 百度沈抖:推动数字经济要办实事,少吹牛多交付
热门文章
- 香港VPS低至6折93元/年,全场8折,香港CN2,洛杉矶CN2 GIA,洛杉矶9929,洛杉矶CMIN2,日本大阪/东京IIJ,日本BGP,韩国BGP,英国伦敦AS9929住宅IP
- 低至4折,2核4GB内存VPS/GPU独服 $2.99/月起,GPU VPS/GPU专用服务器 $13/月起,物理专用服务器$29/月起,可免费试用
- 美国/香港VPS年付99元起,双核/2GB/15GB SSD/500GB流量@100Mbps带宽
- MIT 热门研究:AI 工具“带飞”科研,但也严重加速内卷
- 知乎直答亮相“学术酒吧”开放麦,李开复、刘知远相聚“AI上头俱乐部”
- RISC-V要成为「显性」技术,到了关键时期
- 国行 iPhone 16 相机控制也接入视觉智能了!可一键调用阶跃星辰智能助手「跃问」
- 英伟达SC24六大技术亮点,不止加速超算500强
- 超越 GPT-4o 和 Gemini-1.5,阶跃星辰拿下中国大模型第一
热评文章
「11月18日」2024年V2ray/Clash/SSR/Shadowrocke泰国-新加坡免费节点
MIT 热门研究:AI 工具“带飞”科研,但也严重加速内卷
国行 iPhone 16 相机控制也接入视觉智能了!可一键调用阶跃星辰智能助手「跃问」
知乎直答亮相“学术酒吧”开放麦,李开复、刘知远相聚“AI上头俱乐部”
黄仁勋亲述创业故事:两次都差点倒闭
低至4折,2核4GB内存VPS/GPU独服 $2.99/月起,GPU VPS/GPU专用服务器 $13/月起,物理专用服务器$29/月起,可免费试用
RISC-V要成为「显性」技术,到了关键时期
香港VPS低至6折93元/年,全场8折,香港CN2,洛杉矶CN2 GIA,洛杉矶9929,洛杉矶CMIN2,日本大阪/东京IIJ,日本BGP,韩国BGP,英国伦敦AS9929住宅IP
英伟达SC24六大技术亮点,不止加速超算500强
美国/香港VPS年付99元起,双核/2GB/15GB SSD/500GB流量@100Mbps带宽