Softchoice连续19年被评为加拿大最佳工作场所

Softchoice是一家领先的以软件为重点的IT解决方案提供商,在今年的加拿大最佳工作场所榜单上排名第9。图片{ width=60% }


Softchoice是唯一两家连续19年入选该榜单的组织之一。
Softchoice的人力资源与文化高级副总裁Karen Scott表示:“连续19年获得加拿大最佳工作场所称号,表明我们致力于打造一个世界一流、高绩效的文化,这里充满了经验和思想的多样性,为充满激情和动力的人提供成长、茁壮和释放潜力的机会。我们为自己取得的成就感到自豪,并期待继续投资于培养我们的人才。”
Great Place to Work Canada的客户服务高级副总裁Nancy Fonseca表示:“超过900家公司竞争获得加拿大最佳工作场所的称号。Softchoice连续19年获得这一认可是一项非凡的成就。这表明他们对员工体验的深刻投资,以及对多样性、公平和包容的关注,促进了创新和业务成功的巨大机会。祝贺Softchoice!”
2024年加拿大最佳工作场所榜单由Great Place to Work® Institute编制,代表了多个行业和组织规模。该榜单及其排名是基于员工对Trust Index®调查的回复,该调查评估构成优秀工作场所的关键行为,例如对管理层的信任、与同事的联系和对公司的忠诚。Great Place to Work®通过测量跨不同人口群体和角色的调查回复差异,评估员工体验的质量和一致性。这项研究提供了员工视角下对组织的严谨描述,以及工作场所文化的整体画像。
要了解Softchoice在销售、技术、工程和运营职务的当前机会,请访问其职业页面。



感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

Snowflake发布Arctic:最开放、企业级LLM

Snowflake(NYSE:SNOW),数据云公司,今日宣布推出Snowflake Arctic,一款最新的大型语言模型(LLM),独特设计成市场上最开放、企业级的LLM。图片{ width=60% }


Arctic采用独特的专家混合(MoE)架构,在规模上提供顶级智能与效率。优化用于复杂企业工作负载,超越行业多个基准,包括SQL代码生成、指令跟踪等。此外,Snowflake将以Apache 2.0许可发布Arctic的权重和训练方式,为企业AI技术设定了新的开放标准。Snowflake Arctic LLM是Snowflake Arctic模型系列的一部分,该系列包括Snowflake构建的最佳实用的文本嵌入模型,用于检索使用情况。

“这是Snowflake的一个转折点,我们的AI研究团队正在AI的前沿创新,”Snowflake的首席执行官Sridhar Ramaswamy表示。“通过以真正开放的方式向AI社区提供领先的智能和高效性,我们正在进一步拓展开源AI可以做到的范围。我们与Arctic的研究将显著增强我们交付可靠、高效AI给客户的能力。”

Arctic以真正开放、广泛共享的协作方式开拓了新局面。根据Forrester最近的一份报告,约46%的全球企业AI决策者指出,他们正在利用现有的开源LLM来作为组织AI策略的一部分采用生成式AI。Snowflake作为全球逾9,400家公司和组织的数据基础,正在赋予所有用户利用行业领先的开源LLM的能力,同时为他们提供在工作中使用哪些模型的灵活性和选择。

现在,随着Arctic的推出,Snowflake正在发布一款强大的真正开放模型,附带Apache 2.0许可,允许个人、研究和商业使用。更进一步,Snowflake还提供代码模板,以及灵活的推理和训练选项,使用户可以快速开始使用其首选框架部署和定制Arctic。这些包括与NVIDIA NIM、NVIDIA TensorRT-LLM、vLLM和Hugging Face一起。Arctic可立即用于Snowflake Cortex中的无服务器推理,Snowflake的完全托管服务提供数据云中的机器学习和AI解决方案。它还将在Amazon Web Services(AWS)上可用,与其他模型花园和目录一起使用,这些目录将包括Hugging Face、Lamini、Microsoft Azure、NVIDIA API目录、Perplexity、Together AI等。

Arctic以领先的资源效率提供顶级智能。Snowflake的AI研究团队,包括一支独特的行业领先研究人员和系统工程师组成的团队,在构建Arctic时花费不到三个月的时间,大约花费了类似模型训练成本的1/8。在Amazon弹性计算云(Amazon EC2)P5实例上进行训练,Snowflake正在为最新开放、企业级模型的快速训练设定新基准,最终使用户能够规模化创建成本效率更高的定制模型。

作为这一战略性努力的一部分,Arctic的独特MoE设计改善了训练系统和模型性能,精心设计的数据构成专注于企业需求。Arctic还提供高质量结果,每次激活17个4800亿个参数,以实现行业领先的质量和前所未有的标记效率。在效率突破中,Arctic在推理或训练期间激活的参数数比DBRX少约50%,比Llama 3 70B少约75%。此外,它在编码(HumanEval+、MBPP+)和SQL生成(Spider)方面胜过领先的开源模型,如DBRX、Mixtral-8x7B等,同时在一般语言理解(MMLU)方面提供领先性能。

Snowflake继续为所有用户加速AI创新。在Snowflake Cortex中访问时,Arctic将加速客户在数据云的安全和管理范围内规模化构建生产级AI应用的能力。

除了Arctic LLM,Snowflake Arctic系列模型还包括最近宣布的Arctic embed,一组面向开源社区的最新文本嵌入模型,根据Apache 2.0许可提供。这五个模型可以立即在Hugging Face上使用,并将很快作为Snowflake Cortex embed功能的一部分提供(处于私人预览阶段)。这些嵌入模型经过优化,以在将专有数据集与LLMs结合为检索增强生成或语义搜索服务的一部分时提供领先的检索性能。

Snowflake还优先为客户提供数据基础和最新的AI构建块,使他们能够利用企业数据创建功能强大的AI和机器学习应用。在Snowflake Cortex中访问时,Arctic将加速客户在数据云中构建规模化的生产级AI应用的能力。

此外,Snowflake继续为客户提供数据云中最新且最强大的LLMs,包括最新添加的Reka和Mistral AI模型。此外,Snowflake最近宣布扩大与NVIDIA的合作伙伴关系,继续其AI创新,将全栈NVIDIA加速平台与Snowflake数据云结合在一起,提供安全且强大的基础设施和计算能力组合,以释放AI生产力。Snowflake Ventures最近还对Landing AI、Mistral AI、Reka等进行了投资,以进一步加强Snowflake帮助客户利用LLMs和AI从企业数据中创造价值的承诺。

AI专家对新闻的评论

“Snowflake Arctic注定会为扩展我们的战略合作伙伴关系带来显著成果,为所有人提供AI访问、民主化和创新的机会,”AI21 Labs的联合创始人兼联合首席执行官Yoav Shoham表示。“我们很高兴看到Snowflake帮助企业利用开源模型的力量,就像我们最近发布的基于Mamba的Transformer-SSM模型Jamba一样。Snowflake持续的AI投资是我们选择在数据云上构建的重要因素,我们期待继续为我们的共同客户创造更大的价值。”

“Snowflake和AWS一致认为,生成式AI将改变我们所知的几乎每一个客户体验。”AWS的副总裁Compute和Networking大卫·布朗表示。“通过AWS,Snowflake得以定制其基础架构,加快推出Snowflake Arctic的上市时间。使用Amazon EC2 P5实例与Snowflake的高效训练系统和模型架构共同设计,Snowflake能够迅速开发和交付新的企业级模型给客户。并且计划将Snowflake Arctic提供给AWS,客户将有更多选择,利用强大的AI技术加速他们的转型。”

“随着AI的步伐持续加快,Snowflake通过推出Snowflake Arctic已经巩固了自己作为AI创新者的地位,”Coda的联合创始人兼首席执行官Shishir Mehrotra表示。“我们的创新和设计原则与Snowflake对AI和其他领域的前瞻性看法一致,我们很高兴成为这个通过AI改变日常应用和工作流的旅程的合作伙伴。”

“在过去几个月中,开源AI呈现出一股巨大的潮流,”Hugging Face的首席执行官兼联合创始人Clement Delangue表示。“我们很高兴看到Snowflake通过此次发布不仅以Apache 2.0许可发布模型,还提供了模型训练方式。这为企业构建AI和整个领域开创了空前的透明度和控制。”

“Lamini的愿景是民主化AI,赋予每个人建立自己的超级智能的能力。我们相信企业AI的未来是建立在强大开源模型和开放协作基础上的,”Lamini的联合创始人兼首席执行官Sharon Zhou表示。“Snowflake Arctic对支持该AI未来至关重要。我们很高兴能够调整和定制Arctic以获得高度准确的LLMs,优化控制、安全性,并使其能够抵御动态AI生态系统。”

“社区的贡献对解锁AI创新和为所有人创造价值至关重要,”Landing AI的首席执行官Andrew Ng表示。“Snowflake对Arctic的开源发布是让先进模型可供各方微调、评估和创新的激动人心的一步。”

“通过将Snowflake的新LLM模型Arctic的功能性引入Microsoft Azure AI模型目录,我们将增加企业客户在迅速发展的AI领域中的选择,并为企业AI带来更多丰富的能力,”Microsoft Azure AI平台企业副总裁Eric Boyd表示。“我们与Snowflake的合作是我们致力于推动开放创新、扩展AI成果边界的一个例证。”

“开源AI模型的持续进步、以及它们之间的良好竞争,不仅对Perplexity的成功至关重要,而且对于为所有人民主化生成式AI的未来也很重要,”Perplexity的联合创始人兼首席执行官Aravind Srinivas表示。“我们期待使用Snowflake Arctic进行实验,将其定制为我们的产品,最终为最终用户创造更大的价值。”

“Snowflake和Reka致力于使AI能够被每个用户使用,无论他们的技术专长如何,以更快地推动业务成果,”Reka的联合创始人兼首席执行官Dani Yogatama表示。“随着Snowflake Arctic的推出,Snowflake通过将世界级真正开放的大型语言模型交付给用户更进一步实现了这一愿景。”

“作为开源AI研究、模型和数据集领域的领先组织,我们为见证Snowflake Arctic的推出感到高兴,”Together AI的联合创始人兼首席执行官Vipul Ved Prakash表示。“开源AI领域的进步将惠及整个生态系统,赋予全球开发人员和研究人员部署具有影响力的生成式AI模型的能力。”

了解更多:
注册参加2024年6月3-6日在旧金山举办的Snowflake数据云峰会,获取Snowflake的AI新闻,并参加2024年6月6日的Snowflake开发者日活动,了解这些创新的实际应用。
用户可以直接访问Hugging Face获取Snowflake Arctic,并使用Snowflake的Github存储库获取推理和微调的示例。
有关Snowflake Arctic的更多信息和其他资源,请访问这里。
深入了解Snowflake AI研究团队如何训练Snowflake Arctic,请查看这篇博客。
观看组织如何将生成式AI和LLMs引入其企业数据的视频。
在LinkedIn和Twitter上随时关注Snowflake的最新新闻和公告。
1《生成式AI的现状》,Forrester Research Inc.,2024年1月26日。
2 截至2024年1月31日。

感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

如何评价月之暗面创始人一年就套现数千万美金事件?

文章来源:钛媒体AGI
作者|林志佳

图片来源:由GPTNB生成

1、今天下午我在上海临港的商汤技术开放日活动期间,国内AI领域出现一则新的“吃瓜”消息,引发一阵讨论。

2、大体意思是,一家媒体引述投资人的话称,上一轮融资完成后,月之暗面(Moonshot Al)创始人杨植麟通过售出个人持股已套现数千万美金,但红杉等老股东都没有出售股份,而且引述“传言”称套现金额在4000万美金;随后上述同一报业集团的另一媒体引述月之暗面官方回应称,“消息不实”。


3、简单来说,这则消息引发关注的点主要有两层:一个是杨植麟在投资人面前套现了数亿元人民币,被投资人发现后,向媒体表达不满;二是,月之暗面才成立一年多,创始人就套现,投资人告诉媒体,“公司成立第一年就套现这么多,这种情况并不多见”。

月之暗面创始人 CEO杨植麟

4、从各种角度看,我首先相信月之暗面的官方回应。月之暗面除了向钛媒体AGI表达上述“消息不实”外,还给我发了一则招聘文章说明,里面提到:“在月之暗面,我们深知每一位员工的价值和潜力。为了吸引并留住最优秀的人才,我们自豪地宣布推出全新的员工激励计划,为优秀人才提供匹配其贡献的丰厚回报从今年开始,我们将在公司取得重要进展时发起员工期权回购计划,确保团队成员能够分享公司发展的果实(2024年底启动首次期权回购计划)。每年定期根据工作表现进行调薪和期权增发,确保薪酬和期权充分反映出员工个人的成长和贡献。

5、很显然,从整个逻辑、过程和结果来看,杨植麟团队肯定套现了。至于多少钱、给了多少人、给了谁,这似乎属于一种内部问题。以月之暗面共计10多亿元融资计算,所谓数千万美元套现是非常有可能的。

6、那么,杨植麟应不应该套现?
我看了看下众多投资人、媒体人的讨论和想法。有一个观点比较明确:如果一个投资人,连创业之后都无法通过融资改善自身生活,这肯定是一个失败的创业。

7、当年马克·扎克伯格(Mark Zuckerberg)创立Facebook的时候,在拿一笔关键融资之后就把同时创业的小伙伴给抛弃了,甩了几百万美金,而扎克伯格直接拿了投资人的钱去买楼、租用团队、建立业务、建立流量增长方式,甚至把投资人的钱套现转换一下去炒了股票。而现在,扎克伯格已拥有数百亿美金身价,这也完全不妨碍他是互联网领域的顶级企业家。

8、当然,这个例子不一定与杨植麟的做法一一对应。但我想表达的是,创始人应该通过融资方式改善自身一部分生活。尤其如今经济普遍低迷、上市基本无望、以及国内过于‘卷’大模型等创业环境下,通过这种生活方式实现更多、更freestyle的思维去创业,我觉得这是人之常情。

9、而且,这种套现不止有杨植麟,也有一些初创公司创始人拿了投资人的钱去挥霍、赌博、或者找更多的金融发财之路,但极少有媒体报道。比如,我了解到的一家国内 AI 招聘领域企业,其创始人去拿着公司的钱做了一些非法的事情,最后被警方逮捕并拘留了七天,投资人知道后就把他的CEO职位直接拿掉了,换上了公司CTO接任,最后只留了一个传说。
因此,通过这种消息去批评杨植麟团队是不太正确的。

10、所以,如果不是因为“月之暗面”最近成为大模型领域的“当红炸子鸡”,这些媒体似乎不会关注这类事情,甚至也从未听过其他初创公司的创始人套现新闻,更多还是二级市场投资人套现离场,毕竟上市公司更加透明化,大家都能看到高管和亲属们每天都在资本市场做哪些工作。

11、除了那些八卦烂传言之外,如果从投资人角度来说,杨植麟的做法引起他们“担忧”并不让人吃惊。因为,如今投资领域募、投、管、退四个过程都越来越艰难。
据清科数据统计显示,2024年第一季度,中…

来源:https://www.aixinzhijie.com/article/6845520



感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

这个禁止打字,只能发语音的AI Native产品,成了硅谷最火的社交软件

过去一周,硅谷线上到处充斥着求链接的声音,人们争相涌入一款新的邀请制神秘AI社交应用。上线短短八天,下载量就超过5万次,新用户甚至一度将平台冲垮,导致其不得不暂时关闭注册功能。


这个忽然爆火起来的社交媒体App叫 Airchat,鼓励用户“随便聊聊”。

它被称为「有声版X」或「文字版Clubhouse」,将两者的信息流形式和音频优先结合于一体——用户不能打字键入,发帖和回复都只能用说的。并且令人眼前一亮的是,这款“AI Native”社交产品将最新AI技术集成入整体交互,背后大模型能将用户发布的语音同步转录成文字,还能根据你选择的语言进行精准翻译。当别人滚动浏览信息流时,就会同时播放声音和呈现文本。

由于起初每名用户开始仅开放两个邀请名额,充满了私密圈子的吸引力,加之声音与文字的新式表达媒介,让Airchat在硅谷科技人士、风险投资家、初创公司合伙人、科技媒体记者等最“超前”的人群中瞬间病毒式传播。

它也火速吸引了一批圈内红人入驻,包括OpenAI 创始人 Sam Altman、Y Combinator 首席执行官Gary Tan、Spotify 首席执行官 Daniel Ek、美国传奇酒商Gary Vaynerchuk,以及风投家和马斯克知己 Jason Calacanis等等。

跟这些名人用户一样耀眼的还有Airchat两位鼎鼎大名的联合创始人。

一位是美国知名天使投资人、全球最大创投平台AngelList前CEO 和创始人Naval Ravikant。他被称为股权众筹鼻祖,信徒众多,个人投资过包括Uber、Twitter、FourSquare、Clubhouse等在内的200多家科技公司。

Naval还曾出版过一本《纳瓦尔宝典》,讲述自己从白手起家到财富自由的经验感悟,分享如何“不靠运气”地过上富有而幸福的一生,中文版在读者中非常受欢迎。

另一位是美国最大约会交友软件Tinder前首席产品官Brian Norgard,任职期间推出的Tinder Gold、Superlike、Boost等重要功能极大推动了用户增长,帮助Tinder成为当时全球收入最高的移动应用之一。

此次两人下场打造Airchat 瞄准的需求很简单:重拾人与人之间的真实连结,提供发起真诚对话的场所,“想一想,你有多久没有在社群媒体上真正感受到与人社交的活力了?”

其实初版的Airchat早在去年10月就上线过,只是当时属性较杂没激起太大水花。今年4月,开发团队删除了视频和文字功能并简化界面,改为纯靠语音的全新App版本横空出世,迅速引爆社交网络。

从视觉上看,Airchat的界面很直观,类似于X。启动应用后会进入按时间轴排序的语音信息流。点击播放声音,同时能阅读文字。

用户之间可以互相关注、评论、点赞、转发和发送私信,但一切表达都是以声音的形式。长按屏幕底部的麦克风键开始录制,松开后你的语音便签加转录文本就会立即自动发布了。

如果对自己的表现不满意可以删掉重录,也可加为高亮、或分享到instagram、Facebook等其它平台。录音后还可以添加外部图片或链接,但无论如何就是不能打字。

从当前用户反馈来看,单条信息的录制时长似乎没有限制,有人甚至为了极限测试连续说了一个小时。倘若对一些太长的语音帖子没耐心听,可以选择暂停只浏览文字。

原本Airchat默认的是2倍速播放,这也成为产品一大特色。被《连线》杂志评价为“给每个人一种略显亢奋,刚刚起床就狂饮一杯Philz咖啡,然后立马跳进浴缸冰镇泡澡的感觉。”诚然这样会让人听起来更自信和强势,但很快被社区反映聒噪,语速过快跟不上。现在Airchat已经把默认改为原速,用户也可通过点击播放键来自主调节1x, 2x,3x速度.

这样的语音先行格式让很多人想到了Clubhouse。

这款尘封在记忆里的音频应用曾在 2021年全球疫情期间创造过一个巅峰流行时刻。其界面设计模仿现实生活中的俱乐部或聚会场所,用户同样是通过邀请制加入聊天室,线上就能与马斯克、李开复等名人零距离实时语音对话。只是随着时间推移,在人们恢复线下社交后,Clubhouse失去了持续价值,逐渐淡出了人们的视线。

那现在的Airchat是第二个Clubhouse吗?事实上两者有很大的不同。

相比 Clubhouse 的多人开放聊天室,Airchat更重视一对一交流,每两人之间的对话都形成一条独立Threads信息流。

同时,Airchat是异步交流。能透过录音完整地组织论述,讲不好可以重录,降低了在一群人面前讲话的紧张感,i人友好。

Norgard 认为,这种方式消除了参与者的怯场障碍,因为“你可以在这里尽可能多地尝试撰写消息,没有人会知道。”事实上,他在与早期用户的对话中,发现“今天使用 Airchat 的大多数人都是非常内向和害羞的。”

Airchat 的语音内容也不像Clubhouse那样聊天解散后就丢失了,而是使用AI的语音转文本功能保留下来,可以追溯,转录体验不仅速度快而且质量很好。一些明显的语气词”呃”会出现在记录中,但轻微的停顿和无意义的填充词则会被编辑掉,语意准确,支持中文,还可以多语言翻译。所以总体来看, Airchat更像是人工智能技术加持的有声版 Twitter 。

Airchat的风靡似乎是一夜之间。除了前面提到的异步交流消除社恐,和两位创始人本身在创业和风投圈不容小觑的影响力,开发团队认为,Airchat 是一种令人耳目一新的亲密社交方式。与单靠生硬的文字不同,声音是有温度的,能够为每个人的个性带来更丰富的表达。

许多人在网上认识多年,在 Airchat互相关注后才听到真实的声音。当头像、文字和声音结合在一起时,会勾勒出一个更真实、立体的人物画像,让你在社交网络里变得更有吸引力。

另外,一些其它平台的名人账户背后也许是团队代操作。但在Airchat,你能清楚听到并确认这就是本人。这些明星用户在X上的营销造势,以及邀请式准入门槛也给大多数普通人带来强烈的FOMO心态,迫切希望加入圈子一探究竟。

所以Airchat里到底长什么样?有媒体评价说,它现在的感觉就像旧金山的咖啡店——应用上大多数人都与科技行业存在某种联系。这也许是因为科技爱好者通常是第一批尝试新事物的人。而当前平台上的主要内容也极大反映出硅谷科技圈的泛流行文化。

当Airchat最初推出频道功能时,最先出现的两个频道是「Crypto(区块链)」和「e/acc(有效加速)」,人们在这里讨论应用本身、人工智能、比特币、“长生不老”,每一个都带有强烈的旧金山式符号。尽管也有咖啡、占星术、音乐、运动等频道,但最响亮和受追捧的还是科技向的话题。

Ravikant表示,目前Airchat的资金主要来自于他自己的口袋,“Sam Altman也盲目地投了一些钱,他喜欢任何人工智能相关的东西”,而该应用本身的盈利计划仍不明确。

在被问及“什么时候可能开始看到广告,无论是音频还是其他形式”时,Ravikant 说,”公司根本不存在货币化压力”,”我一点也不在乎货币化。如果有必要,我们会甚至会花少量钱来运营这个东西。”——言外之意就是不差钱。

另一个让外界潜在担忧的是内容审核问题。现在平台上任何用户都可以录制任何内容,公开发布到时间线。在一个名为「战争」的Airchat频道中,有人在输出着一些强硬观点、未经证实的新闻报道,甚至于宣扬纳粹…另有人发布语音挑衅和辱骂,而其他用户能做的也只是屏蔽和静音而已。

对此,Ravikant在Airchat上解释,会把”尽可能多的审核工具交到用户手中。他认为Airchat应该像晚宴一样运作——你不会因为有人参与文明辩论就把他们赶出家门。但如果他们开始对你大声尖叫,明智的做法是进行干预。”我们不想审查内容,但我们会审查语气”,Ravikant说。

那么如果有人冒充或泄露其他人的个人信息呢?这看起来挺棘手,但对于这两位功成名就的硅谷大佬来说,似乎并不是需要立即考虑的问题。眼下制造一个新的沟通范式,引领一轮风靡的社交潮流,在历史上留下一笔就足够了。不论昙花一现还是持久运行,二人都是佛系的边走边看。

Ravikant曾如此形容这款应用,“我想要一个口袋里的家庭聚会。我想随时都能掏出手机,和有趣、讨人喜欢、机智的人聊天。”

在Airchat重新对iOS用户开放的周日晚上,Ravikant 也发布了一条语音信息:“天啊,我得去睡觉了”,声音透着无尽疲惫,“但我正在这里进行着最精彩的对话。”

(Airchat 现已对美国和欧洲用户开放注册,感兴趣的小伙伴可以下载体验,其他地区仍需邀请链接~)

感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

微软被曝未来3年花1000亿美金囤芯片;杨元庆:AI不是取代人类的智能

今日,通用人工智能(AGI)领域又公布了一系列重磅消息。

钛媒体App 4月19日消息,Meta公布期待已久的多模态开源大模型Llama 3系列。


同时,Meta还推出了其首款基于Llama 3开源模型的 AI 聊天机器人产品——AI助手,直接对标ChatGPT-4。

与此同时,科技行业裁员消息频出。谷歌宣布从3月10日开始的新一轮裁员,预计持续到8月,包括商业服务等职能部门;英国AI初创公司Stability AI也于近日宣布裁员10%。

另外,有消息指,微软公司计划到2024年底储备180万块AI芯片,这意味着微软今年计划储备的图形处理单元(GPU)的数量增加了两倍。到2027财年,微软预计将在GPU和数据中心上投资约1000亿美元。

4月18日,联想集团董事长兼CEO杨元庆在第十届联想创新科技大会(2024 Lenovo Tech World)上表示,人工智能(AI)的下半场,一定是从技术突破进入到落地应用的阶段。而落地的途径,就是涵盖智能设备、智能基础设施、智能解决方案和服务的三大支柱。

开源大模型Llama3推出,百度智能云支持其全系列训练推理

北京时间4月19日凌晨,Meta公布期待已久的多模态开源大模型Llama 3系列,目前包括80亿和700亿两个参数的调优版本。与此同时,Meta还推出了其首款基于Llama 3开源模型的 AI 聊天机器人产品——AI助手,直接对标ChatGPT-4。

Llama 3具体的技术细节包括:选用了相对标准的仅解码器Transformer架构,并在两个定制的24K GPU集群上基于超过15T的词库上进行了预训练——训练数据集是 Llama 2 的七倍,包含的代码数量也是 Llama 2 的四倍。与此同时,Llama 3支持8K上下文长度,是Llama 2的两倍。

在处理多种类型的复杂任务方面,Llama 3 70B相比8B版本有显著的提高,同时多个基准得分也超过了Google Gemini Pro 1.5以及Claude 3 Sonnet。

Meta表示,预训练和指导微调模型是目前 8B 和 70B 参数尺度上最好的模型。

微软今年将囤180万块GPU,还有千亿美元投资计划

据Business Insider获得的一份文件,微软公司内部计划到2024年底储备180万块AI芯片,这意味着微软今年计划储备的图形处理单元(GPU)的数量增加了两倍。

另据两位知情人士透露,从当前财年到2027财年,微软预计将在GPU和数据中心上投资约1000亿美元。

1000亿美元投资额让人联想到早些时候的一则报道。今年3月30日,微软和OpenAI宣布计划投资1000亿美元建造“星际之门”(Stargate)AI超级计算机。OpenAI的下一版重大AI升级预计将在明年初落地。微软高管希望最早在2028年发布“星际之门”(Stargate)AI超级计算机。此外,微软和OpenAI计划为AI开发数据中心项目。

对于以上消息,微软发言人弗兰克·肖(Frank Shaw)拒绝发表评论,称上市公司在报告收益之前必须遵守规定的静默期。该公司计划在未来几天发布业绩。

DA Davidson分析师预估,微软2023年在采购英伟达芯片上花费了45亿美元,一位微软高管对外透露,这一数字与实际支出大致相符。

其他科技巨头也正在建设庞大的GPU储备库。Meta首席执行官马克·扎克伯格今年早些时候表示,Meta将在2024年购买约35万个英伟达H100 GPU,到年底将拥有约60万个GPU。

联想杨元庆:AI不是取代人类的智能

4月18日消息,在第十届联想创新科技大会(2024 Lenovo Tech World)上,联想集团董事长兼CEO杨元庆发表《AI for all,让世界充满AI》主题演讲。

首先,杨元庆指出,AI是增强智能而不是取代人类的智能,而混合式AI将是连接增强智能与千家万户、千行百业的桥梁,是AI普惠的必由之路。

何谓混合式AI?在杨元庆看来,它是公共大模型、个人大模型和企业大模型的混合并用。

“我们今天耳熟能详的大语言模型,其实主要是运行在公有云上的公共大模型。毋庸置疑,它是AI底层核心技术飞跃发展的成果,是AI普及的催化剂和加速器。但在实际使用中,它进一步的普及和应用受到了网络速度,云端效率以及成本考量的限制。有研究表明,公共大模型每一次的查询成本达到了传统搜索的十倍之高。这背后的高耗能更是为环保精神所不容。”杨元庆说。

“另一个阻碍公共大语言模型普及的致命原因,那就是数据安全和隐私方面的先天不足。”在杨元庆看来,如果要得到一个从云端返回的精准答案,你将不得不透露真实的个人数据和意图,并且允许这些数据成为公共信息的一部分,这无疑会触发个人隐私和企业信息安全方面的考虑,从而使得大多数人在将它变为日常使用工具的时候望而却步。因此,公共大模型虽好,但本质上是一种公共的智能。要得到更广泛的使用,还需要其他的AI技术的必要补充。

杨元庆称,未来 AI 是基于个人大模型、企业大模型以及在其基础上开发出来的个人智能体和企业智能体。谈及个人智能体和企业智能体,杨元庆详细介绍了二者的运行方式。

其中,个人智能体通过大模型压缩技术,在个人智能终端或边缘设备上运行,以自然交互的方式接收指令,通过个人的旅行纪录、购物偏好这些存储于设备上的信息,更好地进行推理,做出行动。它甚至可以根据你的思维模式和行为频率去预测下一个任务,并主动提出建议,自主寻找解决方案,最重要的是,除非用户授权,否则用户的个人数据永远不会被共享或发送至公有云上去。

“当这样的个人智能体置身于各种各样的智能设备,未来的智能设备就会成为我们每一个人的数字化延伸。”杨元庆称,智能设备中包含智能体,而智能体中包含大模型。我们的“内存”将实现极大的扩展。我们的“算力”,也就是进行推理,并形成答案或意见、结论的速度,将会大大加快。推理能力和决策质量也将显著提升。

在杨元庆看来,企业也将受益于类似的企业智能体。它分散在企业的多个终端设备和基础设施中,将能够对大量的本企业数据进行学习推理,在保障信息安全的同时,支持企业运营决策,提升管理效率,提高生产力。

“未来,个人大模型和企业大模型将分别通过内置个人和企业智能体的形式与公共大模型共存互补,从而构成混合式AI。所以我们相信这就是AI能够普及应用的一个大方向。”杨元庆称。

此外,杨元庆还解答了如何实现混合式AI落地应用这一问题。

他指出,落地离不开涵盖智能设备、智能基础设施、智能解决方案和服务,这也是联想集团推动AI普惠的三大支柱。杨元庆认为,对于个人用户而言,要获得个人智能体的体验,最便捷的路径,就是自己拥有的电脑、手机等个人计算设备中内置了个人智能体。

“对于企业客户来说,AI的落地必须依赖于智能基础设施。每一家企业,每一天都有大量数据产生,不管是来自终端传感器或设备,还是来自边缘和云端。这些数据就像石油,是企业重要的战略资源,需要被开采、输送、提炼。因此,企业需要服务器、网络和存储设备,才能让海量数据各就其位,物尽其用,再通过AI模型和算法来实现企业的数据智能。未来,我们会看到AI将不仅在公有云上运行,还将在本地数据中心、私有云、混合云,甚至在边缘侧运行,算力将会在云、边、端之间更为均衡地分布。这就意味着,企业智能体的落地,需要的是混合式的基础设施,‘端-边-云-网-智’缺一不可,而这样的技术架构,正是联想倾力打造的新IT技术架构。”杨元庆称。

杨元庆强调,混合式AI正是‘新质生产力’的代表,它将大大加速各行各业的智能化转型。从设备到基础设施,再到解决方案与服务,是联想让混合式AI真正落地的三大支柱。

英国AI初创公司Stability AI宣布裁员10%

钛媒体App 4月19日消息,继备受争议的前CEO 埃马德·莫斯塔克(Emad Mostaque)离职后,英国AI初创公司Stability AI近日宣布裁员10%。

一份内部备忘录显示,在经历了一段不可持续的增长后,Stability AI裁减了20多名员工,以适当调整业务规模。

据悉,Stability AI拥有约200名员工,这意味着此次裁员的比例约为10%。

据一位知情人士透露,受影响的员工大多在业务运营领域,他们已被告知裁员一事。

Stability AI新任命的联席CEO Shan Shan Wong和Christian Laforte在一封电子邮件中表示,公司需要重组部分业务,这意味着将不得不与一些同事告别。“我们已经通知了受此影响的员工,我们将在裁员期间为他们提供支持。”

当地时间3月23日,Stability AI宣布CEO埃马德·莫斯塔克将离开公司,以追求去中心化的AI,其职位空缺将由Wong和Laforte接替。

目前,Stability AI仍在寻找一位合适的CEO来填补最高领导层的职位。该公司表示,将继续像往常一样运营,并仍在发布新产品。

谷歌宣布新一轮裁员,并将重组财务团队

钛媒体App 4月18日消息,Alphabet旗下公司谷歌周三表示,正在进行新一轮裁员和部分团队重组,并将部分职位转移到海外。而本轮裁员从3月10日开始,预计持续到8月。

据两名在职员工透露,他们本周已经收到裁员通知,受影响的团队包括谷歌的财务、商业服务和收入现金运营团队,“这次重组的规模相当大”。

谷歌CFO露丝·波拉特 (Ruth Porat) 也在周三的一份备忘录中表示,公司此举是为了将更多资源用于支持AI投资。而重组将影响谷歌在美国以及国外的财务团队,包括亚太地区以及欧洲、中东和非洲地区。

谷歌发言人称,此次重组是正常业务流程的一部分,受影响的员工可以重新申请谷歌内部的其他工作,一小部分职位将会转移到谷歌正在投资的海外中心,公司还将提供离职补偿和再就业服务。

“我们正以负责任的态度投资于公司最优先的业务以及未来的重大机遇。为了以最佳状态迎接这些机遇,在整个2023年下半年到2024年期间,我们的一些团队进行

感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

Brent Barcey加入OSARO担任高级副总裁企业发展

Barcey的广泛经验在将先进的机器人技术、物流和订单履行解决方案销售给领先的电子商务运营中,与OSARO的使命相契合,即在快节奏的电子商务环境中扩大其精准拾取放置机器人解决方案的市场采用率。图片{ width=60% }


全球领先的面向电子商务的机器学习机器人公司OSARO宣布任命行业资深人士Brent Barcey为企业发展高级副总裁。Barcey在电子商务、仓储和物流行业拥有25年的全球业务和团队发展经验,他将领导OSARO的商业增长,以满足不断增长的电子商务履行解决方案的全球需求。
Barcey加入OSARO前是Plus One Robotics的销售与商务拓展副总裁。在这个职位上,他在推动收入增长和建立战略合作伙伴关系方面发挥了关键作用。在Plus One Robotics之前,Barcey曾担任美国FANUC公司全球销售执行董事一职,该公司是领先的工业机器人制造商。他目前是材料处理行业(MHI)贸易协会的机器人组委会活动主席。
OSARO首席执行官Derik Pridmore表示:“我们很高兴欢迎Brent Barcey加入OSARO团队。Brent在机器人行业销售和商业拓展方面的卓越业绩使他成为一位宝贵的资产。他对全球电子商务行业格局和自动化在满足客户需求中的关键作用有着深刻理解,将在推动OSARO增长方面发挥重要作用。”
Barcey的任命恰逢OSARO关键时刻,该公司最近宣布与总部位于东京的IHI物流与机械株式会社(IHI)达成合作伙伴关系。电子商务市场正经历爆炸性增长,给履行中心带来巨大压力,以满足日益增长的客户期望。OSARO的AI机器人软件支持广泛和引人入胜的自动化解决方案,使履行中心能够通过自动化跨运营的分拣任务来减少劳动挑战、提高效率,并降低成本–从托盘化的进货到打包出库订单到套件和塑料袋。
Barcey表示:“我很高兴加入OSARO这个时机。OSARO的智能机器人解决方案,由其业界领先的SightWorks感知系统驱动,正在彻底改变履行中心中的复杂任务,提供快速的价值实现、灵活性和适应性的有力组合。我渴望利用我的建立战略合作伙伴关系和扩大市场影响力的经验,确保OSARO始终走在这场激动人心的革命前沿。”


。注意:Title、Date、Body 三个部分的内容,放入到对应的位置。最后只需要输出为Makedown源文件格式内容。

感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

AI 音乐,会不会诞生下一个「抖音」?

音乐创作从此触手可及。

作者 | 连冉
编辑 | 郑玄

AI 音乐最近火到发烫。


首先是三月下旬,美国 AI 初创公司 Suno 发布 V3 音乐生成模型,该模型能够在几秒钟内根据输入的提示词生成两分钟的高质量音频,惊艳的效果让行业相信 AI 音乐已经迎来了自己的「ChatGPT 时刻」。

紧接着,一个月后,国内的昆仑万维宣布推出「天工SkyMusic」音乐生成大模型,其评分超越 Suno V3,成为 AI 音乐生成模型最新 SOTA(State of the Art,指当前技术在本领域技术指标全球第一)。

这引起了极客公园的好奇。客观来说,今天中美在 AI 大模型的基础研发上还存在着一定差距。即使细分领域的垂直模型,如此自信地宣称全球领先的团队并不多见。

此外,音乐作为多模态领域中的重要组成部分,有着不菲的产业价值。全球录制音乐市场一年的总收入近 300 亿美元,而相关的演唱会、BGM、KTV 和线上的短视频、K 歌平台等更是每年数千亿美元的市场规模。AI 的介入必然带来生产侧和消费侧的全面革新,其潜在影响不会亚于数字音乐和流媒体的兴起。

因此在 4 月 17 日「天工SkyMusic」正式上线后,我们第一时间下载并体验了这款软件。以下是我们的体验感受,以及对 AI 音乐未来发展的一点想法。

01/「天工SkyMusic」:
一段歌词,几秒生成
三首不同风格的歌曲

从产品设计角度来看,「天工SkyMusic」与「Suno V3」在多个方面相似,但在一些关键细节上还是有明显的不同。

使用「天工SkyMusic」生成音乐,需要输入歌名、歌词,同时可以通过添加段落信息,比如「主歌」、「副歌」、「前奏」等进行微调——这些都与 Suno 的操作相似。

两者最大的不同在于:Suno 要求用户输入歌曲风格,如流行、爵士或说唱;而「天工SkyMusic」则允许选择参考曲目,可以来自其他用户上传过的歌曲,也支持自己上传。

这个功能非常有用。一方面,相比于泛泛的「风格」,「曲目」提供了更精确的定向,这更有助于生成自己想要的音乐。

从实际使用体验来看,如果缺少专业乐理训练,普通用户很难精准描述歌曲风格——想象一下,该用什么语言描述《夜的第七章》?因此,像「天工SkyMusic」这样能够在浏览并倾听原音乐时找到与自己歌词契合的风格,这比使用自然语言描述能够更好地表达音乐需求,也更契合普通用户的音乐创作的场景。

输入歌词、歌名和参考曲目以后,就可以直接生成音乐。「天工SkyMusic」会一次性生成三首风格、唱腔略有不同的歌曲——这是一个很实用的产品设计。不论是「Suno V3」还是「天工SkyMusic」,尽管今天 AI 音乐虽然已经能生成出一定水准的音乐,但稳定性还有待提升,三首里往往只有一首还算不错,而想要得到更好的音乐,除了需要做好歌词分段等微调,更需要反复尝试。

除了写好歌词生成歌曲以外,「天工SkyMusic」也支持 AI 写词。如上所示,上面这首《夏天的风》就是我们用「AI 写词」和「生成歌曲」完成创作的歌曲。这首歌的旋律还不错,但由于没有给歌词分段,整首歌听下来缺少了一点音调变化。

我尝试在苏轼的《水调歌头》里加上分段,这次生成的歌曲就有了明显的情感变化,尤其是唱到「人有悲欢离合,月有阴晴圆缺」这样的副歌高潮段落时,感染力十足。

如果生成了满意的歌曲,用户还可以选择「投稿」发布到「天工SkyMusic」平台,以及支持分享到其他社交媒体平台。在首页,我听了一些点赞比较多的热门生成音乐,其中不乏一些质量上乘的作品,乍一听几乎无法辨别其为 AI 生成——当然仔细分辨的话,还是能在一些细节处理上看到与专业作品的差距。

事实上,许多专业音乐人对「天工SkyMusic」也有不低的评价。例如,B 站 UP 主 @Metalion,一名职业音乐人,他尝试了用自己的旧歌词生成,并试听了主页其他人发布的热门 AI 歌曲,其中有好几首都给出了「还不错」、「像是一首完整的歌曲」这种不低的评价。

整体体验下来,我感觉「天工SkyMusic」的音乐生成能力至少在音乐初学者以上,但生成速度远不是人类可比,而且大量的音乐作品中不乏一些相对完整甚至局部惊艳的优秀作品。当然,目前 AI 音乐模型的能力还无法实现整首歌曲从头到尾都保持稳定品质,也无法像真正的音乐人那样细致打磨作品。

然而,就目前的技术水平而言,「天工SkyMusic」已是一款能为用户带来实际价值的优秀产品。通过降低音乐创作门槛,如「模仿曲目」、「一次生成三首」和「选择发布」这些细节设计,大模型已经可以让普通人也能够轻松享受创造音乐、分享音乐的快乐,人人都能以歌明志。

而随着大模型继续迭代,产品和功能继续丰富,未来一两年,AI 音乐还有更多的可能性。

02/AI 音乐,会走向何方

谈完对产品的体验,最后我们来聊聊基于这次体验,我们可以看到的一些对 AI 音乐行业未来发展的观察。

在「天工 3.0」和「天工SkyMusic」的媒体沟通会上,昆仑万维董事长兼 CEO 方汉在接受媒体采访时说,他认为 AI 音乐创作工具未来会有两个分化:面向 PGC 和面向小白的 UGC 用户。UGC 基本上是一键生成,方便为主;PGC 就相对复杂,「天工SkyMusic」也会在后续加入曲调调整等更专业的音乐工具。

「天工SkyMusic」这样的产品,今天对 UGC 和 PGC 而言都有一定的价值,并在可预见的未来,技术会向两个不同的方向持续迭代。

对于普通 UGC 用户,AI 音乐生成主要提供的还是娱乐价值。音乐创作是情感表达的一种形式,即使是非专业人士也有创作的需求。以往,技术门槛如词曲创作和音乐理论是主要障碍,而 AI 技术的引入,相当于为他们提供了一个强大的「音乐创作外骨骼」,使得任何人都能创作出心中所想的音乐并通过社交媒体进行分享。

当然,当前 AI 音乐平台操作依然复杂,用户需手动进行歌词分段和微调,且生成的音质不够稳定。而随着技术的持续迭代,这些问题相信很快就会得到解决。正如微博和抖音在文章和视频创作领域所引发的革命一样,一个去中心化的音乐创作平台可能将彻底改变人们的音乐创作和消费方式。

对于专业人士的 PGC 用户而言,尽管今天的 AI 音乐工具尚不能完全替代人类创作者,但已经开始成为一个极具价值的辅助工具。

首先是创意激发。目前 AI 音乐大模型创作稳定性还不够,但是速度快,对于陷入瓶颈的创作者,AI 可以成为一个很好的创意启发工具。方汉也列举了一个技术团队与专业创作者沟通后的场景,他们认为「天工SkyMusic」有一个特别有价值的地方:就是跨区域风格灵感激发。例如,中国音乐人通常对非洲和拉美音乐不甚了解,但通过使用「天工SkyMusic」,他们可以轻松探索并融合这些异域文化的曲调,从而在创作中获得新的灵感。

还有一个很有价值的场景在于小样。在很多商务创作的沟通场合,尤其是一些音乐人和非音乐人的沟通(比如做广告 BGM 时,编曲和广告主沟通),很大的麻烦在于如何对齐双方对作品方向的理解。而有了 AI 之后,可以很容易地生成一个相对精准地小样儿,这能节省大量的沟通时间以及降低后续返工的风险。

从实用性的角度来看,今天需要用到音乐的行业非常多,比较典型的就是短视频、影视和游戏制作,而传统音乐创作不仅成本高昂还费时费力,把 AI 引入到这些行业的音乐生产流程,任何效率的提升都有可能带来巨大的产业价值。

在内容创作领域,谁能最快适应技术变革,谁就可能获得最大的利益,这一点在短视频领域已经有过验证。随着手机摄像头、5G、以及视频剪辑 APP 的崛起,视频拍摄制作门槛不断降低,最终伴随着抖音的全球走红,短视频赛道全面崛起,拉开一场新时代的大幕。

而今天,在 AI 音乐乃至所有 AIGC 平台上,历史可能再次重演。

感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

Perplexity AI获6270万美元融资,估值10.4亿美元

4月24日,生成式AI平台Perplexity AI在社交平台宣布,获得6270万美元融资,估值10.4亿美元。本次由Daniel Gross领投,Stan Druckenmiller、NVIDIA、Jeff Bezos、Tobi Lutke、Garry Tan、Andrej Karpathy等跟投。


Perplexity AI是一家提供生成式AI搜索引擎服务,支持用户通过自然语言搜索任何信息,可以把Perplexity AI看成搜索引擎版的“ChatGPT”。
目前,已推出了web版和移动版服务,并且支持中文提示。
体验地址:https://www.perplexity.ai/discover

根据资料显示,Perplexity AI创立于2022年8月,同年9月获得310万美元种子轮融资,12月发布问答引擎“Ask”,随后其业务实现飞速增长。
仅用4个月,月活用户便突破200万成为生成式AI搜索引擎领域的一批黑马,这也是能获得微软、谷歌、GitHub等科技大佬投资的重要原因之一。
产品方面,Perplexity AI不仅提供web搜索服务,还推出了面向移动端的iOS应用Perplexity - Ask Anything。
Web搜索:用户可以直接在搜索框进行提问,例如,“如何治疗偏头痛”,会为用户列出治偏头痛的各种方法,并提供这些信息的来源和相关新闻等,点击链接即可跳转到源页面。还支持多层次连续提问,直到得到满意答案为止。

移动应用搜索:功能上与Web搜索几乎差不多,还支持语音提问、查看热门话题、保留历史搜索记录功能。

Perplexity AI表示,像ChatGPT这种问答模式彻底颠覆了应用的交互模式,简化了大量手动业务,使人们获取信息的方式更加便捷、广阔。同时这也为Perplexity AI提供了机会,通过智能技术创新向传统搜索引擎发起挑战。
素材来源:Perplexity AI,如有侵权请联系删除



感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

AI 音乐,会不会诞生下一个「抖音」?

音乐创作从此触手可及。

作者 | 连冉
编辑 | 郑玄

AI 音乐最近火到发烫。


首先是三月下旬,美国 AI 初创公司 Suno 发布 V3 音乐生成模型,该模型能够在几秒钟内根据输入的提示词生成两分钟的高质量音频,惊艳的效果让行业相信 AI 音乐已经迎来了自己的「ChatGPT 时刻」。

紧接着,一个月后,国内的昆仑万维宣布推出「天工SkyMusic」音乐生成大模型,其评分超越 Suno V3,成为 AI 音乐生成模型最新 SOTA(State of the Art,指当前技术在本领域技术指标全球第一)。

这引起了极客公园的好奇。客观来说,今天中美在 AI 大模型的基础研发上还存在着一定差距。即使细分领域的垂直模型,如此自信地宣称全球领先的团队并不多见。

此外,音乐作为多模态领域中的重要组成部分,有着不菲的产业价值。全球录制音乐市场一年的总收入近 300 亿美元,而相关的演唱会、BGM、KTV 和线上的短视频、K 歌平台等更是每年数千亿美元的市场规模。AI 的介入必然带来生产侧和消费侧的全面革新,其潜在影响不会亚于数字音乐和流媒体的兴起。

因此在 4 月 17 日「天工SkyMusic」正式上线后,我们第一时间下载并体验了这款软件。以下是我们的体验感受,以及对 AI 音乐未来发展的一点想法。

01/「天工SkyMusic」:
一段歌词,几秒生成
三首不同风格的歌曲

从产品设计角度来看,「天工SkyMusic」与「Suno V3」在多个方面相似,但在一些关键细节上还是有明显的不同。

使用「天工SkyMusic」生成音乐,需要输入歌名、歌词,同时可以通过添加段落信息,比如「主歌」、「副歌」、「前奏」等进行微调——这些都与 Suno 的操作相似。

两者最大的不同在于:Suno 要求用户输入歌曲风格,如流行、爵士或说唱;而「天工SkyMusic」则允许选择参考曲目,可以来自其他用户上传过的歌曲,也支持自己上传。

这个功能非常有用。一方面,相比于泛泛的「风格」,「曲目」提供了更精确的定向,这更有助于生成自己想要的音乐。

从实际使用体验来看,如果缺少专业乐理训练,普通用户很难精准描述歌曲风格——想象一下,该用什么语言描述《夜的第七章》?因此,像「天工SkyMusic」这样能够在浏览并倾听原音乐时找到与自己歌词契合的风格,这比使用自然语言描述能够更好地表达音乐需求,也更契合普通用户的音乐创作的场景。

输入歌词、歌名和参考曲目以后,就可以直接生成音乐。「天工SkyMusic」会一次性生成三首风格、唱腔略有不同的歌曲——这是一个很实用的产品设计。不论是「Suno V3」还是「天工SkyMusic」,尽管今天 AI 音乐虽然已经能生成出一定水准的音乐,但稳定性还有待提升,三首里往往只有一首还算不错,而想要得到更好的音乐,除了需要做好歌词分段等微调,更需要反复尝试。

除了写好歌词生成歌曲以外,「天工SkyMusic」也支持 AI 写词。如上所示,上面这首《夏天的风》就是我们用「AI 写词」和「生成歌曲」完成创作的歌曲。这首歌的旋律还不错,但由于没有给歌词分段,整首歌听下来缺少了一点音调变化。

我尝试在苏轼的《水调歌头》里加上分段,这次生成的歌曲就有了明显的情感变化,尤其是唱到「人有悲欢离合,月有阴晴圆缺」这样的副歌高潮段落时,感染力十足。

如果生成了满意的歌曲,用户还可以选择「投稿」发布到「天工SkyMusic」平台,以及支持分享到其他社交媒体平台。在首页,我听了一些点赞比较多的热门生成音乐,其中不乏一些质量上乘的作品,乍一听几乎无法辨别其为 AI 生成——当然仔细分辨的话,还是能在一些细节处理上看到与专业作品的差距。

事实上,许多专业音乐人对「天工SkyMusic」也有不低的评价。例如,B 站 UP 主 @Metalion,一名职业音乐人,他尝试了用自己的旧歌词生成,并试听了主页其他人发布的热门 AI 歌曲,其中有好几首都给出了「还不错」、「像是一首完整的歌曲」这种不低的评价。

整体体验下来,我感觉「天工SkyMusic」的音乐生成能力至少在音乐初学者以上,但生成速度远不是人类可比,而且大量的音乐作品中不乏一些相对完整甚至局部惊艳的优秀作品。当然,目前 AI 音乐模型的能力还无法实现整首歌曲从头到尾都保持稳定品质,也无法像真正的音乐人那样细致打磨作品。

然而,就目前的技术水平而言,「天工SkyMusic」已是一款能为用户带来实际价值的优秀产品。通过降低音乐创作门槛,如「模仿曲目」、「一次生成三首」和「选择发布」这些细节设计,大模型已经可以让普通人也能够轻松享受创造音乐、分享音乐的快乐,人人都能以歌明志。


02/AI 音乐,会走向何方

谈完对产品的体验,最后我们来聊聊基于这次体验,我们可以看到的一些对 AI 音乐行业未来发展的观察。

在「天工 3.0」和「天工SkyMusic」的媒体沟通会上,昆仑万维董事长兼 CEO 方汉在接受媒体采访时说,他认为 AI 音乐创作工具未来会有两个分化:面向PGC和面向小白的UGC用户。UGC 基本上是一键生成,方便为主;PGC 就相对复杂,「天工SkyMusic」也会在后续加入曲调调整等更专业的音乐工具。

「天工SkyMusic」这样的产品,今天对 UGC 和 PGC 而言都有一定的价值,并在可预见的未来,技术会向两个不同的方向持续迭代。

对于普通UGC用户,AI音乐生成主要提供的还是娱乐价值。音乐创作是情感表达的一种形式,即使是非专业人士也有创作的需求。以往,技术门槛如词曲创作和音乐理论是主要障碍,而 AI 技术的引入,相当于为他们提供了一个强大的「音乐创作外骨骼」,使得任何人都能创作出心中所想的音乐并通过社交媒体进行分享。

当然,当前 AI 音乐平台操作依然复杂,用户需手动进行歌词分段和微调,且生成的音质不够稳定。而随着技术的持续迭代,这些问题相信很快就会得到解决。正如微博和抖音在文章和视频创作领域所引发的革命一样,一个去中心化的音乐创作平台可能将彻底改变人们的音乐创作和消费方式。

对于专业人士的PGC用户而言,尽管今天的AI音乐工具尚不能完全替代人类创作者,但已经开始成为一个极具价值的辅助工具。

首先是创意激发。目前 AI 音乐大模型创作稳定性还不够,但是速度快,对于陷入瓶颈的创作者,AI 可以成为一个很好的创意启发工具。方汉也列举了一个技术团队与专业创作者沟通后的场景,他们认为「天工SkyMusic」有一个特别有价值的地方:就是跨区域风格灵感激发。例如,中国音乐人通常对非洲和拉美音乐不甚了解,但通过使用「天工SkyMusic」,他们可以轻松探索并融合这些异域文化的曲调,从而在创作中获得新的灵感。…



感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

微软被曝未来3年花1000亿美金囤芯片;杨元庆:AI不是取代人类的智能

今日,通用人工智能(AGI)领域又公布了一系列重磅消息。

钛媒体App 4月19日消息,Meta公布期待已久的多模态开源大模型Llama 3系列。


同时,Meta还推出了其首款基于Llama 3开源模型的 AI 聊天机器人产品——AI助手,直接对标ChatGPT-4。

与此同时,科技行业裁员消息频出。谷歌宣布从3月10日开始的新一轮裁员,预计持续到8月,包括商业服务等职能部门;英国AI初创公司Stability AI也于近日宣布裁员10%。

另外,有消息指,微软公司计划到2024年底储备180万块AI芯片,这意味着微软今年计划储备的图形处理单元(GPU)的数量增加了两倍。到2027财年,微软预计将在GPU和数据中心上投资约1000亿美元。

4月18日,联想集团董事长兼CEO杨元庆在第十届联想创新科技大会(2024 Lenovo Tech World)上表示,人工智能(AI)的下半场,一定是从技术突破进入到落地应用的阶段。而落地的途径,就是涵盖智能设备、智能基础设施、智能解决方案和服务的三大支柱。

开源大模型Llama3推出,百度智能云支持其全系列训练推理

北京时间4月19日凌晨,Meta公布期待已久的多模态开源大模型Llama 3系列,目前包括80亿和700亿两个参数的调优版本。与此同时,Meta还推出了其首款基于Llama 3开源模型的 AI 聊天机器人产品——AI助手,直接对标ChatGPT-4。

Llama 3具体的技术细节包括:选用了相对标准的仅解码器Transformer架构,并在两个定制的24K GPU集群上基于超过15T的词库上进行了预训练——训练数据集是 Llama 2 的七倍,包含的代码数量也是 Llama 2 的四倍。与此同时,Llama 3支持8K上下文长度,是Llama 2的两倍。

在处理多种类型的复杂任务方面,Llama 3 70B相比8B版本有显著的提高,同时多个基准得分也超过了Google Gemini Pro 1.5以及Claude 3 Sonnet。

Meta表示,预训练和指导微调模型是目前 8B 和 70B 参数尺度上最好的模型。

Llama 3 很快将在所有主要平台上提供,包括 AWS、Databricks、Google Cloud、Hugging Face、Kaggle、IBM WatsonX、Microsoft Azure、NVIDIA NIM 和 Snowflake 上提供,并得到 AMD、AWS、戴尔、英特尔、NVIDIA 和高通提供的硬件平台的支持。另外,你也可以在Meta官方助手Meta AI上体验。

Meta还表示,Llama 3 8B 和 70B 型号标志着其Llama 3发布产品的开始。接下来,Llama 最大模型有超过400B(4000亿)参数,虽然这些模型仍在训练中。

值得注意的是,4月19日中午,继18日Llama3的8B、70B大模型发布后,百度智能云千帆大模型平台19日宣布在国内首家推出针对Llama3全系列版本的训练推理方案,便于开发者进行再训练,搭建专属大模型,现已开放邀约测试。

目前,百度智能云千帆大模型平台中各种尺寸模型定制工具ModelBuilder已预置了最全面最丰富的大模型,支持国内外第三方主流模型,总数量达到79个,是国内拥有大模型数量最多的开发平台。

早前百度创始人、董事长、CEO李彦宏则表示,因为基础模型文心 4.0 可以根据需要,兼顾效果、响应速度、推理成本等各种考虑,剪裁出适合各种场景的更小尺寸模型,并且支持精调和 post pretrain。这样通过降维剪裁出来的模型,比直接用开源模型调出来的模型,同等尺寸下,效果明显更好;同等效果下,成本明显更低,“所以开源模型会越来越落后”。

微软今年将囤180万块GPU,还有千亿美元投资计划

据Business Insider获得的一份文件,微软公司内部计划到2024年底储备180万块AI芯片,这意味着微软今年计划储备的图形处理单元(GPU)的数量增加了两倍。

另据两位知情人士透露,从当前财年到2027财年,微软预计将在GPU和数据中心上投资约1000亿美元。

1000亿美元投资额让人联想到早些时候的一则报道。今年3月30日,微软和OpenAI宣布计划投资1000亿美元建造“星际之门”(Stargate)AI超级计算机。OpenAI的下一版重大AI升级预计将在明年初落地。微软高管希望最早在2028年发布“星际之门”(Stargate)AI超级计算机。此外,微软和OpenAI计划为AI开发数据中心项目。

对于以上消息,微软发言人弗兰克·肖(Frank Shaw)拒绝发表评论,称上市公司在报告收益之前必须遵守规定的静默期。该公司计划在未来几天发布业绩。

DA Davidson分析师预估,微软2023年在采购英伟达芯片上花费了45亿美元,一位微软高管对外透露,这一数字与实际支出大致相符。

其他科技巨头也正在建设庞大的GPU储备库。Meta首席执行官马克·扎克伯格今年早些时候表示,Meta将在2024年购买约35万个英伟达H100 GPU,到年底将拥有约60万个GPU。

联想杨元庆:AI不是取代人类的智能

4月18日消息,在第十届联想创新科技大会(2024 Lenovo Tech World)上,联想集团董事长兼CEO杨元庆发表《AI for all,让世界充满AI》主题演讲。

首先,杨元庆指出,AI是增强智能而不是取代人类的智能,而混合式AI将是连接增强智能与千家万户、千行百业的桥梁,是AI普惠的必由之路。

何谓混合式AI?在杨元庆看来,它是公共大模型、个人大模型和企业大模型的混合并用。

“我们今天耳熟能详的大语言模型,其实主要是运行在公有云上的公共大模型。毋庸置疑,它是AI底层核心技术飞跃发展的成果,是AI普及的催化剂和加速器。但在实际使用中,它进一步的普及和应用受到了网络速度,云端效率以及成本考量的限制。有研究表明,公共大模型每一次的查询成本达到了传统搜索的十倍之高。这背后的高耗能更是为环保精神所不容。”杨元庆说。

“另一个阻碍公共大语言模型普及的致命原因,那就是数据安全和隐私方面的先天不足。”在杨元庆看来,如果要得到一个从云端返回的精准答案,你将不得不透露真实的个人数据和意图,并且允许这些数据成为公共信息的一部分,这无疑会触发个人隐私和企业信息安全方面的考虑,从而使得大多数人在将它变为日常使用工具的时候望而却步。因此,公共大模型虽好,但本质上是一种公共的智能。要得到更广泛的使用,还需要其他的AI技术的必要补充。

杨元庆称,未来 AI 是基于个人大模型、企业大模型以及在其基础上开发出来的个人智能体和企业智能体。谈及个人智能体和企业智能体,杨元庆详细介绍了二者的运行方式。

其中,个人智能体通过大模型压缩技术,在个人智能终端或边缘设备上运行,以自然交互的方式接收指令,通过个人的旅行纪录、购物偏好这些存储于设备上的信息,更好地进行推理,做出行动。它甚至可以根据你的思维模式和行为频率去预测下一个任务,并主动提出建议,自主寻找解决方案,最重要的是,除非用户授权,否则用户的个人数据永远不会被共享或发送至公有云上去。

“当这样的个人智能体置身于各种各样的智能设备,未来的智能设备就会成为我们每一个人的数字化延伸。”杨元庆称,智能设备中包含智能体,而智能体中包含大模型。我们的“内存”将实现极大的扩展。我们的“算力”,也就是进行推理,并形成答案或意见、结论的速度,将会大大加快。推理能力和决策质量也将显著提升。

在杨元庆看来,企业也将受益于类似的企业智能体。它分散在企业的多个终端设备和基础设施中,将能够对大量的本企业数据进行学习推理,在保障信息安全的同时,支持企业运营决策,提升管理效率,提高生产力。

“未来,个人大模型和企业大模型将分别通过内置个人和企业智能体的形式与公共大模型共存互补,从而构成混合式AI。所以我们相信这就是AI能够普及应用的一个大方向。”杨元庆称。

此外,杨元庆还解答了如何实现混合式AI落地应用这一问题。

他指出,落地离不开涵盖智能设备、智能基础设施、智能解决方案和服务,这也是联想集团推动AI普惠的三大支柱。杨元庆认为,对于个人用户而言,要获得个人智能体的体验,最便捷的路径,就是自己拥有的电脑、手机等个人计算设备中内置了个人智能体。

“对于企业客户来说,AI的落地必须依赖于智能基础设施。每一家企业,每一天都有大量数据产生,不管是来自终端传感器或设备,还是来自边缘和云端。这些数据就像石油,是企业重要的战略资源,需要被开采、输送、提炼。因此,企业需要服务器、网络和存储设备,才能让海量数据各就其位,物尽其用,再通过AI模型和算法来实现企业的数据智能。未来,我们会看到AI将不仅在公有云上运行,还将在本地数据中心、私有云、混合云,甚至在边缘侧运行,算力将会在云、边、端之间更为均衡地分布。这就意味着,企业智能体的落地,需要的是混合式的基础设施, ‘端-边-云-网-智’缺一不可,而这样的技术架构,正是联想倾力打造的新IT技术架构。”杨元庆称。

杨元庆强调,混合式AI正是‘新质生产力’的代表,它将大大加速各行各业的智能化转型。从设备到基础设施,再到解决方案与服务,是联想让混合式AI真正落地的三大支柱。

英国AI初创公司Stability AI宣布裁员10%

钛媒体App 4月19日消息,继备受争议的前CEO 埃马德·莫斯塔克(Emad Mostaque)离职后,英国AI初创公司Stability AI近日宣布裁员10%。

一份内部备忘录显示,在经历了一段不可持续的增长后,Stability AI裁减了20多名员工,以适当调整业务规模。

据悉,Stability AI拥有约200名员工,这意味着此次裁员的比例约为10%。

据一位知情人士透露,受影响的员工大多在业务运营领域,他们已被告知裁员一事。

Stability AI新任命的联席CEO Shan Shan Wong和Christian Laforte在一封电子邮件中表示,公司需要重组部分业务,这意味着将不得不与一些同事告别。“我们已经通知了受此影响的员工,我们将在裁员期间为他们提供支持。”

当地时间3月23

感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB