美国云计算高增长有望重启,预训练人工智能赋能软件

Posted by: Pickers 05-06-2023 No Comments

上一篇文章为读者解读部份前台SaaS 能够通过提供额外AI 插件应用提高价格,这篇文章将会为读者分析AI应用如何对于后台SaaS 应用需求提升。

公有云行业从2022年开始增长放缓,AI相信有望重燃行业增长

云计算行业经过2020/2021年疫情在家工作的推动后,2022年/2023上半年行业整体进入了调整期。云计算行业龙头AWS也从2021年每个季度按年增长约>30% 大幅放缓到最近季度约按年10%增长。随着 1). 人工智能应用(例如: 联天机器人chatbot) 以及 2). 通用人工智能赋能更快的应用开发效率 (例如: 根据compass UOL study,使用通用人工智能(generative AI)能够提升软件工程师的效率从56小时缩短到36小时。同样完成一样的工序的情况,从这两个推动因素下市场开始对于云计算增长放缓的看法有所改观。

以传统公开云行业占比来说,亚马逊AWS 于 a). 科技/金融行业客户 占比普遍高于其他同行。所以受到科技行业减成本景气的情况。而微软azure 客户行业范围较为阔广涉及到不同传统行业。从公开云增长恢复的观点来看Azure 较优。但由于通用人工智能对(供应端)应用开发人员效率以及 对 (需求端) AI 应用开发需求都有所提升,我们相信云计算行业将会是整个行业基本面改善。所以于公有云个股选择上除了考虑个股基本面外,应同时考虑估值的相对差距进行操作。

图表1: 公有云(季度) 按年云业务收入增长

截圖來源﹕Business Insider

Generative AI 生成式对于带动SaaS 行业增长提速

上篇文章已经提及到CRM 等前台的SaaS 软件通过通用人工智能 (generative AI) 应用带来额外收入空间,例如: 提供更多自动化功能 或提供类似co-pilot 的通用人工智能服务。我们将会于此文章内为大家分析 通用人工智能对于backend 后台SAAS软件需求推动,特别是提供通用人工智能AI 所涉及到的后台支持体系。

  1. Vector search 向量搜索配合 vector database 向量数据库为生成式通用智能主要支撑工具

向量搜索为提供生成式AI 服务的其中核心工具,当中包括涉及到相似度搜索的能力 (使用k-最近搜查来搜索最近的量) 而为输入的问题 (prompt query) 提供更为准确的答案。而不同生成式搜索工具之间的性能差别将会影响到AI的准确性,所以于vector search 的选择上以质量考虑为优先。但由于vector search 主要头部玩家属于大型上市公司 (例如: facebookresearch) / 私有企业 (例如: milvus),所以比较难找到单独的上市个股。

Snowflake 最近Neeva 收购以提供vector search向量搜索能力,能为现有业务带来协同效应

Snowflake 主要提供relational database数据库以及数据分析功能,目前主要以relational database 关系数据库作为支撑。Snowflake公司最近也公布收购Neeva 将会提供生成式AI所需的向量搜索能力。虽然目前snowflake 没有提及到太多的相关整合 (预期将会于6月27号分析师日) 提及到相关应用。我们暂时估计Neeva整合后将会能够赋能Snowflake为其他客户企业内部数据进行联天式机器人chatbot style 应用,成为公司未来引流新客户或者加大现有客户数据于snowflake的存放量。但比较需要留意的是snowflake现时行业收入占比中 约20% 为金融行业 以及 部份创投VC企业,所以短期受到这些行业的(因为银行信贷危机影响) 不景气对使用量 (consumption pattern) 影响较大。虽然Neeva 收购暂时同贡献不大,但值得留意未来当snowflake neeva为企业客户提供生成式AI chatbot 企业搜索功能时,可能会吸引更多企业将数据存于snowflake。Neeva 过去为一家提供AI 生成式搜索网站,所以市场比于neeva 的向量搜索准确度都比较确定。

图表2: 向量资料搜索过程图

截圖來源﹕Elastic Search

图表3: 向量数据搜索排名

截圖來源﹕Ossinsight.io
  1. Generative AI 大模型应用将会加快数据流通,利好整体后台SaaS应用

大模型generative AI应用除了需要使用向量数据库支撑用户搜索外,同时也需要传统的数据库进行额外数据存储。由于generative AI 数据库量可能达到约千亿线级parameters 参数水平,而且可能涉及到图像及文字之间不同格式的组合。所以noSQL 的数据库可能提供更方便/灵活的存储格式,因为比较不受到传统SQL database表格数据单元格式限制。同时,企业应用更多实时性使用prompt 问答应用,也会对NoSQl类型的数据库使用量需求预计将会利好。

  1. 于生成式AI chatbot 应用增加用户与应用之间互动,赋能更多个性化服务以及数据库数据储存。

于用户与应用之间互动加大的趋势下,我们相信会对noSQL 类型的数据库需求 (例如: MongoDB文件document-based 数据库) 特别利好。但需要注意MongoDB 最近股价走势已经涨了不少的风险。由于生成式AI 于客户交流的时候,涉及到更多个人化的信息交换。non-relational 数据库能够更便捷地储存用户相关信息。比较有实时性需求AI chatbot 应用亦会趋向使用NoSQL 数据库,带动mongoDB 数据库需求。根据6sense.com数据,MongoDB 2022年于NoSQL 数据库中市占率达到45.19% 。MongoDB NoSQL数据库也比较适合于处理非结构化数据。但值得留意Generative AI 人工智能的应用利好将会是续步性,而不是一次性带来巨量增长。所以值得同时留意股价的风险。

图表4﹕ MongoDB使用例子

截圖來源﹕https://hevodata.com/learn/mongodb-use-case/
  1. 大模型应用同时也衍生更多数据库之间的实时连接需求

大模型 (特别是针对个别企业定制的模型) 需要针对公司内部不同系统数据库先进行整合,整合过程中将对于数据库连接器软件的需求增加。Confluent 就是一家专门处理资料连接的企业,近期也提到人工智能应用包括: chatbot 联天机器人的互动涉及到实时数据传输,而且当中可能涉及到多用户同时进行的运输量。Confluent kafka 就是主要为管理客户数据库之间的连接,普遍大家认为Confluent cloud能够提供更加 1). 稳定性强的连接。对于chatbot 联天机器人等的前台应用,连接稳定性及实时性将直接影响到客户体验。随着NoSQL 数据库使用场景受惠于Generative AI 应用,将会带来更多的数据库连接器需求。虽然连接器也有部份企业使用内部研发,但kafka能够普遍认为能够提供更好的经济效益。

图表5﹕ Confluent (Kafka) 于NATS市场占有率为41.21%

截圖來源﹕https://hevodata.com/learn/mongodb-use-case/

总结:

整体通用生成式人工智能将会衍生更多云计算 (公有云) 需求,无论从 (供应端)应用开发人员效率提高 及 对 (需求端) AI 应用开发需求提高。所以估计能够更快结束行业从2022年开始增速放缓期。这次为行业的基本面改善,所以整个公有云更多将会是整个行业的机会。所以我们认为选股也可以从相对股值的角度考虑。值得注意,生成人工智能对于云计算收入增量不会出现一次性巨量状况,更多是续步改善步伐。

对于SaaS 行业后台应用,通用人工智能的机会更多于向量搜索以及向量数据库。大部份主要将非上市公司,有部份公司 (例如: snowflake 通过收购) 向 向量搜索发展。相信将能够为现有业务带来额外引流。同时数据处理量多元化及 实时性也会对于个别数据库 (NoSqL- MongoDB) 以及 数据连接器 (Confluent — Kafka) 的需求将来拉动。由于个别股份的涨幅较多 (例如: MongoDB),所以应该同时注意投资的风险进行考虑。

以上个股分析纯为个人意见,不构成投资建议。 C 基金目前持有微软 (MSFT) ,谷歌 (GOOG), 亚马逊(AMZN) 相关可能提及个股的长/短仓。

关于作者: 叶浩然(Stanley Ip)鹏格斯资产管理的投资分析师,覆盖消费和软件板块。

鹏格斯 | 香港 | 对冲基金

Send this to a friend