选择大于一切多模型策略如何成为AI时代制胜法宝

昨天凌晨,亚马逊云科技宣布在Amazon Bedrock 平台上推出全托管、无服务器的DeepSeek-R1 模型—— 这是DeepSeek-R1 首次作为全托管、正式商用模型在 海外云厂商中推出。

选择大于一切多模型策略如何成为AI时代制胜法宝-2

同时DeepSeek 也是首个登陆Amazon Bedrock的国产大模型 ——自今年1月底上线以来,已有数千客户通过Amazon Bedrock的自定义模型导入功能部署了DeepSeek-R1模型。

亚马逊 CEO Andy Jassy 第一时间在 linkedin 上发布了这一消息:

我们使它更容易使用DeepSeek-R1。

它现在在Amazon Bedrock上作为完全托管模型提供(AWS是第一个提供完全托管、正式可用的云服务提供商)。 无需设置或维护,并且具有创建有影响力、实用的生成式AI应用所需的所有安全保障和工具(如Guardrails、Agents和Knowledge Bases)。

请尽情使用。https://lnkd.in/eSVEvmiG

选择大于一切多模型策略如何成为AI时代制胜法宝-3

这背后的逻辑,是 在 AI 快速发展、模型百花齐放的2025年,各大云厂商纷纷加码投入,想要争夺这一新兴战场的主导权 。

选择大于一切多模型策略如何成为AI时代制胜法宝-4

模型正百花齐放(图from Hugging Face)

Gartner 也于近日发布了对 2025年及未来中国企业的人工智能预测——未来两到五年内,中国将发生一系列变革来推动 AI 的普及。并指出:

到 2027 年, 中国 80% 的企业将使用多模型生成式人工智能策略 来实现多样化的模型功能、满足本地部署要求并获得成本效益。

并且, 采用复合型AI的企业将比只依赖生成式人工智能模型的企业领先两年实现AI 落地 。

选择大于一切多模型策略如何成为AI时代制胜法宝-5

不难理解,多模型的策略将更有助于企业在动荡的市场环境中来充分利用人工智能的能力,相比而言能更有效地管理通用任务和专用任务,而不必仅仅赖单一大语言模型。

笔者很认同 Gartner 高级研究总监张桐的观点:“通用模型用途广泛,但在小众领域可能表现不佳。相比之下,专业模型在特定领域表现出色,但在处理训练范围之外的任务时,其表现不尽如人意。因此, 将出现规模和目的各不相同的多样化模型来满足这些不同的需求 。 ”

可以预测,模型使用的多样性和灵活性,将成为企业从竞争中能否胜出的关键。

模型变局——颠覆者的不断崛起和云厂商的应对之道

而当我们回顾过去两年 AI 发展史,就会发现一个有趣的现象: 最优秀的 AI 模型往往不是来自人们最初预期的科技巨头 。

在OpenAI 发布 ChatGPT 之后,从 Claude 的迅速崛起再到开源社区 DeepSeek-R1等模型的横空出世,AI 领域的创新者们不断刷新着我们对模型能力的认知边界。

选择大于一切多模型策略如何成为AI时代制胜法宝-6

尤其是今年初发布的 DeepSeek-R1,其以卓越的推理能力和代码生成能力,在短时间内获得了全球开发者社区的广泛认可。

这个现象也验证了一个关键洞察:

顶尖AI模型可能来自任何地方,而非仅限于OpenAI或Google等巨头之手 。

对应于企业而言,将会经常会面临的情况是:某个场景先前用的是 LlaMa,但 DeepSeek R1 发布后发现它更为合适;或者今天某业务中用的是Qwen,但明天就需要调整为 Claude 了。

如何能快人一步,灵活调整,就显得尤为重要。

在企业客户诉求将趋向于是多而全,而非单一品类单一模型的背后,云厂商们群起争夺市场的关键,将是谁能洞察并把握住这个关键痛点,顺应企业客户的需求趋势。

而 当前的 Ope nAI,Anthropic,xAI,DeepSeek,LlaMa 等模型公司,均仅提供自有模型服务,进驻云厂商,将自身模型能力与其他模型结合供客户选择,将成为必然的发展趋势。

考验云厂商的模型布局能力的时候到了。

在 对各家云厂商对模型的支持情况进行了调研 后 , 我 发现 一 直 秉持 “ 选择大于一切 ” 理念 的亚马逊云科技, 正 基于这一趋势的洞察和 提前 布局,已 然 构建了一个囊括自研、开源和第三方模型的完整阵营,实现了从经济型到高端的 模型 全覆盖。

而排在亚马逊云科技之后的第二名,则是对 OpenAI 进行了 资本 布局的微软,其靠着 ChatGPT 系列模型也占据了不小的市场份额。

但随着微软与 OpenAI 在对未来理念上的分歧,及 OpenAI 模型被DeepSeek,Claude 和Grok 等模型的挤压,微软的竞争优势或将进一步减弱。

一个 显著 的 事 实 是 , 亚马逊云科技基于其及时快速响应市场的能力,已 经 成为模型创新的首选平台 ——在亚马逊云科技的平台上,有接近 200个精选模型 , 涵盖了各个领域和应用场景。

并且,这一状况 似乎 正 在 进入良性循环。

选择大于一切多模型策略如何成为AI时代制胜法宝-7

亚马逊云科技 Bedrock模型目录

可以看到,目前亚马逊云科技模型目录已包含 186个模型,涵盖从自研的Nova系列,到Claude、DeepSeek、Llama、Mistra l、Falco n等众多第三方模型。通过明确的差异化定位,亚马逊云科技为企业客户提供了适应不同场景的丰富选择。

以几个代表性模型为例: Amazon Nova 作为亚马逊云科技自研的全能型基础模型,具有高性价比和通用性,适合客服、内容生成和企业内部自动化等日常任务; DeepSeek R1 则专精于复杂推理、数学计算和代码生成,是处理需要深度逻辑链任务的理想选择;而 Claude 系列则凭借其顶尖的综合性能,适合处理开放式复杂问题,提供接近人类水平的理解和创意能力。

有许多 model router 的项目,也正是基于上述需求而生,例如我自己就是自己造了个轮子,来对不同需求来使用不同的模型。

这里顺便展示一下我在用的模型 路由系统,它根据不同 AI 模型的专长和用户的任务类型进行匹配。我是这样定义模型的:

import requestsfrom typing import Dict, List, Any, Optionalclass AIModel:    def __init__(self, name: str, provider: str, strengths: List[str], use_cases: List[str]):        self.name = name        self.provider = provider        self.strengths = strengths        self.use_cases = use_cases            def describe(self) -> str:        return f"{self.name} by {self.provider}: Specialized in {', '.join(self.strengths)}"        def is_suitable_for(self, task_type: str) -> bool:        return task_type.lower() in [case.lower() for case in self.use_cases]class TaskRouter:    def __init__(self):        self.models = []            def register_model(self, model: AIModel) -> None:        self.models.append(model)            def find_best_model(self, task_description: str, task_type: str) -> Optional[AIModel]:        suitable_models = [model for model in self.models if model.is_suitable_for(task_type)]                if not suitable_models:            return None                    # 简单示例,实际应用中需要替换为更合适的匹配算法        # 这里仅依据任务类型返回第一个匹配的模型        return suitable_models[0]            def route_task(self, task_description: str, task_type: str) -> Dict[str, Any]:        model = self.find_best_model(task_description, task_type)                if not model:            return {"status": "error", "message": "No suitable model found for this task"}                    return {            "status": "success",            "selected_model": model.name,            "provider": model.provider,            "task_description": task_description,            "task_type": task_type        }

然后把我用到的模型们都进行了实例创建:

# 创建模型实例amazon_nova = AIModel(    name="Amazon Nova",    provider="Amazon Web Services",    strengths=["高性价比", "通用性", "企业级解决方案"],    use_cases=["客服对话", "内容生成", "企业内部自动化", "日常助手"])deepseek_r1 = AIModel(    name="DeepSeek R1",    provider="DeepSeek AI",    strengths=["复杂推理", "数学计算", "代码生成", "逻辑链分析"],    use_cases=["数学问题求解", "算法开发", "科学研究", "代码生成与调试"])claude = AIModel(    name="Claude",    provider="Anthropic",    strengths=["开放式问题", "人类水平理解", "创意能力", "综合性能"],    use_cases=["复杂问题求解", "创意写作", "多轮对话", "开放式讨论"])

最终的任务路由和使用则可以这样来完成:

# 创建任务路由器router = TaskRouter()router.register_model(amazon_nova)router.register_model(deepseek_r1)router.register_model(claude)# 这里只是示意,实例上可以用类似bert 的model 或4o-mini 的小模型来路四def process_user_request(user_query: str) -> Dict[str, Any]:    # 简单示例,实际应用中这部分可能需要更复杂的NLP分析    if "代码" in user_query or "编程" in user_query or "数学" in user_query:        task_type = "代码生成"    elif "创意" in user_query or "写作" in user_query or "开放" in user_query:        task_type = "创意写作"    else:        task_type = "日常助手"            return router.route_task(user_query, task_type)# 案例test_queries = [    "帮我写一段Python代码计算斐波那契数列",    "为我的产品创作一段营销文案",    "回答我关于公司政策的问题"]for query in test_queries:    result = process_user_request(query)    print(f"查询: '{query}'")    print(f"推荐模型: {result['selected_model']} (由 {result['provider']} 提供)")    print("-" * 50)

而在github 上,这样的项目也是一搜一大把:

选择大于一切多模型策略如何成为AI时代制胜法宝-8

可见多模型的应用,对开发团队和企业客户而言,已经是必选题。

而说回 亚马逊云科技,其不同定位和价格的模型构成了一个完整谱系,可以让企业根据实际需求和预算来进行更灵活的选择。

在众多玩家中,亚马逊云科技凭借其独特的战略布局和持续的基础设施投入,正在逐步确立其在 AI 领域的领导地位。 而 亚马逊云科技 之 所以 能 精准击中众多企业用户的切身需求 , 正是因 为 其 基于对模型变局认知和企业用户的切实需求交叉点,采取的 “ 选择大于一切 ”(Choice Matters) 前瞻 策略 。

选择大于一切多模型策略如何成为AI时代制胜法宝-9

亚马逊云科技 CEO Matt Garman 也在LinkedIn 上分享表示:

「自从DeepSeek-R1在亚马逊云科技(AWS)上推出以来,我们已经看到了对它的惊人需求,现在我们成为第一个提供它作为完全托管、普遍可用模型的云服务提供商。这意味着强大而又无缝的人工智能,具备所有基本要素: 内置安全性 、 全面监控 、 可定制的护栏 以及对您数据的完全控制。今天就在 Amazon Bedrock上使用DeepSeek AI 的高级推理模型进行构建。」

选择大于一切多模型策略如何成为AI时代制胜法宝-10

在“ 选择大于一切 ”战略下,亚马逊云科技不押注单一 赢家 ,而是 打造开放平台,迅速将市场上涌现的优质模型纳入Bedrock/SageMaker生态 ,为客户提供多样化的选择。

对企业客户而言,这不仅能降低押注单一模型的风险,也可根据不同场景灵活选择最适合的模型组合。

资本博弈:云厂商 AI 基础设施投入对比

支撑这种多模型战略的,是亚马逊云科技在AI基础设施方面的巨额投入。

亚马逊CEO Andy Jassy在财报会议上指出,2024年第四季度263亿美元资本支出的“ 绝大部分 ”都用于亚马逊云科技的AI投资。

从近两年各大云厂商资本支出数据看,亚马逊云科技的投入力度确实远超竞争对手。

选择大于一切多模型策略如何成为AI时代制胜法宝-11

云厂商资本支出对比

2024年,亚马逊云科技在基础设施方面的支出达到了 830亿美元 ,远超微软的512亿美元和谷歌的525亿美元。这种大规模投资主要用于AI基础设施建设,为支持多样化的模型策略奠定了坚实基础。

另外经查阅了相关财报和资料,可以看到这种投资趋势在未来还将继续加强:

选择大于一切多模型策略如何成为AI时代制胜法宝-12

2025年资本支出预测

预计在2025年,亚马逊云科技的资本支出将达到 1000亿美元 ,继续保持行业领先地位。

这种面向未来、持续加码的大力投入,也为亚马逊云科技提供了强大的硬件基础,支撑起其多模型战略的实施。

未来的多模型策略

结合前文提到的 Gartner 预测:

到2027年,中国80%的企业将使用多模型生成式 AI 策略来实现多样化的模型功能、满足本地部署要求兵获得成本效益。

公众号:Gartner公司 Gartner发布2025年及未来中国企业实现AI价值的重要预测

基于当前AI模型格局和实际应用场景,可以预见的是:

未来主流的企业级AI应用将采用“ 高性能模型+good-enough模型 ”的组合策略 。

企业实际部署AI应用时,大部分场景并不需要最尖端的大模型,而是需要一个足够好用、安全稳定且成本可控的“ 好用 ”模型来处理日常任务。

只有在特别复杂或创意性任务需求时,才需要调用更高端的专业模型。

在 各家云 厂商 中, 值得注意的是,亚马逊云科技在年初以来就开始持续快速集成新模型,我梳理了一下 2025年以来亚马逊云科技模型的上线时间线:

选择大于一切多模型策略如何成为AI时代制胜法宝-13

可以看到,亚马逊云科技就不断有模型上新:1月上线DeepSeek-R1,2月则上线了Meta SAM 2.1、Falcon 3 及最新的Claude 3.7 Sonnet,3 月也最新推出了 全托管、无服务器的DeepSeek-R1 模型。接下来还将不断有更多更好更新的模型上线。

这种持续不断的密集式模型更新,也正是亚马逊云科技「 选择大于一切 」策略的实际体现。

亚马逊云科技的多模型策略,也恰好契 合 企业 客 户 “多 + 好的 模型 使用 ” 这一需求 趋势 。

选择大于一切多模型策略如何成为AI时代制胜法宝-14

例如,企业可以使用经济型的 Nova 处理大量的日常任务,用 DeepSeek R1 处理代码和推理任务,而在需要最高质量输出的场景下调用 Claude。

这种灵活组合的能力,能够让企业在性能和成本之间找到最佳平衡点,且切换成本极低,业务迭代很快。

而在提供丰富模型选择的同时,亚马逊云科技也 高度重视 AI 应用的安全性 。

亚马逊云科技 CEO Matt Garman 指出:

「安全是构建业务的根基。对于我们来说,安全性在每一项工作中都至关重要。」

版权声明:
作者:shadowrocket
链接:https://www.shadowrocket9.top/238.html
来源:Shadowrocket官网
文章版权归作者所有,未经允许请勿转载。

THE END
分享
二维码
< <上一篇
下一篇>>