重塑生成式AI时代的数据战略——2023亚马逊云科技re:Invent

2023亚马逊云科技re:Invent全球大会进入第三天，亚马逊云科技数据和人工智能副总裁Swami Sivasubramanian博士在周三的主题演讲中，为大家带来了关于亚马逊云科技生成式AI的最新能力、面向生成式AI时代的数据战略以及借助生成式AI应用提高生产效率的精彩分享，携手众多客户与合作伙伴，共话如何借助数据和生成式AI重塑业务、加速创新。

Swami博士在开场中指出：“当前我们处在另一个新技术的前沿。今天，人类和技术之间正展现出前所未有的紧密关系，生成式AI正以许多意想不到的方式提升人类的生产力。这种关系让人类与人工智能共同形成新的创新充满了无限可能性。”

Amazon Bedrock发布更多模型选择和全新开发工具，

助力安全构建和规模化生成式AI应用

Swami博士介绍：“生成式AI有望成为我们这个时代最具变革性的技术。各行各业都在将生成式AI融入各自的业务，但没有一个大模型能够适合所有的场景。利用Amazon Bedrock，客户可选择任何合适的模型来进行快速创新。”Amazon Bedrock现已支持新推出的基础模型版本包括：Anthropic Claude 2.1、Meta Llama 2 70B以及Amazon Titan Family等。

支持Anthropic最新Claude 2.1模型。提供了长达200,000个token的上下文窗口，并且提高了长文档的准确性。与上一代模型相比，Claude 2.1在开放式对话中的错误陈述减少了50%，同时单次调用的成本降低了25%。
支持Meta Llama 2 700亿参数模型。与早些支持的Llama 2 130亿参数模型相同，这些模型在多个外部基准测试中的表现卓越，包括推理、编码、熟练程度和知识测试等，并在Amazon Bedrock上提供了极高的性价比组合。

除了第三方的模型外，Amazon Bedrock也包含了亚马逊云科技自研的、最新升级的基础模型Amazon Titan：

新增大语言模型Amazon Titan Text Lite与Amazon Titan Text Express。除Embedding的模型外，亚马逊云科技还提供两款大语言模型Amazon Titan Text Lite和Amazon Titan Text Express。Titan Text Lite可执行对文本的总结、文案生成和微调；Titan Text Express开放式文本生成、会话聊天，并支持RAG（检索知识增强）。
新增Amazon Titan Multimodal Embeddings模型。帮助客户为最终用户提高多模态搜索和推荐体验，让输出结果更准确且与上下文相关。模型可以将图像和短文本转换为Embedding数字表示形式，使模型能够轻松理解语义以及数据之间的关系。最终用户可以使用图像和文本提示的任意组合进行搜索查询。
新增Amazon Titan Image Generator模型。为了兑现亚马逊云科技践行负责任的人工智能承诺，所有Amazon Titan生成的图像都包含不可见水印。通过建立严谨的识别AI生成图像的机制，来减少错误信息的传播，促进AI技术的安全、可靠和透明发展。亚马逊云科技是首批广泛发布内置隐形水印的模型提供商之一，这些水印集成到输出的图像中，并设计为“拒绝更改”。

为客户提供更多选择的同时，如何更好地匹配业务需求成为客户面临的新问题。为帮助客户高效评估、比较和选择最适合其应用场景和业务需求的基础模型为帮助客户更好的应用，Swami博士介绍了最新的Amazon Bedrock模型评估与选择功能。

在Amazon Bedrock控制台中，客户可以选择他们想要针对给定任务（例如问答或内容摘要）进行比较的模型，如需自动评估，客户可以选择预定义的评估标准（例如准确性、鲁棒性和是否含有有害内容）并上传自己的测试数据集或从内置的公开数据集中进行选择。对于需要复杂判断的主观标准或细微内容，客户只需点击几下即可轻松设置基于人工的评估工作流程并生成报告。以便客户可以轻松了解模型在关键标准上的表现，并可以做出最佳权衡，从而快速选择最适合其应用场景的模型。

全新定制功能帮助客户更好地使用

私有数据定制基础模型

Swami博士强调，数据是构建差异化生成式AI应用的核心优势。对于企业而言，如何使用企业私有数据打造更懂您的业务、更懂客户的生成式AI应用至关重要。Amazon Bedrock提供专门构建的全新功能，可帮助客户使用自己的数据，私密且安全地定制模型，以构建差异化的生成式AI驱动的应用。

针对Amazon Titan Text Lite和Titan Text Express基础模型的持续预训练支持：进一步借助企业最新的私有数据增强对基础模型的控制，让基础模型的输出更懂您的业务。
Cohere Command、Meta Llama 2和Amazon Titan模型现在可以在Amazon Bedrock上进行微调，并且即将推出对Anthropic Claude 2.1的支持：客户可使用带标签的数据集提高特定任务的模型准确性。此外，亚马逊云科技客户很快就能够利用自己的数据源微调Anthropic Claude 2的性能。
Knowledge Base for Amazon Bedrock正式可用，可以帮助客户借助RAG使用上下文和相关公司数据定制模型输出。Knowledge Base for Amazon Bedrock可将模型安全地连接到公司内部数据源用于RAG，以便为聊天机器人和问答系统等场景提供更准确、针对特定上下文的响应。Knowledge Base for Amazon Bedrock支持多种向量数据库，包括Amazon OpenSearch、Pinecone和Redis Enterprise Cloud的向量引擎，Amazon Aurora和MongoDB也即将推出。
借助Amazon Bedrock Agents功能，生成式AI应用程序助力更便捷高效地开发生成式AI应用。完全托管的Amazon Bedrock代理功能使生成式AI应用程序能够跨公司系统和数据源执行多步骤任务。借助适用于Amazon Bedrock Agents，客户可以提升准确性，加速生成式AI应用程序的开发。