您的位置首页 >资讯 >

重塑生成式AI时代的数据战略——2023亚马逊云科技re:Invent

2023亚马逊云科技re:Invent全球大会进入第三天,亚马逊云科技数据和人工智能副总裁Swami Sivasubramanian博士在周三的主题演讲中,为大家带来了关于亚马逊云科技生成式AI的最新能力、面向生成式AI时代的数据战略以及借助生成式AI应用提高生产效率的精彩分享,携手众多客户与合作伙伴,共话如何借助数据和生成式AI重塑业务、加速创新。

 Swami博士在开场中指出:“当前我们处在另一个新技术的前沿。今天,人类和技术之间正展现出前所未有的紧密关系,生成式AI正以许多意想不到的方式提升人类的生产力。这种关系让人类与人工智能共同形成新的创新充满了无限可能性。”

 

 Amazon Bedrock发布更多模型选择和全新开发工具,

 助力安全构建和规模化生成式AI应用

 Swami博士介绍:“生成式AI有望成为我们这个时代最具变革性的技术。各行各业都在将生成式AI融入各自的业务,但没有一个大模型能够适合所有的场景。利用Amazon Bedrock,客户可选择任何合适的模型来进行快速创新。”Amazon Bedrock现已支持新推出的基础模型版本包括:Anthropic Claude 2.1、Meta Llama 2 70B以及Amazon Titan Family等。

  • 支持Anthropic最新Claude 2.1模型。提供了长达200,000个token的上下文窗口,并且提高了长文档的准确性。与上一代模型相比,Claude 2.1在开放式对话中的错误陈述减少了50%,同时单次调用的成本降低了25%。

  • 支持Meta Llama 2 700亿参数模型。与早些支持的Llama 2 130亿参数模型相同,这些模型在多个外部基准测试中的表现卓越,包括推理、编码、熟练程度和知识测试等,并在Amazon Bedrock上提供了极高的性价比组合。

 除了第三方的模型外,Amazon Bedrock也包含了亚马逊云科技自研的、最新升级的基础模型Amazon Titan:

  • 新增大语言模型Amazon Titan Text Lite与Amazon Titan Text Express。除Embedding的模型外,亚马逊云科技还提供两款大语言模型Amazon Titan Text Lite和Amazon Titan Text Express。Titan Text Lite可执行对文本的总结、文案生成和微调;Titan Text Express开放式文本生成、会话聊天,并支持RAG(检索知识增强)。

  • 新增Amazon Titan Multimodal Embeddings模型。帮助客户为最终用户提高多模态搜索和推荐体验,让输出结果更准确且与上下文相关。模型可以将图像和短文本转换为Embedding数字表示形式,使模型能够轻松理解语义以及数据之间的关系。最终用户可以使用图像和文本提示的任意组合进行搜索查询。

  • 新增Amazon Titan Image Generator模型。为了兑现亚马逊云科技践行负责任的人工智能承诺,所有Amazon Titan生成的图像都包含不可见水印。通过建立严谨的识别AI生成图像的机制,来减少错误信息的传播,促进AI技术的安全、可靠和透明发展。亚马逊云科技是首批广泛发布内置隐形水印的模型提供商之一,这些水印集成到输出的图像中,并设计为“拒绝更改”。

 为客户提供更多选择的同时,如何更好地匹配业务需求成为客户面临的新问题。为帮助客户高效评估、比较和选择最适合其应用场景和业务需求的基础模型为帮助客户更好的应用,Swami博士介绍了最新的Amazon Bedrock模型评估与选择功能。

 在Amazon Bedrock控制台中,客户可以选择他们想要针对给定任务(例如问答或内容摘要)进行比较的模型,如需自动评估,客户可以选择预定义的评估标准(例如准确性、鲁棒性和是否含有有害内容)并上传自己的测试数据集或从内置的公开数据集中进行选择。对于需要复杂判断的主观标准或细微内容,客户只需点击几下即可轻松设置基于人工的评估工作流程并生成报告。以便客户可以轻松了解模型在关键标准上的表现,并可以做出最佳权衡,从而快速选择最适合其应用场景的模型。

 全新定制功能帮助客户更好地使用

 私有数据定制基础模型

 Swami博士强调,数据是构建差异化生成式AI应用的核心优势。对于企业而言,如何使用企业私有数据打造更懂您的业务、更懂客户的生成式AI应用至关重要。Amazon Bedrock提供专门构建的全新功能,可帮助客户使用自己的数据,私密且安全地定制模型,以构建差异化的生成式AI驱动的应用。

  • 针对Amazon Titan Text Lite和Titan Text Express基础模型的持续预训练支持:进一步借助企业最新的私有数据增强对基础模型的控制,让基础模型的输出更懂您的业务。

  • Cohere Command、Meta Llama 2和Amazon Titan模型现在可以在Amazon Bedrock上进行微调,并且即将推出对Anthropic Claude 2.1的支持:客户可使用带标签的数据集提高特定任务的模型准确性。此外,亚马逊云科技客户很快就能够利用自己的数据源微调Anthropic Claude 2的性能。

  • Knowledge Base for Amazon Bedrock正式可用,可以帮助客户借助RAG使用上下文和相关公司数据定制模型输出。Knowledge Base for Amazon Bedrock可将模型安全地连接到公司内部数据源用于RAG,以便为聊天机器人和问答系统等场景提供更准确、针对特定上下文的响应。Knowledge Base for Amazon Bedrock支持多种向量数据库,包括Amazon OpenSearch、Pinecone和Redis Enterprise Cloud的向量引擎,Amazon Aurora和MongoDB也即将推出。

  • 借助Amazon Bedrock Agents功能,生成式AI应用程序助力更便捷高效地开发生成式AI应用。完全托管的Amazon Bedrock代理功能使生成式AI应用程序能够跨公司系统和数据源执行多步骤任务。借助适用于Amazon Bedrock Agents,客户可以提升准确性,加速生成式AI应用程序的开发。

  • 全新推出Amazon SageMaker HyperPod助力客户更轻松地构建、训练和部署生成式AI模型。Amazon SageMaker HyperPod可以提供对按需AI训练集群的访问,开发人员可以通过点击式命令和相对简单的脚本组合来配置集群,这比手动配置基础架构要快得多。

 

 重塑生成式AI时代的数据战略——

 打造全面、集成、受治理的数据基座

 Swami博士提到:“数据是您的差异化能力,同时高质量的数据是生成式AI应用的基础,如果要获取高质量的数据,用户必须要构建强大的数据战略。生成式AI对数据战略提出了新的要求。”他以“全面的、集成的、受治理的”三个维度,开启了系列精彩功能发布:

 全面的(Comprehensive):

 新增支持向量数据库的系列功能

 全新发布的Vector Engine for OpenSearch Serverless,能够带来更高效的搜索和流程处理。

 同时,还发布了Amazon DocumentDB和Amazon DynamoDB新增支持向量检索功能,可以允许用户将多种数据存储在一起。

 除此之外,Amazon MemoryDB for Redis也新增支持向量检索,响应时间变得更快,每秒可以处理数万个查询。

 集成的(Integrated):

 持续投资zero-ETL的未来

 Amazon S3加持下的OpenSearch Service zero-ETL integration,这个新集成的工具可以分析S3中的所有操作数据。

 受治理的(Governed):

 数据治理

 全新推出Amazon Clean Rooms ML,它可以允许用户在不共享底层数据的情况下与业务伙伴共同使用机器学习模型。

  • 生成式AI驱动的Amazon Q支持的数据管理

 AI改变生活和工作方式、提升效率,而生成式AI毫无疑问会进一步提升我们的生产力与工作效率。生成式AI驱动的Amazon Q,可以帮助用户更好的管理数据,实现便捷、直观,更容易访问。

 1. 发布Amazon Q natural language SQL query in RedShift,可以帮助将自然语言转换为SQL,并且在RedShift中做SQL查询;

 2. 发布Amazon Q data integration in Amazon Glue,允许用户使用自然语言实现数据集成。

 

 加速生成式Al之旅所需的一切,

 交给亚马逊云科技为您构建!

 最后,Swami博士以爱因斯坦的名言作为结尾,“创造力就是看到别人见过的东西,思考别人没有想到的东西。”数据、生成式AI及人的关系越来越紧密,将加快我们构建创新与差异化体验的节奏。在安全的地方利用您的数据构建生成式AI,提升用户全面智慧体验,亚马逊云科技有帮助您构建智慧体验的所有服务能力。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。