Qdrant是一个开源向量数据库,专为下一代AI应用程序设计。它是面向云原生的,并提供RESTful和gRPC API以管理嵌入。Qdrant的特性强大,支持图像、语音和视频搜索,以及与AI引擎的集成。
本章介绍快速上手Qdrant向量数据库,如果基于RESTful API 操作向量数据库。
Qdrant向量数据库的集合概念可以类比MYSQL的表结构,用于统一存储同一类向量数据,集合中存储的每一条数据,在Qdrant中称为点(points),这里的点有数学几何空间的点类似的意思,代表向量在几何空间中的表示(你就当成一条数据看待就行)。
点(points)是Qdrant操作的核心实体。一个点是由向量(vector)和可选载荷(payload)组成的记录。
Qdrant的一个重要特性之一是能够在向量之外存储附加信息(存储管理业务属性)。在Qdrant术语中,这些附加信息被称为“负载”。
在许多表示学习应用程序中,搜索最近的向量是核心要素。现代神经网络被训练成将对象转化为向量,使得在向量空间中相近的物体在现实世界中也相近。例如,具有相似含义的文本、视觉上相似的图片,或是属于相同流派的歌曲。
使用Qdrant,您可以在搜索或检索点时设置条件,也就是说除了向量的相似搜索,还可以设置类型sql的where条件,做属性过滤。
每个集合中的数据都被划分成片段。每个片段都有独立的向量存储、有效载荷存储和索引。
Qdrant的一个关键特性是向量索引和传统索引的有效结合。这一点非常重要,因为为了使向量搜索在过滤条件下能够有效运行,仅有向量索引是不够的。简单来说,向量索引加速了向量搜索,而载荷(payload)索引加速了过滤。