Solr:常用查询语法

2025-10-17 04:33:24

Apache Solr提供了丰富的查询语法,支持复杂的全文搜索、精确匹配、范围查询、布尔逻辑组合等多种查询操作。以下是一些常用的Solr查询语法示例:

1. 基本字段查询

查询特定字段中包含特定值的文档。使用冒号(::)代替等号(=, SQL风格)来指定字段和值的关系。例如:

title:电子书

author:张三

price:[10 TO 50] # 价格在10到50之间的商品

2. 分词与非分词查询

默认分词查询:Solr会对查询词进行分词。例如,查询title:计算机科学会匹配标题中包含“计算机”和“科学”的文档。

非分词查询(精确匹配):使用双引号("")包围查询词,表示整个短语作为一个整体进行精确匹配。例如,查询title:"计算机科学"将只匹配标题中包含完整短语“计算机科学”的文档。

3. 通配符查询

使用星号(*)和问号(?)进行通配符查询:

* 表示零个或多个任意字符。? 表示一个任意字符。

例如:

title:*电子书 # 匹配标题中以“电子书”结尾的文档

title:计算机? # 匹配标题中包含“计算机”后面跟着一个任意字符的文档

4. 布尔逻辑操作

使用布尔运算符进行条件组合:

AND:所有条件都必须满足。可以使用空格( )或AND关键字表示。例如:

title:电子书 AND author:李四

OR:满足任一条件即可。使用OR关键字表示。例如:

title:计算机 OR title:科学

NOT:排除满足特定条件的文档。使用NOT或-符号表示。例如:

title:计算机 NOT title:科学

title:电子书 -author:张三

5. 范围查询

查询某个字段值在指定区间内的文档。使用方括号([])表示闭区间(包括边界),尖括号(< >)表示开区间(不包括边界)。例如:

price:[10 TO 50] # 价格在10到50之间(包括10和50)

price:{10 TO 50} # 价格在10到50之间(不包括10和50)

price:[* TO 100] # 价格小于等于100

price:<100 # 价格小于100

6. 通配符与模糊查询

模糊查询:使用 tilde (~) 符号后跟一个可选的编辑距离(Levenshtein距离)。例如,查询title:comp~将匹配与comp编辑距离在默认阈值(通常为2)内的单词,如computer、complement等。

邻近搜索(Proximity Search):使用波浪线 (~) 后跟一个数字表示两个词之间的最大距离。例如,查询"big apple"~5将查找包含短语“big apple”,且两个词之间最多间隔5个词的文档。

7. 分面(Faceting)

指定要进行分面统计的字段,以及可选的分面参数。例如:

facet=true&facet.field=category&facet.limit=10

这意味着对category字段进行分面统计,返回前10个最频繁出现的类别。

8. 排序(Sorting)

指定排序字段和排序方向。例如:

sort=price asc # 按照价格升序排列

sort=popularity desc # 按照流行度降序排列

9. 限制结果数量与分页

使用rows和start参数控制结果数量和分页:

rows=10&start=20 # 返回第21到第30条结果(每页10条,当前为第3页)

10. 高亮(Highlighting)

指定高亮字段和查询参数,返回查询结果中匹配部分的高亮显示。例如:

hl=true&hl.fl=title&hl.simple.pre=&hl.simple.post=

这将对title字段的查询匹配部分进行高亮显示,使用HTML标签包裹高亮内容。

11. 查询参数

q: 查询字符串,必需参数。fq(Filter Query):过滤查询,对主查询结果进行二次过滤,不影响得分,常用于筛选条件。wt(Writer Type):响应格式,如json、xml等。fl(Field List):指定返回结果中包含的字段。

以上仅是Solr查询语法的一部分,实际使用中还可以结合更多的查询参数和高级特性进行复杂查询。请根据实际需求查阅Solr官方文档以获取详细信息和最新功能。