Django中的搜索功能配置问题

搜索框架

haystack 搭建了用户和搜索引擎之间的沟通问题

配置：

1) 安装python包。

pip install django-haystack

pip install whoosh

2) 在settings.py文件中注册应用haystack并做如下配置。

3）在goods应用目录下新建一个search_indexes.py文件，在其中定义一个商品索引类e。

4）在templates下面新建目录search/indexes/goods。

在此目录下面新建一个文件goodssku_text.txt并编辑内容如下：

5）使用命令生成索引文件。

python manage.py rebuild_index

全文检索的使用：

1）配置url。

2）表单搜索时设置表单内容如下。

点击标题进行提交时，会通过haystack搜索数据。

全文检索结果：

搜索出结果后，haystack会把搜索出的结果传递给templates/search目录下的search.html，传递的上下文包括：

query：搜索关键字

page：当前页的page对象

paginator：分页paginator对象

通过HAYSTACK_SEARCH_RESULTS_PER_PAGE 可以控制每页显示数量

改变分词方式：

1. 安装jieba分词模块。

pip install jieba

2. 找到虚拟环境py_django下的haystack目录。

/home/python/.virtualenvs/bj10_py3/lib/python3.5/site-packages/haystack/backends/

3. 在上面的目录中创建ChineseAnalyzer.py文件。

import jieba

from whoosh.analysis import Tokenizer, Token

class ChineseTokenizer(Tokenizer):

def __call__(self, value, positions=False, chars=False,

keeporiginal=False, removestops=True,

start_pos=0, start_char=0, mode='', **kwargs):

t = Token(positions, chars, removestops=removestops, mode=mode, **kwargs)

seglist = jieba.cut(value, cut_all=True)

for w in seglist:

t.original = t.text = w

t.boost = 1.0

if positions:

t.pos = start_pos + value.find(w)

if chars:

t.startchar = start_char + value.find(w)

t.endchar = start_char + value.find(w) + len(w)

yield t

def ChineseAnalyzer():

return ChineseTokenizer()

4. 复制whoosh_backend.py文件，改为如下名称：

whoosh_cn_backend.py

5. 打开复制出来的新文件，引入中文分析类，内部采用jieba分词。

from .ChineseAnalyzer import ChineseAnalyzer

6. 更改词语分析类。

查找

analyzer=StemmingAnalyzer()

改为

analyzer=ChineseAnalyzer()

9. 重新创建索引数据

python manage.py rebuild_index

Django中的搜索功能配置问题

猜你喜欢