Lucene从基础到实战高级(实现华电内部搜索项目)

Lucene从基础到实战高级(实现华电内部搜索项目)

课程目录
        1. Lucene概述
                1.1 课程概述
                1.2 认识Lucene
                1.3 Lucene的经典应用
                1.4 Lucene基本开发环境配置
        2. Lucene系统架构
                2.1 Lucene的特点
                2.2 核心包及其功能介绍 
                2.3 Lucene核心索引类介绍 
                2.4 Lucene核心搜索类介绍  5 E! s& s0 P8 a" L1 G$ u8 C
                2.5 Lucene与关系数据库 
                2.6 Lucene内部实现原理  % L: R- H2 ^& _% U4 f$ z- V
        3. 索引 
                3.1 为什么要用索引 
                3.2 Lucene索引的优越性  * o- T( X# D' ]
                3.3 Lucene索引建立  * {% e+ i6 h  C  H- l
                3.4 利用Lucene组件建立索引 
                3.5 删除Document  5 p8 \3 b  V: [# @7 S
                3.6 恢复删除  6 ]' c+ a, {, ~) O+ P8 G
                3.7 Document更新操作 
                3.8 使用RamDirectory  & ?1 d4 J6 e. o7 ^$ }
                3.9 Document的Boost设置  + ]# }2 h0 \1 N& i( J' u" u
                3.10 索引优化 
        4. 搜索  ( S7 v7 f- X0 @8 A6 P3 @
                4.1 简单搜索的实现 
                4.1.1 指定字段的搜索 
                4.1.2 ScoreDoc的运用 
                4.2 Query类的使用  $ P. E+ s( C0 q+ B
                4.2.1 搜索中使用TermQuery 
                4.2.2 搜索中使用RangeQuery  8 S2 M# b1 B  d
                4.2.3 搜索中使用PreFixQuery 
                4.2.4 搜索中使用FuzzyQuery 
                4.2.5 搜索中使用WilcardQuery 
                4.2.6 搜索中使用BooleanQuery  " a( X+ G4 S0 t) R6 @7 Z* [+ {
                4.4分页搜索的实现  ; p/ s' i: {. {* a$ u8 `( e/ c
                4.3 QueryParser类的使用 
                4.3.1 默认的字段中检索  , O6 Z4 p* k; w; z. L4 d
                4.3.2 搜索中运用逻辑运算    j# I8 E: F# F# o9 P; C
                4.3.3 前缀搜索和模糊搜索  / m! Z( A9 \1 @4 J5 Z
                4.3搜索的总结  , b. f8 m2 p: t; m7 r
        5 分词 
                5.1 分词的基本原理 
                5.2 Lucene分词器的使用  * a: {/ n: W5 r5 o; s
                5.3 中文分词 
                5.3.1 中文分词的基本原理  0 b. }7 F8 }7 L% t/ `
                5.3.2 优秀中文分词器介绍    \5 O" k+ W& u- ]4 U4 g. v
                5.3.3在搜索中使用中文分词器 
        6. 解析文档 
                6.1 XML文件的索引  # s: p/ ?) h. ]; A
                6.1.1 了解XPath  $ [! {3 `; M, a% K% L6 Z, o
                6.1.2 XML解析 
                6.2 PDF文档的索引 
                6.1 使用PDFBox处理PDF文档  
                6.2 使用xpdf来处理中文PDF文档   4 `7 C6 V- z4 z% j) |- v& C
                6.3 HTML文档索引  ( e* b, D; L+ k5 x" K9 j( ~+ [3 N
                6.3.1 获取HTML源文档    k) i# N0 Q2 B3 }; a
                6.3.2 使用JTidy 
                6.3.2 使用NekoHTML  * x2 \3 k( T, k' v- J$ n- H
                6.3.3 使用HttpClient  - b' Y( T6 o7 T/ r- N
                6.3.4 使用HTMLParser 
                6.4 Word文档的索引 
                6.4.1 POI对Word的处理类  
                6.4.2 使用Jacob来处理Word文档   2 k4 c/ }1 @" [7 s$ L6 a: ~1 t
        7. 高亮  4 ]. ]0 f9 I& [0 {1 r* O
                7.1 高亮的基本原理  & V+ u& K* [) Q: {+ C
                7.2 在搜索中使用高亮  9 I  I2 G/ p; _% }
        8. 网络爬虫Heritrix   " V, D, I+ _1 u( I: E
                8.1 Heritrix使用入门  
                8.2 Heritrix的架构   4 z2 O# ]8 `8 X( H  [' o- Q
                8.3 Heritrix的应用     s8 R) P7 F0 i1 \
        9. 项目实战-华电企业内部文档搜索系统(项目截图稍后公布) 
                9.1 需求说明  + d$ P' x- t" U1 H
                9.2 系统架构介绍  ; `5 p0 l, a+ }
                9.2.1 技术方案的选择  3 u: e% w5 H6 K( w. ~0 G+ e7 _
                9.2.2 使用Ibatis  . s+ T  e$ y' o( a
                9.3 系统模块分析 
                9.4 系统开发

下载地址:

百度网盘

猜你喜欢

转载自blog.csdn.net/qq_42316403/article/details/80632660