Lucene从基础到实战高级(实现华电内部搜索项目）

Lucene从基础到实战高级(实现华电内部搜索项目）

课程目录
      1. Lucene概述
            1.1 课程概述
            1.2 认识Lucene
            1.3 Lucene的经典应用
            1.4 Lucene基本开发环境配置
      2. Lucene系统架构
            2.1 Lucene的特点
            2.2 核心包及其功能介绍
            2.3 Lucene核心索引类介绍
            2.4 Lucene核心搜索类介绍 5 E! s& s0 P8 a" L1 G$ u8 C
            2.5 Lucene与关系数据库
            2.6 Lucene内部实现原理 % L: R- H2 ^& _% U4 f$ z- V
      3. 索引
            3.1 为什么要用索引
            3.2 Lucene索引的优越性 * o- T( X# D' ]
            3.3 Lucene索引建立 * {% e+ i6 h  C  H- l
            3.4 利用Lucene组件建立索引
            3.5 删除Document 5 p8 \3 b  V: [# @7 S
            3.6 恢复删除 6 ]' c+ a, {, ~) O+ P8 G
            3.7 Document更新操作
            3.8 使用RamDirectory & ?1 d4 J6 e. o7 ^$ }
            3.9 Document的Boost设置 + ]# }2 h0 \1 N& i( J' u" u
            3.10 索引优化
      4. 搜索 ( S7 v7 f- X0 @8 A6 P3 @
            4.1 简单搜索的实现
            4.1.1 指定字段的搜索
            4.1.2 ScoreDoc的运用
            4.2 Query类的使用 $ P. E+ s( C0 q+ B
            4.2.1 搜索中使用TermQuery
            4.2.2 搜索中使用RangeQuery 8 S2 M# b1 B  d
            4.2.3 搜索中使用PreFixQuery
            4.2.4 搜索中使用FuzzyQuery
            4.2.5 搜索中使用WilcardQuery
            4.2.6 搜索中使用BooleanQuery " a( X+ G4 S0 t) R6 @7 Z* [+ {
            4.4分页搜索的实现 ; p/ s' i: {. {* a$ u8 `( e/ c
            4.3 QueryParser类的使用
            4.3.1 默认的字段中检索 , O6 Z4 p* k; w; z. L4 d
            4.3.2 搜索中运用逻辑运算   j# I8 E: F# F# o9 P; C
            4.3.3 前缀搜索和模糊搜索 / m! Z( A9 \1 @4 J5 Z
            4.3搜索的总结 , b. f8 m2 p: t; m7 r
      5 分词
            5.1 分词的基本原理
            5.2 Lucene分词器的使用 * a: {/ n: W5 r5 o; s
            5.3 中文分词
            5.3.1 中文分词的基本原理 0 b. }7 F8 }7 L% t/ `
            5.3.2 优秀中文分词器介绍   \5 O" k+ W& u- ]4 U4 g. v
            5.3.3在搜索中使用中文分词器
      6. 解析文档
            6.1 XML文件的索引 # s: p/ ?) h. ]; A
            6.1.1 了解XPath $ [! {3 `; M, a% K% L6 Z, o
            6.1.2 XML解析
            6.2 PDF文档的索引
            6.1　使用PDFBox处理PDF文档　
            6.2　使用xpdf来处理中文PDF文档　 4 `7 C6 V- z4 z% j) |- v& C
            6.3 HTML文档索引 ( e* b, D; L+ k5 x" K9 j( ~+ [3 N
            6.3.1 获取HTML源文档   k) i# N0 Q2 B3 }; a
            6.3.2 使用JTidy
            6.3.2 使用NekoHTML * x2 \3 k( T, k' v- J$ n- H
            6.3.3 使用HttpClient - b' Y( T6 o7 T/ r- N
            6.3.4 使用HTMLParser
            6.4 Word文档的索引
            6.4.1　POI对Word的处理类　
            6.4.2　使用Jacob来处理Word文档　 2 k4 c/ }1 @" [7 s$ L6 a: ~1 t
      7. 高亮 4 ]. ]0 f9 I& [0 {1 r* O
            7.1 高亮的基本原理 & V+ u& K* [) Q: {+ C
            7.2 在搜索中使用高亮 9 I  I2 G/ p; _% }
      8.　网络爬虫Heritrix　 " V, D, I+ _1 u( I: E
            8.1　Heritrix使用入门　
            8.2　Heritrix的架构　 4 z2 O# ]8 `8 X( H  [' o- Q
            8.3 Heritrix的应用　   s8 R) P7 F0 i1 \
      9. 项目实战-华电企业内部文档搜索系统(项目截图稍后公布)
            9.1 需求说明 + d$ P' x- t" U1 H
            9.2 系统架构介绍 ; `5 p0 l, a+ }
            9.2.1 技术方案的选择 3 u: e% w5 H6 K( w. ~0 G+ e7 _
            9.2.2 使用Ibatis . s+ T  e$ y' o( a
            9.3 系统模块分析
            9.4 系统开发

下载地址：

百度网盘

Lucene从基础到实战高级(实现华电内部搜索项目）

猜你喜欢