本项目旨在搭建一个搜索校内站内的搜索引擎,使用java语言编写,
调试环境为Eclipse,Ubuntu16.04。
$ mvn clean
$ mvn package
$ mvn dependency:copy-dependencies
会在项目目录下创建一个target/文件夹,依赖包存储在target/dependency中
- 打开DynamicWeb Project
- 连续两次next,修改ContentDirectory:WebContent -> WebRoot
- 右键项目,Deployment Assembly 添加folder, /target/dependency -- WEB-INF/lib (注意WEB前没有斜杠)
- Java Build Path >> Add JARS >> target/dependency目录下的所有jar包 >> Apply
- Servers项目 >> Run as >> Run Configrations >> Arguments >> WorkDirectory >> 修改你的项目根目录
- Servers栏目 >> Tomcat... >> Add and Remove... >> THUSearch
- 切换到你的当前分支
-
使用Eclipse运行
Eclipse内置Tomcat运行,将target/dependency/目录下的所有jar包导入工程
-
将打包好的thusearch.war文件放置在tomcat根目录下
TODO : 尚未测试
网页正文抽取,
pagerank分析
pdf,doc,docx,xml内容解析
前端关键词高亮
maven动态下载依赖包,ant编译
ansj分词(人名识别,数字识别),IKAnalyzer效果不好
jsoup解析html
关键词更正
相似单词
自动补全
图片提取、
语音搜索
清华,计算机系 官网
社会主意,tinghua 关键词更正
师资队伍 图片提取
中,** 自动补全
李昊阳 前端 王龙涛 后端