Solr是什么 Solr是一个基于Lucene java库的企业级搜索服务器,包含XML/HTTP,JSON API,高亮查询结果,缓存,复制,还有一个WEB管理界面。Solr运行在Servlet容器中,其架构如下: 主要功能包括全文检索,高亮命中,分面搜索(faceted search),近实时索引,动态集群,数据库集成,富文本索引,空间搜索;通过提供分布式索引,复制,负载均衡查询,自动故障转移

solr-4.4安装   solr  

需要先安装jdk,下载地址:http://www.java.com/zh_CN/download/manual.jsp 下载完成后步骤如下: tar zxvf jre-8u65-linux-x64.tar.gz -C /usr/java/ mv jre1.8.0_65 jdk 在/etc/profile下增加: # set Java environment JAVA_HOME=/usr/l

solr  

今天是我连续泡在Github上的第200天,也是蛮高兴的,终于达了: 故事的背影是: 去年国庆完后要去印度接受毕业生培训——就是那个神奇的国度。但是在去之前已经在项目待了九个多月,项目上的挑战越来越少,在印度的时间又算是比较多。便给自己设定了一个长期的goal,即100~200天的longest streak。 或许之前你看到过一篇文章让我们连击,那时已然140天,只是还是浑浑噩噩。到了今天,渐渐

angularjs   git   github   solr   elasticsearch  

solrconfig.xml配置文件主要定义了SOLR的一些处理规则,包括索引数据的存放位置,更新,删除,查询的一些规则配置。 下面将对solrconfig进行详细描述: 1 <luceneMatchVersion>4.8</luceneMatchVersion> 表示solr底层使用的是lucene4.8 2 <lib dir="../../../contrib/extraction/lib"

solr   solrconfig.xml  

LinkRank

http://blog.rainystars.me/2014/07/31/linkrank.html 在 Nutch 中,网页的分数主要基于 TF-IDF 和 Nutch 自己的一套识别链接重要性的算法,如果纯按这个算法网页的排序效果不是很好,Nutch 新版本中有一个类 PageRank 的算法 LinkRank,能够根据网页的出链接,入链接来计算网页的重要性。下面是一个简单的示范。 大体步骤是

solr  

安装软件包准备 apache-tomcat-7.0.54 jdk1.7 solr-4.8.1 zookeeper-3.4.5 注:以上软件都是基于 Linux 环境的 64位 软件,以上软件请到各自的官网下载。 服务器准备 为搭建这个集群,准备三台服务器,分别为 192.168.0.2 -- master 角色 192.168.0.3 -- slave 角色 192.168.0.4 -- slav

tomcat   zookeeper   solrcloud   solr  

http://rainyzz.com/2014/02/02/solr-ansj-plugin.html 在一个基于Solr搜索的项目中之前使用的IKAnalyzer分词效果不是很好,师兄推荐我用Ansj,但是当时Ansj没有Solr的插件,在作者Github项目主页的issue中作者也说不准备支持Solr,当时就放弃了。前几天一个同学说Solr有第三方的Solr插件ansj4solr,下载使用发现

lucene   solr   ansj  

当实现一个字符查询功能时,一般都会以搜索结果的质量高低来降序显示 relevancy of each search result。 这也正是Solr的做法。 然而,有时也需要采用手工干预的方式来调整展示顺序。其中一个场景就是在之前文中 previous part of my Spring Data Solr tutorial。 提到的”常规”检索的实现 该文说明了如何使用 Spring Data

solr   排序   spring