写之前,吐槽一下segmentfalult的撰写界面,每次都要我填写Tag,但是没有我需要的tag。 为什么左脑是基础 大部分不会编程的人对程序猿都有如下两个误解: 程序猿的英语都很好 程序猿的逻辑思维能力很强 真相之一:英语好 现实是什么? 我见到的绝大多数程序员,都不敢说自己英语好,甚至说英语差不多的,都不算特别多。大学勉强过个四六级的,工作个几年以后,基本上都还给老师了。 为啥捏? 原因很简

搜索引擎   javascript   html5  

前言 随着微店业务的蓬勃发展,各种业务系统纷纷上线,各类推荐、搜索调优算法应运而生。微店AB测试平台Flood诞生于核心推荐和搜索系统,最初想解决的问题也很简单,比如:哪种搜索精排算法比较好、哪种推荐策略带来的业务转化率更高。 在完成了最初的功能需求之后,我们陷入了思考,在这个数据说话的时代,我们很多部门很多决策都是通过拍脑袋决定的,比如产品经理大手一挥,就随意决定了购物车按钮的颜色,到底是黑色比

hadoop   搜索引擎  

又到了每年618暑期网络大促的时节,各大电商平台都在摩拳擦掌,准备通过各种促销活动把网购者的钱包掏空、信用卡刷爆。某母婴类海淘电商平台是云智慧的重要合作伙伴,该平台每年这时候的促销活动效果都非常棒,常常在短短几周里销售额就有大幅度提升。但这也意味着蜂拥而来的用户会给平台负载造成极大压力,过去每到这时候,公司的技术支撑部门就必须全员通宵达旦加班,严防高并发下IT架构因性能瓶颈造成活动页面访问缓慢、崩

搜索引擎  

前面已经有一篇分布式搜索引擎了,主要介绍的是搜索引擎的索引分片和数据同步,实际上是解决的分布式的问题,最后我给出了一个图 这个图最后出来的是一个低可用的分布式搜索引擎,今天我们要解决的问题是把这个低变成高,今天这篇非常简单,没有任何高级技术,看完你就知道了。 1. 为什么会是低可用 我们得知道为什么这个系统会是一个低可用的系统? 没有一个机制让所有节点知道其他节点的状态,按上面的架构图,只能是启动

分布式   搜索引擎  

搜索引擎已经是目前网络流量最大入口,在大搜上,基本上大家打开网页做的第一件事情就是打开一个搜索引擎,然后键入你感兴趣的内容,然后开始浏览。如果是个电商的网站,你打开以后,基本上也是直接键入你感兴趣的内容,然后开始浏览。 电商的搜索引擎带入到店铺和商品的流量是巨面壁人大的(天空飘来一首歌:不要问我流量有几多,我会告诉你很多很多),流量的巨大必然带来销量的巨大,这些都是钱啊,有人的地方就有江湖,从小的

搜索引擎  

提示:本文较长,看完需要时间,如果你想看彩色重点标记版,请移步微信地址:这里 1.前言 分布式,高可用,和机器学习一样,最近几年被提及得最多的名词,听名字多牛逼,来,我们一步一步来击破前两个名词,今天我们首先来说说分布式。 我个人感受啊,分布式和高可用是随着最近这些年阿里的双11活动火起来的,放眼全球,好像没有哪个公司的系统会在瞬间承接这么大的流量,并且还是绝对不能出错的交易流量,所以阿里确实积累

日志   高可用   分布式   搜索引擎  

这一篇算给这一个系列告一个小的段落,之前开始写这些文章的时候,只是想把自己最近用Golang写的这个搜索引擎说一说,准备了大概3,4篇的量,但是一写下来,发现有点收不住,写到后面其实和Golang没什么关系了,主要在写搜索引擎的架构和一些数据结构了,我觉得这比写代码注释有用吧,而且通过这样写下来,我自己对这些个数据结构的理解也更深了。 一个月的时间,写了14篇了,虽然14篇文字不足以说明一个搜索引

搜索引擎   golang  

大数据索引

bigdata platform and engine spark hadoop tez apex-core apex-malhar streaming spark-streaming flink strom mq kafka nosql hbase hive cassandra phoenix kudu resource manager mesos yarn index solr elastic

nosql   scala   搜索引擎  

今天的标题是论长尾词,长尾词是什么?在百度百科上,长尾词解释是:非目标关键词但也可以带来搜索流量的关键词。这是一个明显的SEM的长尾词解释,简单来说,长尾词就是那些个每天搜索量不是很多,但是一直都有搜索量的词。 首先,我们给个结论,长尾词是个金矿。 长尾词有些什么特征呢: 比较长,这个长和长尾词的长不是一个意思,一般的搜索词都比较精炼,比如只有一两个词语,一般不超过三个,而长尾词可能有5,6个短语

编辑距离   长尾词   搜索引擎优化   搜索引擎  

终于把序号写到了第十篇(其实已经是第13篇了),前面写了几个外篇,我看上篇机器学习的那篇看的人很多,后面会再找一两个点再写写,后面可能会算法部分和架构部分穿插着写了,想到哪里就写哪里了,今天我们继续我们的搜索引擎架构部分,主要来说说数据的检索。 对之前文章感兴趣的话,可以点击下面的链接,或者直接在SF上看整个专栏--吴说 搜索架构 用Golang写一个搜索引擎(0x00)从零开始 用Golang写

败者树   倒排索引   搜索引擎  
1 2 3 4 5