亲们,年底了,小激动来最后一次活动。为了庆祝小组第一,我们这周六去土豪桃子家玩耍一回。
- 周末天气看上去很好的样子,晴,气温 3-10 度。
- 体验一下土豪家里 150 平的地暖是啥感觉。
- 可以烧烤。
- 欢迎一下新妹纸茶茶。
- 排练一下节目。下周二就要节目审核了,我们还没一起排练过一次,别到时出丑哈。
- 如果是打车的,来回车费小组报销。
亲们,年底了,小激动来最后一次活动。为了庆祝小组第一,我们这周六去土豪桃子家玩耍一回。
前两次复盘的时间有点长,今天复盘为了不是特别影响工作,所以时间卡得紧了些。不过这样一来,反而造成一些负面效应,就是大家都想着早点结束,结果讨论不够深入,氛围没有前两次好。另一个和人多了也有关系,坐的是长桌包厢,发言的时候,离得远一些的人不太听得清。
有小伙伴提出疑虑,复盘上提出的问题,后续也没有人去执行,所以觉得复盘的意义似乎不是太大。
其实很多新人不知道,团队成立以来,从第一次只有几个人的复盘开始,就不是以解决问题为目的去复盘的。大家聚一起,聊一聊过去一个月(现在是两个月)的收获,遇到的问题,对公司的建议等等,主要目的还是一个“聚”。
PS:一直没有整理上次三台山的照片,昨天整理一下洗出来。大师拍的几张特写好赞。
两个月过得好快,又要开始复盘了。小组现在有 20 个人,找个复盘地点实在不容易。allface 有点腻了,想找找别的。
政委推荐去支付宝楼下的巴顿咖啡。中午我和叶子去踩点,发现那里有点吵,地方也有点小,也没有长桌。
然后我们又打车去了益乐路,叶子听夕雪说那里有一个比较家静的地方,结果到了目的地,发现是个酒吧,白天还不开门。
于是我们有点扫兴的从益乐路上走回来,一路看看有没有合适的点。
叶子突然说好想去海角七号吃饭,正好我们午饭也还没吃,就进去看看。没想到里面正好有长桌包厢,能坐 20 个人,好巧好巧,果然是要出来多走走。
于是明天的复盘就定在这里了。
午饭在这里吃,味道还不错。
周末升级了 OS X Yosemite 后,快盘网页版不能下载文件了。
今天上午把这个问题反应给快盘网页版客服,下午问题就解决了,很高效,赞一个。
Hi,您反馈的问题有新回复了!
您写道:mac系统升级到 OS X Yosemite 后,快盘网页版不能下载文件了。
回复:您好,推荐您再重新尝试下呢,目前网页上无法下载的问题已经成功处理了。
今天 maggie 家的薛医生来我厂义诊,赞。可惜妹纸屌丝们都比较害羞,咨询量好像不是特别高。我觉得应该开分享,给大家上一课,讲一些医学常识,大家当场发问,那样的形式可能更赞。
今天的技术分享来自川神,爆棚。
分享主题:Nutch
分享人:尚川
课程背景:Nutch诞生于2002年8月,是Apache旗下的一个用Java实现的开源搜索引擎项目,自Nutch1.2版本之后,Nutch已经从搜索引擎演化为网络爬虫,接着Nutch进一步演化为两大分支版本:1.X和2.X,最大的区别在于2.X对底层的数据存储进行了抽象以支持各种底层存储技术。在Nutch的进化过程中,产生了Hadoop、Tika和Gora三个Java开源项目。如今这三个项目都发展迅速,极其火爆,尤其是Hadoop,其已成为大规模数据处理的事实上的标准。Tika使用多种现有的开源内容解析项目来实现从多种格式的文件中提取元数据和结构化文本,Gora支持把大数据持久化到多种存储实现。
课程大纲:
1、Nutch是什么?
Nutch是Apache旗下的Java开源项目,最初是一个搜索引擎,现在是一个网络爬虫。
2、Nutch的设计初衷?
商业搜索引擎不开源,搜索结果不纯粹是根据网页本身的价值进行排序,而是有众多商业利益考虑。Nutch提供了开源的解决方案,帮助人们很容易地建立一个搜索引擎,为用户提供优质的搜索结果,并能从一台机器扩展到成百上千台。
3、为什么要学习Nutch?
搜索技术是信息时代的必备技术之一,没有搜索功能的软件是无法想象的,而搜索引擎是搜索技术的集大成者。通过Nutch的学习,可以对百度、谷歌这样的搜索巨头的内部机制有所了解,并能根据自己的需要打造适合自己的搜索引擎,当然,也可以把搜索技术应用到几乎所有的软件开发中
4、Nutch的设计目标 ?
5、Nutch的发展历程?
6、Nutch的整体架构?
插件机制、数据抓取、数据解析、链接分析、建立索引、分布式搜索等。
对于一个搜索引擎来说,最终可能由成百上千台服务器组成,然而,初创公司最初可能只有几台机器作为尝试,随着公司的发展逐步增加机器,因此,线性可扩展的分布式存储与分布式计算是至关重要的。
Nutch参考了Google的两篇论文:MapReduce计算模型以及GFS存储模型,并做了实现,后来把这两大部分剥离出来形成独立的开源项目Hadoop。由此可知,Hadoop诞生于Nutch,核心由分布式计算和分布式存储组成,是MapReduce和GFS的JAVA开源实现。
Nutch使用HDFS作为存储实现一直持续了很多年,然而使用HDFS有许多限制,后来考虑对存储层进行抽象,剥离并形成了新的开源项目Gora,以支持多种存储技术,包括RDBMS和NoSQL。
对于搜索引擎来说,需要抓取各种各样的文件,解析这些不同格式的文件是一个难题,为了简化设计,也为了重用,于是诞生了Tika,一个专为内容分析而诞生的工具箱。
7、Nutch 3大分支版本?
8、Nutch的应用领域?
站内搜索引擎、全网搜索引擎、垂直搜索引擎、数据采集
9、nutch的使用?
一些具体的实践方法及演示
今天一车人去练车,逮着中间的空隙在手机上写总结,也算是写了一部分。晚上回家再补补,总算写完了。
先往回看了一下 2013 的年终总结,发现那时写的还真有点水。来总结一下 2014 吧。
1、鸟枪换大炮
前年刚入公司的时候,只有我一个人没笔记本,于是公司给配了台小黑。一年之后,公司标配升级了,没笔记本的屌丝统一配 mac,于是咱也随大流用上了公司的 mac。
下半年,公司为了鼓励内推,启动内推送 iphone 的奖励机制。可惜咱没那人脉,在 V2EX 上发了篇软文,虽然浏览量还可以,但是没钓到啥鱼。眼看着一个个都用上 6 了,一年又快过去了,哥也急啊,元旦前突然来了灵感,瞬间下单买了 6p。这年头,购物也需要灵感。
年初换 mac,年底换 iphone,中间还换了很拉风的机械键盘,今年,总算是跟上有赞人民群众的步伐了。
2、职场性格大转型
清明节之后,公司从 9 楼搬到 22 楼,从那之后,就突然感觉自己像是换了一个人。我曾试着去问自己,究竟是什么让我转变这么大?但是最终我也没有找到这个答案,姑且这样理解吧:地方大了,胸也变大了。
3、带领生活小组的乐趣
有一件事我似乎一直没有在公司提起过,就是在学校时,我既做过宣传委员又做过文艺委员,既当过校通讯社记者又当过校报编辑,可是毕业多年之后,却鬼使神差走上了码农这条道,实在是叫我自己都觉得有点匪夷所思。又令我没有想到的是,在这么一家屌丝横行的技术型公司,竟然还能有机会发挥我的这些特长,想想也是醉了。
今年我们小组比较有代表性的三次活动是:高工开生日会、去小强家感受生活、三台山联谊。
4、当爹了
对我而言,这无疑是今年最重大的事情。现在回头去看那篇 9000 字的日志,仍然是感慨良多。小孩出生了,真正辛苦的日子才刚刚开始,单单为户口的事情就折腾了好久。小孩生病的时候也是最折腾的时候。接下去十几年,就是为这小朋友在奋斗了。
5、拖延成性
真不知道自己怎么就不知不觉养成了拖延这个恶习,感觉这不仅是病,而且接近于绝症,好难治。
记得最深就是 Judie 在 8 月初就和我说,能不能给新同学分享一下公司的发展历程。但是不巧那时老婆马上就要生了,就说等生完小孩再整理一下吧。结果一拖就是半年。太忙只不过是个借口,最根本的原因是拖延成性了。以前早上上班我是很少迟到的,后来发现变成了本来是可以不迟到的,也一定要拖到迟到那么几分钟,感觉已经成了习惯。这病,该如何治才好呢?
6、公司的发展空间
创业发展中的公司,空间往往也是很大的,这里以转岗为例说一下我的感想。
我记得公司最早的一次转岗是出现在兔子身上,经常和兔子聊天,感觉兔子那段时间心情特别低落,很迷茫。但是再看今天的兔子,真的是判若两人。
还有一个人是 jello,也经历了一段迷茫时期。
再一个就是柠檬,感觉柠檬比以前更开心了。不是说柠檬以前不开心,而是现在比以前看上去更开心了。
另外就是说说我自己。有一次吃饭,老板说我很适合做 HR(不是那种招人的 HR),以后公司上规模了说不定可以试试。我觉得能给大家带去欢乐,也是件挺好的事情啊。
举这些例子,是想说在这家公司有足够的发展空间,不管转岗在你而言是愿意还是不愿意,其实公司都是在为你提供空间。
罗胖有一次聊“拼爹”的话题,说,做家长的主要任务不是逼孩子做这做那,而是去发现孩子适合做什么事情。
相信公司在 2015 会继续为更多的人提供发展空间,不仅仅是转岗、晋升,还有内部开店、内部孵化、内部创业,等等… 就像有人常说的,大家一定要找准自己的位置,这家公司,有的是发展空间。I Believe!
7、对主业务越来越陌生
这一年公司发展快速,而我接手的项目却变得越来越独立,和主业务相关的东西做得越来越少。发现自己在主业务这条路上正越偏越远。基于这一点,我有了下面的这个想法。
8、新的一年想正儿八经开家店铺
接上面的话题讲,也是有关公司发展空间的话题。11 月 19 号晚上,鸦总突然在群里说允许内部员工在口袋通上开店,当时我听了是真心的高兴。
我想开店的初衷有两个,一个原因是上面说的,对公司主业务越来越陌生了,希望经营一家店铺能让自己对公司的业务变得越来越熟悉。
另一个原因是,希望能找到自己职业生涯的下一个转折点。
有一次吃饭闲聊,晓晓问我:猪哥,你就打算一直做技术吗?有没有什么想法?
这问题问得我一时语塞。技术,我还能做多久呢?我也不知道。
2015,Good luck!