企业网站建设

建站知识

今日已发布信息: 303626
累计注册用户: 50799340

怎样实现网站更新文章

放出收录 不会更新首页快照 百度蜘蛛

概述: 这时及有可能就是你的站权重不行了,也要注意一下。 比如广州网站建设公司网站只要是我自己写的文章,我放上去要不了好久百度一定会放出收录来。   正确引导百度蜘蛛 是关键百度蜘蛛 对于每一个网站都有一定的爬行规律,只要你平时多注意,认真的分析对比,第二天百度会不会更新首页快照,一看就明白。

  如何让百度当天收录当然如果你的网站平时更新了内容,百度不到一个小时或几分钟都会放出收录量,而在某一天,百度不放出收录量。
你的网站第二天多半就不会更新首页快照 了。
这个我们平时得多留意一下自己网站当天的收录。
如果你更新的内容,百度蜘蛛 正常爬行过,然而也没有放出收录来,这时及有可能就是你的站权重不行了,也要注意一下。
比如广州网站建设公司网站只要是我自己写的文章,我放上去要不了好久百度一定会放出收录来。
  正确引导百度蜘蛛 是关键百度蜘蛛 对于每一个网站都有一定的爬行规律,只要你平时多注意,认真的分析对比,第二天百度会不会更新首页快照,一看就明白。

 

  锦州免费做网站  热收缩标签厂   今日推荐免费建站   分类信息   韶山网站建设公司

 


我们平时要注意的无非就是百度蜘蛛 爬行量与爬行的时间分析图,只要注意了这两点,你当天就能及时发现第二天会不会快照。
如果认为不会快照了,这个就得处理一下。
处理方法有很多种,比如你可以多去推广一下,加大更新网站的数量与质量。
我的大多数网站比如等基本上都是天天快照,我就是认真分析了百度蜘蛛 的走向图。
及时的采取处理方法。
  你可能要说了百度蜘蛛 我如何发现,如果分析这种走向图。
给大家推荐一款源码:网邦CMS3.0,这个建站源码 后台能比较清晰的记录各大搜索机器人的痕迹,有各个机器人来访的时间,来访的页面,对来访的详细数据作了分析,进行24小时时间段分析,对各个频道的分析,对你所加的内容的版块进行分析。
对各大搜索机器人喜欢你网站的哪个频道,哪个版块都进行了分析,也给你提出了补救其它频道和版块的建议。
及早的给你提示百度第二天会不会更新首页快照 ,让早发现,早处理。

 

从搜索引擎任务原理折射出的SEO知识(中)

  在前面一篇文章里(搜索引擎工作原理折射SEO知识上)有说到搜索引擎的工作原理的前部分也就是如何通过蛛蛛来抓取网络信息的问题。从中我们也了解到,蛛蛛的一些习性与SEO的一些操作小技巧。在今天的文章中我们会看到更多的有关于搜索引擎的内容,好了废话就不多说了。

  我们都知道蛛蛛它毕竟还只是个程序而已,他做的工作不会通过网站的前台来分析一个网站内容,而是通过网站的代码来进行抓取信息的。而在网站的源代码里我们会看到好多html、js等一些程序的语句。而蛛蛛他只会对里面的文章感兴趣,也就是说他只提取网页里的一些文字。有些朋友可能就会说到了,那我们还写什么代码?代码不是起不到作用了吗?

  其实不是这样的,在网站的标签优化中我们都知道比如H标签、nofollow标签、alt标签等。这些标签还是能在蛛蛛抓取我们网站信息的时候起到强调与修饰作用。比如遇到图片的时候,但蛛蛛并不能识别图片里的信息,那么我们就会考虑去设置一下 alt标签来帮助搜索引擎来识别图片里的信息;为了让网站的一些权重不分散,我们在必要地方给链接加上了nofollow。

  既然搜索引擎蛛蛛是对网站文字特别感兴趣,那对于中文SEO优化来说。是不是会有个概念性的东西在这里面,那就是“分词”

  最简单的一个例子,比如我们中文里面的“网站优化”这四个词,在百度搜索引擎数据词库里,其实是把网站与优化两个不同的词分开来存放的。当用户来搜索网站优化这个词的时候,搜索引擎的步骤也就是把网站这个词库里的网页信息与优化词库里的信息做一个交集来检索与排名。这点后面还会有说到。

  在说到分词的时候我们不得不提一个东西,那就是我们如何来看网站一个分词情况:在百度搜索引擎里面搜索“宁波何涛SEO”在出面的搜索结果里面,我们看下网站的那个快照如图

  

 

  我们是不是很容易的看到在快照里的显示结果百度把这个词分成了三块不同背景色的词组。这个只是其一,我们也可以在百度的搜索结果里看到只要是我们搜索的词,都会有标红的情况。这个也是分词的另一种表现形式。

  有些朋友可能会说了,你说的那些是个别情况,我们在现实过程去搜索的词远远比这个复杂,而且可能还会有一些语气助词等。做为越来越完善的搜索引擎而言。他们其实也早就考虑到了这个问题,首先是因为这些个语气词在搜索过程中实际上是起不到任何作用的。在搜索引擎进行预处理的时候,他们也会把这些词给过滤。一方面是减少检索负担,另一方面也是为了增加内容的准确度。

  在搜索引擎把蛛蛛抓取来的信息进行归档之前,还有个程度是必不可少的,他必须得做内容的重复审核。一重意思:搜索引擎必须把同一个网站里的数据进行删选。有一种情况:比如有人在搜索我的网站宁波SEO的时候,在排名结果中第一页会出现我们的首页与内容页的可能性。其实做为一个成熟的搜索引擎来说,这种情况是要避免的。因为这样的内容对用户的用处不大,就相当于同一个内容给排了两次。第二重:对于不同的网站而言,因为网络上的内容那是成千上万的。这里面就会出现两个不同的网站,但内容相同的情况。

  有了上几步的重重审核,接下来的就是得做个有效的数据整理。我列两张表给大家看下就明白了:

  正向索引

 

  我简单的解释一下上面的表格里的意思:正向索引表格,也就是搜索引擎临时不能直接用于排名的数据表。这个里面他是按照文件来分配每个关键词的。也就是说主键是文件。我们再换到第二张表来看,搜索引擎已经把关键词做为了主键,这也与我们搜索某个关键词来找自己想要的信息一样。我们可以发现:当用户搜索关键词7的时候,这个时候搜索引擎就没有必要对每篇内容再进行检索,它只要做的就是从关键词的词库里面提取出文件1,文件2,文件8等。

怎样打造一个具有执行力的SEO团队

  现在企业或者团队都在讲执行力,可见执行力在所有项目中占很大的比重。那么对于SEO来说也是比较重要的一个环节;如果做SEO,团队或者个人的执行力不够的话,等于是这个SEO项目已经失败了一大半,那么对于SEO主管,顾问或者是企业怎么才能打造一个具有执行力的SEO团队呢,下面说说就执行力的问题。

  首先,做一个seo项目的话先要和老板沟通,沟通一般是需要技巧的,对于你的老板来说,绝对不会是怕承担风险的人。在很多时候有些人跟老板沟通错误的一点就是觉得老板唯利是图的人,感觉这个对自己的生意比较有利可图才上该项目;其实未必,因此有些人在写方案的时候写的天花乱坠,让普通人看了都蠢蠢欲动,递交上去却被不留情的打回。其实在方案里面完全不用去吹嘘什么,SEO本身已经是最划算的营销方式了,老板还能找到什么方式更便宜更有效的吗?

  在给老板或者客户看的方案每一项要写清楚原因,当然有些东西比较专业,不一定让其看懂,但是一定要让其知道这样做的目的是什么,最重要的是让其看到投资和回报。

  比如来说:把某个关键词做上去有多少转换率,网站每天可以卖出去几件产品的话,把该关键词做上去的可以多增加多少销售量,如果不做上去的话就损失多少销售量,按照方案内要付出多少成本给你带来多少流量。其实说来方案还是用数据来说明问题。还有就是把SEO和竞价排名的优缺点都说明下,我相信每个人都有自己的衡量标准。还是如上所说,他还能找到更加便宜效果好的营销方式?

  其次,是对自己的SEO团队来说。首先要分配好各个人的责任,层层递进,作为项目负责人来说,做好督促检查工作。对于一个团队来说没有压力和责任感就不会有动力,

  假例:SEO项目负责人要对网站的整体SEO效果负责,那么你手下的外链人员要对发的外部链接负责,如果你需要一个PR较高的网站交换链接,他做到了,就没有他什么事了。如果整体的SEO效果没有出来的话,你去怪外链人员说对方导出外部链接过多了,那只能说明一个问题,你做为项目负责人很无能;这样也会对团队造成消极的影响。明明是你自己没有规定对方网站导出的外部链接数量。

  以上可以看出,对于团队来说沟通是比较重要的,SEO本身就是一项要和协助你的人以及你协助的人建立良好的沟通,确保团队里的每个人都要知道你想要做什么,其次就是责任的分配一定要做好细节的规定和划分清楚,让自己团队的每个人知道做什么,该如何去做,建立明确的奖罚制度,保证SEO项目团队在运转过程中,某个环节出现了问题都能找到责任人,以及快速分析具体原因进行改进或者调整。

  举个例子来说,今天你想请技术人员把网站首页的页面做下调整,就写清楚,时间、责任人、要做的事情、要达到的效果。如果对方完不成,千万不要觉的是自己执行力的问题,让你们的人事经理找技术人员谈谈或者是考虑换一个技术人员。

怎样解决成为Baidu的“宠儿”

  最近百度的动作可谓有史以来比较大的一次,很多站长因此受重伤,来和我交流,我也说不好,百度扩张势力的同时,似乎在对.cn网站下毒手。令小胡想起了当年的希特勒,大批量的杀戮残疾人,为了最优质的民族。百度也是?为了最优质的搜索引擎?但是希特勒的做法似乎是被否决了。

  小胡今天要讲的是在被百度当成“宠儿”,降权或封站后站长们该怎么处理。

  首先如果你有钱就赶紧买个百度推广,几秒钟就收录的事情呵呵。似乎是对百度的讽刺呵呵。

  如果你的网站的内容质量很低,我是说如果你的网站内容都是采集,当然我理解站长们的辛苦,自己写文章很不可能,但是至少你采集过来后稍微做一些处理,给百度个台阶下么。

  很多站长喜欢在meta和title里面狂塞关键字,短时间内百度可能会给你个好排名,但是请你立马减少吧,万事注重个度哦。从网站浏览者出发布置你的title和meta。

  网站友情链接,这个是个致命的环节,因为在不久前还被力捧的反向链接似乎在被越来越忽视,而且如果你的友情链接里有任何网站被封也许你就会受到株连。(不会百度这招是和以前的满门抄斩学的吧?呵呵)。

  如果空间不好,就换个空间吧,百度这孩子没什么耐心。

  定期备份你的网站,保证你的网站没被挂马和自己挂马上去。百度可是百毒不侵。

  还有一种情况小胡肯定是帮不上任何忙了,就是你人品有问题,被百度识别,k站,那没办法了呵呵。

与100名老板对话

一、不能照搬经念
1、国外的东西照搬照抄过来不行,同行业的照搬照抄也不行,一定要有企业自己的特色。也就是说,你这个企业有多大的量,就发多大的光。
经验只有在一定条件下才可行,条件变了,仍然照搬,没有不失败的。
2、每个成功人士都有过去企业的文化与经验,这对新企业的成长是有益的,但是如果一旦变成思维定式,就是有害的了。
所谓经验主义,就是僵死、教条和静止。
二、战略目标和决策机制
1、我们的目标是做到这个行业国内最大,因此,我们更追求一个较大的整体效益,只会注意竞争者一些大的市场策略,而不太注重价格、营销等一些细节。我们不会因为别人卖了一个很低的价钱,抢了一个什么市场,就赶快压价把这个市场抢回来,因此,在一开始渗透进入一个市场的时候,我们会比别人慢一点,因为要牺牲短期利益才能达到长远的目标。
这是一家很有实力的台湾建材企业老板的一段话。有了足够的资金和一个长远的目标,别人的短期行为当然动摇不了已定的企业方针和策略了。
2、我们与国际知名的大企业的差距是巨大的,而且是全方位的。首先是经营战略的差距。国内大多数企业都没有形成长远的、建立在科学分析基础上的决策机制,经营短视化现象非常普遍。
“赚一把再说”,这种经营心理在相当多的民营企业中尤为突出,秦池就是一个典型。从客观来讲,中国的市场不成熟也助长这种心理的滋长。因为原始积累特别对于刚刚创建的民营企业来说是攸关重要的。
3、我们的民族高科技产业必须坚持三大发展战略,即自主、创新和协同竞争。
只有抛弃“同行是冤家”的陈旧观念,充分发挥群体的力量,加强个企业之间的相互交流和合作,实现群体突破,才是我国高科技产业的出路所在,这就意味着在企业之间要形成一种新的关系协同竞争,即竞争与合作并存,各企业既是竞争对手,又是合作伙伴,在竞争中求发展,在合作中求进步。
这种协同竞争与日本人提倡的竟合是一致的,这是一个全新的市场理念。
三、关于融资
  荣事达的融资手段: 刚开始以固定资产306万元抵押借贷2700万元,因为当时的市场处在短缺经济时代,只要项目选得准,迅速形成规模,产品获利能力强,几乎可以忽略贷款的风险。这一步很快完成了荣事达起步阶段资本积累过程。
第二步是把存量资本盘活。当无形资产不拿到市场上交换时,一分钱不值。所以他们主动出让49%的股份给港商,而且只有资产获利能力最强的时候才能卖个好价钱。
当资本竞争比较激烈时,如果还依赖银行,风险会比较大,所以荣事达第三步是与日本三泽合作,双方注入资金,成立荣事达三泽电器公司。
有了信誉资本,荣事达走出了第四步,与美商合资成立公司,美方注入了8000多万美元,而母体荣事达与上述两家合资公司都是独立法人。
第五步则是吸纳国内民营资本。
我们看重的不仅仅是荣事达公司的融资模式,而更是它因时制宜的融资思路和手段。说白了就是不管采用什么融资手段,首先要坚持风险最小、投入产出比最大的原则。另外要学会自己卖自己,卖个好家钱。
  四、企业家素质
1、战场上,将军和元帅的区别在于,将军决战在战场,元帅决策在后方。商场如战场,在市场经济的战争中,我要做元帅。
许多企业的领导都经常去充当士兵的角色,陷入具体事物的泥淖,忽略了自己的正业:管人、理财、适时度势、把握全局。
2、作为企业的领导者,绝不能陷入事无巨细的泥淖,应善于失小而得大。
求全难,故失小才能得大。失大而得小者,企业之大忌也。
3、作为一个企业家,必须懂得企业生产经营的技术、销售、管理知识;第二点,我觉得一个企业家的思想素质很重要;第三点,是提高文化素质;第四点是身体素质,一定要注意劳逸结合;第五点要具备企业家的心理素质,“遇事而不慌”,胆大心细。
德、智、体全面发展,这只是一个目标,在现实生活中,这样的完人有几个?对于一个现代企业更重要的是建立一个良好的运行机制和一套操作规则,只有这样,才能使中国企业从能人管理中解脱出来。即使能人离走了,在规范操作下的企业仍然发展下去。
4、创新就是不断否定自己。 我们(海信)前天开经济工作会议,有几个中层干部发言,把海信去年的很多工作批得一无是处,许多人都不爱听,我自己也不爱听,但是我跟他们讲,如果你要想海信进一步发展,你必须认真听,这样才能不断创新。
要做到闻过则喜,谈何易!更何况有些意见是错的、过头的,甚至恶意中伤,怎么办?这不仅仅要求“肚量”、“气量”的问题,也不仅仅是“言者无罪,闻者足戒”、“有则改之,无则加勉”的问题,而是要求企业负责人从这些批评意见中挖掘出对企业发展有利的信息。
5、从我们(东华电子公司总经理褚秀菊) 个人来讲,我始终都有一种危机感,这种危机感,不是来自内部的压力,也不是单纯的外部环境影响,而是我处事的一种心态,对一个企业而言,如求生存就好象如履薄冰,一不小心就会掉进窟窿。危机意识可以让我们知道怎样去务实,怎样去创新、怎样去求变,而不至于屈了人后。
我们赞赏褚关于“危机感是处事的一种心态”的提法。企业处于逆境时,从上到下都会有一种危机感,但这种危机感是被动的,而当企业发展顺利时,许多人就会得意忘形,盲目发展,把危机感都抛到九霄云外去了。
事实上,办企业,求生存也好,求发展也好,逆境也好,顺境也好,都如履薄冰。但是只要我们时刻保持这种危机感的心态,并采取必要的措施,那么逆境中会转危为安,顺境中为把危机消灭于萌芽之中,更上一层楼。
6、作为一个企业领导者,你的任务不是去发现人才,今天看看培养一下张三、明天考虑一下李四,如果这样你就本末倒置了。你的职责应是建立一个可以出人才的机制,这个人才机制自身就能够不断地产生人才。
伯乐者,人才机制也!
7、作为企业的头儿,要有善于把握大局的能力,在眼前一堆事情里你能不能找出一个最关键的问题来,找出制约发展的根本问题来,这种很快抓住主要矛盾的能力是必须具备的。
另一方面,要有一种对一件事一抓到底的韧劲。抓而不紧等于不抓。有时候必须抓的非常具体,当然是属于带有全局性的问题。
这是工作方法,在毛泽东著作里比比皆是,学是前提,用是关键。
8、避免决策失误最主要的还是民主和科学,而且领导者的眼界要开阔、收集信息要广泛,没有这一点是很难做出科学决策的。
信息是千里眼、顺风耳,在21世纪,信息对企业更为重要。“民主”是为了集思广益,“科学”是为了避免主观失误。
9、企业要想成功,一定要有健康的核心的价值观,我个人追求“守正出兵”,我希望这个价值观能被企业长期坚持。
一个健康的公司往往取决于创业者、老板自身是否有健康的价值观、生活态度以及健全的人格。
一个健康的价值观让全体职工都从心底里接受是不容易的,但起码老板必须具有,继之为高层领导群体具有。如价值观上有分歧,公司终究会四分五裂。
10、老板善于调兵遣将,因人所长而分任之,使每个人在各自岗位上都能发挥最大的作用,不能发挥作用的人,就要按照“能上能下”的机制换人。
适才而用。
11、宁波彬彬集团董事长一年难得下一次车间,号称那不是他的工作。生产、销售有各公司的经理带领,他用不着天天忙着“救火”。制定企业的下一步发展目标是他的主要任务。郑认为作为企业的领导者,绝不能陷入事无巨细的泥淖,应善于失小而得人。
当一个企业各方面的运作基本上步入正规,亦即企业真正实现“法治”而不是“人治”时,郑永刚的做法才有效。也许郑已经忙过了,真正忙的时候也是没白天没黑夜的,谁知道呢?
12、如果你不是一把手,不是决策者,只是总工、总设计师,我觉得你是需要专业化,而且应该是一个佼佼者。
如果你是一个企业家,那你更重要的是去了解市场,读懂市场,你的决策是来自这个市场。
善弈者谋势,不善弈者谋子

知乎在发展过程中使用了哪些增长黑客技巧

  在近几年的中文互联网上,知乎是一个无法忽视的存在。没有一个网站能像知乎这样,虽然只有3000多万用户,影响力却无处不在;知乎已经毫无疑问地成长为了国内最大的高品质知识问答社区,也沉淀了非常多高价值的专业内容。更重要的是,与此对应的,知乎正在覆盖或者说已经覆盖了国内最有价值和最高质量的专业人群。

 

  知乎创立于2011年1月26日,产品形态类似于国外的Quora,已经从一个初期一个小众的极客社区成长为了拥有3000万注册用户的庞大社区,不仅如此,知乎的用户留存率也高达80%。

  用户可能在门户、今日头条、微博、微信上看到的网络热点,但最后的定性结论都会百川汇海地回到知乎上,“看看知乎上怎么说”。热点的深度挖掘、内幕爆料、多角度分析都发生在知乎上。

  披着“问答网站”的外衣,知乎把自己打造成了中文互联网上最大的综合讨论社区。

  我们看看知乎在发展过程中用了哪些增长黑客手段?

  一、朋友圈小游戏推广

  2014年11 月 17 日,知乎制作的小游戏《财务包子铺》上线后在微信朋友圈里疯传。它被知乎日报直接定义为“软游戏”,目的是推广知乎出的新书《金钱有术》。这是一个关于创业的小游戏,玩家以创业老板的身份,对自己的包子铺的日常经营做出决策。听上去没什么特别,不过不少玩过的人发现,嘿,还真有点意思。

  

 

  游戏上线,三天后,《金钱有术》已经是亚马逊图书销售总榜冠军了,同时还是预售冠军、新书冠军、经济类冠军。这个成绩也超出了知乎团队的预期——“没想到我们连肖秀荣考研书都打败了,真是个奇迹。”

  《财务包子铺》小游戏的营销功不可没。截至 20 日,在游戏里点击“购买秘籍”这一选项的独立用户数就有 55 万。

  那么,这款小游戏是怎么做到的呢?

  1. 创意依托于用户内容

  为什么是包子铺呢?在知乎的金融财务类问题里,回答者常会用“包子铺”来代表最基础的一家企业,围绕它进行一系列通俗易懂的解释和演绎,将枯燥的财务问题化为接地气的包子铺故事,久而久之形成了独特的“包子铺文化”。《财务包子铺》小游戏正是脱胎于这系列回答。(书和游戏都已得到知友授权。)

  知乎市场部负责人透露,其实从书到游戏都是知乎用户全程参与进来的一个事件。首先是知乎过去两年活跃了一批金融、投资、财务背景的知友,已经产生了大量优质内容。然后知乎发现,更广大的用户对这些财务知识也有市场需求。但非财务背景的普通人,很难逾越一道专业门槛和心理障碍,愿意花钱买书去学习财务知识。

  “我们在推广上还必须做好一个台阶或者说斜坡让非专业读者走过来。”而《财务包子铺》小游戏,正式这样一个“斜坡”,“把财务经营的理念、知识融于其中,让大家通过游戏知道自己在这方面的知识欠缺,从而产生购买意愿。”

  2. 题目设计信息量大

  “希望寓教于乐,那么题干结局要信息量大,又要有趣,万万不能敷衍了事。”知乎市场部头脑风暴了三天,之后又随时想出一些新创意:例如续命是要选择知乎新书的,“又硬又有趣”;还有会计三张表,难倒了许多人,也容易形成传播,成为对会计第一课的基本知识的普及。

  在游戏线路和框架已经搭建好的基础上,又花了三天时间写文案,润色所有题干和结局。

  3. 病毒传播点:多种脑洞结局

  这个游戏的一大乐趣在于探索各种脑洞大开的结(死)局(法)。知乎设计了 90 多种结局,30 多幅配图,很多人会反复刷,直到刷出 10 种以上结局。

  4. “软广”植入点不招人烦

  “软游戏”软在哪里呢?游戏中专门设计了机制,比如用户如果决策失误,就会收到破产警告,需要选择一本救命书——当然就是这本《金钱有术》。续命之后可以继续游戏,让玩家对新书留下了初步印象,又不会中断游戏。

  如果最终还是不幸破产,会有“通关秘籍”选项,这时才会将用户导入《金钱有术》亚马逊购买页面。

  二、设计激励用户活跃度的社交元素跟荣誉体系挂钩

  知乎团队在激励用户活跃度方面的诸多尝试,比如将“人”作为主要的传播节点,比如早在2012年4月就在个人主页加入了很多社交元素:个人资料新增“职业经历、居住地、教育经历、擅长技能”,会显示用户获得的赞同和感谢数。总结起来就是一方面引入了社会身份,一方面建立了知乎站内的荣誉体系。

  知乎上的个人品牌和专业声望不是来自于职场中的profile和工作经验,而是用户通过回答问题、通过用户(不仅仅是业内人士)的点赞树立起来的。这是一套和传统职场完全不同的评价体系

  这种基于持续回答问题不断为人所认识的社交方式,在所有的社交网站中无疑是门槛最高的。在知乎打造个人身份、品牌的超高门槛使得社区内涌现出了少数孜孜耕耘的“达人”。也贡献了大量高质量内容。

  三、基于数据,挖掘用户兴趣

  知乎上拥有大量的用户行为数据,这些行为也分轻重,不同的行为,会耗费用户不同的时间,用户对该事件的关注度也能够体现出来。此外,知乎上还有大量的文本信息,基于这些信息,知乎对于用户的兴趣点、擅长的领域的挖掘会更准确。

  用户在知乎上的行为是多维度的;既包括比较轻的浏览阅读,又包括重一些的赞同、反对,还有更重的提问回答(这里的重和轻是根据用户操作成本来界定的)。知乎可以根据这些行为做用户的特征分析,基于各自不同的服务特点,所要分析的特征、采用的算法及其效果各有不同。基于行为和文本,知乎对用户的兴趣和擅长能有更准确的识别。

  四、每周千亿次权重计算,分享用户专业度

  现实社会中,人们对于某些领域的知识掌握会很深入,但个人精力有限,没有人能够全知到成为所有领域的专家。这种情况被映射到知乎上,即不同的用户在不同的话题领域下,他们的专业性是不同的。为了掌握这种不同,知乎给每个人,在每个话题下计算一个权重。计算的分值主要依据用户在知乎上的回答。当然,这里也会加入一些其他考量因素,包括其他专业人士对该用户的背书,用户的专业背景等。

  这是知乎非常基础的数据设施,但这个数值计算的量级较大(100万回答用户10万话题=千亿级别的数量计算),知乎对于权重判定每周都会进行全量的计算,也一直在调整优化中。

  五、不断对答案排序算法优化,让高质量的问答更容易获得关注

  知乎对答案排序算法进行优化,目的是让好的答案更靠前。随着用户量不断增加,早期最简单的答案排序规则出现了问题:一些答案友情赞同比较多,让专业性不足的答案被推到靠前的位置。于是,团队想到了给赞同票加权重的方法,基于每个人在话题下的专业权重进行计算,排序得到优化,能让大部分优质答案可以排到前面。虽然针对权重计算的优化仍然在持续进行,但知乎技术团队还是遇到了一些算法上的瓶颈。如:当问题下有多个发布较早的回答获得高票时,新的回答即使质量很高,也很难在问题页上获得足够的曝光,难以积累更多赞同票;另外,一些误导性、煽动性的高票内容,即使同时也有很多反对票,却仍然排在认真、严谨但票数相对较少的优质回答前。这些问题在专业领域内对参与讨论的用户造成的伤害尤其明显。

  于是,知乎又设计了新的排序算法。使用威尔逊得分算法,即使前一步错了,现在这个新回答排到了前面,获得了更多展示,在它得到更多投票后,算法便会自我修正,基于更多的投票数据更准确地计算得分,从而让排序最终能够真实地反映内容的质量。该新算法年初发布之后,得到知乎站内用户热烈的反馈,很多专业的讨论涌现出来,为知乎的下一步优化提供了很好的想法。

  六、设计反垃圾系统封杀Spammer,删除垃圾内容

  知乎有个反垃圾系统(名「悟空」),每一次用户提交请求都会经过「悟空」的分析处理,「悟空」会通过一系列包括发布频率侦测、文本分析、相似行为检测、用户可信度查验等几十条在线分析策略,作出判断,根据判断结果,系统会作出对应的处理动作,比如屏蔽请求,删除内容封禁帐号、限制行为等。「悟空」会基于正常用户的行为模式,检测异常离群点;不断输入Spammer的行为数据,以检测相似 Spammer行为。

  七、内容的个性化推荐

  知乎希望在首页给不同的用户、不同的时段挑选出最棒的内容,使用机器学习算法,知乎提供了不会重复的个性化内容排序。首页的内容会主要考虑这几方面:

  内容本身的话题领域是用户感兴趣的;

  知乎是一个社交网络,用户的社交行为会带来“粉丝”首页的变化;

  时间因素,一些内容及时出现,可以让它的价值更大。

  知乎的首页有一套专用的数据收集和处理机制,可以记录用户在首页的所有重要动作,例如,某条内容出现在用户浏览器窗口或手机屏幕的可见范围内,就会记录一次。

  八、邀请合适的回答者来回答问题。

  “谢邀”这个词的产品功能是为每一个问题找到合适的回答者。采取一种算法模型预测某个用户回答某问题的可能性和回答质量,有 90% 的邀请是通过这种推荐结果发出的,剩下 10% 是用户主动搜索产生的。

  九、每周知乎个性化精选邮件(EDM),提高打开率。

  针对每个用户做了个性化的计算,通过不断的算法优化,知乎已经做到30%的打开率和14%的点击率。

  十、把问题聚类,形成更好的关联性阅读。

  对问题的文本进行聚类,比如文本语义匹配,通过复杂的词袋模型(如传统的PLSA、LDA、新的Word2Vec等)对问题文本进行向量化,这样通过语义将相关问题聚类起来。知乎站内拥有庞大的用户浏览数据,如果将这些浏览数据通过简单地算法(如协同过滤)建立一个模型同样也能达到很好地效果。

http://jinzhou.kvov.com.cn/jzxx18528.html