欢迎来到智能寄存柜系统|存包柜系统|枪弹柜系统|钥匙柜系统|储物柜系统|东莞中立智能装备技术有限公司!

全国咨询热线:

13825746432

钥匙柜系统大大数据与智能革命重新定义未来

发布时间:2018-04-25点击量:

钥匙柜系统大大数据与智能革命重新定义未来

2001年,当全球互联网泡沫破碎后,大家都在逃离注个领域,很多人从互联网行业回到了学术界。人们问我为什么在这样一个时候离开NASA (美国国家航空航天局),加入Google这家不大的互联网公司。我和他们讲了大萧条时期(1929--1933年) 的一个故事。在大萧条时,有些人买了银行的股票,后来都发了财。事后人们问那些买了银行股票的人为什么在银行如此糟糕时敢买它们的股票,那些投资人讲,“因为全世界的钱都在它们那里。”所以,加入Google的决定并不难做,因为全世界的数据都在Google那里。

若威格Googe负责搜索质量部门(也是我所在的部门)。2005年之前虽然我们不断地使用数据来提高搜索质量,但是主要的工作方法还是道循因果关系。比如我们发现有些搜索结果
相关性不好,那么我们需要先分析原因,再寻找答案。在那个时候,网页搜索质量可以提升的空间还比较大,靠这种方法我们每年可以将搜索质展提高3-5 个百分点。不过随着搜索质量接近完
美,再按照这样一种方式工作每年的进步连了。一个百分点都到不但与此同时,依靠数据的积累,大家发现搜索据特征有很强质量和很多数相关性,际达种性可以迅建提开视家北系购质量。在所有的数据中波东质服技关能展的服大的点击数据, 即对于不同的搜索关键词,用户们都点击了哪些搜索结果(网页)。山如对于“虚拟现实”这个查询,用户有3100次点击了网页A,1000次点击了网页B,11000次点击了网页....在这种情况下,国页A应该被排在第一位,但是如果搜索排序算法不好,有可能出现它没有被排在第一位的情况。这时搜索引擎的设计者就面临一个选择,是采用通过研究改进原有的排序算法,还是干脆相信用户的点击结果,或者是将它们结合在一起。如果单纯改进排序算法,这个周期特别长。如果相信用户点击的结果,其实就是用相关性取代因果关系,  当然这里面有两个风险:首先是用户点击容易形成马太为应,排在前面的结果即使不是很相关,也容易获得更多的点击;其次是单纯依靠点击,搜索结果的排名容易被一些使用者操纵。因此,比较稳妥的办法是对用户的点击数据建立一个简单的模型,作为搜索排序算法的一部分。
  今天,各个搜索引擎都有一个度量用户点击数据和搜索结果相关性的模型,通常被称为“点击模型”。随着数据量的积累,点击模型对搜索结果排名的预测越来越准确,它的重要性也越来越大。今天,它在搜索排序中至少占70%-80%的权重”,也就是说搜索算法中其他所有的因素加起来都不如它重要。换句话说,在今天的搜索引擎中,因果关系已经没有数据的相关性重要了。