18720358503 在线客服 人才招聘 返回顶部
企业动态 技术分享 行业动态

检索模块的网络投票大选的方式与网页页面排列

2021-03-08分享 "> 对不起,没有下一图集了!">
前些天读了1本《大选的窘境》,在其中有1章,从美国的大选规章制度说起,详细介绍美国大选规章制度的不够,随后对于其不够,提出种种改进,但是每种改进都有其各有的难题,在其中的转变很趣味。
先说美国大选规章制度,美国的总理大选是1种“赢者通吃”的方法,每一个州依据此人口是多少,有几10或几百的“州票”,州里的人对总理候选人开展大选,在某个州得到票数最多的那个候选人,得到这个州全部的“州票”,随后统计分析全部候选人的“州票”是多少,得到数最多“州票”的候选人获得胜利。
这样规章制度的难题是明显的,例如假如仅有两个州,A州5本人,而B州4本人,州票也各自是5和4,假如某候选人X在A州以3:2获得胜利,另外一个候选人Y在B州以4:0获得胜利,这样明显候选人Y在全国性范畴内得到了6张票,而候选人X仅有在A州的3张票,可是因为“赢者通吃”,X得到了A周的所有5张“州票”,Y只得到了B周的4张“州票”,在全国性仅有1/3群众适用的X竟然得到了大选的获胜。
这样的状况在2000年美国总理大选中就出現过,小布什的州票领跑于戈尔,但是在全国性群众中统计分析适用戈尔的人数确是超过小布什的,自然戈尔输给小布什也有另外一个缘故,这里按下不表。
假如放在优化算法行业,能够看出这里的难题在于,以便统计分析結果R(最合适的总理人选),寻找了1个特点A(每一个群众的网络投票),而决策結果R的,却并不是特点A,而是由特点A推导出来来的特点B(州票),在特点A向特点B的推导全过程中,信息内容遗失了(每一个洲的适用百分比不1样)。
“赢者通吃”这类规章制度的实际历史时间缘故先不说,有兴趣爱好的盆友能够去看原著。处理这类难题的最立即计划方案便是从“赢者通吃”变为直选,也便是1人1票,立即统计分析票数,但是这样也会遇到1系列难题。
在谈那1系列难题以前,先把要处理的难题抽象性1下:
有n个候选人,每一个选民对这n个候选人网络投票,最后在n个候选人群中选出最适合、最合乎民声、也合乎逻辑性的那本人。
计划方案1:1票制,每人1票,选出自身最喜爱的候选人,对結果开展统计分析,得票数最多的那本人入选。
这样做的难题是会致使作者界定的1种“鹬蚌困局”,举例说,假如有ABC3个候选人,在其中BC政见较为相近,适用B的人也较为适用C,反之亦然,在全民中,喜爱BC的人居多,A的政见和BC相反,适用A的人在全民中占极少数。这样致使的不良影响便是,BC得到的票会较为分散化,而A得到的票较为集中化从而得到获胜,假如BC中有1人不报名参加大选,票就齐集中到B或C1本人的手中,从而使大部分选民的适用者入选。前面按下不表的戈尔不成功的另外一个缘故,便是有人觉得有跟戈尔政见相近的耐德的参加,他分散化了一部分戈尔的选票。
能够对此难题有一定的改进的计划方案叫做“2选制”。
计划方案2:2选制,每人1票,假如无人得到超过50%的适用,则将得票最高的两个候选人拿出来,再开展1轮大选,得票多的人获得胜利。
法国总理大选便是这样的2选制,可是这样的方式只能改进“鹬蚌困局”,而不可以完全处理,2002年的法国总理总统大选就出現了相近的状况,那时候适用左派政见的群众较多,但是在2选制下,最后的前两名确是1个右派和1个极右派。出現这类状况的缘故是当年有16个总理候选人,且大部分是持左派政见者,这样就致使左派的票极端化分散化。
计划方案3:n选制,每人1票,假如无人得到超过50%的适用,则去掉适用至少的候选人,再开展1轮网络投票,若依然无人得到超过50%的适用,再去掉得票至少的候选人,直至有人超过50%适用为止。
2001年奥委会决策北京为2008年奥运会举办大城市的情况下,便是用的这样的规章制度,在第1轮网络投票里大阪被取代,北京在第2轮就得到了过半数以上的适用,从而入选。
n选制的难题在于不好用,假如是奥委会这类仅有几百本人网络投票的状况还能够应用,假如相近前面法国总理大选,有16个候选人,举国左右数最多将会开展15次网络投票,成本费太高。
计划方案4:立刻复选制,每一个群众对候选人开展排列,假如某个候选人得到了50%以上的首选,则立即得到获胜,不然取代票数最低的候选人,而且把票数最低候选人的得票中的第2候选人拿出来,分给对应的候选人,假如有人得到50%以上,则入选,不然再取代1位最低的,而且把他票分给里边排列最高的且未被取代的候选人,这般往复式。
爱尔兰总理大选和伦敦市长大选选用的是相近的计划方案,此计划方案也是有难题,试想这般情景:选民共10人,正中间派候选人是3人的首选,左派和右派的候选人各自是4人的首选,自然左派选民最反感右派候选人,而右派选民也最反感左派候选人,而左派右派的群众对正中间派候选人倒是都可以以接纳,无论是便可复选制還是n选制,正中间派候选人都会在第1轮被取代。而正中间派候选人则是全体人员群众都可以以接纳的人,也最能调合各派之间分歧,最和睦。
这个计划方案的实质难题是,尽管每一个选民能够对候选人排列,可是在第1轮的情况下却只考虑到了第1选,沒有考虑到选民的2、3选。
计划方案5:上行复选制,跟计划方案4相近,只但是第1轮取代的并不是适用至少,而是抵制数最多的候选人(得到数最多末选票的候选人)
再看上面提到的状况,正中间派候选人因为并不是任何人的末选,因此第1轮取代的是左派或右派,再第2轮大选中,正中间派的候选人便可以获得胜利了。
计划方案5也是有计划方案5的难题,考虑到这样1种状况,仅有两个候选人AB参选,选民9人,在其中6人喜爱A而反感B,3人喜爱B而反感A,不管依照以前的哪样方法,都会是A获得胜利。可是如今又多了两个候选人C和D,喜爱B的3人群中,全是把A列在最终1个候选的,而喜爱A的6人的末选,确是BCD各2票,这样,在第1轮大选中,A就因为得到了数最多的末选票被取代了,而根据用心的结构事例,彻底可使B最后入选。仅仅因为CD参选或不参选,A和B之间的输赢关联就产生了惊天逆转。
具体应用此计划方案的事例很少,仅有在公元前507年的雅典有相近的计划方案,并不是让群众投适用票,而是投抵制票,把抵制数最多的人投出局。
计划方案6:多赛制,群众对候选人排列,随后候选人之间两两pk,统计分析每张选票上看候选人A在候选人B前面還是B在A前面,这般寻找获得胜利场次数最多的候选人来获得大选。
这样的难题是将会致使循环系统输赢,如ABC3个候选人,有3个群众,网络投票各自是ABC,BCA,CAB,能够看出AB之间A获得胜利两次,A>B;BC之间B获得胜利两次,B>C,AC之间C获得胜利两次,C>A,这样就组成了1个A>B>C的循环系统。这个是否有点像足球联赛的记分制啊,假如積分同样,足球赛事中能够再看净胜球、进球、输赢关联等,可是作者并沒有在这个层面开展进行,而是详细介绍了另外一种方法:博达制。
计划方案7:博达制,群众对候选人排列,倘若有n个候选人,第1位的候选人得n分,第2位得n⑴分,以此类推,随后统计分析每一个候选人的总分,得到数最多分的获得胜利。
有人对博达制的指责是:将会有选民会运用这类方法开展舞弊(投“对策票”),最适用B的候选人原本心目中的排列是B>A>C,可是因为相对性A,她们還是更喜爱B,因而,以便把B拉上来,就得把A拉下去,她们的网络投票就变为了B>C>A。博达对此指责的答复是:我的规章制度只可用于诚信的网络投票者。
而这本书的作者却觉得博达制的“对策票”难题没那末比较严重,假如没法精确预测分析民声和精准操纵对策票的投法,有将会由于用劲过猛,不仅把A拉下来了,反而让C得到的适用票提升,这样就使得最适用B的那些人的“对策票”反而使得她们最反感的C入选了,当年在IMDB上就产生过相近1幕:
电影《蝙蝠侠6》上映后,蝙蝠侠的粉丝们感觉这部片太酷了,因而就想把蝙蝠侠6投成IMDB第1位,因而她们瘋狂的给蝙蝠侠6打高分,而另外,也竞相的给那时候的IMDB第1《教父》投低分,致使的結果便是用劲过猛,教父变为了第3名,原先的第2肖申克的救赎(TSR)变为了第2(原先的第2是排在教父后边,新的第2是排在蝙蝠侠6后边),然后来,伴随着瘋狂粉丝的激情消散,客观的建议占有了优势,蝙蝠侠6的得分慢慢降低,跌到了第10。而教父還是在肖申克的救赎后边,很久沒有回去了。
博达制是不是有别的难题呢?
以上只是对这本书第14章的1个笔记,也仅仅对于“多候选人单岗位”难题开展了探讨,书的后边还会对“多候选人多岗位”的状况再次讨论,也便是依据每一个人对候选人的排列,来决策最后的候选人排列。
返回检索模块行业来,如上对策的变化会给大家1些启示,先看看以前抽象性出来的难题:
有n个候选人,每一个选民对这n个候选人网络投票,最后在n个候选人群中选出最适合、最合乎民声、也合乎逻辑性的那本人。
这很像检索模块在处理的难题:
系统软件里有n个网页页面,有m个特点(网页页面品质、网页页面內容丰富多彩度、网页页面超链、文字有关性等)对n个网页页面有不一样的打分,怎样依据这些特点的“网络投票”,选出最合适放在第1位的网页页面呢?
从大选的事例中,大家能够获得的几个启示:
1. 设计方案优化算法时,要防止出現“赢者通吃”带来的信息内容遗失难题。
2. 不必由于某几个特点非常好,就把某个网页页面排到最前,或由于某几个特点非常差,就把某个网页页面抛下。
3. 最适合放在首位的网页页面不1定是在每一个特点上都最好是,而应当是可以兼具全部特点,综合性主要表现最好是的那个。
4. 检索模块应用者对检索結果的点一下个人行为,能够当做是对检索結果开展的“网络投票”,这样的“网络投票”信息内容的应用方法,也要留意考虑到是不是会带来大选全过程中出現的种种不符合理。
以上提到的种种大选计划方案,仅仅是对“多候选人单岗位的”的状况开展探讨,而检索模块应对的难题,则更相近于“多候选人排列”的状况,也即:
系统软件里有n个网页页面,有m个特点(网页页面品质、网页页面內容丰富多彩度、网页页面超链、文字有关性等)对n个网页页面有不一样的打分,怎样依据这些特点的“网络投票”,决策n个网页页面的次序?
而这个“多候选人排列”难题,是有1个“不能能的民主化”的基础理论的,该基础理论的疏忽是,“有效”的民主化应当考虑3个标准:
1. 假如选民都觉得A比B好,那末最后結果应当也是A比B好
2. 沒有“专权者”,也即,不存在这样1本人,不管他人如何排列,最后結果的排列都和这本人的排列1致
3. 不相干要素单独性,也即,在第1次网络投票进行后,A排在B前面,如今开展第2次网络投票,假如全部人都沒有更改自身网络投票中A和B的相对性次序,那最后結果应当也是A在B前面
而根据数学课的证实,能够得出结果:假如某种大选方法考虑标准1和3,则必定不考虑2,也即必定存在“专权者.
依据“不能能的民主化”基础理论,和检索模块融合起看来,好像检索模块很难得出1个有效的网页页面排列,可是检索模块和网络投票又好像有一定的不一样,有两个角度能够破译
1. 觉得标准3过度强,必须弱化。
2. 或许在网页页面排列难题上,真的存在这样1个“专权特点”,这个“专权特点”从现阶段来看,最合适的应当便是“客户令人满意度”了,依照客户的令人满意水平来排列网页页面,便是最有效的网页页面排列。怎样考量“客户令人满意度”呢?这便是大家1直在勤奋的。
by liangaili
"> 对不起,没有下一图集了!">
在线咨询