手机浏览器扫描二维码访问
谷歌的绩效管理总是把目标设定为起点。在21世纪第一个10年的初期,谷歌的董事会成员约翰·杜尔向我们推荐了一种在英特尔非常成功的实践方法:OKR。目标必须具体、可度量、可检验;如果你达成所有结果,就能完成目标。比如,如果目标是将搜索质量提升x%,相应的关键结果是更好的搜索相关性(结果对用户而言多有用)和等待时间(多快找到搜索结果)。既要有质量标准,也要有效率标准,这一点非常重要,否则工程师完全可以解决一个问题而忽略另外一个问题。用上三分钟的时间才给你找到完美的结果是不够的,我们既要求相关性强,又要求速度。
我们刻意设定了非常有野心的目标,知道不可能每次都实现这些目标。如果你完成了所有的目标,就说明设定的目标不够激进。负责监管GoogleX——开发出谷歌眼镜(一种置于眼镜内部的电脑,屏幕只有指甲大小)和自动驾驶汽车的团队——的阿斯特罗·泰勒这样描述:“如果你希望自己的汽车能达到时速50英里,没问题,你可以对汽车稍加改造。但是如果我告诉你跑500英里只能用1加仑的汽油,你就需要重新设计了。”我们不会把所有目标都设定得非常激进,但是如何选择需要一些智慧。恰如拉里经常说的:“如果你设定了一个疯狂、有野心的目标,最后没能完成,你至少也能够实现一些了不起的成就。”
因此在季度刚开始的时候,拉里会设定公司的OKR,激励每个人设定的个人OKR要基本与谷歌整体相适应。我们不会让完美与良好形成对立。一旦你看到公司的目标,很容易就可以将其与自己的目标做对比。如果你落后得太多,要么给出一个合理的解释,要么就要重新设定。此外,每个人的OKR在内网里都是对所有人公开的,就放在电话号码和办公室位置的旁边。能够看到其他人和其他团队在做什么是一件非常重要的事情,而看到自己的目标与谷歌的目标相契合也能起到激励作用。最后,拉里的OKR会根据他在季度报告中说明的公司表现来设定沟通透明化的标准,并确定恰当的高要求目标。
在目标的话题上,学术研究与你的本能结果一样:目标能够提升表现。但是,浪费大量的时间在公司上下逐级统一目标却不是很有效。这样做将耗费太多时间,而且公司上下的目标也很难统一起来。我们采用了一种以市场为基础的方式,随着时间的推移,我们的目标都将汇于一点,因为顶层的OKR已经众所周知,而且每个人的OKR也都清晰可见。偏离路线太远的团队会很引人注目,而为数不多的几项关乎所有人的工作也相对容易直接管理。直到现在为止,一切顺利!
从41级绩效考评到5级考评量表
2013年之前,每名谷歌人在每个季度末都会收到绩效考评结果。考评量表总共41级,绩效评分从1.0(表现糟糕)到5.0(表现惊人)。大致说来,低于3.0意味着偶尔或经常达不到期望值,3.0到3.4之间意味着能够达到期望值,3.5到3.9之间意味着超过了期望值,4.0到4.4之间意味着“大幅超过期望值”,4.4到4.9之间意味着“接近于惊人表现”,而5.0代表“表现惊人”。谷歌人的平均分在3.3到3.4之间。如果某人连续几个季度的平均分为3.7或更高,通常就能升职。这种做法没有任何创新可言。
考评体系是否科学仍存在不确定性。考评分级为3个、5个、10个或50个到底有没有不同,至今也没有可靠的证据证明。我们的41级考评量表源自我们的工程师基因。能够准确区分表现3.3和3.4的员工能够令人感到满足。如果将多个季度的评分进行平均,就可以精确地区分3.325和3.350的表现。如果你认为小数点后三位的评分已经过时了,其实我们还有4001级的考评体系!我们开发出极为复杂精细的解析法,确保你的评分略高一点,就能得到略高一点的奖励。实际上这些并没有意义。尽管我们在组织考评上用了很多时间,但等到设定薪水和奖金的时候,管理者或后面的评审者有三分之二的时候会进行调整。我们的管理者每三个月就要用数千小时组织绩效考评,考评过程的精确程度近乎滑稽,却不能作为确定薪酬的可靠依据。
同样一年进行4次绩效考评也遭遇到同样的窘境。我们采用这种方式,一方面是由于在谷歌迅猛发展的几年里,这样做有利于我们管理员工,另一方面是由于我们希望确保对员工的评估总能与实际匹配。然而,我们发现,一年中有多达24周的时间在分配考评任务、校准评级(我将用几页的内容解释校准评级的意义——这一点很重要)或就考评结果进行沟通。有些管理者喜欢这个频率,辩称这样可以迫使他们经常检查员工工作,以便发现绩效突然变差的员工。但这种评分体系只起到一种支撑作用。我在此无意要求他们停止检查未参加评估的员工,但是为了发现500名陷入困境的员工却要评估5000人,看起来似乎是一种浪费。
2013年,我们用去大部分时间探索是否有更好的方法。我们尝试了各种替代方式,从没有工作分级到800个工作分级,这使几乎每个人在每个季度都因升职而士气上涨。我们研究了年度、季度、月度和实时绩效考评。我们考虑过3分和50分的考评分数体系。我们争论过是用数字还是某种主题词作为标签标注每一个绩效分类,甚至还反复考虑过无意义的主题词,以避免人们将注意力放在标签上。我甚至还提议加入水行侠、红三角或杧果(见图7-1)等考评等级。
图7-1谷歌人保罗·考恩制作了“大幅超过期望值的杧果”图形,用于解释我的一种考评分级建议
图片由保罗·考恩提供注释标题任何阅读本书的谷歌人都可使用这张图片,我们已经得到保罗·考恩和科林·麦克米伦以及GCPA的同意。Memegen网站上出现的东西,可以保留在Memegen上!
这个体系的意义在于,利用毫无意义的名称使人们忽略标签本身。当然,人们最终还是会给标签加上含义,很可能会将水行侠定义为最差的(水行侠似乎总是输给其他一些超级英雄)。我们组织了协调委员会、咨询委员会,甚至就一些问题开展员工投票。
最终,我们总结了三条经验:
●不可能达成一致意见。没有明确证据的情况下,所有人都可以成为专家,而且每一种方案都可能有人支持。人们对于绩效分级为5个还是6个之类的问题都很有主见。即便是对谷歌最不讨人喜欢的现行流程进行调整,也不可能找出一个令所有人满意的解决方案。尽管人们似乎不喜欢现有的体系,但是他们更不喜欢其他任何选择!
●人们对待绩效管理非常严肃。比如,我们就绩效分类的标签征询谷歌人的意见,结果得到4200多张投票。大趋势倾向于严肃、明晰,而不是异想天开。
●实验至关重要。没有外部证据的情况下,我们必须自己动手,与谷歌各个部门的管理者协作,帮助他们测试想法。在YouTube,他们尝试将所有人按照最高效到最低效的顺序进行排名,不论员工级别,排名之后发现最高效的两个人是中层员工,然后两人得到了YouTube最高的股权奖励。虽然获奖人的具体奖励并没有公布,但是每个人都知道有这样的事情发生。注释标题这个例子很容易令人想到艾伦·尤斯塔斯的格言:顶尖工程师的价值相当于普通工程师的300倍,而传统的绩效和薪酬体系都是依据等级制度而不是依据贡献来决定报酬的。我们还在另外的部门尝试将绩效考评分为5级,管理者发现相比此前41级的绩效评估,在部分项目上满意度要高20%。
我要特别强调这项工作对人力运营部而言的难度。我们的工作并非关乎生死,但是员工会抱怨、会抗议,最终可能会辞职。我们在谷歌面临的挑战在于,因为我们给了谷歌人太多的自由,因为我们以数据为导向,因为谷歌人关注公平性以及我们对待彼此的方式,所以要做出此类改变需要艰苦卓绝的努力。我们接触的每一个团队都对现行体系非常失望,但是每个团队又都不愿做一些新的事情。而单单是我们的YouTube部门,就提出十几种不同的新考评体系进行尝试。我非常自豪,人力运营团队在实现这些改变的过程中坚韧、有见解、细心,而我更要感谢那些与我们合作的团队,他们放弃了谷歌15年的传统,尝试了一些新的东西。
根据我们的实验,2013年初我们停止了季度考评,改为6个月进行一次。虽然还有人抱怨,但并没有造成任何损失。这一改革立刻节省了50%的考评时间。
2013年底,我们选定了全公司大约15%的员工,一共6200多位谷歌人,改为采用5级考评量表:需要改进、持续达到期望值、超过期望值、大幅超过期望值和表现杰出。与以前的标签类似,但是实际的评分级别变少了。
我们秉持了医学的宗旨:Primumnonnocere,即首先不要造成任何伤害。鉴于这是第一次尝试这种改变,我们设定的目标仅仅是达到与旧的考评量表相当的满意度、公平性和效率即可。我们发现,一旦跨越了最初的怀疑和认知阶段(“你说我不再是3.8是什么意思?我很努力地工作才得到3.8的!”),就不必再为0.1的评分差别而苦恼和浪费时间了。管理者也被迫与员工进行更有意义的对话,而不是将一切都隐藏在“你这个季度的考评分数提高了0.1,干得不错,继续努力”之类的话中。
看到“准确性”没有丧失,我们长舒了一口气。我们将5级量表考评体系下谷歌人的感受与41级量表下谷歌人的感受做了对比。我们问了如下问题:
●绩效水平低下的人识别出来了吗?
●适合升职的人识别出来了吗?
●讨论有意义吗?
●过程公平吗?
在全公司范围内,新流程的评价并不比旧的差。虽然看起来似乎只是一场得不偿失的胜利,但是我们长长地舒了一口气。有些谷歌人担心41级的考评量表所传递出的准确性会丧失,也就意味着我们的评分会不那么有用和有意义。但现实中谷歌人调查结果暴露出我们一直怀疑的一个问题:41级考评量表只是给了准确性的假象。
多数谷歌人都承认,很多考评体系下多0.1或少0.1的评分并没有什么区别。比如,对3.1和3.2之间的差别从来都没有一致的结论。正如我们人力与创新实验室成员梅根·胡特所解释的:“这种状况下的考评可能既不可靠也没有效力。同一个人,同样的表现,但是由于考评人和校准团队的不同,她得到的评分可能是3.2,也可能是3.3。这就意味着考评不可靠。如果她得到了3.3,实际表现却只是3.2,那么就说明考评没有效力——评分没有反映实际情况。”
因此,如梅根所说,考评体系并不完善。也就是说,我们应该告诉员工:“吉姆,你的绩效表现介于3.3和3.5之间。”但现实中我们并不是这么做的,管理者拿到一个分数,就会给分数赋予一定的含义。因此,如果某人的考评分数从3.3提升到3.5,就会认定他取得了进步,但实际上他的表现可能还保持在原来的水平。再想象一下,你的考评分数降低了,对你的评述也认为你的表现变差,但实际上只是测评的误差,这时你的处境该多么糟糕啊。
接下来,发生了一些有趣的事情。这6200多位谷歌人分属8个不同的部门,其中总人数1000人的三个团队决定对5个绩效分类做进一步细分。比如,有一个团队将每一个分类进一步分为三个次级分类,这样明星谷歌人就可能得到“特别杰出”“中等杰出”“低水平杰出”的评定。图7-2显示的是最终的考评分布。我将所有的次级分类合成了5个主要分类,便于对比两种方式的区别。A组坚持了5个分类,B组有15个分类。
图7-2A组和B组的平均考评分布
B组中有更多的绩效标签,他们期望能更细致地区分员工,但实际上区分度远不及A组。A组中5%的员工为“表现杰出”,B组中只有1%。我敢说,所有这些团队的总体表现都在同一水平上,他们给谷歌带来的价值相当,没有哪一个团队的成员优于另外一个。而B组中加入了更多的考评分类,不知不觉、无意识或错误地认定他们没有明星员工。虽本无意如此,但他们80%的顶级员工被排除在顶级绩效分类之外。
在你阅读本书时,所有谷歌人都已经开始采用5级考评量表了。在2013年底,这还处于实验阶段,但最初的种种迹象都很好。第一,这种体系下员工能够得到更多的考评结果反馈,替代了以往3.2和3.3之间的模糊区别。第二,这种体系下的绩效分布更广。我们缩减了绩效考评的分类,管理者就更可能利用考评体系的两极。虽然关于绩效考评体系的学术研究尚无定论,而且谷歌人的反馈意见也都趋于中立,但是我发现5级分类的考评体系至少在上述两个方面具有优势。
如果和女友BE 战术大师:最强训练家 直播系统之退圈后靠灵气复苏翻红 二战·柏林玫瑰 火影之修行有道 顾少的黑化萌妻 召唤影忍,开局成为最强村长 剑道圣君 人在光之国:师从艾斯,新生法王 我是路过的旅行者 给我记好了 我真的是教主 娱乐之金手指的世界 欢乐颂·典藏版(全3册) 灵然宠悠然余生 重生大佬当赘婿 moba:开局觉醒狂风之力 表妹她娇媚动人(重生) 开放虚空通道,让所有人给我打工 人体冷冻,开局走出异星休眠舱 我,海军小兵,开局吃空海军本部
如果杀人不是为了装逼,那将毫无意义如果活着不是为了装逼,那还不如死了。杀,就杀他个尸横遍野,装,就装他个巅峰不败!mdashmdash新书一剑独尊已发布,欢迎大家去阅读,在纵横直接搜索一剑独尊便可。微信公众号直接搜青鸾峰上。青鸾读者群571783824...
叶飞获得不灭剑魂,鏖战九天十地,手中一剑,屠灭神魔亿万,冲天一怒,斩断无垠星河为红颜,他甘愿冒死,为兄弟,他不惧两肋插刀亿万年剑皇沉寂,只为这一天,剑意永恒不灭,威名万古长存...
上一世,瞎了眼!真情错付,死不瞑目!这一世,再重来,仇恨滔天!绝不手软!惩庶母,虐渣男,斗小三!专治各种不服和小人!相府嫡女,涅槃重生!当最善良的人学会狠毒,当最软弱的人硬起心肠,凤眸半挑,素手倾城,欺她害她者,定要千百倍偿还!翻云覆雨中,将自己的命运掌握在自己的手上!且看她锋芒喋血,风华惊天下!...
你跑不掉。被称为活阎王的男人强势在她耳边宣告。江遇年掌握帝国所有的商业命脉,暴戾冷酷,却唯独视顾淮枳为珍宝。只要她想,任她肆意妄为。在她遭遇继母谋害,被赶出家门之时,他腾空而降,一言不合宠上天。完虐渣爹,手刃贱女。女人,只要嫁给我,整个帝国你都可以横着走...
村里的傻子给全村人下药,半夜全村疯狂了...
母亲重病,巨额医药费将张超逼上了绝路。因为善心救人,却得到了一双鉴宝神眼。从此以后,纯净清透的帝王绿翡翠,富贵逼人的极品玛瑙,温润洁白的和田玉,古拙厚重的青铜器,精美绝伦的青花瓷,云缭烟绕的山水画一个珠光宝气的世界向他敞开大门,鉴宝捡漏,赌石改命,张超的人生步步青云,直上云霄!...