読者です 読者をやめる 読者になる 読者になる

アラカン"BOKU"のITな日常

人事評価と人工知能について考えたことがメインテーマです。

人事評価する人工知能をつくるとして、評価が人によってブレる問題の対策を考える

はじめの思いつき

今回は、「評価」を考えるときの懸念について、「人事評価する人工知能」でどう扱ったらいいかをざっくり考えたので、そのことを書いてみます。

 

前回あげた懸念事項は以下の2点でした。

  • 中心軸や基点が定まらず、不安定になりがちなこと
  • 同じ対象に対する「ブレ」が大きく、正解がないこと

 

まずは上の中心軸や基点が定まらないことについてです。

 

評価される側の評価軸

こねくりまわすと収束しないので、一旦、評価される側(評価対象者)がどういう人かによって、評価軸が変わるという問題だととらえます。

 

その上で、同じことをしてもほめられるか、普通と思われるかどうかの判断軸を何にするのが一般化しやすいかを考えてみます。

 

今の人事評価だと、役職とか経験年数を基準にしている企業が多いと思います。

 

例えば、新人だから、これくらいできれば素晴らしい。君は課長になったんだから、これくらいでは評価できないよ・・という感じです。

 

でも、課長という役職からイメージするレベルは、会社によって全然違うはずですし、一見公平そうで実はそうでもなかったりします。

 

企業とかの枠を超えた公平な評価をめざすにあたり、これでは、汎用的基準にはなり難いです。

 

やっぱ、一番汎用的な基準はベタですけど「金」じゃないでしょうか。ようするに、給料ですね。同じ行動をとらえて、「給料を月20万円の人がやった」場合にどう評価するのか?、「給料が月50万円の人がやった」場合にどう評価するのか?という観点は、とってもわかりやすいと思うのです。

 

つまり、「評価対象者のレベルは、給料を基準にすればいいんじゃない」ということですね。

 

評価する側のブレ

評価者によって大きくブレがでてしまう問題です。

 

これは2つの考え方があるなと思ってます。

 

人間とはそういうものだとして扱って、最終的な判断をする人に適切な情報提供をするという方法論がそのうちのひとつです。

 

もうひとつは、評価者による甘辛や、判断ブレを統計的手法を使って正規化してあつかう方法論です。

 

コンピュータが評価する手もあると思いましたが、最初にルールを定義した人の色がつくことは避けられないですし、そうすると、一定の割合の人にとっては納得いかない評価になりますから、それは考慮からはずしてみます。

 

今のところ、後者の方で考えたいなと思います。

 

つまり、「同一行動に対する多様な評価結果をそのまま学習・結果に使う。ただし、なんらかの統計的手法を使った人工知能で正規化してレポートにする。」ということですね。

 

イメージにしてみる

頭の中のイメージをEXCELで書いてみます。

f:id:arakan_no_boku:20161028061604j:plain

 

今のところ、評価の正規化の方法が漠然としているので、単純にウエイトなどという言葉を使っていますが、あくまで、仮置きということにしておきます。

 

2017年2月25日追記

この記事は勉強をはじめる前の初期のころに書きました。今は、このころより、少しわかってきたので、少し方向修正してます。

 

この思いつきから派生したカテゴリがこちらです。

人事評価そのものについて、もう一度考え直してみる。

ディープラーニングについて、もう少し勉強してみる。

システムを開発する言語やフレームワークについて試してみる。

 

あと、それ以外にもいくつかカテゴリをわけて書いてます。

ホワイトカラーの仕事のやり方で思うことを書いてみる

お昼休みとかの時間つぶしにやった頭の体操的なことを書いてみる。

人工知能と仕事などに関連して興味を持ったことを書いてみる。

 

よければ、読んでやってください。