お久しぶりです。久保です。

SGを読んでくれている方の中にはS&Cコーチやトレーナーの方も多くいると思います。最近では、チームの管理にいろんなデータを採取してそれを元に選手たちにフィードバックしている方も多くいるでしょう。

今回はそんなフィードバックの時に、ちょっと気をつけておきたい点を1つ書いていこうと思います。3分くらいで読めるように。

正規分布という言葉

皆さんは正規分布という言葉を聞いたことがありますか?僕は大学院に入るまで知らなかったです。

正規分布というのは、分かりやすく言うと平均値付近に多くの値があること、つまりは平均から離れていけば値が少なくなる分布のことを言います。言葉だけだとよくわからないと思うので、図を載せます。平均からどのくらい離れたら〜とかあるのですが、その辺は調べてみてください。

この時、平均値は中央値と最頻値が等しくなります。中央値とはその名の通りデータの真ん中に位置する値のこと、最頻値とは最もデータが集まっている値のことを意味します。

一方「正規分布」という言葉があるならば「非正規分布」という言葉も存在します。図にすると下記のようになります。

ここで感のいい方はお気づきかもしれません。そうです、平均値、中央値、最頻値はどれも独立しているのです。なぜこれがフィードバックするときに注意しなければいけないのでしょうか、以下の図を見てみましょう。

この図は、とあるAというチームがあったとして、そのチームの垂直跳びのデータの分布を調べたものです。このAというチームの垂直跳びのデータは’正規分布している’と言えるので、フィードバックのときに「君は平均より下だったからもうちょっと頑張ろうね〜」とか「平均より上だったからこの調子で頑張ってね」という声がけができます。しかし、以下のような場合はどうでしょう?

はい、このチームの場合は正規分布をしていないので最頻値が40cmなのに対して平均が70cmです。ではこの時、平均をビャーッと計算して「君は平均より下だったネ」とフィードバックすることは果たして正しいのでしょうか。

ご覧になると分かる通り、「平均値」というものは極端なハズレ値に引っ張られて値が変わったりするので、そのチームのデータが本当にそこに多く集まっているのかはデータが非正規分布している場合はわかりません。つまり、データが正規分布していない状態で「平均」だけ見てフィードバックを行ってしまうと、そのチームの傾向を過大評価したり過小評価してしまったりして見逃しかねない、ということになります。

じゃあどうすりゃいいの?

もし、データを取ってみて、平均値、中央値、最頻値の値が極端にずれている場合、まずは散布図を作ってハズレ値がいないが見てみましょう。そして、そのハズレ値を取り除いてもう一度平均値、中央値、最頻値を計算して、ズレていないようならハズレ値の人たちは別個でフィードバックして、残りの人たちは平均を使ってフィーバックしましょう。

そして、もし極端にハズレ値がいない場合は、最頻値、もしくは中央値を一つの尺度として採用してみましょう。ただし、その性質上、中央値はデータの変化や比較には不向きなこと、最頻値はデータの個数が少ない場合に使えないことを考慮して、フィードバックしてみましょう。

この記事がみなさんのフィードバックの手助けになれば幸いです。