タグ別アーカイブ: 散布図

散布図&近似曲線&相関係数の表示

散布図は数あるグラフの中でも相関関係を見るのに一番適しています

そして、散布図がダッシュボード内にあれば数字の深い洞察が行えるようになります

今回は散布図の作り方だけでなく、相関関係を解釈し易いように「近似曲線を追加」する方法と相関係数の計算方法を解説します

散布図

散布図はX軸とY軸の2つの軸から構成されます

上の画像では、X軸に身長、Y軸に体重を配置しています

ここで、散布図ならではの注意点があります

X軸とY軸ともに数字は「集計しない」を選択しておきましょう

近似曲線の追加

表示

近似曲線の追加は下の画像の黄色く印をつけた箇所から行います

近似曲線はPower BIでは「傾向線」という名前になっています

上の画像の「追加」をクリックすれば、近似曲線が散布図に追加されます

線の種類や色を調整したい時には下の画像の箇所にて調整します

数式

数式を表示したい時には新たにメジャーを作成します

メジャー内ではLINESTX関数を使用します

LINESTX関数でテーブルを作成すると、下のようなテーブルが作成されます

myValue =

VAR myTable=SUMMARIZE(‘ラグビー’,’ラグビー'[名前],”X”,SUM(‘ラグビー'[身長]),”Y”,SUM(‘ラグビー'[体重]))

VAR myData=LINESTX(myTable,[Y],[X])
Return myData

LINESTX関数で返される値には近似式(ax+b)の「Slope1:係数a」と「Intercept:定数b」が含まれます

こちらの2つの値をメジャーの中で成形する形になります

尚、LINESTX関数を使用前には「SUMMARIZE関数」でメジャー内にテーブルを事前に作成して変数に格納しておいてください(今回の場合はmyTable)

SUMMARIZE関数の文法は

SUMMARIZE(テーブル名,グループ化する切り口,列名1,集計式1・・・となります)

ここまでで、ax+bの「係数a:SLOPE1」と「定数b:Intercept」を求めることができました

それでは最後にこちらのSLOPE1とInterceptを数式の形で成形できるようにします

数式の形で成形するには変数を使用して、SLOPE1とInterceptを抜き出しておきます

myValueY =

VAR myTable=SUMMARIZE(‘ラグビー’,’ラグビー'[名前],”X”,SUM(‘ラグビー'[身長]),”Y”,SUM(‘ラグビー'[体重]))

VAR myData=LINESTX(myTable,[Y],[X])

VAR Intercept=SELECTCOLUMNS(myData,[Intercept])

VAR Slope=SELECTCOLUMNS(myData,[Slope1])
Return

FORMAT(Slope,”#.###”) & “x” & FORMAT(Intercept,”+#.###;-#,###”)

相関係数

*2023年4月30日に「相関係数」の部分は訂正します

Power BIのバージョンアップ後にクイックメジャーで相関係数を算出すると正しい値が表示されません

ですので、以下のメジャーの式を修正しながらご使用ください

式の中で「X」と「Y」が出てきます

XとYとは下のグラフの横軸(X)と縦軸(Y)のことになります(R2は相関係数を二乗した値のことになります)

*修正要の箇所:テーブル名/’ラグビー’、列名1/’ラグビー'[身長]、列名2/’ラグビー'[体重]

相関 =

//X平均

var __muX =calculate(AVERAGE(‘ラグビー'[身長]))

//Y平均

var __muY=calculate(AVERAGE(‘ラグビー'[体重]))

//分子

var __numerator  =  sumx(‘ラグビー’,(‘ラグビー'[身長]-__muX)*(‘ラグビー'[体重]-__muY))

//分母

var __denominator=  SQRT(sumx(‘ラグビー’,(‘ラグビー'[身長]-__muX)^2)*sumx(‘ラグビー’,(‘ラグビー'[体重]-__muY)^2))

return

divide(__numerator,__denominator)

***以降の記事は無効***

相関係数はクイックメジャーで計算し、「カード」で表示します

まず「新しいメジャー」の右横のマークをクリックします

クイックメジャーの画面が開いたら計算の種類を選択します

今回は「相関係数」を選択します

計算の種類を選択したら、上の散布図のX軸とY軸と同様の設定を行います

クイックメジャーの設定後は、新しいフィールドが設定されます

**************

<まとめ>

散布図は数字の背後にある相関関係を明らかにするのに有効なグラフです

ダッシュボード内の仲間に散布図を加えることで、数字の解像度がグッとあがります!

そして、近似曲線を追加することで散布図の背後にある相関関係の解釈を行い易くなります

ぜひ、深く数字を分析したい時にはこの散布図と近似曲線を有効活用してください

にほんブログ村 資格ブログ ビジネススキルへ

にほんブログ村

にほんブログ村 IT技術ブログ VBAへ

中学数学⁻三角比

昔、中学で習った数学の問題です

以下のグラフの針は散布図で動いています

果たして、Xの値③に設定されるのは、SINの関数から算出される値でしょうか?

それともCOSの関数から算出される値でしょうか?

ちなみに斜辺の長さは1です!

ヒントはグラフは時計回りになっていることです!

正解はSINです

反時計回りであれば底辺を求めるCOSです

出典:
https://yarinaosinosansu.nomaki.jp/sankakuhi2/index.html

ところが、今回は時計回りなので反対の対辺を求めるSINになります

解答を検証したい方は以下のサンプルをダウンロードしてください

サンプルには以下のスピードメーターグラフのテンプレートも同じく含まれています

スピードメーターグラフについて詳しく知りたい方はこちら

にほんブログ村 資格ブログ ビジネススキルへ

にほんブログ村 IT技術ブログ VBAへ

にほんブログ村

スピードメーターグラフ_テンプレート(散布図使用)

 これまで2回、スピードメーターグラフの添付レートを紹介してきました
1度目は円グラフを組み合わせたもの、2度目はVBAを使用したものです

今回紹介するのは、メーターの針を散布図で作成したものです

ですので、円グラフで針を作成するよりリアルなメーターになっています

最小値と最大値も調整ができるので、数字をメリハリをつけて示すことができます

下の図では値は35%のままですが、最小値と最大値を変えているのでメーターの針の角度が変わっています

ちなみにメーターは最小値と最大値の間の外には動かないようになっていますのでその点は注意して使用してください

にほんブログ村 資格ブログ ビジネススキルへ
にほんブログ村
にほんブログ村 IT技術ブログ VBAへ