こんにちはbudouです!
今回はタブローを使って一瞬で記述統計量(の一部)の見る方法を書きたいと思います。
(Python.pandas
でいうところのDataFrame.describe()
と似たようなこと)
はじめに
タブローを使い始めたころ、Pythonとかだと一行でできるこの記述統計量がみたいけどどうやるんだ...! というところで「きっと出来るのだろうけれどもやり方が分からない」という悩みにぶつかっていた時期がありました。。
データインポートしたらまず記述統計量を見たい...という自分からしてみると、「~~!」というストレスが若干ありました。
が、やっぱりタブローならコーディングフリーで10秒以内に表現できました!
そのやり方を書きます。
それは「サマリー」と呼ぶらしい
記述統計量のタブロー内での呼び方は、「サマリー」と呼ぶらしい。 やりたいことの呼び名が分かると検索もできるし一歩進みますよね。
「サマリー」を呼び出そう!
まだ何も表示させようとしてないので「サマリー」にも何も出ない。
「サマリー」で計算してほしいものを明確に定義してあげる必要がある
PythonのDataFrameの扱いなどに慣れてしまっていると、タブローの動作の理解に一つだけ気を付けなければならない事がある。 それは、「タブロー内では"メジャー" × "ディメンション"の表現の中で、現在選択されているものに対しての、指定された処理を行いますよ」 という動作になるということ。
・売上のサマリーがみたい。じゃあ...
- サマリー機能を起動させていて
- 売上情報を指定する という二つでできるのかと思ったが
あれ? カウントが1? 合計値も平均値も同じ?
正しくは、 - サマリー機能を起動させていて - 売上情報を指定して - それを "レコード単位で表示出来る" ディメンションを指定する
という事が必要ということみたいでした。
今回は「レコード単位でサマリーが見たい」というところなので、その意味のディメンションを追加することで、タブローが良しなに計算してくれました。っと
ふむふむ。できた~