分析屋さんの立場からのExcel 2007チームに向けた5つ(+2)の改善案

最近では、論文もWord形式で受け付けるところも増えてきて、Microsoftの文書がいかに世の中で広く使われているかということを実感することがあります。

統計ツールにおいても、信頼性でいえば専門のツール(SPSS, SAS)などを用いるのが常套手段ですが、こと統計ツールに入力する前のデータ編集にはMicrosoft Excelが周りでは、よく使われています。確かに解析機能は、専門ツールには劣るのですが、データ編集、そしてその後のグラフを書くということに関していうと、Excelは次の点でかなり便利です。

  • 編集に必要な機能が多くの部分でカバーされている。
    • レコードの条件抽出
    • 条件付きソート
    • 項目(列)の入れ替え
  • グラフ機能がインタラクティブに操作可能である。
    • タイトルの位置調整
    • legend(凡例)の位置調整
    • グラフの色の調整
    • 数値範囲の指定
    • プロット対象の入れ替え
    • データ値に対して動的にプロットが追随

など、普通の統計ツールではこうはいかないだろ?ということが実行可能です。だからでしょうか、多くの統計ツールでは、何らかの形でExcelとの連携機能がついています。

さて、そんな高機能ツールExcelに対して、Juice AnalyticsのChrisさんの記事:

http://www.juiceanalytics.com/weblog/?p=189

では、さらにグラフ機能に対して5点の改善案を出しています。どれも分析屋さんにとっては実現してほしいものばかり。それぞれに対してちょっとした解説と私の意見を織り交ぜて紹介します。

1. (色などに関して)デフォルト設定の向上

Excelのグラフのデフォルト色と形は正直ださいし、見難いのですね。特に印刷する際には線の違いがわかり難くなる色がデフォルトで選択されているので、グラフを書くたびに色と形をかえる必要があり、面倒なのでこれをなんとかしてほしいのです。統計ツールS-PLUSなんかだと、色と形はそこそこ良い選択がされているので、カラープリンタが使えない環境では、このような統計ツールの色に習えばよいです。

2. グラフの種類の選び方のガイドの追加

同じデータに対しても、つかうグラフの種類で、わかりやすさがかわってきます。基本的に時間に対する変化を表すなら折れ線グラフがよいでしょうし、商品に対するシェアを表示するなら円グラフがよいでしょう。こうした、(常識的な)グラフの種類をある程度、教えてほしいということでしょうね。

3. もっと適切なグラフ機能の追加

Excelには多数のグラフ種類がありますが、箱ひげ図や点プロットはありません。これらは読み方さえ覚えれば、強力な図示の方法であるので、搭載してほしいということですね。まぁ、こういうのが必要だったら、普通の統計ツールを使うので私はいらないですけどね。

4. Excelのアドイン機能の共通パッケージングフォーマットを作る

これはよくわからないですけど、アドインの作り方が難しいので、Firefoxのように簡単にアドインを作れるようにしてくれってことみたいですね。まぁ、これがあると、Excelに不足している解析機能が楽に追加できるようになるので、私としても、簡単にアドインが作れるようになってほしいと思います。

5. (グラフ表示に関する)Excelに関するコミュニティーを作る

SASと比べてユーザカンファレンスの参加者が圧倒的に少なかったみたいです。まぁ、専門家としてはExcelで分析やってますってアピールするのはある意味恥ずかしいので参加者も少ないのでしょうねぇ。

以上、グラフ機能5点の改善案でしたが、分析屋さんとしては、Excelは編集と表示というところに特化させた使い方をしているので、私は編集の観点から改善希望を。

6. データの勝手な丸め処理やめて

編集というところで考えると、データを勝手に丸められたりすると、分析結果がかわってきてしまいます。

7. 数値データでない要素の処理

欠損値と無限大、NULLなんかの処理がうまくされていれば、ソートでの並び間違いなどがなくなる。

こんなところの機能が強化されたならば、分析屋さんが使うデータ編集ツールとしてもはや、いうことなしです。

Excelで学ぶ統計解析―統計学理論をExcelでシミュレーションすれば、視覚的に理解できる

Excelで学ぶ統計解析―統計学理論をExcelでシミュレーションすれば、視覚的に理解できる