統計
(*)こちらのデータはタンタンタイガーの数値を基にして作成しておりますが、全てのデータ開示は会社の競争上で問題があるため、売上や単価など一部数値を変更しております。個別にご連絡いただければ開示・ご相談を検討します。 あけましておめでとうござい…
こんにちは、Hayatoです。年末ですね。 カーネル密度推定をおさらいしようと何度かググったのですが良い感じの記事が見当たらなかったので、書き落としておきます。 Index カーネル密度推定って? どういうときに使うといいの? カーネル密度の算出方法 (実…
iPythonでデータ分析するときに、当然matplotlibやseabornでグラフを描画するのですが、日本語対応されてなく文字化けを起こします。 グラフの描画はデータの概要を掴んだりビジュアライズしたりするためなので、文字化けを起こしていると割と致命的です。 …
どーもこんにちは、ハヤトです。 アンケートやオンライン広告を計画するときに、 どれくらいのサンプルサイズがあれば妥当な検証結果を得られるか知りたい 、なんて時が結構あると思います。 今回は、必要なサンプルサイズをPythonで計算します(ちょっと無…
2変数の間に関係性があるかどうか調べる時に、ピアソンの相関係数を扱うことは非常に多いと思います。 しかし御存知の通り、相関係数は扱うデータのサンプルの外れ値に大きく影響を受けます。 テストの問題を解くだけなら良いのですが、実際に分析していると…
学校の授業や資格のテストでは、「正規分布をしている」ことを前提に、検定や推定が行われることが多いですよね。 しかし、実際に自分でデータをとって分析する時は、当然ですが誰もそのデータ郡が「正規分布をしている」とは保証してくれないわけです。 そ…
みなさんGoogle Analytics(以下GA) 使ってますか?一番ポピュラーなアクセス解析ツールで、とりあえず入れてるっていう人も多いはず。 しかししかし。GAは機能めちゃたくさんあって、50以上のレポートがデフォルトで用意されています。 全部使えてる!って…
アクセスログとは別にデータベースに直接アクセスして分析したいみたいなことって結構あると思うんですよね。 でもわざわざsshでログインして、そのサーバーに分析環境作ってみたいのって面倒な上になんかぶっ飛ばしちゃいそうで怖いじゃないですか。 なので…
2016年3月25日にアップデートしました。 こんにちは。Hayatoです。仕事では大きなデータの処理とかそのクリーニングや解析をしています。 大学時代は熱心に勉学に励まなかったこともあり統計的知識が弱く、いつも平均だけだしてパパっと分析済ませちゃったり…