数学的理論と計算

Pythonで確率の計算。for文で集合の中の要素を抽出

確率という言葉は「降水確率」みたいな形で見たことはあるけど、なんとなく感覚的にわかっているだけで、実際に何かというと何かよくわからないですよね。しかし、データ分析をするのに理解する必要があるので、頑張って読んでみました。やり方としては、この...
数学的理論と計算

python で重さの単位変換プログラムを書いてみた

重さの単位は世界共通ではありません。イギリスやアメリカなどでは、私たちが使っているキログラムではなく、ポンドやオンスが重量の単位です。当然そのままでは都合が悪いので、どちらに単位の変換をしなければなりません。そこで、pythonでポンドから...
数学的理論と計算

python で正規分布の確率密度関数を描く

Pythonで正規分布の確率密度関数を描いてみます。データは気象庁の仙台 日平均気温の月平均値(℃)を使って正規分布の確率密度関数を描いてみます。この記事はこんな人におすすめ。 データの前処理の方法を知りたい。 正規分布の確率密度関数を描い...
数学的理論と計算

pythonで相関関係と共分散を求めてみる。

相関関係とは2種類のデータの関連性を示す指標であり、例えばAとBの間に何らかの関連性があるとき、AとBは相関関係にあるといえるでしょう。例えば、Aが増加するときBも増加する場合はAとBの間に正の相関関係があり、Aが増加するときBが減少すれば...
統計

Pyhton を使って確率の計算をやってみる:中心極限定理と正規分布

簡単な確率の計算をPythonを使ってやってみましょう。確率は何とも概念がつかみにくいものがあるのですが、実際に計算してみることで概念をつかんでみたいと思います。この記事はこんな人におすすめです。 Pythonで確率の計算をしてみたい。 中...
データ分析

Pythonで時系列データ分析 Vol. 2 定常性と自己相関

定常性の検定は、将来の予測や統計的分析を行う上で重要です。定常性とは、時系列データの統計的性質が時間に依存しないことを指し、平均や分散、自己相関が一定であることを意味します。また、自己相関分析とは、時系列データ内のデータ点とそのタイムラグと...
データ分析

Python による平均値、中央値、最頻値の求めかたと数式の意味

標本を度数分布表に落とし込み、グラフにすることでその大まかな傾向が見えますが、さらに細かくデータを見てみましょう。データを視覚的、感覚的に確認するために、一般的に用いられるのが「平均値」「中央値」「最頻値」ですね。ということで、この三つはど...
統計

Python による分散、標準偏差の求めかたと数式の意味

「平均値」「中央値」「最頻値」でデータを視覚的、感覚的に確認し、さらにデータがどのような性質を持っているのかを確認するために用いられるのが、分散と標準偏差です。この記事では、分散と標準偏差とは何か、どのようなときに使われるのか、さらにpyt...
統計

Python を使った度数分布表とヒストグラムの作成

データ分析をするうえで重要なのが、データがどのような状態なのかを確認することです。そのための方法として一般的なのが、度数分布表とヒストグラムです。この記事では、Pythonを使って Pythonで度数分布表とヒストグラムを作成する方法 Ma...
データ分析

Pythonによる時系列データ解析 Vol.1 前処理と特徴抽出

Pythonを使った時系列データの特徴抽出に限らず、データを分析する際にはデータの前処理が必要です。この記事では、時系列データの性質を理解し、トレンドや季節変動、不規則性を識別する方法、平滑化などの処理方法を解説します。プログラミング、機械...