statistics [Statistics][媒介分析]媒介分析における直接効果・間接効果とは何か。 媒介分析 以前の記事で取り上げた。 Stataでの媒介分析について。 この記事でも出てきたが、「調整済み直接効果 (Controlled Direct Effect, CDE)」や「自然な直接効果 (Natural ... 2023.08.24 statistics
ChatGPT [ChatGPT][Code Interpreter]ChatGPT4で時系列データの分析を行う Code Interpreterとは 世界に衝撃を与え続けているChatGPTであるが、Code Interpreterの便利さは驚愕的。CSVやEXCELファイルをアップロードし、データの加工や分析、グラフの作成を一瞬で行ってくれ... 2023.08.04 ChatGPTFXstatistics
statistics [情報量][Statistics]情報量とは何か? 情報量 情報量やエントロピー (entropy)は、確率の用語として用いる場合、「ある事象がどれほど起こりにくいか」を表す尺度である。 数式での定義 ある事象が起こる確率を\(p\)としたとき、事象が起こったことを知ると... 2023.07.25 statistics
statistics [Books][読書][Statistics][データサイエンス]因果推論の科学 因果推論の科学 Judea Perlによる一般向け統計書。もともと電気科学からAI研究、そしてベイジアンネットワークの研究を経て因果推論に深く関わるようになった研究者。この本は重要な本なので、読みながらまとめていく。 ... 2023.07.20 statistics
FX [Statistics][Foreign Exchange]水曜日のドル円は上昇する、あるいは7月のドル円は下落する 使用データ 引き続き時系列データの解析を行う。便利なので、ドル円の始値、高値などのデータを再度用いる。 一気に解析・図示 大した内容ではないので、一気にプロットまで。 import pandas as pd imp... 2023.07.12 FXpythonstatistics
python [Python][Statistics]様々な確率分布から、データが最もフィットするものを選ぶ方法 データの分布 手持ちデータの分布は、統計解析を行う上で重要であるが、暗黙の内に正規分布が採用されることが多いと思う。 以前の記事では、正規性の検定を行ったが、それでは、正規性が仮定できないとき、データがどのような分布に従うのか... 2023.07.11 pythonstatistics
statistics [Statistics][感度・特異度]検査の感度・特異度・陽性尤度比・陰性尤度比について理解する 感度・特異度 検査の感度・特異度を語る上で欠かせないのは分割表を記載することに尽きる。 病気あり病気なし検査陽性\(a\)\(b\)検査陰性\(c\)\(d\)分割表 このように記載し、合計人数も書き込む。 病気あ... 2023.07.11 statistics
FX [Statistics]変動値の従う分布について。正規分布と正規性の検定手法。 時系列データの正規性 国内総生産(GDP)やトヨタの株価などは時系列データと考えられる。時系列データの変動(一日のうちの値幅でもいいし、「高値」-「低値」でもいい)を考えた時、分布の仮定として正規分布を当てはまる事が多い。ところが、... 2023.07.10 FXpythonstatistics
FX [python][Statistics]単位根検定とは?Pythonでの実装方法と結果の解釈について 単位根検定の基本:なぜ重要なのか 単位根検定は、時系列データが定常か非定常かを判断するための統計的手法である。時系列データの特性を理解するためには、そのデータが定常性を持っているかどうかを知ることが重要で、その理由は以下の通りである... 2023.07.06 FXpythonstatistics
statistics [Statistics][Instrumental variant]操作変数法とはなにか? 操作変数法(Instrumental variables (IV) estimation)とは 曝露が統制できないとき、つまり、処置がランダムに割り当てられないときに、因果推論を行うための手法である。 図1: 操作変数法の説明... 2022.11.22 statistics