python

FX

[Statistics]変動値の従う分布について。正規分布と正規性の検定手法。

時系列データの正規性 国内総生産(GDP)やトヨタの株価などは時系列データと考えられる。時系列データの変動(一日のうちの値幅でもいいし、「高値」-「低値」でもいい)を考えた時、分布の仮定として正規分布を当てはまる事が多い。ところが、...
FX

[python][Statistics]単位根検定とは?Pythonでの実装方法と結果の解釈について

単位根検定の基本:なぜ重要なのか 単位根検定は、時系列データが定常か非定常かを判断するための統計的手法である。時系列データの特性を理解するためには、そのデータが定常性を持っているかどうかを知ることが重要で、その理由は以下の通りである...
ChatGPT

[python][ChatGPT]ChatGTPで臨床検査技師国家試験演習Webサイトを作成

経緯 ひょんなことから臨床検査学科で授業を持つことになり、いい機会だと思って臨床検査技師の国家試験を勉強→せっかくなので問題演習をできるサイトを作成。 結果 デザインもクソもない無骨な感じになってしまったが、なん...
python

[Python][Polars]Polarsで行うデータクリーニングの実際

データフレームの準備 PythonでのスクレイピングとCSVファイルへ書き込み 前回の記事でせっかくCSVファイルを作成したので、これを例にデータクリーニングをPolarsで行なってみる。データクリーニング前のCSVファイルは...
python

[Python][Scraping]PythonでのスクレイピングとCSVファイルへ書き込み

データの抽出 いつものBeautifulSoupで。ほとんどpowered by ChatGPTであるが、一部文字化け部分についてはChatGPTは解決できなかったので、加筆している。 必要ライブラリのimport こち...
python

[Python][PDF]PythonでPDFからテキストを抽出する方法

PyPDF2 PyPDF2を用いる。version 3.0.0以上推奨。インストールはいつもので。 pip install PyPDF2 もうこういうのはChatGPTに聞くほうが早くなってきたな。 コード...
python

[Seaborn][matplotlib]Pythonのseaborn散布図プロットで各点にラベルをつける方法

Seaborn 散布図で各点にラベルをふる 意外に調べてもわからなかった。ここではTipsデータセットを使って各点にラベル(番号)をつける。 必要ライブラリのimport いつものやつ。 import...
python

[Python][Polars]pythonのデータフレームLibrary PolarsのExpressionについて理解を深める

Polars Expression これがPolarsのcore機能なので、十分に理解を深める価値がある。 例題データセット Tutorialに従ってやってみる。 import polars as pl i...
python

[python][Polars]pythonの新データフレームlibrary、Polarsについて

Polarsとは Rustベースに作られたデータフレームのLibrary。Pandasよりも高速で直感的で使いやすい。以下の例でも出てくるが、基本的にRのdplyrのように文法をつなげていくという使い方になる。速度に関しては...
python

[python][numpy]配列を繰り返したいときのrepeatとtileの違い

tileとrepeat numpyで配列を繰り返したいとき、今までrepeatしか知らなかったけれど、tileというmethodもあることに気がついた。 まずはrepeatから 基本的な使い方は以下。 ...
タイトルとURLをコピーしました