大阪大学医学部 Python会 (情報医科学研究会)

Now is better than never.



同じ基本統計量・異なる散布図のデータセットを焼きなまし法で生成する

2020-07-01(Wed) - Posted by 山本 in 技術ブログ    tag:Statistics

Anscombeの例 平均や標準偏差、相関係数といった基本統計量は重要ですが、散布図の外観が全く異なっていてもこれらの基本統計量が(ほぼ)同一となることは起こりえます。このような例としてAnscombeの例 (Anscombe's quartet) が有名です。Seabornを用いると、....

Read more...



線形混合効果モデル

2020-04-08(Wed) - Posted by 竹内 in 技術ブログ    tag:Statistics

経時測定データ解析 複数の対象者に対して、ある反応変数を時間の経過とともに繰り返し測定したデータを、経時測定データ(longitudinal data)という。経済学分野では、パネルデータ解析として知られている。 経時測定データ解析の特徴 個体間誤差だけでなく、個体内誤差も考慮する必要が....

Read more...


ICA(独立成分分析)について

2020-03-29(Sun) - Posted by 奥田 in 技術ブログ    tag:Statistics

概要 脳の機能解析に使用されるEEG(脳波計)やMEG(脳磁図)の計測結果(つまり、電圧や磁場の時系列データ)には色々なノイズがのります。例えばEEGでは電源ノイズ、筋電、まばたき、などが主要なノイズとして知られています。 電源ノイズのように周波数が分かっていればフィルタでノイズを除....

Read more...



ローレンツ曲線とPythonで日本人の年収の偏りを示そう!

2019-03-25(Mon) - Posted by 平岡 in 技術ブログ    tag:Statistics

このページでは統計初学者向けにローレンツ曲線とその意味、使い所について説明し、Pythonを使って実際にデータ解析を行ってみます。 ローレンツ曲線とは ローレンツ曲線とは、横軸にも縦軸にも累積相対度数を使って、描いたグラフのことです。何かの偏りを示したいときに利用されることが多いです....

Read more...


必要n数の決定~研究計画~

2019-03-22(Fri) - Posted by 依藤 in 技術ブログ    tag:Statistics

シングルセル解析での細胞数実現可能性:金銭面、使用機器のスループットを考慮した細胞数 ② 検出力:統計学的検討により細胞種間の差が充分に検出される症例数であるか ③ 倫理面:ヒトサンプル、あるいはモデル動物サンプルの取り扱い とくに②に関して: 分類するclusterに関して過去の文献から....

Read more...


カプランマイヤー曲線について

2018-11-20(Tue) - Posted by 佐藤 in 技術ブログ    tag:Statistics

はじめに 書こうと思ったきっかけ 実習中論文を頂いて読む機会が多いが、医学論文は薬は新しい治療方法の成績を比較しているのが多い。 だいたい Kaplan-Meier曲線 が使われているので(偏見)、論文を読むときにはもちろん、将来自分が論文を執筆するときに、何が行われているのか少しでも理解....

Read more...