PyInv

プログラミングのメモ、海外投資のメモ

2020-09-01から1ヶ月間の記事一覧

Unsupervised Learning: PCA (主成分分析)の流れ

PCA (Principal Component Analysis) とは Structure 主なParameters 主なAttributes PCA を 1からやってみる Sample Dataの作成 Sample Dataの可視化 PCAの実行 結果の確認 Explained Variance Ratio (寄与率) Cumulative Explained Variance (累積寄与率…

アルゴリズム思考術 問題解決の最強ツール

アルゴリズム思考術 問題解決の最強ツール (早川書房)作者:ブライアン クリスチャン,トム グリフィス発売日: 2017/10/31メディア: Kindle版 読むべき時に読めた本。ちょうど最適化アルゴリズムを仕事で使う必要があったので、本書からのインサイトはすぐに役…

Exploratory Data Analysis - 探索的データ解析

Exploratory Data Analysisとは 実践編 データ準備 データの観察 眺める データの前処理 データの成型 欠損値処理 Box plotで分布の広がりと異常値を観察 基本統計量の確認 組み合わせ散布図 Pair Plot 相関行列のHeat Map その後 特徴量エンジニアリング k-…

第三回:Ensemble Model - Bagging (Bootstrap Aggregating)

Baggingとは Structure 主なParameters Sample Baggingとは Bootstrapping(サンプル集合から復元抽出によりsub-sample setを作成)により作成したsub-sample setそれぞれに対してモデルを作成し、モデルの結果を集約して予測すること。 結果の集約はClassif…

回帰モデルの評価

回帰モデルの評価 平均二乗誤差(MSE: Mean Squared Error ) crross_validateの引数 平均絶対誤差(MAE: Mean Absolute Error) crross_validateの引数 中央値絶対誤差(MedAE: Median Absolute Error) crross_validateの引数 決定係数(R2) crross_valid…

Hot Encoder

Hot Encoderとは Dataの準備 OneHotEncoder Structure 主なParameters Sample get_dummies Structure 主なParameters Sample label_binarize Structure 主なParameters Sample Hot Encoderとは 特徴量(行列X、多分類のときにはyも)をOne Hot Vectorつまり1…

住友銀行秘史

住友銀行秘史作者:國重 惇史発売日: 2016/10/06メディア: 単行本 バブルの象徴として名高い「イトマン事件」の告発当事者(住銀)のメモを基にした備忘録。メモの抜粋が紙面の多くを占めているのでページ数のわりには短時間で読了した。 反社に付け込まれた…

Unsupervised Learning: Clustering (K-means)の流れ

Clustering (K-means)を1からやってみる Sample Dataの作成 Sample Dataの可視化 エルボー法でクラスター数を決める 最適なクラスター数を使った結果の確認 Clustering (K-means)を1からやってみる 流れ 準備:Sample Dataの作成 Sample Dataをグラフ化し…

Decision Treeのvisualisation

Decision Treeを可視化 準備 Visualisation Code 結果 Decision Treeを可視化 Decision Treeは図にして俯瞰すると大変理解しやすくなる。ありふれた(諸先輩方には既知)コードではあるが自分用のメモとして残しておく。 準備 Decision Treeの作り方をおさら…