Unsupervised Learning: PCA （主成分分析）の流れ

Python Python-Machine Learning

PCA (Principal Component Analysis) とは Structure 主なParameters 主なAttributes PCA を１からやってみる Sample Dataの作成 Sample Dataの可視化 PCAの実行結果の確認 Explained Variance Ratio (寄与率) Cumulative Explained Variance (累積寄与率…

2020-09-26

アルゴリズム思考術　問題解決の最強ツール

Book Review

アルゴリズム思考術問題解決の最強ツール (早川書房)作者:ブライアンクリスチャン,トムグリフィス発売日: 2017/10/31メディア: Kindle版読むべき時に読めた本。ちょうど最適化アルゴリズムを仕事で使う必要があったので、本書からのインサイトはすぐに役…

2020-09-26

Exploratory Data Analysis - 探索的データ解析

Python Python-Machine Learning

Exploratory Data Analysisとは実践編データ準備データの観察眺めるデータの前処理データの成型欠損値処理 Box plotで分布の広がりと異常値を観察基本統計量の確認組み合わせ散布図 Pair Plot 相関行列のHeat Map その後特徴量エンジニアリング k-…

2020-09-23

第三回：Ensemble Model - Bagging (Bootstrap Aggregating)

Python Python-Machine Learning

Baggingとは Structure 主なParameters Sample Baggingとは Bootstrapping（サンプル集合から復元抽出によりsub-sample setを作成）により作成したsub-sample setそれぞれに対してモデルを作成し、モデルの結果を集約して予測すること。結果の集約はClassif…

2020-09-23

回帰モデルの評価

Python Python-Machine Learning

回帰モデルの評価平均二乗誤差（MSE: Mean Squared Error ） crross_validateの引数平均絶対誤差（MAE: Mean Absolute Error） crross_validateの引数中央値絶対誤差（MedAE: Median Absolute Error） crross_validateの引数決定係数（R2） crross_valid…

2020-09-22

Hot Encoder

Python Python-Machine Learning

Hot Encoderとは Dataの準備 OneHotEncoder Structure 主なParameters Sample get_dummies Structure 主なParameters Sample label_binarize Structure 主なParameters Sample Hot Encoderとは特徴量（行列X、多分類のときにはyも)をOne Hot Vectorつまり1…

2020-09-18

住友銀行秘史

Book Review

住友銀行秘史作者:國重惇史発売日: 2016/10/06メディア: 単行本バブルの象徴として名高い「イトマン事件」の告発当事者（住銀）のメモを基にした備忘録。メモの抜粋が紙面の多くを占めているのでページ数のわりには短時間で読了した。反社に付け込まれた…

2020-09-15

Unsupervised Learning: Clustering (K-means)の流れ

Python Python-Machine Learning

Clustering (K-means)を１からやってみる Sample Dataの作成 Sample Dataの可視化エルボー法でクラスター数を決める最適なクラスター数を使った結果の確認 Clustering (K-means)を１からやってみる流れ準備：Sample Dataの作成 Sample Dataをグラフ化し…

2020-09-14

Decision Treeのvisualisation

Python Python-Machine Learning

Decision Treeを可視化準備 Visualisation Code 結果 Decision Treeを可視化 Decision Treeは図にして俯瞰すると大変理解しやすくなる。ありふれた（諸先輩方には既知）コードではあるが自分用のメモとして残しておく。準備 Decision Treeの作り方をおさら…

PyInv

プログラミングのメモ、海外投資のメモ

2020-09-01から1ヶ月間の記事一覧

Unsupervised Learning: PCA （主成分分析）の流れ

アルゴリズム思考術　問題解決の最強ツール

Exploratory Data Analysis - 探索的データ解析

第三回：Ensemble Model - Bagging (Bootstrap Aggregating)

回帰モデルの評価

Hot Encoder

住友銀行秘史

Unsupervised Learning: Clustering (K-means)の流れ

Decision Treeのvisualisation