2025年2月– date –
-
【Python実践】ハイパーパラメータチューニング(最適化)3選(グリッド、ランダム、ベイズ)と実務で使えるサンプルコード紹介
製造業の現場では、データ分析やAIモデルの導入が進む中で、「どうやってモデルの性能を最大限に引き出すか」が重要な課題となっています。 その鍵を握るのが ハイパーパラメータの最適化。最適なハイパーパラメータを見つけることで、モデルの精度が劇的... -
【Python実践】サポートベクターマシンを使いこなす!分類・回帰・異常検知の実践法(コピペで使えるサンプルコード付き)
サポートベクターマシン(SVM)は、機械学習における強力なアルゴリズムの一つであり、分類問題や回帰問題、さらには異常検知にも幅広く利用されています。 特に少ないデータでも高い精度を出せる点が特徴で、ビジネスや研究の現場で重宝されています。 本... -
【Python実践】データ分析の影の立役者!主成分分析(PCA)の使い方ガイド(コピペで使えるサンプルコード付き)
「データ分析の舞台裏で、重要な役割を果たす影の立役者」、それが主成分分析(PCA)です。『膨大なデータをどう整理すればいい?』『関係性をどう見抜く?』そんな課題に答えてくれます。 PCAは、データの次元削減や要因分析でよく使われますが、それ以外... -
【Python実践】データに潜む共通点を見つける!因子分析(FA)の使い方ガイド(コピペで使えるサンプルコード付き)
製造業のデータ分析において、複雑なデータの中から本質的な要因を見極めることは非常に重要です。そこで活躍するのが 因子分析(Factor Analysis, FA)。データに潜む「見えない因子」を明らかにし、プロセス最適化や品質向上につなげる強力な手法です。 ... -
【製造業】データの分類と予測の救世主!アンサンブル学習とは?
機械学習の精度をさらに向上させる手法として注目されているのが「アンサンブル学習」です。分類や回帰といった課題において、複数のアルゴリズムを組み合わせることで、それぞれの強みを引き出し、弱点を補うこの手法は、データ分析の現場で強力な武器と... -
【コピペOK】ランダムフォレストやLightGBMを簡単に扱える自作クラスを紹介
機械学習のモデル開発では、ランダムフォレストやLightGBMといったアルゴリズムを使い分けることが一般的です。しかし、その都度コードを一から書き直すのは非効率で、作業の重複が発生しがちです。 そこで活用したいのが、複数のアルゴリズムに対応した汎... -
【製造業】データ分類と異常検知の強い味方!クラスタリングとは?
膨大なデータを理解し、活用するための手法の一つとして「クラスタリング」は、長い歴史を持ち、その有効性が広く認識されています。 クラスタリングは、データを似た特徴ごとにグループに分けることで、データのパターンや構造を明確にし、新たな洞察を得... -
【Python実践】ランダムフォレスト(Random Forest)で回帰問題と分類問題を解く(コピペで使えるサンプルコード付き)
ランダムフォレストとは ランダムフォレスト (Random Forest) は、機械学習のアルゴリズムの1つで、分類や回帰の問題を解決するために使用されます。多くの決定木 (Decision Trees) を組み合わせて、全体の予測精度を向上させるアンサンブル学習手法の1つ... -
【実践データ】本記事で使うテストデータのダウンロードについて
本ブログでは、より実践的な内容を提供できるよう、テストデータを用意しています。いずれも架空のデータではありますが、私が今までに経験した業務に基づいているため、それらしいデータになっていると思います。 本記事は、テストデータの具体的な内容に... -
【簡単便利】Graphvizの概要とPythonで使うためのインストール手順
graphviz は、データ分析で使われる「ネットワーク分析」や「決定木分析」、「階層化クラスタリング」などの結果を可視化するためのツールです。 本記事では、graphviz の入手先と、Pythonから利用するためのインストール手順、日本語の対応方法についてス...