管理人– Author –
-
【Python実践】ランダムフォレスト(Random Forest)で回帰問題と分類問題を解く(コピペで使えるサンプルコード付き)
ランダムフォレストとは ランダムフォレスト (Random Forest) は、機械学習のアルゴリズムの1つで、分類や回帰の問題を解決するために使用されます。多くの決定木 (Decision Trees) を組み合わせて、全体の予測精度を向上させるアンサンブル学習手法の1つ... -
【実践データ】本記事で使うテストデータのダウンロードについて
本ブログでは、より実践的な内容を提供できるよう、テストデータを用意しています。いずれも架空のデータではありますが、私が今までに経験した業務に基づいているため、それらしいデータになっていると思います。 本記事は、テストデータの具体的な内容に... -
【簡単便利】Graphvizの概要とPythonで使うためのインストール手順
graphviz は、データ分析で使われる「ネットワーク分析」や「決定木分析」、「階層化クラスタリング」などの結果を可視化するためのツールです。 本記事では、graphviz の入手先と、Pythonから利用するためのインストール手順、日本語の対応方法についてス... -
【Python実践】製造業データ分析におけるTF-IDFの活用(コピペで使えるサンプルコード付き)
TF-IDF は、テキストデータにおける単語の重要度を数値化する手法として広く知られていますが、製造業のデータ分析においても、適切なデータと組み合わせることで、以下のような用途が考えられます。 TF-IDFとは TF-IDF(Term Frequency - Inverse Documen... -
【Python実践】Isolation Forestで異常検知を行う(コピペで使えるサンプルコード付き)
Isolation Forest(アイソレーションフォレスト)は、機械学習の異常検知手法の一つで、特に大量のデータから異常なデータポイントを効率的に検出できることで注目されています。 このアルゴリズムは、データの「孤立度」を基に異常を検知するユニークなア... -
【Python実践】決定木分析で隠れたルールを可視化しよう(コピペで使えるサンプルコード付き)
Pythonで機械学習を行う際、決定木はシンプルかつ効果的なアルゴリズムとして人気です。 この記事では、初心者でも簡単に実装できる決定木分析の手順を、サンプルコードと共に詳しく解説します。 データの前処理から、モデルの訓練、可視化まで、Pythonの... -
【Python実践】DBSCANでデータのグルーピングを行う(コピペで使えるサンプルコード付き)
DBSCANは、密度に基づいてデータをグループ化するアルゴリズムで、ノイズを含むデータにも強い特徴があります。製造業では、センサーから得られる振動データをDBSCANで分析し、異常な振る舞いを早期検知するなど、異常検知や設備の故障予兆の分析、品質管... -
【Python実践】K-meansでデータのグルーピングを行う(コピペで使えるサンプルコード付き)
K-meansクラスタリングは、大量のデータを自動的にグループ分けするアルゴリズムで、製造現場における異常検知や、部品の品質分類、設備の稼働状態の監視など、さまざまな場面で利用できます。 この記事では、製造業における具体的な活用例を交えながら、K... -
【Python実践】重回帰分析で因果関係を解明し、未来を予測する(コピペで使えるサンプルコード付き)
製造業では、製品の品質向上、生産性の向上、コスト削減など、様々な課題が常に存在します。特に、製品不良の原因究明は、企業にとって喫緊の課題の一つです。 重回帰分析を使えば、製造工程における様々な要因が製品不良に与える影響を数値化し、根本的な... -
【Python実践】OneClassSVMで異常検知を行う(コピペで使えるサンプルコード付き)
異常検知は、大量のデータの中から不正やエラー、異常な動作を迅速に検出する技術で、製造業も含めて幅広い分野で活用されています。 本記事でhあ、異常検知に特化した「OneClassSVM」というアルゴリズムに焦点を当て、その基本的な考え方や、Pythonでの実...